【Sora2】 動画作成で見えた課題と対策
Contents
Sora2で動画作成を行っていると、理想の映像を目指す過程で、いくつか共通した課題に繰り返し遭遇します。
本記事では、私が実際に遭遇した問題と、それに対して現時点で有効だった対処、あるいは未解決のまま確認できた事実を整理します。
「起きたこと」「試したこと」「分かったこと」を以下に記録として示します。
課題1:毎回、カメラ構図を勝手に変えられる
現象
同じ世界観・被写体・シーン設定を与えても、生成のたびに以下が変化することがあった。
- 画角
- 被写体の画面占有率や配置
- 視点の高さや角度
結果として、カットの連続性が崩れる。
対策
Prompt内で「構図」に関する要素をまとめて明示し、曖昧さを減少させた。
sample 設定例
Framing: { Shot size: Wide shot; Composition: Centered on main subject, >30% of frame height; Angle: eye-level;
DOF: normal}
結論
➡ Prompt適正化でほぼ解決
課題2:4回目あたりから、指示を無視して暴走しているように見える
現象
連続して生成を行うと、
- 指定していないカメラ動作
- 意図しない演出や補完
が入り始めることがある。
体感的には「4回目前後」で顕著になる感じ。
解釈
モデルが過去の生成履歴を参照し、勝手な解釈を保持しているように見える。
対策
毎回の生成を完全に独立したものとして解釈させる意図を明言した。
設定例(解釈ルール制限)
Interpretation Rule: Do not rely on previous generations; generate strictly from this prompt.
結論
➡ Promptの禁止事項の適正化で、いくらか改善されたように見える
課題3:Sub Character の統一性が徐々に崩れる
現象
生成回数が増えるにつれ、
- 顔の印象
- 髪型
- 体格や雰囲気
が少しずつ変化していく。
対策
Sub Character に関して、「保持してほしい要素」をまとめて指定。
継続性制御の指定例
Continuity / Consistency: Maintain character identity and world settings.
結論
➡ 保持率を少し上げることは可能。ただしCameoとは異なり、完全固定は困難。
課題4:Superimpose Text が出る時と出ない時がある
現象
同一の Superimpose 指定を行っても、
- 表示される場合
- 完全に無視される場合
が混在して、成功率は低めである。
現状
- 再現条件は特定できていない
- 記述位置や指示用語の影響を疑っている
結論
➡ 現在、Prompt実験中(未解決)
課題5:人の「右半身」と「左半身」の区別ができない
現象
Sora2は、画面の左右は認識できている様子だが、人物の右半身・左半身の区別ができていない。
検証と確認
そのものズバリではないが、truck left/rightの挙動の問題について、OpenAI に問い合わせ※を行ったところ、以下の回答があった。要約すると、
「左右の物理的動きについては、条件によってはうまくいく場合もあるが、安定性は保証されない」
という回答であった。
結論
➡ 現時点ではモデル仕様上の制約
まとめ
今回整理した課題の多くは、
- モデルの「気まぐれ」ではなく
- 未指定・曖昧な領域をモデルが補完している結果
として説明できる。
Sora2は「何でも理解する存在」ではなく、指定されていない部分をそれらしく埋める存在だと考える方が自然に見える。
補足
ここで示したpromptの項目名については検証中でもあり、また曖昧性をなくすために英語にしていますが、項目名ではない本文の表現については日本語で記述することは、問題はありません。
本記事の検証内容を踏まえ、Sora2の動画作成向け Prompt Template Sample(初級〜中級者向け) を現在作成中です。
整理できた段階で、別記事として公開の予定です。➡ 公開中です。
【余談】
open AIのsupport deskへ、初めてmailをしてみました。
翌朝に返信mailが来ていることに気が付いたのだが、mail送信後わずか1分後の着信でしたww
そして、その返信へ回答mailを送ったら、やはり1分後に返信mailが到着w
さすがopenAI、ですね。
