こんにちは!妖精アーヤです!

大好評(自分で言っちゃう!)をいただいております、動画生成AI「Vidu」の新機能「リファレンスから画像(reference-to-Image)」の徹底検証レポート、第3弾をお届けします!
▼シリーズvol.1▼
「リアルな写真とアニメキャラを合成」
▼シリーズvol.2▼
「被写体に小物を持たせる」
第1弾では「キャラクターと背景」、第2弾では「キャラクターと小物」の関係性を探求してきました。そして今回、私たちが挑むのは、キャラクターイラスト生成における永遠の課題であり、最も奥深いテーマ…そう、「ポージング」です!
「うちの子に、もっとこんなポーズをさせたい!」
「躍動感あふれる、あの決めポーズを再現したい!」
そんな風に思ったこと、一度はありますよね?👀
でも、それを文字だけのプロンプト(呪文)でAIに正確に伝えるのって、実は至難の業なんです。
「右腕を45度に曲げて、左足を一歩前に出して…」なんて細かく書いても、なかなかイメージ通りにはいかない…。この「ポージングの壁」に、涙を飲んだクリエイターは少なくないはずです。
でも、もう悩まなくて大丈夫!
今回は、この分厚い壁を打ち破るための魔法のアイテム…「棒人間」を使って、Viduに思い通りのポーズを”憑依”させるという、禁断の(?)錬成術に挑戦したいと思います!
果たして、シンプルな棒人間のポーズを、私たちの愛するキャラクターにどこまで正確にトレースさせることができるのか? AIの身体能力と理解力の限界を探る、壮大な人体実験の幕開けです!わっしょい!
準備編:ポージングの神を召喚!「SETPOSE」という魔法の杖
今回の実験で、私たちの強力な味方になってくれるのが、「SETPOSE」というWebサイトです。

この「SETPOSE」は、ブラウザ上で棒人間の関節を自由に動かして、好きなポーズを簡単に作ることができる、超優秀なサイトなんです!
自分で関節を一つ一つ動かして、オリジナルのポーズを組み立てることができるので、創造力は無限大。有料版だともっと複雑なポージングも可能ですが、無料版でも今回の実験には十分すぎるくらいの機能が使えちゃいます。

こんなふうに「なんでやねん!」っと突っ込ませるポーズも微調整でつくれます。笑
今回は、この「SETPOSE」で作成した棒人間を「ポーズのお手本」としてViduに読み込ませ、私の分身「妖精アーヤ」にその魂を宿らせていきたいと思います!
さあ、準備は整いました。
それでは、れっつら生成! Viduのスタジオで、新たな魔法を試してみましょう!
第一章:基本のセットアップ〜舞台と役者を揃えよう〜
まずは、実験の舞台となるステージと、主役の役者をViduに紹介するところから始めます。
ステップ1:主役の紹介「妖精アーヤ」
おなじみ、私のオリジナルキャラクター「妖精アーヤ」の画像を、Viduのキャラクター参照にセットします。前回までの実験で、Viduはもうアーヤのことをしっかり覚えてくれているはず!

ステップ2:舞台の設営「真っ白なスタジオ」
今回はポーズそのものの再現度を純粋に検証したいので、背景は余計な情報がない、ごくシンプルな「白いスタジオ」を用意しました。

ちなみに、この背景も画像生成AIで作ったものです。プロンプトはこんな感じ。
white photo studio,no people
よかったら参考にしてみてくださいね。
ステップ3:まずは呪文なしで召喚!
さあ、役者と舞台が揃いました。
ここで一旦、ポーズのお手本(棒人間)は使わずに、
- 妖精アーヤのキャラクター画像
- 白いスタジオの背景画像
この2枚だけで生成してみましょう。どうなるかな?

はい、バッチリです!
真っ白な空間に、アーヤが自然な立ち姿で召喚されましたね。ここを基準点として、いよいよポージングの実験に突入します!
第二章:基本ポーズ編〜棒人間の魂は宿るのか?〜
ここからが本番! 「SETPOSE」で作成した棒人間のポーズを、アーヤにトレースさせていきます。
実験2-1:基本の「腕組み」ポーズ
まずは、誰もが一度は描きたい、クールで知的な印象を与える「腕組み」ポーズから挑戦です!

「SETPOSE」で腕を組んだ棒人間を作成し、そのスクリーンショットを撮影。
Viduのリファレンス画像に、「アーヤ」「白いスタジオ」そして「腕組み棒人間」の3枚をセットします。

さらに、プロンプトに「被写体のポーズ参考」という一文を添えて、Viduに「この棒人間を真似してね!」という意図を明確に伝えます。
さあ、どうなるでしょうか…!?

おおーっ!アーヤが、棒人間のポーズと寸分違わず、完璧な腕組みをしています!
腕の交差の仕方を忠実に再現してくれました。
Viduは、棒人間という非常にシンプルな線画の情報からでも人体の構造を正確に理解しそれを参照元のキャラクターに適用する能力を持っている、ということが証明されました!
実験2-2:自信の「腰に手を当てる」ポーズ
腕組みが成功したなら、これもいけるはず!
次は、自信や力強さを感じさせる、定番の「両手を腰に当てる」ポーズです。


こちらも大成功ーっ!見てください、この堂々とした立ち姿! 両手をキュッと腰に当てて、胸を張るポーズがバッチリ決まっています。
基本的なポーズであれば、棒人間の画像をポンと追加するだけで、驚くほど高い精度でキャラクターに反映させることができる。これはもう、イラスト制作の革命と言っても過言ではありませんね!
第三章:合わせ技編〜画像参照+プロンプトで創る究極の表現〜
実験3-1:「片膝立ちでしゃがむ」ポーズへの挑戦
次に用意したのは、ヒーローの登場シーンや、絶望の淵に立たされた場面などで使えそうな、「片足立ちでしゃがんでいる」ようなポーズです。これも重心のバランスが難しそう。

まずは、プロンプトなし。棒人間の画像参照だけで生成してみます。

うーん、惜しい! 手の雰囲気は合っていますが、肝心の足が両膝とも地面についてしまいました。
やはり、この複雑なバランスを画像だけで伝えるのは難しかったようです。
では、ここで魔法の言葉を唱えましょう。
プロンプトに「片方の膝をついてしゃがむ」と、ポーズの具体的な説明を追加します!


やりました! 完璧です!
棒人間の画像でポーズの全体像を伝え、文字プロンプトで「片膝」という重要なポイントを補足する。この連携プレイによって、Viduは私たちの意図を100%理解し、理想のポーズを完璧に再現してくれました!
第四章:実践応用編〜ポーズ+アクションで物語を創る〜
最後に、これまでのテクニックを総動員して、一つの完成されたシーンを創り上げてみましょう。
実験4-1:「両膝を抱えてしゃがむ」ポーズ
まず、「両膝を折り曲げてしゃがむ」という、可愛らしいポーズの棒人間を用意しました。
これは比較的シンプルなポーズなので、まずはプロンプトなし、画像参照だけでいけるはず!


はい、完璧です! とっても綺麗にポージングをトレースしてくれました。この自然なしゃがみポーズ、素晴らしいですね。
実験4-2:しゃがんだまま「黒猫を撫でる」
この可愛いポーズに、さらにアクションを加えて、物語を生み出してみましょう。
プロンプトに「黒猫を撫でている」という一文を追加します。

きゃー! 可愛いーっ!!
見てください、この完成度! しゃがんだポーズは一切崩すことなく、その体勢のまま、ごく自然に手を伸ばして黒猫を優しく撫でています。 手の位置、目線、キャラクターと追加されたオブジェクト(黒猫)との距離感、すべてが完璧です!
これは、「棒人間でベースとなるポーズを固定し、プロンプトで追加のアクションやオブジェクトを指示する」という手法が、非常に有効であることを示しています。この方法を使えば、どんな複雑なシーンでも、思い通りに構築できそうな気がしますね!
実験4-3:ここでも比較! もしも「棒人間」がなかったら…?
念のため、ここでも比較実験。
棒人間の画像参照なしで、「(しゃがんで)黒猫を撫でている」という文字プロンプトだけで生成してみます。

やはり、ダメでした。
しゃがむポーズが中途半端になってしまい、猫を撫でようと伸ばした手が、悲しくも空を切っています…。
この結果からも、「しゃがむ」「座る」といった、体の重心が低いポーズと、何かへのインタラクション(触る、持つなど)を組み合わせる際には、棒人間でのポーズ指定が絶大な効果を発揮する、ということがよく分かりましたね!
おまけ情報:Viduが受け付けてくれる「棒人間」の条件
実は、今回の実験で「SETPOSE」に行き着くまでに、他のいくつかの棒人間作成サイトも試してみたんです。
でも、例えば人の形がリアルで、裸体に見えてしまうようなモデル(女性モデルでも男性モデルでも試しました)の場合、Viduに画像を参照させようとすると、「これはセンシティブなコンテンツなので、ポリシーに反します」という警告が出て、参照を拒否されてしまいました。

この経験から、Viduにポーズ見本として受け付けてもらいやすいのは、
- 性別が曖昧
- 人肌の色をしていない
- リアルな人体というより、抽象的な「記号」としての棒人間
であるということが分かりました。今回ご紹介した「SETPOSE」のモデルは、この条件を完璧に満たしているので、安心して使うことができます。皆さんが他のツールを探す際にも、この点をぜひ参考にしてみてくださいね!
結論:Vidu+棒人間は、キャラクターを自在に操る「究極の操り人形術」だった!
第3弾にわたるポージング実験、いかがでしたか?
棒人間というシンプルなツールが、これほどまでに強力な魔法の杖になるなんて、アーヤも驚きの連続でした!
今回の実験で分かった、Viduのポージング能力と、それを最大限に引き出すためのコツをまとめます!
Viduのポージング能力まとめ
- 驚異のトレース能力
腕組みなどの基本的なポーズなら、棒人間の画像だけでほぼ完璧に再現可能! - プロンプトとの連携で進化する
画像参照と文字プロンプトを組み合わせることで、複雑なポーズや感情表現も可能になる!
Viduで理想のポーズを創るための黄金ルール!
- ポーズの「核」は棒人間で作る!
思い通りのポージングをさせたいなら、まずは「SETPOSE」のようなツールで棒人間のお手本を作るのが一番の近道。 - 不自然なポーズには「文脈」を添える!
何をしているか分かりにくいポーズは、プロンプトで「綱を引いている」などの状況説明を加えてあげよう。 - ポーズは画像で、感情やアクションは文字で!
「棒人間でポーズを固定し、プロンプトで表情や追加の動きを指示する」という役割分担が、複雑なシーンを創る鍵となる。
Viduの画像参照機能と、棒人間という先人の知恵。この二つを組み合わせることで、私たちはまるで人形師のように、自分のキャラクターを、自分の思い描いた通りに、自由に動かすことができるようになります。
これは、イラストを描くすべての人にとって、まさに革命的なテクニックだと言えるでしょう。
もう、プロンプトだけで理想のポーズが出ずに、何十回もガチャを回す必要はありません。
あなたもぜひ、この「究極の操り人形術」をマスターして、あなたの「うちの子」に、最高の輝きを与えてあげてください!
さて、3回にわたってお届けしてきたVidu徹底検証レポートも、いよいよ佳境です!
次回はどんな実験が待っているのか…? どうぞお楽しみに!
最後まで読んでくれて、ありがとうございました! 妖精アーヤでした!
おまけのおまけ(「なんでやねん」ポーズ参照で生成したアーヤでお別れ)


