機能
    リファレンスから動画
    画像から動画
    テキストから動画
    AI効果音
    テンプレート
    料金プラン
    Vidu CPP
    API Platform
    サポート
    ヘルプセンター
    チュートリアル
    ブログ
    言語
    今すぐ試す

    What you imagine is what Vidu.

    今すぐ開始
    リファレンスから動画画像から動画テキストから動画AI効果音Templates
    エンタープライズ向け
    API Platform
    会社
    お問い合わせ先:support@vidu.comCreative Partner Program
    Copyright © 2025 Vidu®
    利用規約プライバシーポリシー
    ホームページ
    ブログ
    Vidu クリエイターインサイト
    今こそ画像生成が熱い!viduリファレンス画像機能を使ってみた vol.1「リアルな写真とアニメキャラを合成」

    今こそ画像生成が熱い!viduリファレンス画像機能を使ってみた vol.1「リアルな写真とアニメキャラを合成」

    こんにちは!妖精アーヤです!

    今、私たちの周りでは、生成AI、特に画像生成AIの世界がとんっでもないスピードで進化していて、毎日がキラキラした驚きに満ちていますよね! アーヤもワクワクが止まりませんっ!

    特に最近、一番ホットで面白いトレンドといえば、なんといっても「リファレンスから画像(reference-to-Image)」機能だと思いませんか? 自分の持っている画像やイラストを「お手本」にして、新しい画像を創り出す…。この技術のおかげで、私たちの創造力はまさに無限大に広がったんです!

    Googleの「nanobanana」や話題の「Seedream v4」など、素晴らしいAIが次々と登場して、SNSのタイムラインは毎日がお祭り騒ぎ。わっしょい!!そんな華やかなAI画像界に、ついに…私の推しAIも参戦!

    そう、動画生成AIの「Vidu」です!デデーン!

    Viduといえば、なんといってもキャラクターの表情の豊かさ、生命感あふれる動きが魅力の動画生成AI。事前に自分のオリジナルキャラクター(うちの子)を登録しておけば、その子がまるで生きているかのように動画の中で動いてくれる…! そんな魔法のような機能で、たくさんのクリエイターの心を鷲掴みにしてきた、愛すべきAIです。

    そんなViduから、待望の「リファレンスから画像生成」機能が新登場したって聞いたら…もう、試さずにはいられませんよね!?

    というわけで、今回はこのViduのピカピカの新機能を使って、私のオリジナルキャラクターである、この「妖精アーヤ」ちゃんを主役に、壮大な実験をしちゃいたいと思います!

    今、SNSで大流行している「リアルな現実世界の風景に、アニメタッチのキャラクターを溶け込ませる」表現。あれって、すごく素敵だと思いませんか? まるで、アニメのキャラクターが私たちの世界に遊びに来てくれたみたいで。今回は、Viduがその夢をどれだけ高いクオリティで叶えてくれるのか、アーヤが体を張って(?)徹底的に検証していきます!

    それでは、Viduが織りなす新たな魔法の世界へ、一緒に出発しましょう!

    第一章:準備編〜私の分身、アーヤちゃんをViduに登録!〜

    さて、壮大な実験を始める前に、一番大切な準備をしなくちゃいけません。それは、Viduに私の分身である「妖精アーヤ」のことを覚えてもらうこと!

    Viduの画像生成機能が他のAIと一線を画す素晴らしい点、それはViduがもともと持っている「キャラクター登録機能」がそのまま使えることなんです。これ、本当に画期的! 普通の画像生成AIだと、同じキャラクターを違うポーズや表情で出そうとするたびに、プロンプト(呪文)を工夫したり、何度も生成し直したり、いわゆる「キャラガチャ」に苦労することが多いんですよね。

    でもViduなら大丈夫! 事前にキャラクターの画像を登録しておくことで、「この子がアーヤちゃんだよ」ってAIにしっかり覚えてもらえるんです。だから、どんなシチュエーションで生成しても、キャラクターの一貫性が、すっごく高く保たれるんです。

    Viduのキャラクター登録では、最大3枚の画像を設定できます。ここでポイントなのが、「正面」「サイドショット(横顔)」「後ろ姿」のように、なるべく違う角度からの画像を登録しておくこと!

    というわけで、私もアーヤのイラストを3枚、心を込めて登録しました。

    さあ、これで準備は万端! いよいよ、アーヤを現実世界に召喚する魔法の実験を開始します!わっしょい!

    第二章:基本の召喚術〜プロンプトなしでどこまでできる?〜

    まずは小手調べ。一番シンプルな方法で、アーヤちゃんが現実世界に馴染めるか試してみましょう!

    ステップ1:呪文は不要!画像だけで奇跡は起きるか?

    最初に試すのは、あえて文字のプロンプト(呪文)を一切入れずに、画像だけで生成してみる、という実験です。

    用意したのは2枚の画像。

    1. リアルでおしゃれなカフェの写真
    2. 登録したキャラクター「妖精アーヤ」

    この2つをViduにポンッと渡して、「さあ、よろしく!」とお願いするだけ。AIは、この2枚の画像から文脈を読み取って、素敵な画像を創りだしてくれるんでしょうか…? ドキドキしながら生成ボタンをクリック!

    そして、出来上がったのがこちらです!

    おおお
    まるで最初からそこにいたみたいに、アーヤがカフェの空間に自然に溶け込んでいるじゃないですか! 

    ただ画像を2枚並べただけなのに、Viduは「このアニメキャラクターを、このリアルな風景の中に、自然な形で登場させてほしいんだな」っていう私の意図を、完璧に理解してくれたんです。AIの解釈力、恐るべし…! テンションあがるぅ

    ステップ2:魔法の呪文(プロンプト)で意思を伝えよう!

    画像だけでも素晴らしい結果が出ましたが、ここからがプロンプトの腕の見せ所。もっと具体的なシチュエーションを創り出していきましょう!

    今度は、文字のプロンプトで「妖精がカフェでお茶をしている」という、シンプルな指示を加えてみました。さあ、どうなるかな?

    アーヤの手に、ちゃんと飲み物の入ったカップが握られています! プロンプトを正確に読み取って、イラストに小物を追加してくれました。賢い!

    でも、ちょっとだけ欲を言えば、カップを持ったまま立ってるのは少し不自然かな…? やっぱりカフェに来たからには、椅子に座ってくつろいでほしいですよね。

    そこで、さらにプロンプトを具体的にします。
    「妖精がカフェの椅子に座ってお茶をしている」
    これでどうだ!

    成功です!ちゃんとカフェの椅子にちょこんと腰かけて、リラックスしている様子が伝わってきます。プロンプトを少し具体的にするだけで、AIの理解度がグンと上がって、私たちのイメージに近い画像を創り出してくれる。この対話するような感覚が、画像生成の醍醐味ですよね!

    第三章:応用編その1〜アイテムを追加してみよう!魅惑のケーキ登場〜

    カフェでお茶ができたら、次に欲しくなるもの…それはもちろん、甘くて美味しいケーキですよね! むふふ。というわけで、今度はアーヤにケーキを食べてもらう実験に挑戦です!

    ステップ1:画像だけで挑戦!「アーヤ+カフェ+ケーキ」

    まずは基本に立ち返って、プロンプトなしの画像参照だけでやってみましょう。
    用意したのは、

    1. リアルなカフェの写真
    2. 登録したキャラクター「妖精アーヤ」
    3. とっても美味しそうなリアルな苺のショートケーキの写真

    この3つの画像を並べて、Viduにお願いしてみました。さあ、ViduはAIの読心術で、私たちの願いを叶えてくれるでしょうか?

    きゃー!
    プロンプトで何も指示していないのに、Viduは「この子は、このカフェで、このケーキを食べたいんだな」って理解してくれたみたいです! アーヤが嬉しそうにケーキを持っている画像が生成されました。もう、Viduとは心で会話できる親友になれそうな気分ですわい。ほほほ

    ステップ2:「ケーキを食べている」呪文で、至福のひとときを

    画像だけでも十分すごいですが、やっぱり「食べている」というアクションを加えて、もっと幸せそうな一枚を創りたい!

    そこで、「妖精がカフェでケーキを食べている」というプロンプトを追加。
    すると…!

    あ、頼んでないのにお水も用意してくれてる!これで甘いケーキもしっかり流し込めるってわけね?気遣いばっちりねVidu(笑)

    第四章:応用編その2〜アングルを変えてみよう!秘密の後ろ姿〜

    さて、正面や斜めからのアングルは完璧にこなしてくれることが分かりました。でも、キャラクターの一貫性を保ったまま、難しいアングルを描くことはできるんでしょうか?

    ここで挑戦するのが「後ろ姿」です。
    これ、実は画像生成AIにとってちょっくら難易度の高いお題なんです。キャラクターの背中側のデザインを、正面からの情報だけで正確に描くのは至難の業。でも、Viduなら…?

    思い出してください。準備編で私が言っていた「伏線」を。そう、キャラクター登録の時に「後ろ姿」の画像を入れておいたこと、ここでその真価が問われます!

    プロンプトはこうです。
    「妖精がカフェでケーキを食べている、後ろ姿」

    さあ、奇跡は起きるのか…!

    完璧! 完璧な後ろ姿!
    私が登録した通りの、アーヤの背中のデザイン、髪型、服装…そのすべてが、寸分の狂いもなく再現されています。これは、キャラクター登録機能がいかに強力で、Viduがその情報をいかに忠実に守ってくれるかの証明です!

    これなら、漫画やイラストの資料として、いろんなアングルの「うちの子」をViduに描いてもらう、なんて使い方もできちゃいますね。

    第五章:世界観チェンジ!〜ファンタジーな出会いをプロデュース〜

    リアルなカフェでの実験は大成功でした!
    でも、私は妖精アーヤ。もっとファンタジックで、夢のあるシチュエーションも試してみたい!

    というわけで、今度は背景のカフェ画像は使わずに、アーヤとケーキだけで、どんな世界が創れるか試してみましょう。

    プロンプトは、「とても小さな妖精が、大きなピンクのケーキに抱きついている」。
    妖精と大きなケーキ…考えただけでも可愛い組み合わせですよね!

    わぁ…! きゃわわ♡
    メルヘンで、とっても可愛い世界観が生まれました。プロンプト通りのサイズ感で、アーヤが一生懸命ケーキに抱きついているのが健気じゃないか!

    さて、このファンタジーな世界に、新しいお友達を呼んでみましょう。
    ファンタジーといえば…そう、猫ちゃんです!

    プロンプトに、「…アーヤを黒猫が羨ましそうに見ている」という一文を追加してみました。

    にゃーん!可愛い黒猫ちゃんが登場しました!
    アーヤがケーキに夢中になっているのを、「いいなぁ…」って顔で見つめているのが伝わってきますね。

    ここで注目したいのが、黒猫ちゃんが「アニメタッチ」で描かれていること。これはおそらく、Viduが参照元のキャラクターであるアーヤの画風に合わせて、追加するキャラクターのスタイルも調整してくれたんじゃないかな、とアーヤは推測しています。この気遣い、AIなのにまるで心があるみたいですごいですよね!

    第六章:禁断の魔法?〜スタイルの融合に挑戦!アニメキャラとリアルな動物〜

    アニメタッチの猫ちゃんも可愛いけど、Viduの実力はこんなものじゃないはず。
    私が本当に見たかったのは、SNSで話題の、あの表現。

    「アニメタッチのキャラクター」と、「リアルな写真のような存在」が、同じ一枚の絵の中に共存するという、異次元の融合です。

    これは、Viduにとってかなり高度な要求のはず。でも、挑戦する価値はあります!
    プロンプトをこう変更しました。
    「大きなピンクのケーキに抱きついている、とても小さなアーヤを、リアルで、巨大な黒猫が羨ましそうに見ている」

    「リアルで」という魔法の言葉を追加しました。さあ、Vidu、私のお願いを聞いてくれる…?

    おお!アーヤは紛れもなくいつもの可愛いアニメタッチのまま。それなのに、すぐ隣にいる黒猫ちゃんは、まるで本物の写真のような、リアルなタッチで描かれています!一つの画像の中に、全く異なる二つのスタイルが、違和感なく共存していますね~!

    第七章:限界への挑戦〜サイズ感の極限を探る!妖精vs超巨大生物〜

    スタイルの融合という大きな壁を乗り越えた今、次なる挑戦は「サイズ感」です。
    小さな妖精と、巨大な生き物。その圧倒的なスケール感を、Viduはどこまで表現できるのでしょうか? ここからは、試行錯誤の連続です!

    試行錯誤その1:「巨大」から「超巨大」へ

    先ほどのプロンプトでは猫を「巨大」としましたが、もっともっと大きくしたい!
    そこで安直に「超巨大」というプロンプトに打ち替えてみました。

    うーん…! 気持ち、少しだけ大きくなったような気もしますが、正直、パッと見では違いが分かりにくいかも…。

    ここで一つの仮説が浮かびました。もしかして、「妖精」と「猫」という組み合わせ自体が、元のサイズのイメージが人によって違うから、比較対象として分かりにくいのかな?と。

    試行錯誤その2:比較対象を「恐竜」に変更!

    もっと誰が見ても「大きい!」と分かるもの…。
    そうだ、「恐竜」だ!
    妖精と恐竜なら、大きさの違いは一目瞭然のはず!

    プロンプト:「大きなピンクのケーキに抱きついているとても小さなアーヤを、リアルで超巨大な恐竜が羨ましそうに見ている」

    恐竜は出てきてくれたけど…あれ? 正直、期待したほどの「超巨大」感は伝わってこないかも…。
    どうすれば、この絶望的なサイズ差を表現できるんだろう…。

    試行錯誤その3:魔法の呪文「具体的な数値」

    ここで、私は一つのブレイクスルーを思いつきます。
    曖昧な「大きい」という言葉じゃなくて、具体的な数値で大きさを指定したらどうなるんだろう?

    プロンプト:「…リアルで100mの超巨大な恐竜が…」

    「100m」という、ビルに匹敵するサイズを指定してみました。すると…!

    見てください! 明らかに大きくなりました!
    「100m」という数値を指定したことで、AIが「これは相当大きいから、遠近法を使って表現しないと収まらないな」と判断してくれたみたいです。恐竜が少し遠くに配置され、その分、巨大さが際立つ構図になりました。これは大きな発見です!

    試行錯誤その4:さらなる巨大化と失敗談

    もっとだ!もっと大きくしたい!
    「100m」よりも、もっと分かりやすい比較対象はないかな…? そうだ!

    プロンプト:「…リアルで東京タワーくらい大きい超巨大な恐竜が…」

    あちゃー! やっちゃいました!
    「東京タワー」というあまりに強力なワードに、AIが引っ張られてしまったみたいで、なんと恐竜と一緒に妖精アーヤまで巨大化してしまいました(笑)。これはこれで面白い絵だけど、実験としては失敗ですね。

    試行錯誤その5:両方に数値を指定する合わせ技

    失敗から学びます。恐竜だけじゃなく、アーヤの方も数値で小ささを指定すれば、相対的なサイズ感が伝わるはず!

    プロンプト:「10cmのとても小さな妖精アーヤを、リアルで東京タワーくらい大きい超巨大な恐竜が…」

    うーん、惜しい! 今度は「東京タワー」という固有名詞が、比較対象としてだけではなく、背景そのものとして画像に反映されてしまいました。AIのプロンプト解釈の癖が垣間見えて、これはこれで興味深い結果です。

    比較対象は書かずに、シンプルに数値だけで勝負してみましょう。
    プロンプト:「10cmのとても小さな妖精と100mの超巨大な恐竜」

    …うーん、今度は背景が真っ白になってしまいました。情報が少なすぎたみたい。
    よし、最終調整です! 場所も指定して、もっと自然なシチュエーションにしましょう!

    プロンプト:「サファリパークで、10cmの妖精と100mの恐竜」

    さらに、妖精の小ささを際立たせるために、思い切ってこうしてみました。

    プロンプト:「サファリパークで、1cmの妖精と100mの恐竜が…」

    ここまで試行錯誤を重ねて、それなりに巨大感を表現できるようになりました!

    ただ、正直なところを言うと、画像上では「10cm」と「1cm」の差は、あまり明確には伝わらなかった、というのが今回の結論です。AIにとって、現段階ではミリ単位の微細なサイズ表現や、天と地ほど離れた極端なスケール感の表現は、まだ少し難しい課題なのかもしれませんね。でも、この試行錯誤の過程自体が、AIとの対話みたいで楽しかったです!

    第八章:日常への帰還〜リアルな空間での自然な振る舞いを探る〜

    さて、ファンタジーな巨大生物との遭遇から、今度は私たちの日常空間に戻ってきましょう。
    舞台は「リビングのソファ」。より身近な空間で、アーヤがどれだけ自然に振る舞えるか、ポーズの実験をしてみたいと思います!

    まずは基本形から。
    プロンプト:「アーヤが大きなピンクのケーキをソファーで美味しそうに食べている」

    ソファの質感、部屋の窓から差し込む光、そしてその光を受けてアーヤの体に落ちる影。すべてが完璧に計算されていて、本当にこのリビングにアーヤがいるみたいです。Viduの優れた空間認識能力を感じますね。

    さて、ここからはいろんなポーズに挑戦です!

    • 「ソファに寝転んで美味しそうにケーキを食べている」
      →うーん、ちょっとお行儀が悪かったからか、AIが戸惑ってしまったようで、あまり上手くいきませんでした。
    • 「あぐらをかいて美味しそうに食べている」
      →これも惜しい!「あぐら」というポーズが少し伝わりづらかったのか、ちょっと不自然な座り方になってしまいました。
    • 「正座をして美味しそうに食べている」
      →これも上手くいきません。考えてみれば、フカフカのソファの上で「正座」をするって、あまり自然な状況ではないですよね。
    • 「体育座りをして美味しそうに食べている」
      →これも同様に、ソファの上でするポーズとしては不自然だったためか、うまく反映されませんでした。

    この一連のポーズ実験から、とても大切なことが分かりました。
    それは、「その背景や状況において、不自然なプロンプトを指示すると、AIはうまく表現することが難しい」ということです。逆に言えば、その場所に馴染むような「自然な振る舞い」をプロンプトで指示してあげることが、クオリティの高い画像を生成するための重要なコツなんですね! AIに無茶をさせるのではなく、AIが理解しやすいように、私たちが歩み寄ってあげることが大切なんだな、と学びました。

    結論:Viduの「リファレンスから画像生成」はおもしろい!

    さて、ここまで本当にたくさんの実験をしてきました。
    今回の検証で分かった、Viduの「リファレンスから画像生成」機能のすごいところと、使いこなすためのコツをまとめてみたいと思います!

    Viduのここがすごい!

    1. キャラクターの一貫性!
      キャラクター登録機能のおかげで、何度生成しても「うちの子」が別人になる心配がありません。後ろ姿まで完璧に再現してくれました!
    2. 異なるスタイルの奇跡的な融合!
      「アニメキャラ」と「リアルな動物」を、一枚の絵の中で違和感なく共存させる表現力。
    3. 高いプロンプト解釈力と自然な表現!
      基本的な指示なら的確に汲み取り、光や影を背景に合わせて自動で調整してくれる賢さ。まるでAIと会話しながら作品を創っているような感覚を味わえます。

    Viduを使いこなすためのコツ!

    1. サイズ感を操るには「具体的な数値」を!
      「大きい」「小さい」といった曖昧な言葉より、「10m」「5cm」のような具体的な数値を入れると、AIがスケール感を理解しやすくなります。
    2. AIには「自然な振る舞い」を教えてあげよう!
      その場所や状況に合った、自然なポーズや行動を指示することで、生成される画像のクオリティは格段にアップします。

    これからViduが、得意の動画機能とこの画像機能をどう連携させていくのか、考えるだけでワクワクが止まりません。あなたもぜひ、Viduであなただけのキャラクターを登録して、新しい世界の扉を開いてみてください!

    それでは、今日の実験レポートはここまで~
    最後まで読んでくれて、ありがとうございました! また次の記事でお会いしましょう。妖精アーヤでした!

    妖精アーヤ
    By 妖精アーヤ
    デザイン・アートディレクター歴10年以上フリーランスです。数々のAI動画で受賞経験有り。ViduをはじめとするAI動画生成を使い、企業のクライアントワークの動画を作成したりAI動画コンテストに参加しています。
    blogFixedRight
    Vidu
    最先端のAI動画生成ツール。数秒で高品質な映像を作成。
    今すぐ作成
    blogFixedRight
    Vidu
    最先端のAI動画生成ツール。数秒で高品質な映像を作成。
    今すぐ作成
    今すぐ作成
    Top