画像・動画生成AI ComfyUI マスターガイド¶
この1冊でComfyUIを使いこなせるようになる! 圧倒的な情報量でお届けする『マスターガイド』登場
ComfyUIを使って各種生成AIモデルを利用して画像/動画を生成する方法を解説します。はじめて画像/動画生成AIを使う人も、ComfyUI環境への移行を考えている人にも画像/動画生成の基礎知識から丁寧に解説し、知識を身に付けて本格的な画像/動画生成を体験しましょう。
書籍情報¶
- 画像・動画生成AI ComfyUI マスターガイド
- 著者:AICU Japan 株式会社 (著), 白井 暁彦 (著), 早野 康寛 (著)
- 出版社:SBクリエイティブ
- 発売日:2025年5月9日
- ISBN:978-4-8156-2875-8
- サイズ:B5判
- ページ数:304
出版社公式はこちら
https://www.sbcr.jp/product/4815628758/
目次¶
- はじめに
- Chapter1 画像生成AIの基礎知識
- Chapter2 Stable Diffusionの基礎知識
- Chapter 3 ComfyUIの導入と環境構築
- Chapter 4 ComfyUIの基本操作と画像生成
- Chapter 5 カスタムノードの活用と拡張機能の導入
- Chapter 6 img2img・Inpaint・Outpaintの実践テクニック
- Chapter 7 ControlNetとIPAdapterによる画像制御
- Chapter 8 LoRAを使ったスタイル適用とモデル拡張
- Chapter 9 AnimateDiffによる動画生成
- Chapter10 画像生成AIの実践活用例
はじめに¶
本書「画像生成AI ComfyUI マスターガイド」を手に取っていただき、ありがとうございます! この書籍は、世界の画像生成AIのスタンダードになりつつある「ComfyUI」の基本的な使い方をゼロから学べるガイドです。 Stability AIが2022年8月にオープンソースとして公開した「Stable Diffusion」は、誰でも無償でダウンロードして自分のコンピューター環境で利用できるため、世界中でムーブメントを巻き起こしました。前作「画像生成AI Stable Diffusionスタートガイド」(以下「SD黄色本」)で中心的に紹介した「AUTOMATIC1111」をはじめ、世界中の開発者が文字通り「ありとあらゆる画像」を生成できる技術を作り出し、ホビーや商用など多様なAIクリエイターやAIサービスを生み出しました。
一方では、この複雑になった画像生成AIの全体像を学びたい人や、画像生成のみならず動画生成、商用利用、業務活用を考えている人にとっては、整理された情報にアクセスすることが難しくなったとも言えます。
本書は、Stability AIやAWS、GoogleやOpenAIといった企業と連携しながら「つくる人をつくる」をビジョンに活動するAICUのクリエイター陣が、前作「SD黄色本」の発売後の社会の反応、企業やクリエイターコミュニティ、研究教育機関などのフィードバックを通して、目まぐるしく変わる生成AIの社会実装の動きや、今後の画像生成AI分野の文化的・商業的な価値を意識し、より手軽かつ法律や権利、クリエイター文化に配慮したツール化を並行しつつ、今後の基盤となるような知識・常識をオープンに共有し、読者がよりプロフェッショナルな人材へと昇華していくこと意識して長い期間をかけて動的に製作してきました。
前作「SD黄色本」をお持ちの方も、そうでない方も、「Stable Diffusion」だけでなく、最新のモデルやAPI、アプリ開発といった分野でその関連技術を使いこなすための基本・応用の両面でテクニックを解説しています。また生成する画像も、実写風、商業写真や動画など、デジタルイラストレーションや漫画製作だけでなく、業務用サービスやアプリ開発、チャットボットといった分野にAI技術を活用できるよう、応用分野も習得できるように設計されています。
本書は、映像製作やグラフィックデザインといったプロフェッショナルの産業で活躍する読者に向けて執筆していますが、中学生や高校生など、これから本分野を専門的に学びたい方や、「美しい画像を生成したい」「老後の趣味にしたい」といった純粋な美的・知的探究心を持つホビーストにも適した内容となっています。 週末にAIを楽しむ「週末AI作家」の皆さんにも読みやすく、刺激的な内容を提供しています。 また、ビジネスパーソンにとっては、世界観を伝えるプレゼンテーションのキービジュアルの生成、社員や上司、経営者に向けたメッセージ性のあるイラスト表現、オリジナルキャラクターを活用した漫画の制作やコンセプトアート、サービス開発など、多彩な活用方法が広がっていますし、運に頼らず制御性高くグラフィックスを作る方法を学ぶことは、長期に渡って価値を持つでしょう クリエイティブAI分野の研究を深めたい初学者、中級者、研究者や教育者にとっては、ベースになる技術やツールをオープンに開発・整備するための「ラボメン必携のバイブル」なるかもしれません。
本書を読み終えたとき、あなたは生成AI時代に「つくる人をつくる」、つまり「先生」と呼べるレベルになっているはずです。
一緒に画像生成や動画生成AIについて体系的に学び、「ComfyUI」の「マスター」と呼ばれるレベルに旅立ちましょう!
本書のポリシー¶
本書を開発しているAICU magazine編集部は、AICU Inc.(米国)とAICU Japan株式会社(以下AICU)と、ポノテク株式会社によって構成される「つくる人をつくる(Creating people who create)」をビジョンに活動するAIクリエイターユニオンです。AICUは世界中でAI技術やメタバースなどプロフェッショナル分野向けにAI技術の導入や活用テクニックを開発し、ワークショップやブログ、読み物メディアや動画メディアなどを通じて、その経験を広く共有しています。
本書はStable Diffusion、特に画像生成モデルとして「Stable Diffusion 1.5 (SD1.5)」、「Stable Diffusion XL (SDXL)」、「Stable Diffusion 3 (SD3)」世代以降の技術、動画生成技術のツールおよびインタフェースとして「ComfyUI」を用いた写実的な画像製作を中心に解説しています。本書は画像生成AIの基本的な知識やスキル、表現技術を習得し、ホビー目的に限らず、産業応用や、アプリ開発にも触れることで、プロフェッショナルが長く活用できることを目指しています。
そのため、本書ではGPU搭載PC環境の他に、Google Colaboratory (Colab)を中心としたクラウドGPU環境、入門者やカジュアルなユーザーにとっても活用しやすい標準的な環境とAICUが提供する「共有ComfyUI」を用いて解説を行います。
基本的に本書が提供するサンプルはAICUが開発・翻訳・メンテナンスしており、その著作権はそれぞれ保留され、ライセンスに明記されています。商用目的での使用に関しては、その品質や実装方法に保証はありません。生命、身体、経済など直接・関節の損害を含む一切の不利益には著者や出版社は応じる義務がないことを明記します。
本書の情報は2025年4月時点をベースに更新しながら執筆しています。また、著作権や関連法令に関しては、日本の文化庁資料「AIと著作権」および文部科学省ガイドラインを基準にしており、画像生成AIを使用するクリエイターが遵守すべき法令や「他者に迷惑をかけない」といった倫理面、リスク管理、説明責任についても「生成AIクリエイター仕草(v.2025)」および、コラムや解説の形で取り上げています。
本書の内容について、AICUは出版社とともに、誠心誠意、内容の正確性維持や動作確認を行っていますが、読者への説明や紙面の都合上、表現の制約、将来の改変、外部環境の変化に対しての保証はできません。不具合が発生した際には、日本語のコミュニティサービス「AICU.jp」および AICU media の note (note.com/aicu)、また本書のポータルサイト(https://comfy.aicu.ai) にて随時更新を行う予定です。
AICUが提供する「AICU.jp」コミュニティ機能、ブログへのコメント、Discordサーバー、X@AICUai、YouTube@AICUai といったさまざまなメディアコミュニケーションを通して、サポートを行い、日本のComfyUIコミュニティの醸成を助力しています。ぜひ積極的にご参加いただき、フィードバックをお寄せいただけますと幸いです。 本書のサンプルはオープンソースであり、本書での解説内容を大幅に逸脱しない改善、品質維持、プルリクエストなどは歓迎です。 AICUは「AIクリエイターユニオン」であり、本書をハブにした技術基盤の向上、世界のComfyUIコミュニティでのプレゼンス向上、ひいてはComfyUIのプロフェッショナルによる「AI技術による新しい職業の創出」に寄与できましたら幸いです。
生成AIクリエイター仕草(v.2025)¶
「仕草」とは、ある物事をするときの動作や態度。やり方であり、「かわいらしい仕草」といった意識/無意識関係がない動作であったり、俳優の動作、所作といった演技や世間からのしうちについても含まれる言葉です。
AICUでは、生成AI時代の「つくる人をつくる」というビジョンで世界各国で生成AIクリエイティブのためのラーニングメディアを開発していますが、特に「責任」、「モラル」や「エチック」という言葉を倫理観だけでなく、表現者としての人格を認識し、アップデートしていく「仕草」(Code of Conduct/行動規範)として機会あるごとに定めています。生成AI時代のクリエイターが「すべきでないこと」・「すべきこと」を倫理や法律に従い、わかりやすさを伴いながら、考え方を柔軟にアップデートしています。
目的:生成AIクリエイターは、自己の人間性の探究、社会との対話のために、生成AI技術を使います。
すべきでないこと:他者の迷惑になること。 ディープフェイクの生成や肖像の無断使用など、無責任に他者の迷惑や混乱を招く行為を行わない。 技術や法律上の可否とマナーやモラル、過去の常識やリスクや感情を混ぜて混乱させない。 技術や道具、スキルは「使わないこと」も選択であり、表現者に自由は委ねられています。技術があるからといって他者のクリエイティブや手法を批判することも、その手法を強要することも、推奨される行為ではありません。 人間のクリエイティブ行為の本質の侵害。「生成AIだから自動でできる」とか、「AIだから安い」とか、「無償で作れるとか」、「楽して儲かる」といった世間を誤解させるような行為も、真剣にこの技術を探求する側にとっては迷惑な行いになります。
すべきこと:楽しむこと。作品を作る情熱を持ち続けること。AI for Good。 わからないことは自分で調べて、共有し、コミュニティや Issue で共有しましょう。「再現性のある方法」と、「そうではない方法」を見極め、正しい方法を人々に伝えていく行為が推奨されます。 あいさつ、返事、お礼、質問を具体化、質問時は「わからない」と頼るだけでなく詳細な情報、進行具合を報告するなど誠意、他者に対するリスペクトや理解する姿勢、「ぬくもりティ」を持つこと。 オープンソースコミュニティの開発者には敬意をもって接すること。彼らは常に悩み、苦しみながらも、限られた時間の中で人々にとって便利な技術をオープンに公開、メンテナンスしています。 AI for Good: 障害者や生きづらさを抱える人々を想像すること。生成AIは経済的な効率だけでなく、身体の障害や精神、知的、発達、パーソナリティやコミュニケーションなど、まだ名前がついていない「生きづらさを持つ人々」にとって、重要な価値や表現能力を補完するアシスト技術でもあります。この技術をより多くの人々に伝えて、誰でもアクセスできるようにしていくことと同時に、「つくる人」がどのようにして、生きた証としての作品を認め、作り続けていけるのかが、人間と人工知能の関係、ひいては人々の社会の「良識」としてインテリジェンスを積み上げていけるかどうかの鍵となります。
ビジネスにおいても同様です。リスペクトや倫理観、法的遵守を大切に、お互いを尊重したコミュニティ構築を行っていきましょう。
おわりに¶
本書は”SD黄色本”「画像生成AI Stable Diffusionスタートガイド」の続編として、「クリエイティブなAIの使い方」という果てのない探求と、「マスターガイド」という、よりプロフェッショナルで懸命な読者を対象に「確実なスキルを得ること」を目的とした内容になっています。
そのため、Stable Diffusionの技術的な解説はSD黄色本との重複を可能な限り減らし、ニューラルネットワークや潜在拡散モデルとは何か、その研究の歴史や「なぜ文字から画像を生成できるのか」といった内部解説、CLIP、UNet、サンプラーやControlNetの内部については割愛しています。使い手として適切な技術を選択し「一言で説明できるレベル」に到達していれば十分ですが、まだまだ物足りないという読者はSD黄色本を再読するか、また新たな新刊の執筆にご参加いただければ幸いです。
本書の読者は、今後より当たり前になっていく動画生成AIの技術進化に対して、2022〜2025年の技術進化の過程をご自身の手で目の当たりにしたはずです。ComfyUIと本書は「本来5年はかかる」と言われていた技術革新の収斂をオープンソースとノードベースで描いた地図であり、今後、新しい技術が登場したときに「これは何か?」「表現に役立つのか?制御できるのか?」を考え、本書を片手に説明できるようになるはずです。本書が、単なる一過性のハウツーではなく、生成AI時代の常識として広く浸透する一助となれば幸いです。
最先端AI技術によって常識が日々更新されるなか、驚くだけではなく、実際に行動することが求められています。 AICUで扱う生成AIクリエイティブ活動に関する情報は世界的な大企業、ビッグテックが生み出す技術に押し潰されるだけでなく、個人の枠を超え、技術的な研究開発にとどまらず、ビジュアルやクリエイティブの分野を皮切りに、人々に「技術よりもクリエイティブな人間の方が大切だ」という当たり前のことを発信し続けています。
「生成AI時代に、つくる人をつくる」この理念が花開き、世界中で実を結びつつあります。
創作活動を通じて、多くの人たちの笑顔や感動に出会えることは、大きな喜びです。 AICUでは、今後も本書や関連技術を使って、イラストレーションや画像、動画生成だけでなく、映画、アニメ、ゲーム、広告、放送、キャラクターIP展開、教育、アートやプログラミング教室、障害者・高齢者の社会参加、コンテスト運営や、言語・文化を超えたクリエイティブな分野において「生成AI時代につくる人をつくる」という理念に共感する人々を認定する事業展開していきます。
いつか、皆さんと一緒に仕事ができる日を楽しみにしています。 https://corp.aicu.ai/
謝辞: 本書の執筆にあたりお世話になった方々¶
Comfy Org の皆様
AWS Japan の皆様 Ryota Oikawa, Taiki Maekawa, Minoru Mukai
Stability AI Ltd の皆様
デジタルハリウッド大学 杉山知之 池谷和浩 事務局の皆様 クリエイティブAIラボ(CAIL)
AICU協力クリエイターのみなさま
BlendAI 小宮自由 Shio デルタもん ガンマミィ ベータミーナ 犬澤某 はねごろう martina. 殻尾(からびー)
レビューにご参加いただいた皆様 Lucas.whitewell ないとっち(内藤孝洋) 森 徹郎
AICU Inc. 徳田浩司 Naru インターンの皆様 AICU Japan Hikonyan
美麗な表紙、装丁を制作いただいた皆様 短い時間でDTP、校正にお付き合いいただいた皆様
家族。傘寿米寿を超えて健康な両親。息子たち。いつも徹夜を見守ってきた妻・久美子。 SBパブリッシングのみなさま
すべてのグラフィックスに関わる研究者、開発者、アーティスト、 そして、すべての美と芸と技と表現を愛する人たちへ。 感謝と共に。
著者 早野康寛(Yas) 白井暁彦