はじめに
本が出ました!!!
書籍タイトル
はじめてでもここまでできる Stable Diffusion画像生成[本格]活用ガイド
出版社
技術評論社
発売日
2024/03/23
どうもふしめろです。
久しぶりにブログを書きます。
出版は文字書きとして生きる人たちにとって一つの到達点であると思います。どのような形であれ出版、特に自費出版ではなく商業出版で出るということは自分の書いた文字が誰かに必要とされると言うかけがえのないものでしょう。
この本は同人誌として作成した、AIアートを楽しもう!シリーズの中で一番人気であった、Stable Diffusionの導入からLoRA作成までを取り扱った本をたたき台としています。
コンセプトとしては全くの初心者を中級者まで強引にレベルアップさせて、画像生成AIの醍醐味を味わってもらおうと考えてみました。
雑に言えば、「楽しいゲームがあるから一緒に遊ぼう!さあ取扱説明書はこれだよ」です。
画像生成AIの醍醐味としては4つあると考えています。
一つは画像生成、単純に自分の思うとおりに美しい画像が手に入れられたら楽しいに決まっています。ゲームに例えると、モンスター図鑑を埋める楽しさです。
もう一つはLoRAをはじめとする、追加学習を用いて画像生成モデルを微調整する楽しさです。様々に画像を用意してGPUのファンを唸らせモデルをカイゼンする楽しさは味わうべきです。
これは捕まえたモンスターを育成し、最強のモンスターを作る楽しさに似ています。
次にモデルマージ、画像生成モデル同士を融合させて新しいモデルを作成する作業です。
これはモンスター同士を融合させて新しいモンスターを生み出すシステム似よく似ています。
最後に拡張機能の実装、上の三つに飽き足らずMODを作成するところまで行ってしまった状態です。
書籍などで面白さが伝わるのは上二つ、画像生成の楽しさとLoRA作成のみです。後の二つは自分から沼に足を踏み入れなければ面白さが伝わりにくい領域です。
と言うわけで、同人誌の執筆時には二つのわかりやすい面白さを提案し、中級者として知識が身につけば後は自分の興味のある分野に進むことができるように書き進めました。
同人誌と商業出版の違い
さて、ここまでが同人誌として気をつけた部分です。
とはいえ、同人誌版には三つの大きな課題がありました。
一つは視認性の悪さ
自分の能力的な問題で視認性が悪すぎました。どうしても紙面デザインをうまく作ることができなかったのです。自力では改善のしようが無く、明らかにセンスの問題でした。
よって、出版社にデザインについては本当に見やすくなるように十分配慮してくださいとお願いした結果、紙面デザインのプロである風工舎の川月様にご協力をいただき、非常に見やすいレイアウトに生まれ変わりました。
マジで本当に見やすいです。同人誌版を知っている人がいたら本当に驚きます。本当です。月とすっぽんくらい違います。
これで初心者の方でも安心して取り組むことができます。
もう一つは同人誌版では具体的なLoRAの方法がかけなかったこと
LoRAの事前準備については同人誌版で事細かに説明をしているのですが、実際のLoRA作成については同人誌執筆時点で主流だったポップアップ版と呼ばれる、起動すれば一問一答方式で設定が進められる大変便利なものがありました。
しかし時間経過で古くなり、効率の良い設定が可能なGUI形式が主流になっていったため使用しにくくなってきたのが実情でした。
そこで今回は新しくGUI形式で書き直し、情報量の拡充を図りました。図解でわかりやすく解説することができたため是非ご一読ください。
最後は著作権周りについて
画像生成AI周りの話では著作権についての論争が絶えません。少なくとも商業出版として出版する以上言及することは避けては通れない場所ですし、出版社からの要請もあり、著作権について新しく章をもうける必要がありました。最終的にアーティファクト法律事務所の水口 瑛介氏に筆を取ってもらい、第5章として「画像生成AIと著作権」を設けることができました。
おそらく初心者にとって著作権の話は聞きなじみのないことであり、初心者にとって必要以上に不安が募る部分のはずです。
第5章を読むことで、著作権について必要以上に不安がる必要は無く、むしろ著作権に適切な態度をとることで画像生成AIと付き合っていく指針が得られるはずです。
類書との違い
では、本書は類書と何が違うのでしょうか?
難しい話を全部カットしました
画像生成AI特にStable Diffusionに関連する本ではその仕組み、どのように画像生成AIが学習されて、なぜ画像が生成できるのか?が掲載されています。
本書ではそういった解説は全部カットしました。
なぜならそれは、スマホの操作説明でスマホの内部構造から勉強するようなものです。初心者はスマホの内部構造よりもやりたいことをどう操作すれば実現できるかが知りたいのです。
本書では初心者の脱落しそうな箇所(例えば数式とか出てきたら読むの諦めますよね)を可能な限り削り、楽しそうな部分のみで構成しました。
その結果、非常に初心者に優しい本となり読書感がアップしています。
Google Colaboratoryについての解説はカットしました
Google Colaboratory 通称ClolabはGoogleのクラウドサービスで課金するとGoogleの強力なサーバーを利用し画像生成ができます。
利点としてはGPUを搭載していないPCでも画像生成ができること、1枚数百万もする高価なGPUを比較的安価で利用できることです。
とはいえ問題点もあります。
サーバーの利用時間で課金が必要なこと、使用開始までの手順が複雑、生成した画像がセンシティブであったときの(日本人の好むイラストは海外から児童のイラストに見えるためセンシティブ判定に引っかかりやすい)Googleアカウントの喪失リスクなどを考えると初心者には安易に進められません。
よって、生成AIが動くだけのスペックの高いPCを所有していることを前提とした類書と比べて若干ハードルが高いものとなりました。
ただし、そのハードルをクリアした方は本書を購入していただければ、紹介している画像管理ツールを除いて完全無課金で画像生成AIを楽しみ尽くせることを保証します。
ほかにも様々な差はありますが、大きく紹介するとこの二つが該当します。
もちろんカットした分、その他の部分を増量しています。
プロンプト集の追加、有用な拡張機能の紹介、プロンプト管理ツール、画像整理ツールの紹介を入れて、初心者が躓く些細な部分を石ころ一つにいたりルまで石ころすべてすくい上げるつもりで書き上げました。
初心者フォローアップについては絶対に類書に負けません。と言うか僕の執筆スタイルが初心者が絶対躓く部分を全部拾い上げる書き方です。僕のウリを最大限生かした集大成だと思ってご覧ください。
画像管理ツールEagleとのコラボ
先ほど話に出ていた画像管理ツールですが、名前をEagleと言います。
こちらのソフトは画像生成AI界隈でかなりの人気を持ち、動作が軽快で、買い切り型の永久ライセンスのため一度触ったら無くてはならないものに変貌します。
実際に素晴らしいレビューブログがあるので一度ご覧いただければその力強さがおわかりいただけるかと思います。
本書でも使い方を一部紹介しており、画像選別のノウハウを解説しています。
画像生成を行う上でEagleは無くてはならない最重要ツールであるため非常に感謝しているのです。
出版するに当たりEagleさんとお話をした結果、私の本を購入していただいた方に、20%オフのクーポンを発行していただけることとなりました。
まさかの出来事です。神ツールだと思っていたら運営も神だったなんて信じられません。
Eagleさんから提案された応募方法は下記の通りです。
キャンペーン期限
5月31日
クーポン発行手順
1.購入証明書(レシートやECサイトの請求書スクリーンショット)を用意してください。
2.メールアドレス(team@eagle.cool)宛てにメールを送信してください。
件名は「Eagle クーポン券申請 - Stable Diffusion 画像生成本格活用ガイド」としてください。
3.メール本文に、購入証明書を添付してください。
30日間の無料期間も用意されているので、本書を購入して気に入っていただいた方は是非ご利用ください。
おわりに
私が初めて能動的に文章を書いたのは中学時代でした。それから20年越しに人に恵まれ出版に至たり、本日発売となるのは感慨深い何かを感じます。
ジュンク堂さんや書泉ブックタワーさんなど、コンピューター系に強い書店はもちろん電子書籍でも下記のストアさんで取扱を予定しています。
・Gihyo Digital Publishing
・ヨドバシドットコム
・Amazon Kindle
・楽天ブックス(楽天Kobo)
・honto
・Book Live
・DMM.com
画像生成AIに興味がある方は是非お手にとってください。
SNSやレビューで買ったよ報告していただけると非常にうれしいです。
よろしくお願いします。
書籍タイトル
はじめてでもここまでできる Stable Diffusion画像生成[本格]活用ガイド
出版社
技術評論社
発売日
2024/03/23