こんにちは!
昨年末に初めてインフルエンザに罹ったM氏です。
今猛威を振るっているようなのでみなさんも気を付けてくださいね。
今回は以前からやってみたかったAIネタです。
普段も思考のまとめや検索などでChat GPT等のAIを使っているのですが、今回は画像生成してみようかと目論んでいます。
最近では珍しくなくなっていますが個人的な興味もあるのでトライします。
画像生成用のAIはいくつかあるようですが、メジャーで色々な人が使用方法を説明して下さっている「Stable Diffusion」を今回は採用していきます。
大して詳しくもない私がStable Diffusion説明してもアレなので詳しくはこちらをご覧下さい。
さて、生成AIに使用する機材は出来るだけ高性能なもの、特にGPUの性能がモノを言います。
そこで今回はこちらのMacBook Proを使用します。
M1 Pro搭載、メモリ16GB、SSD1TBなのですが、これでもギリギリのスペックのようです。
まあ動けばいいのでとりあえず作業を進めて行きます。←テキトー
今回はStable Diffusion Web UI(AUTOMATIC1111)を採用してローカル(先程登場したMacBook Pro)に環境を構築していきます。
Stable Diffusion Web UI(AUTOMATIC1111)はWebブラウザを使用してお手軽に画像生成ができる無料のツールです。
色々検索して調べながらライブラリなどのインストールを進めて行きます。
特に詰まるところもなく設定完了!

UIこんな感じです。
さて、ワクワクしながら初期設定のまま画像生成にトライ!
txt2imgボックスに「cat」とだけ入力。
ちなみに設定は以下の通りでした
- Sampling method:DPM++ 2M Karras
- Sampling steps:20
- Width:512
- Height:512
- Batch count:1
- Batch size:1
- CFG Scale:7
- Seed:-1
- Script:None
待つこと30秒ほど・・・

誰、きみ?
なんだろう、思った通りの画像じゃない。
調べてみたところ、色々パラメーターの設定をしないとダメらしい。
やっぱり簡単、といっても簡単に思い通りの画像が生成される訳ではありませんでした。
パラメーターや入力するプロンプトの使い方をネットで検索しながら色々試行錯誤していきます。
これは楽しい!ちゃんとしたネコの画像も生成できるようになりました。



あれこれ夢中になっていると時間が溶けてしまいます。
収集がつかなくなりそうなので、今回は早々に撤退します。
お遊び程度ですが今回画像生成をしてみて感じたことをまとめてみました。
- 思っている画像を生成しようと思うとプロンプトや各パラメーターの使い方をマスターする必要がある。
- 生成画像のサイズやノイズ除去の工程を増やせば増やすだけ生成に掛かる時間が増えるので、本格的にやるなら相応のスペックのマシンを用意する必要がありそう。
- やっぱり絵を描ける人は素敵!
※ちなみに今回使用したMacBook Proで画像生成に掛かった時間は512×512ピクセルで約30秒、1024×1024ピクセルで約3分、2048×2048ピクセルはバックエンドのメモリ不足というエラーが出て生成できませんでした。メモリ不足に関しては設定などで解消するかもしれません。
と、いう訳で今回はこれで終わりたいと思います。
なかなか楽しかったので機会があればまたチャレンジしてみます。
ここでまでご覧いただきありがとうございました。