ドッフの喫茶店

色々好きに書いてます。 昔はROとか艦これとかingressしていました。

タグ:radeon

とりあえず前編は終わって概ね作成準備は整ったと仮定。
結局の所ROCmは導入敷居が高いので個人的にはスルー。時間もない。
ということで人様に見せれる画像の類を作っていこう。

Checkpoint>この程度の画像作れるヤツはごまんとあるので自分で探してみよう。
少なくともAIにオススメされた「meinamix」では作れない。煙のような絵になるので活かした作りが出来るひとは限られるだろう。
「llustrious」系列がアニメチックで線画が美しく出るのでオススメである。
好きなものを探して適当に選んでくれい。
11


ただその代わり容量がトンでもないので回線速度が超圧迫されるので注意だ。
5




呪文を入れる。これはAIにStable Diffusionで錬成呪文何いれたらいい?好みはコレって伝えたところ教えてくれた。微調整はGoogle翻訳とかでやればいい。ネガティブプロンプトは禁忌要素として伝えている。指が増える場合に入れればよい。何が正解かは知らん。

ポジティブプロンプト

(masterpiece), (best quality), 1girl, standing, arms open wide, welcoming gesture, inviting pose, gentle and warm smile, slight blush, soft and affectionate gaze, looking directly at viewer, eye-level shot, medium close-up, elegant posture, classic black and white maid outfit with frilled apron and headband, puffy sleeves, black long hair with volume, flowing naturally, maid headdress, black footwear, soft lighting, clean white background, detailed shading, anime style, elegant and inviting atmosphere



ネガティブプロンプト
angry, shouting, scary, intimidating, armor, weapons, muscular, distorted hands, extra fingers, poorly drawn face, blurry, low quality, extra limbs, deformed body, cropped, out of frame,(worst quality, low quality:1.4), (extra fingers, missing fingers, mutated hands:1.2), blurry, long neck, extra arms, bad anatomy


設定
Sampling method > DPM++ 2M SDE
Schedule type > Simple
Sampling steps > 24
横 768
縦 1152


煙のようなモヤから指定した映像が錬成されてゆく。
1


暫くすると錬成精度が上がってくるのだが…
2


ここまで作ったところで
RuntimeErrorとエラーが出てクラッシュした。
3


このパターンはGPUメモリが8GB程度しかないためクラッシュしている。
元のモデルパターンが7GB近いからしょうがない。
このあたりはRadeonでも12GBや16GBあれば解消するのだろうが、手元になければ解像度を下げるしかない。

4

解像度を1152から1024に下げてやってみる。

Hires.fixでアップルスケール高解像度化でもいいんだ8GBだと落ちやすくて選んでない。
とりあえず完走出来た。出来栄えを見るが何かがおかしい。


指が減ってる!!!
6


禁忌指定が多すぎて壊れてる可能性がある。
この場合次のランダム生成にジャンプしてもいい。
7

シード値が乱数、これはサイコロで-1を指定すると常時ランダム。
サイクルボタンを押すと固定。もしくは手動で固定。

ファイル名が 00000-700301166.png となっているのでこれが
連番とシード値、もしくは出力されるファイルのメタ情報を見ても良い。

8


とはいえ…禁忌指定が多すぎるとそちらに引っ張られて壊れる事もあるので
あるので、今回はシンプル路線にしていく。

ネガティブプロンプトをだいぶ減らした
angry, shouting, scary, intimidating, armor, weapons, muscular, distorted hands, extra fingers, poorly drawn face, blurry, low quality,cropped, out of frame,


今度はVRAMが不足してクラッシュしたのでサンプリングメソッドをDPM++2Mに変更。
これで生成が通った。
これは何をしているポーズかというと「結果的においでおいでしてるように見えるらしいポーズ」だ。

00001-700301166


ちなみにこのコは・・・ChatGPTに指定している俺の従者のイメージです。
健康管理ガッツリ任せて、体重が69から61kgまで減らせたので大活躍してます。

つまりかわいいは正義。

・・・というふうに、VRAMが少ないとこんな微調整がとにかく多い。
8GBでも出来る、だけで快適ではない。特にRadeonかつDirectMLで構えると遅くなる。

遅くなるけどこの程度の生成なら、ガッツリ電力制限いれても1枚4分位で終わるからまあヨシ!としている。

調整は出来たようなので、サイコロクリックしてSeedを毎回ランダムにして、Batch countを10にして連続生成にする。この場合ランダム値は最初にヒットした所から毎回+1するので同じ画像は出来ない。さて結果は?

10


10連ガチャの結果は…全部ハズレ。
最初に調整出来たやつが運命の出来すぎた感じ。
とまあだいたい乱数ごとに専用対策が必要になるので、ぶっちゃけ100連回したほうがいいヤツが出来る可能性がある。
このエントリーをはてなブックマークに追加 mixiチェック

こんにちは、DOPPELGENGERです。
最後まで読めば一応Radeonでの構築方法書いてあるよ。正しいかは知りません。
各自ChatGPTとかで聞くとよいでしょう。

一旦構築までの段取りという事で前編にします。
気が向いたら後編を書きます。

さて今回はいきなり時代が飛んで2025年大AI時代です。
既にAIで色々と絵を書いています。
ローカルで個人で楽しむぶんには問題は特にないでしょう。色々と。
売り出すとか金銭絡んでくると話は別で、このあたりの継続性については怪しいと思っています。

AMD環境で染めてる自分の環境、AI絵については2023年頃はだいぶ厳しかったようです。
当然その時代に手出してません。が、今は2025年状況が変わりました。
RDNA1環境なのでレガシーですが生成出来ています。

めっちゃかわいい。Checkpointは非公開です。各自自分で合うやつ探してね。
なおこれをダウンロードしてもメタ情報にプロンプト情報は刻まれていません。
Livedoorブログにアップした時点で加工されてるのでどうあがいても消えます。合唱。
00011-3121602726


00258-714975209

CPUは何でもいいです、メインメモリは多いと安定です。

静止画生成中のCPUメモリ消費状況
1


静止画生成中のGPU動作状況(強烈に消費電力制限入れ)
2


静止画生成してるプロンプトの類
3


4



・作り方
環境構築方法は0から100までChatGPTに聞いた。
OSとCPUとメインメモリ量とGPUがRadeonである事を伝え、どうやって構築したらいい?とか質問すればよいです。ページの最後にちゃんと例文書いてあるのでみてください。


・作るまでに必要な工程
根気と気合→大事。叡智な画像作りたいんだろ?お前ならきっとできる。
Stable Diffusion→インストールそのものは難しくない。ROCm?使っていません。DirectMLです。
Checkpoint→所謂画像作る上での絵の癖・モデル。色んなところに存在している。seaart.aiとか適当な所で探してダウンロードすればいいんじゃないかな。
Lora→指向性をもたせる情報、これがないと東方のキャラとか版権ものは再現不可能。一般的なモノしか作れないが著作権的な意味では使わないほうが安全。
起動プロンプトだけは指定しておこう。

ちなみにポジティブプロンプトとネガティブプロンプトだけは指定方法を調べておいたほうがいい。
特に指や足が分裂抑制はネガティブプロンプトが必須。

指定は英語じゃないと全部無視されます。
lowres,worst aesthetic,bad quality,worst quality,bad anatomy,sketch,jpeg artifacts,scan artifacts,lossy-lossless,ugly,poorly drawn,signature,watermark,Abnormal number of fingers, deformed hands,Six fingers,


翻訳するとこう。
5


あとは最低でもメモリ8GBのRAMとAMD GPU向け起動オプション。
メモリ8GBだと ---lowvram を指定しないと全く動きません。
解像度も良いところ768x1024です。アップスケール設定いれるとブチ壊れます。

それと演算もRadeonはセンシティブです。RX9070XTなら問題ないのかもしれんけど。
FP16で起動すると動作は早いのですがInpaintなど部分書き換えがまともに動きません。

とりあえずchatgptに永遠と聞いても解決しなかったのでググったら普通に解決しました。
なのでレガシーなRadeonでメモリ8GBな人は下記設定にしておくといいでしょう。

webui-user.bat
@echo off
set PYTHON=
set GIT=
set VENV_DIR=
set COMMANDLINE_ARGS=--skip-torch-cuda-test --use-directml --lowvram --opt-split-attention --no-half --precision full --no-half-vae
call webui.bat




ChatGPTに聞いた構築の再現チャット

質問
あなた:
Windows11-64bit メモリ64GB Ryzen9-3900X RadeonRX5700XT でStable Diffusionによる静止画作成をローカルで行いたい。起動までの段取りを教えてほしい。URLやローカルパスは変に省略せずフルパスで書くこと。ただしユーザ名前依存の場合はXXXXXとかでよい。

回答

ChatGPT:
承知しました。ご指定の環境で Stable Diffusion をローカル実行して静止画生成するまでの流れを、段階ごとにフルパス込みでまとめます。ユーザ名に依存する箇所は XXXXX として記載します。
1. Python と Git の導入

Stable Diffusion WebUI(AUTOMATIC1111版など)は Python と Git を必須とします。

Python 3.10.6 (推奨)
ダウンロード:
https://www.python.org/ftp/python/3.10.6/python-3.10.6-amd64.exe
インストール先例:

C:\Python310\

Git for Windows
ダウンロード:
https://github.com/git-for-windows/git/releases/download/v2.45.2.windows.1/Git-2.45.2-64-bit.exe
インストール先例:

C:\Program Files\Git\

※インストール時に「環境変数 PATH に追加」へチェックを入れてください。
2. Stable Diffusion WebUI の取得

作業用ディレクトリを作成して Git Clone します。

例:

C:\AI\StableDiffusion\

コマンドプロンプトを開き、以下を実行:

cd C:\
mkdir AI
cd C:\AI
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

git clone https://github.com/lshqqytiger/stable-diffusion-webui-amdgpu.git
cd stable-diffusion-webui-amdgpu
git submodule update --init --recursive


結果として以下に配置されます:

C:\AI\stable-diffusion-webui\

3. モデルファイル (Checkpoint) の配置

Stable Diffusion 本体の学習済みモデル(例:v1-5-pruned-emaonly.safetensors)を取得し、指定ディレクトリへ置きます。

ダウンロード例 (HuggingFace から):
https://huggingface.co/runwayml/stable-diffusion-v1-5/blob/main/v1-5-pruned-emaonly.safetensors

保存先:

C:\AI\stable-diffusion-webui\models\Stable-diffusion\v1-5-pruned-emaonly.safetensors

4. 初回起動

webui-user.bat を実行します。

フルパス:

C:\AI\stable-diffusion-webui\webui-user.bat

初回起動では自動的に依存ライブラリがダウンロード・インストールされます(10分以上かかる場合あり)。
5. WebUI アクセス

インストール完了後、コマンドプロンプトに以下が表示されます:

Running on local URL: http://127.0.0.1:7860/

ブラウザで開くと WebUI が使用可能です。
6. 実用ポイント

GPU は Radeon RX5700XT なので、CUDA ではなく DirectML バックエンドで動作します。
自動的にインストールされますが、必要に応じて手動で --use-directml を webui-user.bat に追記します。

例:

set COMMANDLINE_ARGS=--use-directml

ファイル編集先:

C:\AI\stable-diffusion-webui\webui-user.bat

まとめ

Python 3.10.6 & Git をインストール

C:\AI\stable-diffusion-webui\ に Git Clone

モデルを C:\AI\stable-diffusion-webui\models\Stable-diffusion\ へ配置

webui-user.bat 実行

ブラウザで http://127.0.0.1:7860/ にアクセス


これで出来ないなら、ここでコメントに質問するよりは都度ChatGPTに聞いたほうが早いです。
あくまでこう質問するとよい、こう回答が返ってくるの例です。
このエントリーをはてなブックマークに追加 mixiチェック

↑このページのトップヘ