大規模言語モデル(LLM)を使って画像生成AIのプロンプトを作ってみます。LLMはOllamaで動かしモデルはDeepSeek-R1で試します。OllamaのAPIと通信するため画像生成はComfyUIで行い通信用のカスタムノードをインストールします。LLMでプロンプトを作ったらそれで画像生成します。
DeepSeek-R1の14Bモデルなら日本語で作りたい画像の指示ができるようになるかも。
ScreamingHawk / comfyui-ollama-prompt-encode
https://github.com/ScreamingHawk/comfyui-ollama-prompt-encode
pythongosssss / ComfyUI-Custom-Scripts
https://github.com/pythongosssss/ComfyUI-Custom-Scripts
theshubzworld /
ComfyUI-ollama_killer
https://github.com/theshubzworld/ComfyUI-ollama_killer
アマゾン:
RTXシリーズ https://amzn.to/4juW07P
DeepSeek R1をRTX4070TIで動かしてみる【Ollama】
マウスをクリックするだけで画像生成AIを始められる Stability Matrix
チャプター:
0:00 イントロ
0:17 まえおき
1:42 comfyui-ollama-prompt-encodeで画像生成用プロンプトを生成する
6:51 DeepSeek-R1のプロンプトで画像生成してみる
9:20 メモリーの開放
#ollama #comfyui #deepseek
コメント