About Stable Diffusion Dream Machine (Image Generation AI)-16
言葉によって映像を生成する、というのは映画で言えば、台本のト書き、「雨が降っている」とか「暗い無人の居間」とか、そんなようなものかもしれない。stable diffusion側に設定されたAIデータモデルが美術兼カメラのようなものだろうか。料理で言えば、プロンプトはレシピで、AIデータは豊富な原材料、野菜や肉や米が入った箱のようなものかもしれない。
「雪の庭園を歩く女性」と呪文欄に入れてみても、設定したAIデータによって生成召喚される画像は正に千差万別だった。
stable diffusionによる画像生成を行うにはまず何よりも、有志によって作成された各種AIデータモデルの特徴、その味、その色味、その表現手法を大まかにでもしっかり把握することが重要だ、ということが次第に分かってきた。
夢で見た景色や、心の中に存在する、どこか曖昧でぼんやりした光景を、心の中、心眼だけでなく、この物質的な両眼、肉眼で、できることなら見てみたい。
stable diffusionでの画像生成は、言葉を入力しては画像を確認、修正して、言葉に重みを付けたり、別の言葉に替えたりして画像を再出力、再確認、また言葉の再選定、というような形で延々と試行錯誤の繰り返しであった。
Generating images with words might be like the tome of a script in a movie, “It’s raining,” or “A dark, uninhabited living room,” etc. The AI data model set on the stable diffusion side might be like the art and the camera. In cooking, the prompt might be a recipe, and the AI data might be like a box with abundant raw materials, vegetables, meat, and rice.
Even when I entered “a woman walking in a snowy garden” into the spell field, the images generated and summoned by the AI model data I had set up varied widely.
It became clear to me that the first and foremost thing to generate images with stable diffusion is to have a good grasp of the characteristics of the various AI data models created by volunteers, their flavors, their colors, and their expression techniques, even if only roughly.
I would like to see the scenery I have seen in my dreams and the somewhat vague and hazy scenes that exist in my mind, not only with my mind’s eye but also with this material naked eye, if possible.
The process of image generation in stable diffusion was an endless repetition of trial and error: input words, check the image, modify it, add weight to the words, replace them with other words, output the image again, check it again, select the words again, and so on.