Stable Diffusion 夢の機械(画像生成AI)について-34

About Stable Diffusion Dream Machine (Image Generation AI)-34

 stable diffusionでの画像生成は、紙とペンで絵を描いたり、楽器を弾いたり、料理を作ったりするのと同じような創造的行為である。夢映像をただ自動的に浴びるように見続ける、というものではない。
 それが料理や工作などと異なるのは、使う道具がAIという新しい技術を使っている、という点だけだろう。
 絵には描く人の心、無意識が往々にして現れる。写真も同じく。AI画像、stable diffusionにも、画像生成者の心や癖、仕草のような、その人と不可分の何かが示されている。そのような 個人独自の無意識は、いつかは、その人にしか出せない独特な香気に昇華できたら理想的だと思う。
 美に惹かれるのは、何故なのだろう。美しいものには、人の心を狂わせるに値するだけの何かがあるらしい。美しいものをお金で求めようとしてもあまり得られず、退屈なものや刺激的なものばかりが増えていくような現状。簡単にワンクリックで美しいものを求めようとするのはもしかしたら間違っているのかもしれない。
 だが、それでも、美的な恍惚というのは何物にも代えがたく、それに固執するのは、何かが自身に欠けてるから執拗に求めてしまうのかもしれない。

 Image generation with stable diffusion is a creative act similar to drawing with pen and paper, playing a musical instrument, or cooking. It is not a process of just automatically watching dream images as if one were being bombarded with them.
 It differs from cooking and crafts only in that the tools used are based on a new technology called AI.
 The mind and unconsciousness of the painter often appear in a picture, and the same is true of a photograph. AI images and stable diffusion also show something inseparable from the person who created them, such as his/her mind, habits, and gestures. It would be ideal if such an individual’s unique unconsciousness could someday be sublimed into a unique fragrance that only that person can produce.
 Why is it that we are attracted to beauty? It seems that there is something about beautiful things that is worthy of making people’s hearts go crazy. In the current situation, we can’t get much beauty for the money, and only boring and exciting things seem to increase in number. Maybe it is wrong to try to seek something beautiful with one easy click.
 But even so, aesthetic ecstasy is irreplaceable, and perhaps we cling to it because something is lacking in us, and we seek it relentlessly.

借りた家は空き家のまま、時間だけが過ぎる

借りた家は空き家のまま、時間だけが過ぎる
何か重要なことをし忘れているのではないかという不安
その家には秘密がある

The rented house remains vacant and time just flies by
Fear of forgetting to do something important
There are secrets in that house

Stable Diffusion 夢の機械(画像生成AI)について-33

About Stable Diffusion Dream Machine (Image Generation AI)-33

 stable diffusionによる無意識の映像化は、言葉という理性や意識があって初めてどうやら成り立つらしい。
 意識なく、無意識ばかりなら、夢中毒、映像中毒で、刺激に反応するだけの単純で無思考なアメーバのような状態になるかもしれない。
 混沌とした無意識を言葉で呼び出すのは、酔っ払いを演じる役者が本当に酒を飲んでいないのと似てる気もする。無意識の暴風や狂気を観賞に堪える姿で画面上に現すのは、どこか客観的に醒めている必要がある。
 確か『夢の果てまでも』でも夢映像中毒になった人物は、言葉によって、その依存状態を抜け出ていた気がする。
 想像できて言葉で表せるものならおおよそstable diffusionは写真の如く写実的に画面上に再現してしまう。
 もし創作者がその気になれば、奇怪でおぞましい光景や、酸鼻を極めた残酷な情景、性的な幻想風景などをいくらでも産み出すことができる。もちろん、爽やかだったり一般的だったり常識的だったり綺麗だったりするものも、言葉によって自由に生成できる。
 では、果たしてここには「夢中毒」のような病的な依存性はないだろうか。各個人が理想的な夢の桃源郷で無意識の沼に水没してしまうような状態。

 The visualization of the unconscious by stable diffusion is apparently only possible when there is reason and consciousness in the form of language.
 If there is no consciousness and only unconsciousness, one may be addicted to dreams and images, like a simple, unthinking amoeba that only reacts to stimuli.
 It seems to me that invoking the chaotic unconscious with words is akin to an actor playing a drunk who is not really drunk. It is necessary to be somewhat objectively sober in order to present the storm and madness of the unconscious on the screen in a form that is bearable to watch.
 As I recall, in “Until the End of the World”, the character who became addicted to dream images was able to escape this state of dependence through words.
 If it can be imagined and expressed in words, stable diffusion can reproduce it on the screen as realistically as a photograph.
 If the creator is so inclined, he or she can produce any number of bizarre and horrifying sights, extremely acidic and cruel scenes, and sexual fantasies. Of course, we can also freely create things that are refreshing, common, sensible, and beautiful through words.
 But is there really no pathological dependence on such things as “dream addiction” here? A state in which each individual is submerged in a swamp of unconsciousness in a paradise of ideal dreams.

Stable Diffusion 夢の機械(画像生成AI)について-32

About Stable Diffusion Dream Machine (Image Generation AI)-32

 私にとってstable diffusionは一種の詩的降霊装置なのかもしれない。降霊呪文は散文詩で、魔方陣は「ブラックボックス」と一部に悪名高いらしいAIプログラム。
 物質世界に存在しないような映像が言葉で呼び起こされる。『夢の果てまでも』では脳波から直接読み取った、睡眠中の夢映像をモニタ上に映していた。一方、stable diffusionでは頭の中にあるぼんやりしたイメージを一度、言葉に変換する必要がある。それら呪文としての詩はAIによって映像に変換される。
 脳や心から直接イメージが映像化される未来方式と異なり、心に浮かぶイメージを言葉に変換し、それを再度AIで映像にする。心像を映像化する、という点で、「脳と映像モニタのダイレクト直結」に比べると、AIのstable diffusionは言語・詩を経由する映像なので、心像をどうしても意識化する必要がある。
 ダイレクト方式なら、言葉も意識化も不要で、ぼんやりとしたまま、テレビやネット動画を見るように、自らの夢映像や心像を眺め続けてしまうかもしれない。

 For me, stable diffusion may be a kind of poetic seance device. The seance spells are prose poems, and the magic circle is an AI program that some say is infamous as a “black box”.
 Images that do not seem to exist in the material world are evoked with words. In “Until the End of the World”, dream images during sleep, read directly from brain waves, were projected on a monitor. In stable diffusion, on the other hand, the hazy images in the mind need to be converted into words. Those poems as incantations are converted into images by the AI.
 Unlike the future method, in which images are visualized directly from the brain or mind, images in the mind are converted into words, which are then visualized again by AI. Compared to the “direct connection between the brain and the image monitor,” AI’s stable diffusion is an image via language and poetry, so it is necessary to make the mental image conscious.
 With the direct method, there is no need for language or consciousness, and the user may continue to view his or her own dream images and mental images as if watching TV or Internet video, in a blurred state.

Stable Diffusion 夢の機械(画像生成AI)について-31

About Stable Diffusion Dream Machine (Image Generation AI)-31

 無意識というのは自然の一部で、易経などの卜占は無意識の現れを見る。大げさな話だが古代からの占星術では、大宇宙での星々の動きが個々人の小宇宙に影響を与えるとされる。
 頭で計算された理性や論理などを超えた世界、宇宙や自然の広大な、人知を超えた何かが絵や映像の中にどことなく感じられる方が私は美しいと思ってしまう。
 タルコフスキーが自身の映画について「特に脈略のない映像が冒頭にあるのは何故なのか?」と問われ、「特に意味はなく、ただ詩的なもの、と答えるしかない」と(いうようなことを)書いていたのを思い出す。
 哲学を超えたところに詩がある。論理的な意味を超えたところに詩的感興があるらしい。

 The unconscious is part of nature, and divination such as the I Ching sees manifestations of the unconscious. It may sound exaggerated, but in ancient astrology, the movement of the stars in the macrocosm affects the microcosm of each individual.
 I find it more beautiful when I can somehow sense something in the pictures and images that transcends reason and logic calculated by the mind, the vastness of the universe and nature, something that transcends human knowledge.
 When Tarkovsky was asked about his films, “Why is there an image at the beginning that has no particular context?” I am reminded of Tarkovsky’s statement about his films, “There is no particular meaning, it is just poetic,” or something like that.
 Poetry is beyond philosophy. It seems that poetic excitement exists beyond logical meaning.

Stable Diffusion 夢の機械(画像生成AI)について-29

About Stable Diffusion Dream Machine (Image Generation AI)-29

 言葉でAIに指示を出す。「花束を持った女性」。AIモデルや描画方法の種類によって、描かれる図像は様々だ。
 どのような服を着て、どこにいて、どんな顔をしているのか、葬儀なのか結婚式なのか、誕生日なのか、買い物帰りなのか、ありとあらゆる考えられる状況を、召喚用のプロンプト呪文として用意する。光の強さ、色、雰囲気、小物、靴、等々。事細かな指示用の文言は「呪文」だとはよく言ったものではある。
 陶芸で最後に窯に火を入れた後、器の色彩が窯変するように、stable diffusionでもAIモデルデータと呪文の組み合わせを数限りなく何回も試行し、最終的に「これでOK」となった時点でも、やはり最終出力での窯変は不可避だ。ここが偶然性を考慮しなければならない箇所で、徹底的に呪文を細目化しても、やはり完全に何か予測した物と同一画像を出力するのは難しいだろう。
 こちらで意図したものを超えた、もしくは的外れなものが出力されることもstable diffusionの面白いところである。
 どのように偶然性を考えるか、という行程も、生成画像AIの楽しい部分だと思う。この「避けられない偶然性」といった画像AIの特徴が、怪談の入り込む余地もあり、念写にも通ずる、感興を呼び起こす点だと私は思う。

 Words are used to give instructions to the AI for the generated image. “A woman with a bouquet of flowers”. Depending on the AI model and the drawing method, the image drawn will vary.
 What kind of clothes, where she is, what she looks like, whether it is a funeral, a wedding, a birthday, a shopping trip, or any other possible situation, are prepared as prompt spells for the summoning. Light intensity, color, atmosphere, accessories, shoes, etc. It is often said that detailed instructions are “spells”.
 Just as the color of a ceramic vessel will change after the kiln is fired for the final time, so too, with stable diffusion, the combination of AI model data and spells is tried countless times, and even when the final “OK” is reached, kiln changes are inevitable in the final output. This is the point where coincidence must be taken into account. Even if the spells are thoroughly refined, it will still be difficult to output an image that is completely identical to something predicted.
 The fact that the output may be beyond or off the mark from what we intended is one of the interesting aspects of stable diffusion.
 The process of how to consider coincidences is also a fun part of generated image AI. I think that this characteristic of image AI, such as “inevitable coincidence,” is a point that evokes a sense of excitement, which is similar to psychic photography, and also has room for ghost stories.