Stable Diffusion 夢の機械(画像生成AI)について-24

About Stable Diffusion Dream Machine (Image Generation AI)-24

 戦争関連の或る種の図像をstable diffusionで呼び出すのは一体、悪なのだろうか。平安貴族の十二単は唯のデータ不足なのかもしれない。AIで出力が禁じられる画像とはどのようなものだろうか。
 日本語変換ソフトで差別語などとして存在を否定され、変換されない単語、言葉狩りの対象である単語たちと同じ問題のようだった。
 一方が言葉狩りであれば、一方は画像狩りというところだろうか。
 日本語変換では「差別語変換辞書」というものが有志によって作られているように、stable diffusionのAIモデルに足りない、もしくは禁じられた図像は自身でデータを作成するか、もしくは有志によって作成されたloraと呼ばれるような画像プラグインを探すしかなさそうだった。
 だが、わざわざそこまでして禁じられた図像を召喚することに私も特にこだわりはなかった。
 禁止された決まりを破ることに特別、快楽を感じる訳でもなかった。技術的な手間を考えれば、必要最低限なもので、納得できるものを出力できればそれで良かった。
 しかし、今後、よりAIでの画像生成が一般的になれば、そのときAIモデルデータ内に存在しない図像は当然出力できない訳で、「着物」という言葉で中国風の着物が画像として出てくるのか、韓国風の物なのか、そこで「日本の着物」と限定しても、やはり(現時点のように)中華風の着物が出てくるのであれば、表したい和風の景色が「ハリウッド映画製日本」のようにどこか大味で、大雑把なものになりそうだ。

 Is it evil to call up certain war-related images with stable diffusion? What kind of images are forbidden to be output by AI?
 It seems to be the same problem as that of words that are not converted by Japanese conversion software because their existence is denied as racist words, or words that are the target of word-hunting.
 If one is word-hunting, the other is image-hunting.
 As a “discriminatory word conversion dictionary” has been created by volunteers for Japanese language conversion, it seemed that the only way to get images that are missing from the AI model of stable diffusion or forbidden was to create their own data or find an image plug-in called “lora” created by volunteers. However, it seemed that it would be difficult to go to such lengths and find a forbidden image.
 However, I was not particularly concerned about going to such lengths to summon forbidden images.
 Nor did I feel any particular pleasure in breaking a prohibited rule. Considering the technical effort involved, I was happy as long as I could output something satisfactory with the minimum necessary.
 However, if AI image generation becomes more common in the future, images that do not exist in the AI model data will naturally not be output. At that time, will the word “kimono” produce images of Chinese-style kimonos or Korean-style kimonos? Even if we limit the term to “Japanese kimono,” if Chinese-style kimonos still appear (as they do at present), the Japanese-style scenery we want to represent will likely be somewhat rough and sketchy, like “Japanese scenery created by Hollywood movies”.

Stable Diffusion 夢の機械(画像生成AI)について-23

About Stable Diffusion Dream Machine (Image Generation AI)-23

 私は『原神』や『聊斎志異』が好きなので、中国文化の図像を呼び出すことで満足はできたが、しかし、やはり深く心の奥底にある日本的なイメージを存分に映像として具現化したい、という止むに止まれぬ思いはあった。
 (先述したが)AIの問題は権力や政治力、経済力の問題でもあるのだと分かった。
 AIモデルデータが作れなければ、少なくともstable diffusionという道具の中では、その国の歴史や文化は存在しない、ということになるのだった。
「平安時代の貴族の屋敷」という言葉で、それらしき映像が出てこなければ、やはりそれはAI写真では召喚のしようがなく、平安時代というものが存在しない世界が、そこでは標準になってしまう。
 同じような問題として戦争関連の或る種の図像も通常では出力が出来ないようになっているようだった。
 何が正しくて何が間違っているか、何が良くて何が悪いか、というような価値基準がAIのモデルデータにも反映しているようだった。

 I was satisfied with invoking the iconography of Chinese culture because of my love of “Genshin Impact” and “Liaozai Shii,” but I still had an irresistible desire to generate images of Japanese imagery that were deeply rooted in my mind.
 (As mentioned earlier,) I realized that the problem of AI is also a problem of power, political power, and economic power.
 If AI model data could not be created, the history and culture of a country would not exist, at least in the tool called stable diffusion.
 If the term “Heian-period aristocratic residences” does not produce any images, there is no way to summon such images in AI photographs, and a world in which the Heian period does not exist becomes the norm.
 Similarly, certain war-related images are not normally output.
 The AI model data seemed to reflect such value criteria as what is right and wrong, what is good and what is bad.

Stable Diffusion 夢の機械(画像生成AI)について-22

About Stable Diffusion Dream Machine (Image Generation AI)-22

 AIのモデルデータは英語圏、もしくは中華圏で作成されたものが多く、日本文化独自の図像を思い通りに呼び出すことが困難なことが多い、ということも次第に分かってきた。
 例えば、1980年代の日本の歌番組、薄暗いゲームセンター、小学校の美術室、寺の裏にある墓場、デパート屋上の遊園地、見世物小屋、夏祭り、浴衣、着物、平安時代、鎌倉時代、江戸時代、それぞれの時代の建築や服装、等々、日本人であればその光景を思い浮かべることができるであろうイメージが、stable diffusionでは出力困難なことがあった。
 AIは文化と歴史と民族(更には政治と経済)の問題でもあるのだと、そのとき思い知った。
 AIモデルに存在しないデータは、映像として呼び出すことができない。1980年代の薄暗いゲームセンターの景色を、私はどうにかしてstable diffusionで呼び出したい。平安時代の貴族が住む寝殿造りの屋敷を映像として物質化したい。しかしそれには元になるデータが必要で、それをするには膨大な手間と知識と費用が必要になる筈だった。歴史的なものも含み日本文化の図像を完璧に再現できるstable diffusionでのAIモデルデータはまだ存在しないようだった。

 It has become increasingly clear that most of the model data for AI was created in English-speaking or Chinese-speaking countries, and that it is often difficult to call up the unique iconography of Japanese culture as desired.
 For example, Japanese song shows in the 1980s, dimly lit game centers, elementary school art rooms, graveyards behind temples, amusement parks on department store rooftops, freak shows, summer festivals, yukata, kimono, architecture and clothing from the Heian, Kamakura, and Edo periods, etc. Japanese people would be able to picture these scenes, but stable diffusion has difficulty in outputting them.
 I realized then that AI is also a matter of culture, history, and ethnicity (and even politics and economics).
 I wanted to use stable diffusion to recall a dimly-lit arcade scene from the 1980s. I would like to materialize a video of a Heian-period aristocrat’s mansion in the shinden-zukuri style, but I need the original data. However, this would require the original data, which would require a great deal of time, knowledge, and expense. It seemed that there was no AI model data in stable diffusion that could perfectly reproduce the iconography of Japanese culture, including historical ones.

Stable Diffusion 夢の機械(画像生成AI)について-21

About Stable Diffusion Dream Machine (Image Generation AI)-21

自身の内的現実を外界に反映させるというのは、仏教的に言えば、それはクリアで清浄な心で観察した世界ではなく、邪見に汚れた世界なのかもしれない。
汚れのない心で世界をあるがままに見れる日がいつか私にも来るのだろうか。それは分からない。
とにかく「心の目で世界を写す」というフォトショップのキャッチコピーはstable diffusionの革命的技術で現実になった。
stable diffusionを駆使する各人それぞれの心像、内的世界、夢、妄想、記憶、空想の数々は各々のプロンプト呪文で現実界に召喚される。
夢の世界は死の世界で、心と想念の純粋世界であった。
恐怖であれば恐怖の終わりに止めどはなく、不安や欲望はそのまま何者かに姿を変えて、妄執として襲いかかってくる。そこは自身の心がそのまま純粋に物質化してしまうサイケデリックな精神世界であった。
心の欲望そのままに、私も「地上世界には存在しないが、可能であれば物質化された存在としてこの目で見てみたい」映像をstable diffusionで呼び出し続けた。
これは心の映像化で、各人それぞれの無意識に潜む、重く悩ましい夢の映像作品化だった。

Reflecting one’s own internal reality to the external world is, from a Buddhist perspective, not a world observed with a clear and pure mind, but a world tainted by evil.
Will I one day be able to see the world as it is with an untainted mind? I do not know.
In any case, the catchphrase of Photoshop, “photograph the world with your mind’s eye,” has become a reality with the revolutionary technology of stable diffusion.
The mental images, inner worlds, dreams, delusions, memories, and fantasies of each person who uses stable diffusion are summoned into the real world by their own prompting spells.
The dream world was the world of death, the pure world of mind and thought.
Fear is the endless end of fear, and anxiety and desire are transformed into something else and strike as a delusion. It was a psychedelic mental world where one’s own mind was materialized purely as it was.
As my mind’s desire, I also continued to call up images in stable diffusion that “do not exist in the earthly world, but I would like to see them with my own eyes as materialized beings if possible.”
This was the visualization of the mind, the visualization of the heavy and troubled dreams that lurk in the unconscious of each of us.

Stable Diffusion 夢の機械(画像生成AI)について-20

About Stable Diffusion Dream Machine (Image Generation AI)-20

 私はそれまでフォトショップを使って電子絵画を面白がって作っていたが、その際に必要な電子ペンが壊れてから、画像作りからしばらく離れていた。
 また、日常の中でどこか謎めいた光景に出逢うことがあれば、それをカメラに収めない訳にはいかなかった。
 stable diffusionで夢の光景をどうにか再現しようと私は召喚プロンプト呪文をあれこれと工夫をした。
 幾つかは多少上手くいったような気もするが「これはお前が夢の中でその通りに見た景色なのか?」と問われると、答えに窮し、曖昧に苦笑いして目を逸らしてしまいそうだ。
 少なくとも、次のようには言える。夢の中で見た、感じた情景を元に、そこからstable diffusionとの相互作用で形作られた一種の内的な現実景色だ、と。
 しかし、内的現実とは言っても、私にとってはこのstable diffusionとの相互作用で作られた光景の方がよほど外的現実にも近い。私はそのように世界を感じている。
 私の肉体的な目、網膜には、一般的な風景のように、確かに周囲の景色は映っているかもしれない。だが私の心にはそれがその通りには映らない。stable diffusionで言葉を駆使してどうにか生み出した電子風景の方が、私の本当に見ている、感じている世界により近い。確かにそれは、私の内的現実なのだろうが、私の中では、紛う方なき、もう一つの外的現実だった。

 I had previously used Photoshop to make electronic paintings for fun, but after my electronic pen broke down, I had to take a break from image making for a while.
 I also could not help but take pictures whenever I came across a somewhat mysterious scene in my daily life.
 I tried to recreate the dream scene in stable diffusion by inventing various summoning prompt spells.
 Some of them seemed to work, but when asked, “Is this exactly what you saw in your dream?” I am at a loss for an answer, and I am likely to smile vaguely and look away.
 At least, I can say the following. It is a kind of internal reality that is formed by the interaction with stable diffusion based on the scene seen and felt in the dream.
 However, even though I call it an internal reality, for me, the scene created by the interaction with stable diffusion is much closer to my external reality. That is how I perceive the world.
 My physical eyes, my retinas, may indeed see the surrounding landscape, just like any other landscape, but my mind does not see it as it is. But my mind does not see it as it is; the electronic landscape that I have managed to create with words in stable diffusion is closer to the world as I really see and feel it. It may indeed be my internal reality, but in my mind, it is unmistakably another external reality.

Stable Diffusion 夢の機械(画像生成AI)について-19

About Stable Diffusion Dream Machine (Image Generation AI)-19

 ノートに夢を記録をするとき、私はなるべく図や絵を使わず、言葉だけでそれらをどうにか書き付けようと何故か意識していた。
 夢の中で感じたあの感覚や感情をどうすれば物質界、この地上世界で再現できるだろうか。肉体がないらしい想念や心の世界をどうにか言葉でほんの少しでも似たものを作り出したい。
 好きな人の顔を描く、好きな景色の絵を描く、写真を撮る、好きなペットや子供たちの写真を撮る。旅行先での写真を撮る。
 私にとって夢の光景を記すのはそれらと似たような行為なのかもしれなかった。
 故郷に帰省したときの旅行写真、お土産。私にとって睡眠中の夢は一種の死であり、魂や心の故郷のように思えた。
 あの世、というものがあるなら、毎晩、夢の中でその近所まで行っているに違いないと思えることがあった。
 眠りは死の兄弟であるらしい。文字だけで書いた夢のノートは累積していった。夢のメモは五分で終わることもあれば二時間以上掛かることもあった。
 その行為を何十年も続けている中で、私はstable diffusionに出会った。

 When I recorded my dreams in a notebook, for some reason I was conscious of trying to write them down somehow using only words, without using diagrams or pictures as much as possible.
 How could I reproduce the sensations and emotions I felt in the dream in the material world, the world on earth? I wanted to somehow create something even slightly similar in words to the world of thoughts and feelings that seem to have no physical form.
 We can paint the faces of our favorite people, draw pictures of our favorite scenery, take pictures, take pictures of our favorite pets and children, take pictures of our favorite travel destinations. We take pictures of our travel destinations.
 For me, writing down the scenes of my dreams may have been similar to these acts.
 Traveling back to my hometown, taking souvenirs. For me, dreams during sleep are a kind of death, and they seem to be the home of my soul and heart.
 If there is such a thing as the afterlife, I sometimes felt that I must have been close to it in my dreams every night.
 Sleep, it seems, is the brother of death. The notes of my dreams, written only in letters, were cumulative. Sometimes the dream notes took five minutes, sometimes more than two hours.
 In the course of decades of doing this, I came across stable diffusion.

Stable Diffusion 夢の機械(画像生成AI)について-18

About Stable Diffusion Dream Machine (Image Generation AI)-18

 stable diffusionに出力できないものはあまりないようだった。
 私は大学生の頃から夢の記録を取り続けていた。睡眠中に見た景色や物語を忘れない裡にノートにメモを取った。傍からは狂気じみたように見えるかもしれない。見た夢の光景を何十年も毎日書き続けているというのはちょっとどうかしている、と誰かに言われたとしても、それはその通りであり、彼または彼女がそう言いたくなるのも、常識的に考えて仕方ないことだと思われる。
 幼児の頃から謎の夢が気に掛かって仕方がないことがあり、丁度二十歳頃から、見た夢を文章で書き付ければ、何となく心の靄が少し晴れるようなことが分かった。
 夢の記憶、心に引っ掛かった情景や、不定型で曖昧な、霧の中にあるようなぼんやりとした景色、言葉、人々。霧と靄の中にあるそれらの光景は記憶の断片など、些細な何かを切っ掛けに一瞬で晴れる。夢を思い出すまでの経過は地面を掘って温泉を探し当てるようなもので、掘り当てて噴出すればあとはひたすら流れ作業のようなものだ。順を追ってノートに言葉でメモをする。それで終わり。
 およそ一般に「生産性」と呼ばれるものと縁遠い行為に思われるが、私にはそれは必要な行為なのだった。

 There didn’t seem to be much that couldn’t be output to stable diffusion.
 I have kept a record of my dreams since I was a college student. I made notes in a notebook so that I would not forget the sights and stories I saw in my sleep. It may seem crazy to some, but I have been writing down my dreams every day for dozens of years. If someone were to say that I was a bit crazy for writing down the scenes of my dreams every day for decades, he or she would be right, and it would seem to be common sense that he or she would be tempted to say so.
 Ever since I was a toddler, I have had mysterious dreams that have been bothering me, and since I was just about 20 years old, I have found that if I write down the dreams I have had in writing, it somehow clears the haze in my mind a little.
 Dream memories, scenes that stuck in my mind, and hazy landscapes, words, and people that were indefinite and vague, as if they were in a fog. These scenes in the fog and haze are cleared in an instant by something trivial, such as a fragment of memory. The process of recalling a dream is like digging for a hot spring in the ground, and once it has been dug and gushed out, the rest of the process is just a continuous stream of work. I write down the sequence of events in a notebook with words. That’s it.
 It may not seem like the kind of activity that is generally associated with “productivity,” but for me, it was a necessary act.

Stable Diffusion 夢の機械(画像生成AI)について-17

About Stable Diffusion Dream Machine (Image Generation AI)-17

 AI画像生成については、粘土を何度も練り直し、形を作り、角度を変えて眺めては、また細かい修正作業を続けていく、塑像の作業に近いような気がした。
 真の姿を写す、という語から成る「写真」は、外的で、物質的、地上的、いわゆる「現実」と呼ばれて疑われないものを律儀に写し取るものだと考えられている。
 しかし一体、「現実」とは何なのだろうか。カメラが写したものは確固とした客観的現実、と呼ばれるようなものなのだろうか。
「客観的現実」というものが存在するのか、存在するならそれはどういったものか、ということは措いておいて、とりあえずスマホのカメラではその人の身近にある物や人や景色が主観的に写されていると思われる。
 その写真は確かに撮影者にとっては「現実」であるだろう。  
ではAI写真ではどうだろうか。
 その人の心や記憶の中にある、傍からは見えない心像が、現実のような写真風の体裁でパソコンモニタに現れてくる。茫洋とした曖昧な夢や、記憶の心像がAI写真機としてのstable diffusionによって画面上に現像されてくる。
 stable diffusionを用いて心像を映像化した人が、出力されたその画像を良しとするなら、それは彼にとっての内的現実の一種だと言っても良い気はする。
 他に様々な用途はあろうが、内的現実をある程度写す鏡として私はstable diffusionを使い始めた。

 As for the AI image generation, it seemed to me that it was similar to the process of plastic arts, in which clay is kneaded again and again, shaped, viewed from different angles, and then the fine modification process is continued again.
 The word “photograph,” which consists of the words “to capture the true image,” is thought to be a disciplined copying of what is external, material, and earthly, what is unquestionably called “reality”.
 But what exactly is “reality”? Is what the camera captures something that can be called a solid objective reality?
 Let us leave aside the question of whether there is such a thing as “objective reality” and, if so, what it is. At any rate, a smartphone camera is thought to subjectively capture objects, people, and scenery that are close to the photographer.
 The photo would certainly be “reality” to the photographer.  
How about an AI photo?
 The mental image in a person’s mind or memory, which cannot be seen from the outside, appears on a computer monitor in a photo-like appearance, as if it were reality. The mental image of a vague dream or memory is developed on the screen by stable diffusion as an AI photo machine.
 If the person who visualized his mental image by using stable diffusion considers the output image to be good, it is safe to say that it is a kind of inner reality for him.
 I started to use stable diffusion as a mirror of inner reality to some extent, although it may have many other uses.

Stable Diffusion 夢の機械(画像生成AI)について-16

About Stable Diffusion Dream Machine (Image Generation AI)-16

 言葉によって映像を生成する、というのは映画で言えば、台本のト書き、「雨が降っている」とか「暗い無人の居間」とか、そんなようなものかもしれない。stable diffusion側に設定されたAIデータモデルが美術兼カメラのようなものだろうか。料理で言えば、プロンプトはレシピで、AIデータは豊富な原材料、野菜や肉や米が入った箱のようなものかもしれない。
「雪の庭園を歩く女性」と呪文欄に入れてみても、設定したAIデータによって生成召喚される画像は正に千差万別だった。
 stable diffusionによる画像生成を行うにはまず何よりも、有志によって作成された各種AIデータモデルの特徴、その味、その色味、その表現手法を大まかにでもしっかり把握することが重要だ、ということが次第に分かってきた。
 夢で見た景色や、心の中に存在する、どこか曖昧でぼんやりした光景を、心の中、心眼だけでなく、この物質的な両眼、肉眼で、できることなら見てみたい。
 stable diffusionでの画像生成は、言葉を入力しては画像を確認、修正して、言葉に重みを付けたり、別の言葉に替えたりして画像を再出力、再確認、また言葉の再選定、というような形で延々と試行錯誤の繰り返しであった。

 Generating images with words might be like the tome of a script in a movie, “It’s raining,” or “A dark, uninhabited living room,” etc. The AI data model set on the stable diffusion side might be like the art and the camera. In cooking, the prompt might be a recipe, and the AI data might be like a box with abundant raw materials, vegetables, meat, and rice.
Even when I entered “a woman walking in a snowy garden” into the spell field, the images generated and summoned by the AI model data I had set up varied widely.
 It became clear to me that the first and foremost thing to generate images with stable diffusion is to have a good grasp of the characteristics of the various AI data models created by volunteers, their flavors, their colors, and their expression techniques, even if only roughly.
 I would like to see the scenery I have seen in my dreams and the somewhat vague and hazy scenes that exist in my mind, not only with my mind’s eye but also with this material naked eye, if possible.
 The process of image generation in stable diffusion was an endless repetition of trial and error: input words, check the image, modify it, add weight to the words, replace them with other words, output the image again, check it again, select the words again, and so on.

Stable Diffusion 夢の機械(画像生成AI)について-15

About Stable Diffusion Dream Machine (Image Generation AI)-15

 地上の物質世界には存在し得ない類の、物理法則を超越した、精神的な原風景、心的な現実の景色をstable diffusionで呼び出すことができる。プロンプトに「水」と入力すれば水が、「炎」と入力すれば火が映像として画面上に現れる。「水の上の炎」と入れれば、水の上で燃える火が現れる。
 AI画像ギャラリーでは圧倒的に女性のAI像が投稿されていた。相当なマシンパワーを必要とするパソコンにわざわざstable diffusionをインストールし、費用と時間と手間を掛けて、「理想の異性像」生成に熱中しているのはどうやらやはり専ら男性たちが中心のようだった。
 アニメイラスト風の美少女たちが可憐そうに微笑んでいる。この世に存在しない人工生成のAI少女が薄着姿で庭園に佇んでいる。
 stable diffusionユーザーによってプロンプト(呪文)で呼び出された(召喚された)或る種の少女らは、個人毎に切り離された孤独な夢幻世界の人工楽園に存在する別次元の生命体のようでもあった。
 そこに投稿されていた何枚かの画像やプロンプトを参考にし、私も自身の心的現実風景を生成し始めた。

 Stable diffusion can conjure up a mental landscape, a mental reality that transcends the laws of physics and that cannot exist in the earthly material world. Type “water” at the prompt and water appears on the screen; type “fire” and fire appears on the screen. If you enter “fire on water,” a fire burning on top of water appears.
 In the AI image gallery, female AI images were overwhelmingly submitted. It seemed that it was mainly men who took the trouble to install stable diffusion on their computers, which require a lot of machine power, and spent a lot of money, time, and effort to create their “ideal image of the opposite sex”.
 Beautiful girls in the style of anime illustrations were smiling prettily. Artificial AI girls, who do not exist in this world, stood in the garden in light clothing.
 Some of the girls, summoned by stable diffusion users with prompts (spells), seemed to be life forms from another dimension existing in an artificial paradise of a solitary dream world, separated from each other.
 I also began to generate my own mental reality, using some of the images and prompts posted there as a reference.