AIが自分の作品を量産!?生成AIを活用するアーティストに聞いた。

  • 文:石川博也
Share:

画像生成AIが登場し、クリエイティブな仕事さえもAIに奪われる危機が叫ばれる中、アーティストのカスミさんは全面的に創作に取り入れている。自らの作品を画像生成AIでリメイクすれば、その作品のクオリティは手描きの作品と見紛うほどに生成AIは進化しているという。

Pen最新号は『いまここにある、SFが描いた未来』。SF作家たちは想像力の翼を広げ、夢のようなテクノロジーに囲まれた未来を思い描いてきた。突飛と思われたその発想も、気づけばいま次々に現実となりつつある。今特集では人類の夢を叶える最新テクノロジーにフォーカス。SFが夢見た世界が、ここにある。

『いまここにある、SFが描いた未来』
Pen 2024年6月号 ¥880(税込)
Amazonでの購入はこちら
楽天での購入はこちら

---fadeinPager---

2-L1029384.jpg

カスミ アーティスト
福岡県出身。海外のストリートアートや壁画にインスパイアされ、オフィスや店舗のウォールアートを手掛ける。2023年3月に画像生成AIに出合い、ワールドAIグランプリAI天使賞受賞などAIアートの分野でも活躍中。

生成AIに興味を持ったのは昨年3月だった。

「それ以前に生成AIが描き出した画像はクオリティが低く不自然でしたが、突然クオリティが跳ね上がった。1年もすればナチュラルな画像を生成できるようになるだろうと、勉強を始めました」

画像生成AIツールで人気なのはブラウザ上で使える「ミッドジャーニー」や「ダリ3」だが、カスミさんはネットに接続しなくても機能する「ステイブル・ディフュージョン」を使用している。

「画像を生成する際、プロンプトと呼ばれる“人魚”“椰子の木”“怒り”(実際は英語で)など、画像のイメージを指示する言葉を入力していきます。私の場合はヌードを描くことも多いのですが、ネットに接続されたブラウザ上では性的だったりグロテスクだったりする表現は禁忌ワードとして弾かれてしまうため、表現を制限なく自由に行えるステイブル・ディフュージョンを使っています」

プロンプトと生成画像にはブレが生じやすいため、精度を上げるべくカスミさんが使用するのが「テクスチュアル インバージョン」と「ローラ」だ。画像に追加学習効果を生み出すもので、ある程度の方向づけができる。

「たとえば、現代風の女性を描いた自分の作品を学習させたローラデータをつくり、それをベースに生成することで、“スマイル”などのプロンプトを入力するだけで、まるで自分が手描きしたかのような微笑んだ現代風の女性の顔が生成されます。自分でも手描きなのか生成作品なのか判別できないほど、精度が上がっています」

手描きの場合は描き手の身体コンディションによって完成度が変わるが、画像生成AIの場合は当然それがなく、いろいろなバージョンを生成してくれるため、作業効率も格段によくなった。

「和風の絵を手描きすると1枚10時間くらいかかるんですが、生成AIの場合は一瞬でできてしまいます。あまりに作業効率が違うので、最近は自分で絵を描くことが非常に少なくなりました」

著作権の問題もある。画像はゼロから生成されるわけではなく、ウェブ上にあるおよそ40億枚の画像をベースにしているからだ。

「私も生成AIを使う時点で著作権的にグレーなのですが、そもそも手描きの絵も、絵を勉強する過程で他人が描いたさまざまな作品から学んでいるわけです。問題なのは、他人の作品を模倣する意図があるかどうかだと思います」

生成AIをいかに正しく活用するか。クリエイターにとっての新常識といえるものが急速に生まれようとしている

---fadeinPager---

手描きと生成AIで作られた絵を比較

GEISHA【手描き】

1_JAPHOP 2 (1).jpg
カスミさんがシリーズで制作している絵画「GEISHA」。この作品はタブレット端末でペンを使って手描きで描き出したオリジナルのもので、これをステイブル・ディフュージョンに学習させ、自身の作風をインプットした。

GEISHA【生成AI】

4-230827kathmigeisha60.jpg
6-230827kathmigeisha48 (1).jpg
5-387344851_638238978518727_7727736921810364220_n.jpg
7-230827kathmigeisha103.jpg
画像生成AIによる作品。カスミさんが過去に描いた画像を、AIに複数枚読み込ませてローラデータを作成。そこにさまざまなプロンプトを入力すると、本人が手描きした作品と見紛う画像ができあがる。
3-スクリーンショット 2024-03-12 145755.jpg
ステイブル・ディフュージョンの画面。左上の横長のスペースに並ぶ文字がプロンプトと呼ばれ、画像のイメージを具体的に伝えるキーワードになる。生成された画像を見ながらワードの修正を行い、思い描く画像に近づけていく。

Pen0426_RGB.jpg

『いまここにある、SFが描いた未来』
Pen 2024年6月号 ¥880(税込)
Amazonでの購入はこちら
楽天での購入はこちら