六本木アートカレッジ2019 Vol.2
セミナーレポート

AIと人間が協働することで、新しいクリエイションが可能になる

徳井直生
株式会社 Qosmo 代表取締役 / 慶應義塾大学 政策・メディア研究科 准教授 / Dentsu Craft Tokyo, Head of Technology
Profile

2009年にQosmoを設立。Computational Creativity and Beyondをモットーに、AIと人の共生による創造性の拡張の可能性を模索。AIを用いたインスタレーション作品群で知られる。また、AI DJプロジェクトと題し、AIのDJと自分が一曲ずつかけ合うスタイルでのDJパフォーマンスを国内外で行う。2019年5月にはGoogle I/O 2019に招待され、Google CEOのキーノートスピーチをAI DJによって盛り上げた。
2019年4月からは慶應義塾大学SFCでComputational Creativity Labを主宰。研究・教育面からも実践を深めている。
東京大学 工学系研究科 電子工学専攻 博士課程修了。工学博士。

山口周
独立研究者・著作家・パブリックスピーカー
Profile

1970年東京都生まれ。独立研究者、著作家、パブリックスピーカー。電通、BCGなどで戦略策定、文化政策、組織開発等に従事。著書に『世界のエリートはなぜ「美意識」を鍛えるのか?』『武器になる哲学』など。慶應義塾大学文学部哲学科、同大学院文学研究科修士課程修了。

Overview

六本木アートカレッジ2019「“役に立つ”から“意味がある”へ」。第二回のテーマは、「AIと人間が協働することで新しいクリエーションが可能になる」です。冒頭、シリーズディレクターの山口周氏がAI時代における人間の心構えについて語るところからセミナーはスタートしました。続いて、AIを使って様々な音楽や映像表現を創作している徳井直生氏が、なぜAIの実験に音楽というフィールドを使うのかについて説明。二人の対談では、AIと協働する上でのポイントや、人の模倣ではない全く新しい表現を作ることの難しさについて、具体例を交えつつ対話が進んでいきます。幼少期より作曲に取り組まれていた山口氏と、AIクリエイターの徳井氏が、音楽の未来、そして創造性の未来に迫ります。

Presentation人類が目指すべきはAIとの「戦い」ではなく「共存」

山口周

昭和の頃に価値があると言われていた「正解」は、令和の今ではすっかり価値が薄れてしまいました。多くの問題や不都合を人間が解決し尽くし、現代は「便利なものより豊かなもの」「物より意味」「正解より問題」に価値を置く時代になりつつあるように感じます。そんな価値観の転換期である今、AIが急成長しています。

AIと聞くと、感性が無くて何だか得体が知れないとか、人間の仕事を奪う脅威の存在というイメージを持つ人も多いですが、果たして本当にそうでしょうか。人類社会の発展というのは様々な変化の積み重ねであり、AIはテクノロジーやアートに変化を与えるひとつのツールだと私は考えています。ですから敵対心を持つのではなく、AIと人類がいかに協働してより良い世の中を作り上げることができるか、という考え方にシフトしたほうがずっと建設的で健全だと思うんです。

現代人がもっと深く考えるべきは、「ビジョンを持つ」ということではないでしょうか。ビジョンとは「自分のありたい姿」とも言い換えることができます。ただし、現代人にとって、ビジョンを持つことは簡単ではありません。なぜなら、多くの問題が解決されてしまい、一体どこに力点を置いて頑張るべきか、何に価値を見出したら良いかが分からないからです。しかし、もし「ありたい姿」を思い描くことができれば、現状の自分との間にあるギャップが見え、新たな問題を生み出して、また頑張ることが可能です。なぜAppleやGoogle、IKEAなどが突出した業績を上げているかというと、会社のコンセプトやビジョンがしっかりしているため、自分たちが実現したい世界観が明確で、目標に向かいやすい雰囲気が溢れているからです。

そして、ビジョンを持つということはAIには困難であり、人間がやるべきことです。しかし、そのビジョンによって見つかった問題に対しては、AIが様々な解決策を示してくれるでしょう。AIと人間が上手く共存し、より良い世界を築いていくためには、今後このビジョンが大きなポイントになると感じています。

今回は徳井さんと「AIと音楽」という観点でお話をしていきます。私は昔から音楽が大好きで、素晴らしい音楽に触れた時にグッと心を掴まれるメカニズムを知りたくて、作曲方法や音楽理論、そして音楽の歴史について長らく学んできました。音楽というのは感情的な表現と思われがちですが、実は和声や作曲の教科書はまるで数学の教科書のようにロジカルで、非常にコンピューターと馴染みが良いのです。つまりAIを導入するのにも適していて、有意義な結果が期待できる分野として注目されているんですね。

Presentation創造性の主体はAIにではなく人間にある

徳井直生

私は人工知能の機械学習やディープラーニング関連の技術開発に取り組んでいて、コンピューター上に何らかの創造的なシステムを作ることで、主に人が音楽などの芸術表現を創造するプロセスを拡張することを目指しています。

人工知能の研究室にいた20歳の頃、音楽に興味を持ってDJを始めました。楽譜を読めず楽器も弾けない自分でも、AIを使えば自分にしかできない音楽表現を作れるのではないかと思い、AIと音楽を結び付けたんです。同じ頃、AI技術を駆使して3次元シミュレーション空間の中に仮想生命体がうごめくという作品を見たのですが、その作家の言葉に衝撃を受けました。「自分でも何でこんな生き物が生まれてきたのか全く説明できない。自分はシンプルなルールを作っただけで、その中で勝手に生まれてきたのだ」と。つまり、作者でも、作品の創造過程については説明できないと発言した。私はそれを聞いて、AIによって今まで存在しなかったような想像を超える音楽作品を生み出せるのではないか、と確信しました。

最近のプロジェクトでは、バッハやベートーベン、そしてビートルズなどの過去の音楽をAIで再現するのではなく、既存の音楽空間の中に存在する隙間、つまりまだ生み出されていない音楽を割り出して、音楽空間を拡張する可能性を探っています。現状のAIでは、過去を学習しながら、模倣せずに新しい表現を作り出すのは難しいので、今は主に人間の創造性と掛け合わせるという手法で研究を重ねています。例えば「AI DJ Project」というプロジェクトでは、人のDJプレイ後にAIが選曲して音楽を流すという掛け合いを行っています。試行錯誤した結果、AIがカメラの映像からお客さんの盛り上がりの様子を定量化し、選曲パターンを変化させることもできるようになりました。

皆さんにお伝えしたいのは、AIは効率化や最適化のためのものだけではないということです。私は、AIとは既知の領域ではまだ見つかっていない新しい隙間や、ちょっと外側を賢く探索するためのツールだと思っています。そして、その過程で得た新しい気づきや面白いAIの「間違い」を取り込んで、表現の探索空間を拡大し定義付けしていくのが人間の役割なのです。

AIだけでは新しい音楽は生まれない。人間の働きかけが必要

山口 徳井さんに早速質問があるのですが、あらゆるパターンの音楽が作られ尽くした現代、AIと人間の協働によって今までに無いような新しい音楽は作れるでしょうか? と言うのも、音楽というのはその時代毎に、人の受け取り方の感性や価値観のフレームが切り替わりますよね。例えば13世紀のグレゴリオ聖歌の頃は、和音が現代のドミソと違ってドとソの2音で構成されていました。理由は、「人の心を動かしすぎるのは悪い音楽」という共通認識が当時あったから。一方、その後ベートーベンの時代になると、逆に情緒性豊かで人の心を動かし過ぎるくらいの音楽が人気になりました。さらにドビュッシーの頃は不協和音の使用が全盛期でした。このように歴史を辿ると、パターンは網羅されているように感じるので、これからの可能性についてご質問しました。

徳井 新しい音楽は作れますが、課題が2点あります。1点目は、作曲者自身のアップデートです。AIで音楽を作るというと、AIが勝手に音楽を作ると思われがちです。しかし、実際の制作現場では、例えば1オクターブを12音の音階で、1小節の最小単位を16分音符として分解するというような制限を決めた上でデータを学習させて曲を作ります。そのため、結局のところ人間が音楽をどう捉えるのかというフレームワーク自体をアップデートしていかないと、AIを使ってもなかなか新しいものは生まれないのが実状なんです。
2点目は、聴き手との距離感です。最近、あまりメジャーではない微分音や古い日本の音階などをAIに取り込んでいくことで、面白い音楽を早期に作れる可能性が生まれています。ただ、過去の音楽から離れすぎてあまりに斬新な音楽をAIが作るようになると聴き手から拒否反応が出てしまうので、その距離感の加減が難しいところではあります。

類似性との「ズレ」でAIの創造性を刺激する

山口 なるほど。そうすると、作り手が、既存音楽の類似性からどうずらすかというパターンを体系的にAIに折り込んであげて、何度も調整しつつ新しい音楽の誕生を待つことが大事ですね。現代を生きる私たちにとっては、基本的に平均律のルールに基づいている音楽に耳馴染みがあるため、AIのディープラーニングも西洋音楽を母集団にしています。しかし、例えばイラク音楽は1オクターブが12ではなく36個に分かれていて、根本的に振りが違います。このようなマイノリティーな音楽を取り込んでみると、新しい可能性も見えてきそうです。

徳井 今のディープラーニングの特徴として、人間の感覚や印象のようなものを、よく分からないゴチャッとしたデータとして表現できる点が挙げられます。つまり、言語化も分類もできないのですが、何となく印象や特徴を定量化できる。ですから、定量化したものをちょっとずらしてあげると、過去に無かったような表現や感覚を探せるんです。この「ちょっと外側にずらす」というのがポイントになると思います。

AIが音楽を民主化する時代は、必ずしも幸福ではない

山口 AIには音楽を民主化させるポテンシャルがありますよね。かつては音楽の教育を受けるにも、楽器を演奏したり、作曲したりするにも、ものすごくお金がかかりました。一部の社会的、経済的に恵まれている人のためのもの、という側面がある。しかし、テクノロジーの進化によって、これらのことがAIとの協働で安価に実現できるようになりました。創造に携わる喜びというものを、一部の特権的なアーティストだけでなく誰でも得られるようになったというのは、非常にポジティブなことだと思います。一方で、スタジオミュージシャンが減ったように、民主化され過ぎると、職業として成立しなくなるというマイナスポイントも出てきますよね。

徳井 AIによる民主化が幅広く達成されると、確かに一時的には職業への影響も大きく出るでしょう。しかし、今度はちゃんとした生身の人間が演奏していることに希少価値が生まれ、そういう音楽を聴いてみたいと思う人も大いに増えてくると思います。さらに、AIが関わっていないからこその価値、魅力というものが生まれてくると思います。大学の同僚でもあるゴスペラーズの北山さんは、AIによる音楽の民主化について、「AIで素人でも簡単に音楽が演奏できるようになることは、素人たちにとってすごく残酷だ」と語っていました。AIの助けを借りて素人が演奏する音楽と、時間をかけて鍛錬を積んでプロが演奏する音楽とでは、歴然とした差が出てくるはずだと考えている訳です。AIで音楽を作ろうとするにわか作曲家には、じっくり時間をかけて上達してきた人たちとの差やセンスの違いに気付くことができません。ただ、聴き手にはその差は伝わってしまいます。中身のある音楽を奏でられない素人は、結局不幸なままなのかもしれません。

AIと人類はサーフィンにおける波と人との関係に似ている

徳井 私は、AIと付き合うことはサーフィンに似ていると感じています。サーフィンは受動性と主体性のバランスです。波が来ないとどうしようもできないし、その波を選んで乗っていくという主体的な部分も必要です。同様に、AIが作り出していく新しい正解や間違いを取捨選択して、適度に乗り適度に流されつつ、自分の価値観や考え方をアップデートしていくのが、AIと人間とのあるべき姿のように思います。

山口 能動態と受動態という言葉は皆さんご存じだと思いますが、古代ギリシャでは、受動態が無く、自分でやっているとも言えるし、何かにさせられているとも言える「中動態」という概念がありました。サーフィンのお話は、まさに中動態です。世の中というのはほとんどの行為が中動態であり、与え与えられる中で物事が進展していると思います。AIも、人が使うのか使われるのか、どちらが勝つか負けるかという話がありますが、過去を振り返ってみると、テクノロジーが進化することで人間の感性も進化し、それによって生み出された作品が世の中のあり方を変えてきました。テクノロジーと人間が互いに影響の連鎖の中で成長し、世の中に良い影響を与えていける関係性を築いていくことが大切です。

参加者との質疑応答

Q. 定量化した類似性からちょっとずらす、というところに興味を持ったのですが、どうずらすかというのは人間の裁量になるのでしょうか? 聴いている人の脳波を計り、一番ピークにくるところを最適化すれば、ずらすのも完全に自動化できるのではないでしょうか?

徳井 現代の脳科学の技術では、生理的な快不快をデータとして取れます。しかしながら、聴いている音楽に思う「良し悪し」みたいなものを、脳の計測だけでどれくらい定量化できるかというと疑問です。人がずらすのもひとつの手ですが、僕が考えているのはAIを使って偶然性を入れるなどの別の切り口です。必ずしもそのズレが良い方向にいくとは限りませんが、取捨選択を繰り返して新しい音楽を見つけていくという流れになると思います。今はまだなかなかそこを最適化するのは難しく、AI研究の課題となっている部分です。

Q. 私は声の仕事をしています。中国ではAIニュースキャスターも登場するなど、今後AIに仕事を奪われる日が来るのかと戦々恐々としています。やはり予想通りの状況になってしまうのか、或いは人間にしかできない部分があり、お互いウィンウィンで上手く共存していく余地があるのか、教えてください。

山口 以前、村上春樹さんが自身の著作を自身の声で読む朗読会を開いた時、プレミアチケットになり一気に売り切れました。書いた本人が読み上げる、というところに大きな意味があり、価値が生まれた好例ですね。単に声だけあれば良いということならAIで十分ですが、人間しか持ち得ない唯一無二性、ストーリー性が背後にあれば、AIより優位な立場になれます。聞く側もAIが作ったものにどれほど思い入れを持てるかと言うと、疑問がありますよね。

徳井 平均的なナレーションはAIに適しているかもしれませんが、ドラえもんの大山さんのような味のある声はAIで醸し出すのは難しいですね。AIで大山さんの声を学習することはできるかもしれませんが、結局それは二番煎じでしかない。AIによって、ああいった「味」や「クセ」を新たに作り出すのは難しいと思います。大切なのは、自分なりの何か強い特徴や魅力をいかに持つかということなのではないでしょうか。AIが普及する未来社会では、AIは言わば「正解」であり、人間はAIにとって「ノイズ」だと考えることもできます。誰がやっても同じ答えにたどり着くというのが正解です。AIによって正解があふれる世の中になれば、ノイズにこそ価値が出てくると私は考えます。正解を見つけ続けるAIに対して、どうやって自分が乱数として入り込んでいくかということが、どんな職業においても新たな仕事を生み出すための生き残り策になっていく気がします。

登壇者コメント
- セッションを終えたばかりのお二人に、感想を伺いました。-

山口 現代は音楽や絵画は既に行きつくところまで行きついてしまい、ここから先はもうあまり広がっていく余地は無いのではないかと言われていました。しかし今回のセッションを通して、AIの登場によって音楽界に新しい可能性や展望が見えてきたことが伝わったのではないでしょうか。

徳井 音楽は自由で抽象度が高いという性質を持つので、他のいろいろな芸術表現よりもAIとの互換性が高く、恰好の導入実験フィールドとなっています。また、社会にある様々な問題の中でも、真っ先によくテーマに上がりがちなのが芸術ですから、AIの問題や人間社会の未来を考えるのに、音楽はやはり適していると思います。

山口 既に音楽産業の中でも、ゴスペラーズさんや坂本龍一さんなどがAIの導入に積極的ですね。彼らのような人達はAIを脅威に感じていないと思います。寧ろ上手く利用して更に自身の音楽性を高めています。しかしテレビ広告のCM音楽などを作っている人たちにとっては、今後厳しい時代がやってくるのは確かでしょう。AIが作曲すれば安価で、しかもコピーライトフリーになるので、クライアント企業側も絶対的に都合が良いですからね。

徳井 AIと上手く共存するためにも、人間はこれからむしろ自分らしさをしっかりと持ち、自分の感覚やセンスを洗練させることに注力する必要があると思います。

山口 そうですね。人工知能に人間が乗っ取られるという戦々恐々とした構図ではなく、AIを上手くコントロールし、共に成長していくイメージを持てる社会になると良いですね。