■ 『人工知能が俳句を詠む』 AI一茶くんの挑戦  (2021.10.4)








AIと俳句との組合せ。思わず何をしているんだろうと興味を引かれる。AIは取り合わせの俳句(無関係な2つを並べたもの)が得意ですね、という俳人のコメントもおもしろい。
(本書では、「AI」と「人工知能」という表現が混在している。特に区分して使用している様子はないのですが、原文を尊重しそのままとしています)




たしかに、何のためにわざわざAIの手間をかけて俳句を詠むのか?という疑問はわく。機械仕掛けで俳句を量産して何になるというわけだ。これについては、俳人の五十嵐秀彦さんの考察が納得できる。雑誌『俳壇』へ投稿されたものだ。こう言っている。
   AIが人間と同じように俳句を詠むこと。それ自体は何の役にも立たない。これは便利なことだなと思う人がいるはずがないからだ。なぜ私たちはAI俳句が気になるのか。人はどうやって俳句を作り、選句し鑑賞しているのか、そのメカニズムがAIによって明らかになるからだろう。AIが俳句を作れるということは、言葉のつながりの意味性よりも、単独の言葉の持つ力の存在を浮き彫りにしており、「俳句における言語」というものの本質を示唆しているのであると。

AI俳句に取り組んだのは、北海道大学大学院情報科学研究院調和系工学研究室のメンバーである。「より知能の本質に迫るため、本当の意味で機械が知能を獲得するためには何が必要なのか?」という問いがある。人工知能で俳句を生成したり、俳句を批評したりという研究が、この問いへの一つのアプローチになるのではと考えたからだという。このプロジェクトは「AI一茶くん」と名付けられ、2017年夏に研究を開始した。単に俳句を生成する人工知能をつくることを目的としているのではない。最終的には人に交じって人と対等に句会に参加できる人工知能を開発することがゴールなのだ。

AI一茶くんの誕生には、人工知能の基礎技術となる、ディープラーニング(深層学習)が活用されている。ディープラーニングは、お手本となる大量の教師データから、その判断を学ぶことによって性能を向上させていく技術だ。初期の一茶くんは、ひらがなで書き下ろした小林一茶の俳句2万句を教師データにつかった。さらに教師データの強化のため、正岡子規、高浜虚子のトータル5万句をデータ化した。さらに、青空文庫で公開されている作品をデータ化するなど不断の拡張を続けている。

一茶くんでは、LSTM(Long Short Term Memory)と呼ばれるディープラーニングのモデルを用いた。教師データの中の俳句それぞれについて、最初の1文字目が何の文字であるかをまず学習する。次に1文字目に続く2文字目、2文字目に続く3文字目を順に学習していく。これらを繰り返すことで教師データの俳句の文字列の並びを学習する。
詠むときには、1文字目を何らかの方法で確率的に選んで入力する、そうするとその文字に続く文字を出力させることができる。その文字をまた入力にして次の新しい文字を出力させる。17音に達するまでひらがなを出力させれば俳句らしきものができる仕組みだ。漢字などへの対応を加え格段の進歩を図った。

LSTM手法では、無から確率的に俳句を生み出すことが可能である。しかし、決められたお題や写真をもとにした俳句の生成はできない。新しい教師データ ――人間が詠んだ俳句の状況とマッチするような写真とのペアを大量に集めることが必要だ。画像認識と俳句を生成するディープラーニングを組み合わせて、写真と俳句の相性を数値化して、お題の写真と相性の良い生成俳句を選べるようになった。

「一茶くんは取り合わせの俳句が得意ですね」というコメントを多くの俳人からもらうようだ。取り合わせの俳句は無関係な2つを並べることで、内容にコントラストや奥行きが生じる。一茶くんでは、統計的にありそうな言葉のつながりを学習し、繋がりそうな言葉を確率的に選んで俳句を生成している。このため17音で首尾一貫した一つの内容を表現することは難しい。一方、サイコロのいたずらによって面白い組み合わせが生まれことがある。高評価はこのためだろう。

おわりに、俳人の大塚凱さんが選句した、AI一茶くんの作品を挙げてみよう。
・水仙やしばらくわれの切れさうな
・強霜に日のさす如し磯の人
・逢引のこえのくらがりさくらんぼ
・雲ふかくゆきて帰らず毛虫焼く
・白鷺の風ばかり見て畳かな


◆ 『人工知能が俳句を詠む ―AI一茶くんの挑戦―』 川村秀憲ほか、オーム社、2021/7

    HOME      読書ノートIndex     ≪≪ 前の読書ノートへ    次の読書ノートへ ≫≫