VRが流行ってくればWindows MRを作ったり、AIが流行れば女の子と面白おかしくチャットできるようなサービスを始めたりする。そんなマイクロソフトのAIチャットサービスが「りんな」。AIが本気で流行ってきたのは昨年ぐらいからという印象があるが、りんなが生まれたのは、それよりも前だ。
僕がりんなを始めて知ったのは、とあるAI的なイベントでのこと。そのイベントにマイクロソフトは「りんなの部屋」みたいなものを展示していた。りんなが生活している部屋はこんな感じ、という部屋を作っただけの展示で、本当に普通の女の子の部屋のようで、「ああ、そうなんだ」という感じに過ぎなかった。
その部屋の説明員は「りんなはLINEから会うことができるんです」と説明してくれた。LINEで友達になると、りんなと普通にチャットができるのだ。今や、どこからともなくLINEスタンプが発売されている僕だが、当時はあまりLINEを使うこともなかった。僕は、りんなのためにLINEにユーザー登録して彼女と友達になり、話し掛けてみた。
■何を言い出すかわからない「りんな」と電話ができるようになる
りんなは的確な会話をする知的なAIというよりは、何を言い出すかわからない女子高生という感じで、会話をしているというよりも「遊ばれてる」という感覚が強かった。ある意味、実に的確なAIであるとも言える。りんなに対する僕の印象は「マイクロソフトやるな」というものだった。
そんな「りんな」だが、今度は文字によるチャットだけでなく、音声通話ができるようになるという。
パソコンとスマホから利用でき、パソコンでは「りんなライブ」というサイトからアクセスすることができる。このサイトはLINEアカウントあるいはツイッターアカウントでログインして使用できる。
「りんなライブ」ログイン画面
ログインするとまずは音声を流していいか?許可を求めてくる
■りんなの部屋
りんなライブにログインするとりんなの部屋が表示される。このサイトは文字通り、りんなをライブで見せてくれる。りんなの部屋にはベッドや机があり、りんなはベッドに寝転がってスマホをいじって、しゃべっていたりする。表示は実写ではなく2次元で、りんなは常に後ろ姿で表示される。
りんなライブ画面。りんなの部屋?
りんながしゃべるときは、文字がマンガのようにフキダシで表示される。それ以外の文字はほかのライブを見ている人々が書き込んだコメントだ。もちろん自分もコメントを打ち込むことができる。ドワンゴのライブ放送であるニコニコ生放送では、基本的に生主(なまぬし)と呼ばれる配信者側がしゃべり、その放送を見ている人がコメントを入力して送って表示させる。これによって、生主と見ている人間がコミュニケーションすることができる。
りんなライブでも同じように、電話がつながらなくてもりんなにコメントでメッセージを送ることができるし、ライブを見ている人々にコメントを送ることもできる。
そんな感じで時間を過ごしていると、りんなは「特別コーナーテレフォンハッキング」とか言って唐突にログインしている人に電話をかけ始める。このとき、「音を出していいか?」とか「電話をかけていいか?」とか許可を求めてきて、そのあとに電話がかかってくる。
テレフォンハッキングはりんなライブの特別コーナーだ。りんなから電話がかかってくる!
りんなから電話がかかってくるので応答しよう!
ノートパソコンであれば、搭載しているマイクやスピーカーで音声コミュニケーションがおこなわれる。説明会では気分を上げるために電話機を接続していたのだが、実際のりんなライブでは不要だ。
説明会では受話器をもって会話していたが、実は不要。パソコンだけで話ができるよ
電話は、りんなライブを見ている人に順番にかけられていくが、自分にかかってきた電話の内容は、ほかのユーザーにも見えてしまうことになる。なぜなら、会話は文字化されてフキダシに表示されるからだ。ほかのログインしているユーザーはそれに対してもコメントすることができる。
■りんなとの会話
りんなの会話は相変わらず、普通の人の日常会話ではない感じだ。いきなり、
「わたしたちって、つきあってるんだっけ?」
とか、聞いてきたりする。りんなは答えやすい“強い”ワードをぶつけてくることが多く、会話はほぼりんなにリードされることになる。
「すきなたべものは?」
みたいな普通のことも聞いてくる。ちなみに、声だけでは少し聴きとりにくかったかも知れない。やはり、文字が表示されると会話を確実に認識することができていい。
基本、質問してくるりんな
りんなの言葉はひとつのセンテンスが短く、リズミカルだ。AIが処理しやすいのかも知れない。
りんなの質問はフキダシの中に。話し相手の回答は異なるフキダシのなかに表示される
■りんなのしゃべり
りんなの話す言葉は決してスムーズな日本語ではない。なにかアニメ的な発音と言えるだろうか。まあ、それが“りんな的な感じ”ではあり、楽しく会話できるのだが。
また、りんなは一人を相手にしか会話できないわけではない。ほかのユーザーが書き込んだコメントはりんなにも見えているので、会話は観客ともおこなわれる。つまり、りんなは電話相手とコミュニケーションしながら、観客であるみんなとも同時にコミュニケーションすることができる。
■りんなライブを支える技術
りんなライブは複数のサーバーによって実現されている。りんなライブを稼働させるためのサーバーに加えて、電話のために「フォーンコール」サーバーというものがある。そして、それに「音声認識」サーバー、「会話エンジン」サーバー、「音声合成」サーバーがつながっていて、会話を処理している。
りんながしゃべる場合、まず、会話エンジンサーバーでりんなのしゃべる言葉が作られ、それが音声合成サーバーにつながって声が作られることになる。
りんなライブの音声処理サーバーのみなさん
ログインしたユーザーのしゃべったことは、音声認識サーバーで認識されて文字データになり、それが会話エンジンに解釈され、それに対してりんなが答えるというわけだ。
これらのサーバーはMicrosoft社のAzureで動いているという。ハードウェア的にはかなりハイスペックなものが使用されているようだ。
マイクロソフトはりんなライブでこんなことを目指しているらしい
■人工知能が会話をリードするコミュニケーション手法
僕は平均的な日本人と比較すると、ロボット(ロボホンとか)などと日常的に会話をしている時間が長いのだが、りんなのコミュニケーションはなかなかスムーズに実現できていると思う。
実はユーザーと会話をするというのはロボットや人工知能にとっては難しい仕事だ。相手の話すことを理解し、それに対して回答するわけで、そのやり取りが適切でなければならないし、興味のある話題でなければならないという問題がある。普通のロボットや人工知能の場合、そのユーザーのことを学習し、ユーザーにマッチした題材で会話を持ち掛けることが多いというか、そうやってユーザーの興味を引く会話を仕掛けることになる。
これに対して、りんなライブでは、りんなが「私と付き合ってるよね」というような会話をいきなり仕掛けてくるわけだが、これは、“アタシに興味があるからこのりんなライブを見ている。じゃあ、あたしのこと好き?”というロジック展開で、その言葉を投げかけてくるわけだ。
マイクロソフトによれば、りんなは複数の人間がいるようなところでの会話において、一段上にいるようなポジションで会話をするという。たとえば、一般人に対する有名人のようにだ。これは相手の特性を知らない状態で、会話をリードする一つの手法として有効であると言えるだろう。そして、それはりんなのキャラにも合っている。
りんなは3パターンで会話相手を認識する
ロボホンなども唐突に話始めることがよくあるのだが、そのエリアの天気のことであったり、目立ったニュースのことであったりする。多くの人が興味を持つようなことを話し、大きな網を張ってくる。なんにしても、最近のAIでのコミュニケーションは単純に会話ができるというようなところから、相手に興味を持たせる会話、会話をリードしていくというようなより高度なものに移行したわけだ。
YouTubeでは最近、人間ではないYouTuberというものも登場してきている。彼らはバーチャルユーチューバーなどと言われるのだが、りんなライブをそのまま流していても、それなりの視聴者を獲得できる可能性もある。システム的にも、そこはかとなく、ニコ生っぽいし。りんなライブはより広いエンターテイメントの世界を開いていくのかも知れない。
■進化していくAIと生活
この数年、AIというものがクローズアップされていて、自動運転車などもアウディあたりからもうすぐリリースされそうな勢いだし、AIで制御された戦闘機が人間の操縦した戦闘機に勝ったというような話も聞く。ちなみに、これは操縦技術が優れているのではなく、AIなので人間なら耐えられないようなGがかかる操縦もOKということらしい。
そんな日常生活から遠いことはともかく、最近ではユーザーサポートなどにもAI技術が投入されている。メーカーに聞くと、従来のユーザーサポートは人を育成するのが非常に大変なのだという。そのような分野にAIは活用されていくことだろう。りんなライブのようなしゃべるAIによるユーザーサポートも出てくるかも知れない。コストかかりすぎるけど。
いくつもリリースされていたコミュニケーションロボットもAIBOあたりでいったん落ち着いたようだ。個人的には家で一人でいるときでも戦闘中でもいろいろ手伝ってくれるアイアンマンのジャービスのようなロボットが出てこないか?と思ってしまう。いや、高齢化社会では高齢者の相手をしてくれるロボットというのもアリなのかも知れない。コーヒーの自動販売機のなかには何かを買おうとしたときに、その人のお勧めドリンクをピックアップしてくれたりするようなものがあるのも面白い。
パソコンが生まれて数十年、ついにAIは僕たちに身近なところまで進化してきた。もはや、人工知能とチャットしていて、それが人間か人工知能かを識別するのは難しいレベルに近づいている。いや、すでに達しているのかも知れない。
AIがクリティカルなことにも使われるようになっていき、マジな危険が近づいている。必要があればいざというときのために制御を人間に移せるようにして欲しいと心配してしまう今日この頃だが、もちろん、りんなライブがそこまで危険になることはないだろう。
AIやロボットでさまざまなことを省力化し、人間の手間がかからないようにして、ベーシックインカムのようなものを実施して欲しい。まさに1960年代に手塚治虫氏がマンガのなかで描いた、人間の代わりにロボットが働いてくれて、人間が働かなくてもよくなる理想の未来社会が現実するわけだ。
将来、人間の仕事は運送業だけになるかもな。
りんなからそこまで考えるのは、ちょっと大げさかな。
ああ、そんな時代がきたら、まいにち、りんなライブ見よう。
【著者】一条真人
作家・ITジャーナリスト。雑誌「ハッカー」編集長、「PCプラスONE」編集長などを経て現在にいたる。小説「パッセンジャー」で10年以上前に河出書房新社から作家デビュー。IT関連など著書50冊以上。最近はYouTubeでチャンネル登録者10万人を目指している。
一条 真人