いよいよ日本でもスマートスピーカーの本格的な普及が始まりましたね。日本では、ラインのClova WAVE、グーグルのGoogle Home、アマゾンのAmazon Echoが実際に日本国内で販売開始されました。

スマートスピーカーというのは、音声応答するAI(人工知能)を搭載したスピーカーのことです。極端な喩えですが、「ドラえもんの口」だけがリビングやキッチンにあるような生活がいよいよ現実的になりました。

それは、自分で動き回ったり、便利な道具を取り出したりすることはできませんが、話しかければ返事をし、様々な疑問に答えてくれるでしょう。そうした機能性を持つデバイスを、シンプルなスピーカーの形に凝縮したものがスマートスピーカーなのです。

1.Echo

2.Google-Home-Colors

3.homepod-white-shelf

大手IT企業と家電メーカーが続々参入

実際のAIによる処理はインターネットを介してクラウド上で行われるため、端末としてのスピーカーの負荷はさほど高くありません。また、一部の上位機種を除けばディスプレイなども内蔵していないので製造コストも比較的低く抑えられ、販売価格も数千円から数万円程度となっています。

機能だけを見ると、たとえばスマートフォンで利用できるSiriやGoogle AssistantなどのAI機能の自動応答設定をオンにしておけば、同じようなことが可能です。しかし、スマートスピーカーは少し離れた場所の声も拾える設計となっており、家の中の定位置に置いて家族みんなで使うような利用スタイルが想定されています。その意味では、「画面のないホームコンピュータ」的な存在ともいえるでしょう。

そんなスマートスピーカーの元祖は、AlexaというAIアシスタントをサポートするアマゾンのAmazon Echoです。先日、大手検索サービスのグーグルによるGoogle Homeと前後するように、日本でも発表が相次ぎましたので、すでに注文や招待申請(Amazon Echoは現時点では招待者のみの購入)されている方も多いのではないでしょうか。あるいは、筆者もその1人ですが、もう使っているという人もおわれるでしょう。

Amazon Echoは、アメリカでは2014年に試験運用が行われて翌2015年から正式販売が始まり、その後、バリエーションが増えると共に、ライバルたちの参入も相次いできました。発売済み、もしくは今後発売予定のものも含めると、IT系企業の純正製品では、グーグルのGoogle Home(Google Assistant対応)やアップルのHomePod(Siri対応)、サムスンのVega(仮称。同社のAI技術、Bixbyに対応)、ラインのClova WAVE(韓国NAVERとの共同開発になるAI技術、Clovaに対応)があり、家電・オーディオメーカー系では、ソニーやJBL、ハーマンカードンをはじめとする様々な会社が、Alexa、Google Assistant、そしてマイクロソフトのAI技術であるCortanaに対応したデバイスを発表しています。

中でも、市場シェアの7割を押さえて先行するアマゾンは、Echoシリーズを自社通販の窓口としても活用して電子御用聞き的な役割も担わせたり、デバイス自体を傘下の大手自然派スーパーで販売するなど、他のITメーカーには真似しにくい独自の戦略を展開していて目が離せません。

身近なお金の相談相手にも

さて、このスマートスピーカーがなぜこのように期待されているかというと、電子デバイスのユーザー層や使われ方を大きく広がる可能性を秘めているからです。確かに、スマートフォンやタブレット、あるいはウェアラブルデバイスは、それまでのコンピュータとは異なる使いやすさや、どこでも使える気軽さをもたらしましたが、それはユーザーが若年~中年層の場合に当てはまること。高齢者の中には、今も自分には無縁の存在と考えている人が多いのも現実といえます。それは、いかにタッチ操作が簡単とはいっても、やはり、デバイス自体の使い方は新たに学ぶ必要があり、そのことに戸惑ったり、負担に感じてしまうためではないでしょうか。

これに対して、スマートスピーカーは、普通に話しかけるだけで、今日の天気やスポーツの結果、株価などまでわかりますし、製品によっては通販の注文までできてしまうわけです(必要情報の登録は、息子さんや娘さんの協力も必要かもしれませんが…)。

また、スマートフォンなどを活用している人たちにとっても、家で料理をしたり、くつろいでいるときに、声だけでレシピ検索や調べ物ができるというのは、魅力的な機能といえます。そして、もちろん、自分の銀行残高などの資産情報を調べたり、他のフィンテック系のサービスを利用する場合にも、スマートスピーカーを経由する機会は増えていくことになるでしょう。というのは、スマートスピーカーでは声紋を利用した本人確認も理論的に可能であり、いくつかのパスフレーズを言わせるようなログイン方式を採るなどすれば、セキュアなセッションを実現できるためです。ちなみに、10月のAlexaの発表に合わせメガバンクなども対応を発表しています。中でも、MUFGが発表した「請求額・ポイント残高かんたん確認アプリ for Amazon Alexa」はマネーツリーが開発に携わっています。

さらに、同様の技術をIP電話機能に応用すれば、話者が本人かを自動で判別できるので、いわゆる振り込め詐欺なども未然に防げるようになるかもしれません。

SXSW 2017でも、これからのフィンテックは、AIやボット(自動応答するチャットシステム)との連携で伸びていくとの議論が見られましたが、それらは、まさにスマートスピーカーのベースとなっている機能です。たとえば特定の金融商品に関する情報や投資の基礎知識を、ボットとやり取りしながら得ていくような使われ方が考えられますし、将来的には資産運用のアドバイスまで行えるようになる可能性も十分にあるでしょう。どれだけ聞き直したり、深掘りする質問をしても、最後まできちんと相手をしてくれるので、ユーザーに知識がなくても気後れせずに利用できるサービスとなるはずです。

もっとも、当初はそのレベルまでできなくても、預金残高の照会や、登録してある振込先への送金などを声で命じられるだけで、十分に便利さを感じられるに違いありません。

個人的に欲しいのは「ヒソヒソ話モード」

一方で、フィンテック企業を含むソフトやサービスの開発会社にとっては、スマートスピーカーに相応しい新しいユーザー体験を創出していく必要があります。

過去のユーザーインターフェースの概念には、キャラクターベースの「CUI」や、グラフィカルな「GUI」がありましたが、IT業界ではすでにボイス・インターフェースを意味する「VI」という略称が注目されるようになっていて、この分野の覇者になるべく、競争が始まっているのです。

ちなみに、個人的にはVIに「ヒソヒソ話モード」のようなものも含めて欲しいと思います。単純な送金手続きであれば、あまり気にならないかもしれませんが、フィンテック関連の情報にはプライベートなものも多いので、それを普通の話し声で行うのも気が引けるからです。

もちろん、そういう情報はスマートフォンなどで個別に確認すれば良いともいえますが、今後はスマートスピーカーしか電子機器がない高齢者の家も普通に存在するようになるかもしれません。話の内容によっては、小声で話しかけた場合には、その人にしか聞こえないような声で返してくれるといった配慮があっても良いのでは…と思うわけです。最近では、特定範囲の特定の距離の人にしか聞こえないようなスピーカーシステムも開発されていますから、そういう機構を組み込むのもありではないかと考えます。

あるいは、室内に居る人数をセンサーで確認して、秘匿性の高い情報に関しては、今ここで話して良いのかをユーザーに確認してくれる、そんな賢いデバイスも登場してこないとは限りません。

いずれにしても、まだやっとその可能性の一端を垣間見られるようになったばかりのスマートスピーカーです。ほんの10年ほど前には、スマートフォンが普及した後の世界や新ジャンルのアプリを想像できなかったように、これから5年後、10年後には、スマートスピーカーも予想を超える発展を見せていることでしょう。


執筆者:大谷和利

テクノロジーライター,原宿AssistOnアドバイザー,自称路上写真家。Macintosh専門誌, デザイン評論誌, 自転車雑誌などの誌上でコンピュータ,カメラ,写真,デザイン,自転車分野の文筆活動を行うかたわら,製品開発のコンサルティングも手がける