このコラムでは、過去2回(過去の記事は下のリンクからご覧ください)にわたって「スマートスピーカーとフィンテック」の話題を採り上げてきました。昨年の秋頃、筆者は、その中の1つでも入手して試せれば程度の気持ちでしたが、結局のところ仕事柄と好奇心もあって、Amazon EchoとGoogle Home、そしてアップルのHomePodという、業界を代表するスマートスピーカー(アップルは、そう呼んでいないとしても)を、3種類とも所有する状態になっています。

過去のブログはこちらからご覧ください。 ・スマートスピーカーとフィンテック
盛り上がるボイスベースのEコマース

そこで、今回は改めてスマートスピーカーとフィンテックの関係を、現状と課題という切り口で考えてみることにしました。

3種のスピーカーは、すべて自腹で購入したものです。日本未発売のHomePodは、先日、たまたまアメリカ出張と発売日が重なり、ホテル近くのApple Storeで試したところ、(現時点では、英語のみの対応ながら)非常に良い印象を受けたので、買って帰りました。今はまだ日本語では使えませんが、セットアップ時に、対応したら知らせる旨のメッセージが表示されるので、日本語化や国内販売の準備も進められているとみて良いでしょう。

多言語対応については、Google Homeが年内に30言語をサポート予定で、HomePodは英語のみだが、Siri自体は20言語に対応しています。Amazon Echoは、Alexaが英語、ドイツ語、日本語しかサポートしていないため、その制約を受けているが、今後、対応言語を増やしてくることは間違いありません。

当面は1種類で済ませるつもりでいたスマートスピーカーの数が一気に増えてしまったのは、現状では万能なプラットフォームがなく、互いに補完関係にあるためです。また、コンピュータや他のスマートデバイスに比べれば価格的にも手が届きやすい6000~1万6000円(HomePodのみ349ドル[約3万8000円]で、やはり日本未発売のGoogle Home Maxになると399ドル[約4万3400円])ので、すべて買い揃えても比較的負担が小さくて済んだということもあります。高めの製品は音質の向上にコストをかけているので、価格もそれなりのレベルのオーディオスピーカーと比較すべきかもしれません。

ここで改めて明確にしておきたいのは、Amazon EchoとGoogle Homeは、それぞれ、グーグルとアマゾンのAIアシスタントであるGoogle AssistantとAlexaに対応する純正デバイスを指しますが、市場には、それらをサポートしたサードパーティ製のスマートスピーカーも存在しているということです。したがって、原稿内では純正デバイス名を使っていますが、サードパーティ製品もアシスタント機能面では同等と考えてください。

また、スマートスピーカーに対する最初の呼びかけ(OK、Google、Alexa、Hey Siriなど)のことを「起動ワード」(あるいは、「ウェイクワード」)といいますが、Alexaが短くて呼びかけやすい反面、OKやHeyが付かないため、AIアシスタント名が出てくる話をしていると、起動してしまうことがあるのが悩ましい点です(実害はありませんが)。

筆者が最初に入手したGoogle Homeは、検索結果が充実しているほか、Chromecastとの連携によって声でYoutube動画やGoogleフォトのアルバムをテレビ上に呼び出すことができます。また、Google Play MusicやSpotify、auのうたパスのサービスを利用した音楽再生が可能であり、サードパーティのサービスは、「アクション」というインストール不要の音声アプリを通じて提供される仕組みです。   Amazon Echoは、Wikipedia中心の検索機能ではやや劣りますが、「スキル」と呼ばれる対応音声アプリ/サービスの数(国内400以上、英語圏3万以上)で優位に立っており、音声によるアマゾンへの発注機能もセールスポイントの1つです。

しかし、後者は、色々と比較して決めるような買い方には適していません。向いているのは、あらかじめ決まっている普段使いのアイテムを注文するような場合で、いうなれば、御用聞きに対して消耗品の補充を頼むような感覚です。また、音楽再生は、Amazon Musicやうたパス、NTTドコモのdヒッツが利用できます。

アップルのHomePodは、(英語ですが)ニュースや天気、スポーツ結果、交通情報などのベーシックな質問に他のスマートスピーカーと同じように答えてくれるものの、音楽サービスはApple Musicのみで、サードパーティが音声アプリやサービスを提供するための仕組みも(少なくとも今のところは)用意されていません。

これは、1つには、アップルがスマートスピーカーの開発で後手に回ったこともありますが、先行する他のスマートスピーカーのサードパーティアプリ/サービスでは、VUI(ボイス・ユーザーインターフェース。単にVIとも)という新たな概念を開発者たちが持て余しているところが見られ、手探り状態で構築されたユーザー体験もバラバラです。   そこでアップルは、慌ててアプリ/サービスを揃えるよりも、しっかりしたガイドラインの策定を優先する道を選んだのではないか、と筆者は考えるようになりました。

音質でいえば、HomePodは3種の中で最高であり、Siriでコントロール可能なWi-Fiスピーカーとして考えれば、十分満足できます。また、(現状、英語ではありますが)Siriの受け答えは流暢で、音の良さとも相まって、AIとの対話の雰囲気を一番醸し出しているのも、この製品です。

試行段階にあるスマートスピーカー上の銀行サービス

さて、どれもベーシックな質問に答えたり、サポートされたスマートデバイスのコントロールができたり、対応の音楽サービスからの楽曲再生が可能なスマートスピーカーですが、フィンテックへの応用はどのような状態にあるのでしょうか? 以下は、原稿執筆時点での現状です。

まず、Amazon Echoは、日本でもすでにいくつかの銀行が、音声によって口座残金や入出金明細を調べたりできるスキルを提供しています。また、仮想通貨のレートや、コイン所持数を設定しておくと総資産額がわかるスキルもあります。

しかし、Google Homeでは、仮想通貨関連のアクションはあっても、日本ではまだ一般銀行から提供されているアクションがありません。

金融関係の法整備の問題とも絡むため、今のところ日本のスキルやアクションで送金などができない点は理解できますが、銀行サービスがAmazon Echoのスキルに集中しているのは何故でしょうか?

これは想像ですが、銀行側も、現在はVUIの試行期間であり、アメリカでスマートスピーカー市場の7割を押さえているAmazon Echoシリーズの評判を耳にして、まずは情報収拾を兼ねてこちらに参入してみた、ということのように思えます。

アメリカの銀行も、今はまだ、ユーザーがスマートスピーカーに何を求め、どのように使っているかを調査している段階です。そのため、声だけで送金まで可能なスキルの開発やデモなども行われているものの、実際にリリースされているのは、口座残金や入出金明細関連のスキルに留めているのが現実といえます(クレジットカードなどの請求に対して口座から支払えるスキルを提供している銀行はあるものの、自由に相手を指定しての送金とは異なります)。

それでも、これからはVUIベースの顧客チャンネルの確保が重要となることを認識している点ではどの銀行も一致しており、どこかが突破口を作れば、一気に道が開ける可能性は高いでしょう。

調査会社のBIインテリジェンスの調べでは、現時点で(スマートスピーカーに限らず)声を使って商品を購入したり、知り合いに送金したことがあるというアメリカ人は8%に留まっていますが、向こう5年間で約4倍の31%にまで拡大すると分析しています。その原動力の1つが、スマートスピーカーであるわけです。

さらなるフィンテックへの応用のために

さて、HomePodは、現時点では欧米でもこのデバイス上のSiriの機能がサードパーティに開放されておらず、銀行のサービスも利用できない状態です(Siri自体は、後述するように、アメリカをはじめいくつかの国で、個人送金にも対応しています)。その一方で、たとえば仮想通貨のレートは、普通にSiriに訊くだけで答えを返してくれます(HomePod上では英語ですが、iOSやmacOS上のSiriは日本語でも音声と画面表示で答えます)。

実は、ここからが興味深いのですが、Amazon EchoやGoogle Homeに対して、起動ワードに続けて「1ビットコインはいくら?」のように仮想通貨レートの質問をしても、戻ってくるのは「すみません、私には分かりません。」、「すみません。お役に立てそうにありません。もっと勉強して改善します。」という残念な返事なのです。

モバイルアプリのGoogle Assistantでは、同じ質問すると画面に関連するWebページの情報が表示されます。ところが、スマートスピーカーでは仮想通貨レートのアクションやスキルを「Coin Priceにつないで」のように呼び出だしてから、改めて質問する必要があるということです。

この差は何なのでしょうか?

グーグルやアマゾンはスマートスピーカーにおいて、アプリに相当するアクションやスキルを用い、ユーザーが明示的にサービスに接続して利用するスタイルを採っていますが、サービス名を知らなければ処理ができません。これは、かつてのDOSのコマンドを記憶して何かをするやり方に似ています。

これに対してアップルは、声で明示的にサービスに接続してから質問したり処理を行うやり方は、AIアシスタントのユーザー体験として望ましいものではないと考えているようです。Siriに、ただ普通に質問したり指示するだけで、ユーザーがしたいことをできる環境を目指しているともいえるでしょう。

ただし、それはあくまでも理想であって、アップル自身もどうすればそういうAIアシスタント環境が実現できるのか、模索している最中だと思われます。こういうときの同社の対処法は、中途半端なソリューションを提供することなく、内部で納得のいく解決法が見つかった時点で組み込むというもので、その結果が、現在のHomePodの姿なのです。

また、ボイスペイメントに関して、日本では先のAmazon Echoによるアマゾンへの発注のみが可能ですが、アメリカではGoogle HomeもGoogle Expressというショッピングサービスで対応しており、さらにアマゾンはAmazon PayをAlexa向けのスキル開発をしているサードパーティに開放する予定で、実現すればより自由に物品/サービス購入が可能となります。

Siriは、アメリカではiOS上で個人送金できるApple Pay CashをSiri経由でも可能としており、つい最近、同じサービスがアイルランド、スペイン、ブラジルにも拡大しつつありますが、HomePod上ではサポートされていません。

この違いは、おそらく認証の問題が関係しており、iOSデバイスではTouch IDやFace IDによって認証処理を行えるのに対し、HomePodではできないためと思われます。もちろん、HomePodから送金を指示して、iOSデバイスで認証する方法も考えられますが、それなら最初からiOSデバイスで済むという話です。

Amazon EchoやGoogle Homeでは、ボイスによる注文時や銀行口座の確認時などに、そのために設定した暗証番号をユーザーに質問することで本人確認を行います。しかし、暗証番号を声に出していうことには抵抗もありますし、実際にもさほどセキュアだとは思えません。アップルがHomePodでこうした処理をサポートしていないのも、まだ同社が想定するセキュリティ基準を満たせないためと考えられます。

この対策としては、声によるユーザーの判別が挙げられるでしょう。HomePodはまだマルチユーザーに対応していませんが、Google Homeはすでに複数のボイスを聞き分けることができ、Amazon Echoもアメリカでは先ごろ同様の機能が実装されました。しかし、にもかかわらず暗証番号を訊いてくるのは、現状のボイス判別ではセキュリティが不十分なためでしょう。

だとしても、将来的にTouch IDやFace IDと並ぶVoice IDとでもいうべき認証方法が確立されるならば、暗証番号が不要になる可能性は残されています。

それでは、スマートスピーカーを導入したり、それに対するサービス開発をするのは、まだ時期尚早なのでしょうか? 筆者は、そうは思いません。米公共ラジオ局のNPRとエジソンリサーチの共同調査結果によれば、スマートスピーカー購入者の65%が、それなしの生活には戻りたくないと答えています。また、ここに書いたようなことに筆者が気づいたのも、実際に生活の中に採り入れて使ってみたからなのです。

その理想像からすれば未完成かもしれませんが、特に企業の方々は、来るべき未来に備えて、VUIにできること、できないこと、そして、できたら良いことを見定めるためにも、実際に利用してみて、スマートスピーカーとは何かを肌感覚で知ることが大切だと思います。


執筆者:大谷和利

テクノロジーライター,原宿AssistOnアドバイザー,自称路上写真家。Macintosh専門誌, デザイン評論誌, 自転車雑誌などの誌上でコンピュータ,カメラ,写真,デザイン,自転車分野の文筆活動を行うかたわら,製品開発のコンサルティングも手がける。原宿アシストオンのウェブサイト

これからの時代の強い味方
Moneytreeで資産管理を始めよう

  • Download on the App store
  • Androidアプリ Google Play