音声アシストとは?4つの音声アシスタントの代表的製品を比較

1.あらすじ

人工知能ブームがますます加速する現在、Siriに代表される音声アシストは、どんどん存在感を増していき、それを追従するような製品が、大手企業やベンチャー企業まで、幅広くリリースされるようになってきました。

音声アシスト・アプリが便利なのは、スマートフォン等の機器にデフォルトで搭載されている事が多く、道に迷ってしまった時や、ある特定の場所に行きたい時等に、気軽に話しかける事ができ、また、万能ではないものの、それをかなりの高精度で意図解釈をしてくれ、正しい回答を返してくれる点にあります。

最近では、自閉症の子供が、Siriと会話を繰り返していく事で、会話の楽しみを学習するようになり、自閉症を克服する等のニュースもありました。

このようにただの音声アシストという用途から、さらに拡大して使用されるようになった音声アシストには大きな注目が集まり、また、その元になっている、人工知能の一分野のNLP(自然言語処理)技術を駆使した、対話システムに対する研究開発もますます加速しています。

対話システムの応用先は音声アシストだけに関わらず、人間のオペレータによるお問い合わせ対応の手間を代行するチャットボット等にも応用され、ますます市場が盛り上がっています。

チャットボットは、音声アシストとは異なり、もっと目的特化型ですが、場合によっては音声インタフェースにも対応しているため、そういった音声対応チャットボットは、目的特化型の音声アシストとみなす事もできるでしょう。

今回の記事では、現在、世界で注目を集めている音声アシストの例をご紹介いたします。

2.音声アシストとは?

それではまずはじめに音声アシストとは何かという説明からしてこうと思います。

音声アシストの説明といっても、そんなに畏まった内容にはなりませんが、一般的に音声アシストは以下のような機能を備えています。

  • スマートフォン、スマートスピーカー、ウエラブルデバイス、PC等、一般的なデバイスをサポートする
  • 対象の言語はそのアプリケーションが使用されている母国語を最低限サポートする(Siri等は、かなり幅広い言語をサポートします)
  • 音声認識による、発話での音声入力に対応している
  • 音声でない、テキストでの入力にも対応している
  • 音声合成による、音声出力に対応している
  • テキストによる出力にも対応している
  • 天気の情報、ナビゲーション、スマートフォンの操作等、何らかの決まった対応ドメインに対して、ユーザの自然言語入力を理解し、回答する

上記は、音声アシストの非常に一般的な機能かと思います。

ここで、今までのアシストアプリケーションと、音声アシストが異なる点は、音声アシストが、ユーザの自然言語による入力を意図解釈し、それに適したリアクションをするという点かと思います。

Siriを筆頭として、意図解釈の部分の技術は大きく向上し、かなりの言い換え表現や、くだけた表現にも対応しています。

他にも、音声アシストは、一部雑談的なものに対応した対話システム的な側面や、「Hey Siri」のように、本体に話しかけたら自動起動できるような機能等も備えているものもあります。

3.【Alexa】の特徴とは?

Amazon Echo は皆さん既にご存知の事と思います。

言わずと知れたAmazon Echoで、2015年から米国で発売開始され、世界中で話題になった、人工知能Alexa掲載の音声アシストの代表格です。

Alexa

Amazon Echoでは、AccuWeatherから天気の情報を提供したり、様々な外部のAPIを通じでニュースを提供したり、曲のストリーミング再生を行ったり、Googleカレンダにアクセスして予定を調整する等、様々なアシスト機能を提供します。

「Hey Siri」のような起動ワードが使用でき、「アレクサ」と発話すると起動させる事ができます。(起動ワードは「アマゾン」「エコー」「コンピュータ」に変更可能です)

その、中核であるアシストの機能を提供するのがAlexaという名前の人工知能アシスタントであり、Amazon Echoを通して利用できるだけでなく、他社のスマートスピーカーや、スマートウオッチ等のウエラブルデバイス、その他、冷蔵庫等の家電にも対応しています。

単なるパーソナルアシスタントの域を超えて、IoTと密接に連携した、ホームオートメーションを実現するための技術としても有効活用されています。

勿論、Amazonのプラットフォームとの連携が非常に便利で、買い物の購買記録の検索や、現在ペンディング中のオーダーを検索したり、まさに痛いところに手が届く仕様になっています。

Siriと並んで、もしくは商用分野ではSiri以上に、注目されている音声アシストと言えるでしょう。

amazon alexa

4.【Siri】の特徴とは?

Speech Interpretation and Recognition Interface の略です。

あえてAlexaの方を先に書きましたが、音声アシスタントの紹介をする際に絶対に外せないのが、このSiriでしょう。

siri

iPhone、iPad等に標準掲載されているため、実際に使用された方も非常に多いかと思います。

まず驚くのは、その圧倒的な意図解釈の精度の高さで、天気や、ナビゲーションのような音声アシスタントとして想定される質問だけで無く、一部、雑談的な話にも対応でき、面白いジョークのような返答をしたり、まるで人間と会話を楽しんでいるかのような錯覚に陥ってきます。

もともとは、アメリカ国防高等研究計画局によって、兵士を戦場でサポートするための人工知能プロジェクトとしての開発が始まりました。

当時は、人類史上最高の人工知能プロジェクトとも言われ、巨額の資金が投じられました。

そのプロジェクトから派生してできたのがSiriという訳です。

最近では、開発者に向けてSiriのAPIを公開する等の動きもあり、ますますSiriの存在が身近になってきています。

音声アシストといえば、Siriと言わしめるほど、不動の定着感を気づいたSiriですが、これからもますます進化していくと思います。

5.【Google Assistant】の特徴とは?

最近、日本に上陸して話題になっているGoogleの音声アシスタント。

これによりAndroidでもSiri同様の機能が使えるようになり、かなり便利になりました。

google assistant

このGoogleアシスタント、音声認識の精度も抜群で、反応も早く非常に重宝します。

スマートフォンで設定を行った後、「OK Google」と話しかけると起動できます。

Googleカレンダーと連携して予定を追加したり、天気の情報を調べたり、目的地までの最短経路を調べたり、現在の交通状況を調べたり等、Siriと同様に様々な事を検索できます。

また、当然ながらGoogle検索と連動して動作をするため、音声アシスタントがサポートできないような質問でも、本来のGoogleの検索機能を使用して、的確な回答を返す事ができます。

これで、Siriがなくて寂しいAndroidユーザも満足できるのではないでしょうか?

6.【しゃべってコンシェル】の特徴とは?

さて今まで、ずっと世界的を代表するといっても過言でない、3大音声アシストについて紹介してきましたが、ここで日本発の音声アシスタントについても紹介しておきましょう。

ドコモのユーザにはおそらく馴染み深いかと思いますが、「しゃべってコンシェル」です。

しゃべってコンシェル

目的地までいきたい等の位置情報系取得の質問に関しては、他の音声アシスト同様にサポートします。

面白いのは、自宅の最寄駅を設定できる機能だったり、電話をかけるポーズをしたら、自動的に音声入力モードに切り替わったり、細かいディテールに配慮がある、ある意味日本らしいキメの細かいサービスが受けられます。

7.まとめ

今回は、日本のしゃべってコンシェルまで含めて、代表的な音声アシスタントについて紹介してきました。

勿論、他にも色々な音声アシストがあり、その応用範囲も、スマートフォンや車のカーナビとの連動だけでなく、IoTと絡んでホームオートメーションにに結びついたり、これからもっと音声アシスタントの波は加速していくと思われます。