未経験からの音声認識 実践入門

音声アシストとは?4つの代表的製品を比較

  • このエントリーをはてなブックマークに追加
  • Pocket
音声アシスト

あらすじ

人工知能ブームがますます加速する現在、Siriに代表される音声アシストは、どんどん存在感を増していき、それを追従するような製品が、大手企業やベンチャー企業まで、幅広くリリースされるようになってきました。

音声アシスト・アプリが便利なのは、スマートフォン等の機器にデフォルトで搭載されている事が多く、道に迷ってしまった時や、ある特定の場所に行きたい時等に、気軽に話しかける事ができ、また、万能ではないものの、それをかなりの高精度で意図解釈をしてくれ、正しい回答を返してくれる点にあります。

最近では、自閉症の子供が、Siriと会話を繰り返していく事で、会話の楽しみを学習するようになり、自閉症を克服する等のニュースもありました。

このようにただの音声アシストという用途から、さらに拡大して使用されるようになった音声アシストには大きな注目が集まり、また、その元になっている、人工知能の一分野のNLP(自然言語処理)技術を駆使した、対話システムに対する研究開発もますます加速しています。

対話システムの応用先は音声アシストだけに関わらず、人間のオペレータによるお問い合わせ対応の手間を代行するチャットボット等にも応用され、ますます市場が盛り上がっています。

チャットボットは、音声アシストとは異なり、もっと目的特化型ですが、場合によっては音声インタフェースにも対応しているため、そういった音声対応チャットボットは、目的特化型の音声アシストとみなす事もできるでしょう。

今回の記事では、現在、世界で注目を集めている音声アシストの例をご紹介いたします。

音声アシストとは?

それではまずはじめに音声アシストとは何かという説明からしてこうと思います。

音声アシストの説明といっても、そんなに畏まった内容にはなりませんが、一般的に音声アシストは以下のような機能を備えています。

  • スマートフォン、スマートスピーカー、ウエラブルデバイス、PC等、一般的なデバイスをサポートする
  • 対象の言語はそのアプリケーションが使用されている母国語を最低限サポートする(Siri等は、かなり幅広い言語をサポートします)
  • 音声認識による、発話での音声入力に対応している
  • 音声でない、テキストでの入力にも対応している
  • 音声合成による、音声出力に対応している
  • テキストによる出力にも対応している
  • 天気の情報、ナビゲーション、スマートフォンの操作等、何らかの決まった対応ドメインに対して、ユーザの自然言語入力を理解し、回答する

上記は、音声アシストの非常に一般的な機能かと思います。

ここで、今までのアシストアプリケーションと、音声アシストが異なる点は、音声アシストが、ユーザの自然言語による入力を意図解釈し、それに適したリアクションをするという点かと思います。

Siriを筆頭として、意図解釈の部分の技術は大きく向上し、かなりの言い換え表現や、くだけた表現にも対応しています。

他にも、音声アシストは、一部雑談的なものに対応した対話システム的な側面や、「Hey Siri」のように、本体に話しかけたら自動起動できるような機能等も備えているものもあります。

Alexa

Amazon Echo は皆さん既にご存知の事と思います。

言わずと知れたAmazon Echoで、2015年から米国で発売開始され、世界中で話題になった、人工知能Alexa掲載の音声アシストの代表格です。

Alexa

Amazon Echoでは、AccuWeatherから天気の情報を提供したり、様々な外部のAPIを通じでニュースを提供したり、曲のストリーミング再生を行ったり、Googleカレンダにアクセスして予定を調整する等、様々なアシスト機能を提供します。

「Hey Siri」のような起動ワードが使用でき、「アレクサ」と発話すると起動させる事ができます。(起動ワードは「アマゾン」「エコー」「コンピュータ」に変更可能です)

その、中核であるアシストの機能を提供するのがAlexaという名前の人工知能アシスタントであり、Amazon Echoを通して利用できるだけでなく、他社のスマートスピーカーや、スマートウオッチ等のウエラブルデバイス、その他、冷蔵庫等の家電にも対応しています。

単なるパーソナルアシスタントの域を超えて、IoTと密接に連携した、ホームオートメーションを実現するための技術としても有効活用されています。

勿論、Amazonのプラットフォームとの連携が非常に便利で、買い物の購買記録の検索や、現在ペンディング中のオーダーを検索したり、まさに痛いところに手が届く仕様になっています。

Siriと並んで、もしくは商用分野ではSiri以上に、注目されている音声アシストと言えるでしょう。

amazon alexa

Siri

Speech Interpretation and Recognition Interface の略です。

あえてAlexaの方を先に書きましたが、音声アシスタントの紹介をする際に絶対に外せないのが、このSiriでしょう。

siri

iPhone、iPad等に標準掲載されているため、実際に使用された方も非常に多いかと思います。

まず驚くのは、その圧倒的な意図解釈の精度の高さで、天気や、ナビゲーションのような音声アシスタントとして想定される質問だけで無く、一部、雑談的な話にも対応でき、面白いジョークのような返答をしたり、まるで人間と会話を楽しんでいるかのような錯覚に陥ってきます。

もともとは、アメリカ国防高等研究計画局によって、兵士を戦場でサポートするための人工知能プロジェクトとしての開発が始まりました。

当時は、人類史上最高の人工知能プロジェクトとも言われ、巨額の資金が投じられました。

そのプロジェクトから派生してできたのがSiriという訳です。

最近では、開発者に向けてSiriのAPIを公開する等の動きもあり、ますますSiriの存在が身近になってきています。

音声アシストといえば、Siriと言わしめるほど、不動の定着感を気づいたSiriですが、これからもますます進化していくと思います。

Google Assistant

最近、日本に上陸して話題になっているGoogleの音声アシスタント。

これによりAndroidでもSiri同様の機能が使えるようになり、かなり便利になりました。

google assistant

このGoogleアシスタント、音声認識の精度も抜群で、反応も早く非常に重宝します。

スマートフォンで設定を行った後、「OK Google」と話しかけると起動できます。

Googleカレンダーと連携して予定を追加したり、天気の情報を調べたり、目的地までの最短経路を調べたり、現在の交通状況を調べたり等、Siriと同様に様々な事を検索できます。

また、当然ながらGoogle検索と連動して動作をするため、音声アシスタントがサポートできないような質問でも、本来のGoogleの検索機能を使用して、的確な回答を返す事ができます。

これで、Siriがなくて寂しいAndroidユーザも満足できるのではないでしょうか?

しゃべってコンシェル

さて今まで、ずっと世界的を代表するといっても過言でない、3大音声アシストについて紹介してきましたが、ここで日本発の音声アシスタントについても紹介しておきましょう。

ドコモのユーザにはおそらく馴染み深いかと思いますが、「しゃべってコンシェル」です。

しゃべってコンシェル

目的地までいきたい等の位置情報系取得の質問に関しては、他の音声アシスト同様にサポートします。

面白いのは、自宅の最寄駅を設定できる機能だったり、電話をかけるポーズをしたら、自動的に音声入力モードに切り替わったり、細かいディテールに配慮がある、ある意味日本らしいキメの細かいサービスが受けられます。

終わりに

今回は、日本のしゃべってコンシェルまで含めて、代表的な音声アシスタントについて紹介してきました。

勿論、他にも色々な音声アシストがあり、その応用範囲も、スマートフォンや車のカーナビとの連動だけでなく、IoTと絡んでホームオートメーションにに結びついたり、これからもっと音声アシスタントの波は加速していくと思われます。

ご質問等ございましたら、以下コメント欄よりお気軽にお問合せ下さい!

  • このエントリーをはてなブックマークに追加
  • Pocket

アクセス・ランキング

人気AI記事 月間ランキングTOP25

詳しくはこちら

よく一緒に読まれているAI記事

検索エンジンの3つの仕組みと、アルゴリズムを公開します... あらすじ Googleや、Yahoo検索等は、日常のネットライフには切り離せない存在になり、検索エンジンの存在しないネットサーフィン等、殆ど有り得ないかと思います。 そのくらい、今やすっかり日常に馴染んだ検索エンジンですが、最近では、AI技術と組み合わせる事でより高度になってきています。 ...
ディープラーニングで文章のカテゴリー分類を自動化する方法... 1.あらすじ 人工知能という言葉が、昨今、ますます身近になってきており、Siriなどの対話システムも日々発達してきています。 また、人間の言語を人工知能に解釈させる対話システムの需要が増えると共に、NLP(自然言語処理)のニーズも日に日に高くなって来ています。 NLP分野では、画像処理...
あの!パリのフラワーショップ「MONCEAU FLEURS(モンソーフルール)」銀座マロニエゲート店... あのパリのフラワーショップ、モンソーフルール【MONCEAU FLEURS】銀座マロニエゲート店に新人AIスタッフ(Helene エレーヌ)が登場します。 エレーヌはお花の事を沢山知っているAI店員です。エレーヌはお客様の顔を認識し、会話によってお客様お一人お一人にお好みのアレンジをお奨めしま...
ニューラルネットワークのパラメータ設定方法(scikit-learnのMLPClassifier)... ニューラルネットワークを作成する際に、層の数、ニューロンの数、活性化関数の種類等考えるべきパラメータは非常に多くあります。 そこで、これらのパラメータがどのようにモデルや学習に影響を与えるかということをscikit-learnの MLPClassifier を使って解説したいと思います。 ...
Javaで簡単に感情分析する方法 近年、AIの技術の活用分野は多岐に渡り、その中でも特に、人間の言葉を解釈する技術であるNLP(自然言語処理)が進歩してきています。 テキストマイニングや、対話システム等多岐に渡って使用され、人間のコミュニケーションを一部、チャットボットが代行するという所まで来ています。 今回は、そのNL...

最新の人工知能アルゴリズムをSNSでお届けします

Leave a Reply

*