未経験からの音声認識 実践入門

音声アシストとは?4つの音声アシスタント代表的製品を比較

  • このエントリーをはてなブックマークに追加
  • Pocket
音声アシスト

あらすじ

人工知能ブームがますます加速する現在、Siriに代表される音声アシストは、どんどん存在感を増していき、それを追従するような製品が、大手企業やベンチャー企業まで、幅広くリリースされるようになってきました。

音声アシスト・アプリが便利なのは、スマートフォン等の機器にデフォルトで搭載されている事が多く、道に迷ってしまった時や、ある特定の場所に行きたい時等に、気軽に話しかける事ができ、また、万能ではないものの、それをかなりの高精度で意図解釈をしてくれ、正しい回答を返してくれる点にあります。

最近では、自閉症の子供が、Siriと会話を繰り返していく事で、会話の楽しみを学習するようになり、自閉症を克服する等のニュースもありました。

このようにただの音声アシストという用途から、さらに拡大して使用されるようになった音声アシストには大きな注目が集まり、また、その元になっている、人工知能の一分野のNLP(自然言語処理)技術を駆使した、対話システムに対する研究開発もますます加速しています。

対話システムの応用先は音声アシストだけに関わらず、人間のオペレータによるお問い合わせ対応の手間を代行するチャットボット等にも応用され、ますます市場が盛り上がっています。

チャットボットは、音声アシストとは異なり、もっと目的特化型ですが、場合によっては音声インタフェースにも対応しているため、そういった音声対応チャットボットは、目的特化型の音声アシストとみなす事もできるでしょう。

今回の記事では、現在、世界で注目を集めている音声アシストの例をご紹介いたします。

音声アシストとは?

それではまずはじめに音声アシストとは何かという説明からしてこうと思います。

音声アシストの説明といっても、そんなに畏まった内容にはなりませんが、一般的に音声アシストは以下のような機能を備えています。

  • スマートフォン、スマートスピーカー、ウエラブルデバイス、PC等、一般的なデバイスをサポートする
  • 対象の言語はそのアプリケーションが使用されている母国語を最低限サポートする(Siri等は、かなり幅広い言語をサポートします)
  • 音声認識による、発話での音声入力に対応している
  • 音声でない、テキストでの入力にも対応している
  • 音声合成による、音声出力に対応している
  • テキストによる出力にも対応している
  • 天気の情報、ナビゲーション、スマートフォンの操作等、何らかの決まった対応ドメインに対して、ユーザの自然言語入力を理解し、回答する

上記は、音声アシストの非常に一般的な機能かと思います。

ここで、今までのアシストアプリケーションと、音声アシストが異なる点は、音声アシストが、ユーザの自然言語による入力を意図解釈し、それに適したリアクションをするという点かと思います。

Siriを筆頭として、意図解釈の部分の技術は大きく向上し、かなりの言い換え表現や、くだけた表現にも対応しています。

他にも、音声アシストは、一部雑談的なものに対応した対話システム的な側面や、「Hey Siri」のように、本体に話しかけたら自動起動できるような機能等も備えているものもあります。

Alexa

Amazon Echo は皆さん既にご存知の事と思います。

言わずと知れたAmazon Echoで、2015年から米国で発売開始され、世界中で話題になった、人工知能Alexa掲載の音声アシストの代表格です。

Alexa

Amazon Echoでは、AccuWeatherから天気の情報を提供したり、様々な外部のAPIを通じでニュースを提供したり、曲のストリーミング再生を行ったり、Googleカレンダにアクセスして予定を調整する等、様々なアシスト機能を提供します。

「Hey Siri」のような起動ワードが使用でき、「アレクサ」と発話すると起動させる事ができます。(起動ワードは「アマゾン」「エコー」「コンピュータ」に変更可能です)

その、中核であるアシストの機能を提供するのがAlexaという名前の人工知能アシスタントであり、Amazon Echoを通して利用できるだけでなく、他社のスマートスピーカーや、スマートウオッチ等のウエラブルデバイス、その他、冷蔵庫等の家電にも対応しています。

単なるパーソナルアシスタントの域を超えて、IoTと密接に連携した、ホームオートメーションを実現するための技術としても有効活用されています。

勿論、Amazonのプラットフォームとの連携が非常に便利で、買い物の購買記録の検索や、現在ペンディング中のオーダーを検索したり、まさに痛いところに手が届く仕様になっています。

Siriと並んで、もしくは商用分野ではSiri以上に、注目されている音声アシストと言えるでしょう。

amazon alexa

Siri

Speech Interpretation and Recognition Interface の略です。

あえてAlexaの方を先に書きましたが、音声アシスタントの紹介をする際に絶対に外せないのが、このSiriでしょう。

siri

iPhone、iPad等に標準掲載されているため、実際に使用された方も非常に多いかと思います。

まず驚くのは、その圧倒的な意図解釈の精度の高さで、天気や、ナビゲーションのような音声アシスタントとして想定される質問だけで無く、一部、雑談的な話にも対応でき、面白いジョークのような返答をしたり、まるで人間と会話を楽しんでいるかのような錯覚に陥ってきます。

もともとは、アメリカ国防高等研究計画局によって、兵士を戦場でサポートするための人工知能プロジェクトとしての開発が始まりました。

当時は、人類史上最高の人工知能プロジェクトとも言われ、巨額の資金が投じられました。

そのプロジェクトから派生してできたのがSiriという訳です。

最近では、開発者に向けてSiriのAPIを公開する等の動きもあり、ますますSiriの存在が身近になってきています。

音声アシストといえば、Siriと言わしめるほど、不動の定着感を気づいたSiriですが、これからもますます進化していくと思います。

Google Assistant

最近、日本に上陸して話題になっているGoogleの音声アシスタント。

これによりAndroidでもSiri同様の機能が使えるようになり、かなり便利になりました。

google assistant

このGoogleアシスタント、音声認識の精度も抜群で、反応も早く非常に重宝します。

スマートフォンで設定を行った後、「OK Google」と話しかけると起動できます。

Googleカレンダーと連携して予定を追加したり、天気の情報を調べたり、目的地までの最短経路を調べたり、現在の交通状況を調べたり等、Siriと同様に様々な事を検索できます。

また、当然ながらGoogle検索と連動して動作をするため、音声アシスタントがサポートできないような質問でも、本来のGoogleの検索機能を使用して、的確な回答を返す事ができます。

これで、Siriがなくて寂しいAndroidユーザも満足できるのではないでしょうか?

しゃべってコンシェル

さて今まで、ずっと世界的を代表するといっても過言でない、3大音声アシストについて紹介してきましたが、ここで日本発の音声アシスタントについても紹介しておきましょう。

ドコモのユーザにはおそらく馴染み深いかと思いますが、「しゃべってコンシェル」です。

しゃべってコンシェル

目的地までいきたい等の位置情報系取得の質問に関しては、他の音声アシスト同様にサポートします。

面白いのは、自宅の最寄駅を設定できる機能だったり、電話をかけるポーズをしたら、自動的に音声入力モードに切り替わったり、細かいディテールに配慮がある、ある意味日本らしいキメの細かいサービスが受けられます。

終わりに

今回は、日本のしゃべってコンシェルまで含めて、代表的な音声アシスタントについて紹介してきました。

勿論、他にも色々な音声アシストがあり、その応用範囲も、スマートフォンや車のカーナビとの連動だけでなく、IoTと絡んでホームオートメーションにに結びついたり、これからもっと音声アシスタントの波は加速していくと思われます。

ご質問等ございましたら、以下コメント欄よりお気軽にお問合せ下さい!

【動画あり】AI店員(人工知能)が小売業・流通業の接客を可能に!ニュースにも登場!

AI店員

AI関連サービス導入事例

AI導入事例

オージス総研

詳しくはこちら

お知らせ

2018/04/20 【セミナー】【世界最高レベルの精度のAIチャットボットを開発・導入する方法】 2018/05/19(土) 東京 開催

2018/03/12 【プレスリリース】世界初!会話を学習しアナタだけの性格に育つメイド カーナビAIを共同開発

2018/03/03 【セミナー】【世界最高レベルの精度のAIチャットボットを開発・導入する方法】 2018/04/21(土) 東京 開催

2018/02/20 【メディア掲載】Ledge.ai(AI:人工知能特化型メディア)にインタビュー記事が掲載されました

2018/01/24 【セミナー】【世界最高レベルの精度のAIチャットボットを開発・導入する方法】 2018/03/24(土) 東京 開催

過去のお知らせ一覧

  • このエントリーをはてなブックマークに追加
  • Pocket

アクセス・ランキング

人気AI記事 月間ランキングTOP25

詳しくはこちら

よく一緒に読まれているAI記事

scikit-learn(機械学習)の推定器:Estimatorの選び方入門... scikit-learnはpythonで使用できる機械学習ライブラリですが、元々とても多くの推定器(Estimator)が実装されています。 ただ、どのEstimatorを使えばよいのか最初から決めるのは経験則や広範囲な知識が必要なのでなかなか難しいです。 そのため、一括で全部試してしま...
【入門】アンサンブル学習の代表的な2つの手法とアルゴリズム... 1.あらすじ 人工知能ブームがどんどん加速する中、ニューラルネット、SVM、ナイーブベーズ等、様々な機械学習の手法が存在し、その派生系もどんどん増えていって、一体どういう場合にどのアルゴリズムを選ぶといいんだろうと、首を傾げている方も多いと思います。 今回はその中でも、特にアンサンブル学習と...
Bag of wordsでのテキストマイニング最速精度向上方法... 空前のAI(人工知能)ブームで、NLP(自然言語処理)に興味を持ち、MeCabやKuromoji等の形態素解析器を試した方は多いと思います。 ただし、いまいち形態素解析器が何に活かせるのか把握していない人は多く、その出力をどう料理すればいいのかわからない人が多いのも事実です。 そこで、本...
Javaで簡単に感情分析する方法 近年、AIの技術の活用分野は多岐に渡り、その中でも特に、人間の言葉を解釈する技術であるNLP(自然言語処理)が進歩してきています。 テキストマイニングや、対話システム等多岐に渡って使用され、人間のコミュニケーションを一部、チャットボットが代行するという所まで来ています。 今回は、そのNL...
【入門】自然言語処理(NLP)の8つの課題と解決策とは?... 1.自然言語とは何か? 言語は、私たちの生活の中に常にあり、また、なくてはならないものです。 そんな日々当たり前に使われる言語を見つめ直し、解析すると、どんな興味深いものが見えてくるのでしょうか。 1-1.言語の世界とは? 「自然言語処理」の「自然言語」とは何か? 言語には、大きく...

最新の人工知能アルゴリズムをSNSでお届けします

Leave a Reply

*