未経験からの音声認識 実践入門

音声アシストとは?4つの音声アシスタント代表的製品を比較

  • このエントリーをはてなブックマークに追加
  • Pocket
音声アシスト

あらすじ

人工知能ブームがますます加速する現在、Siriに代表される音声アシストは、どんどん存在感を増していき、それを追従するような製品が、大手企業やベンチャー企業まで、幅広くリリースされるようになってきました。

音声アシスト・アプリが便利なのは、スマートフォン等の機器にデフォルトで搭載されている事が多く、道に迷ってしまった時や、ある特定の場所に行きたい時等に、気軽に話しかける事ができ、また、万能ではないものの、それをかなりの高精度で意図解釈をしてくれ、正しい回答を返してくれる点にあります。

最近では、自閉症の子供が、Siriと会話を繰り返していく事で、会話の楽しみを学習するようになり、自閉症を克服する等のニュースもありました。

このようにただの音声アシストという用途から、さらに拡大して使用されるようになった音声アシストには大きな注目が集まり、また、その元になっている、人工知能の一分野のNLP(自然言語処理)技術を駆使した、対話システムに対する研究開発もますます加速しています。

対話システムの応用先は音声アシストだけに関わらず、人間のオペレータによるお問い合わせ対応の手間を代行するチャットボット等にも応用され、ますます市場が盛り上がっています。

チャットボットは、音声アシストとは異なり、もっと目的特化型ですが、場合によっては音声インタフェースにも対応しているため、そういった音声対応チャットボットは、目的特化型の音声アシストとみなす事もできるでしょう。

今回の記事では、現在、世界で注目を集めている音声アシストの例をご紹介いたします。

音声アシストとは?

それではまずはじめに音声アシストとは何かという説明からしてこうと思います。

音声アシストの説明といっても、そんなに畏まった内容にはなりませんが、一般的に音声アシストは以下のような機能を備えています。

  • スマートフォン、スマートスピーカー、ウエラブルデバイス、PC等、一般的なデバイスをサポートする
  • 対象の言語はそのアプリケーションが使用されている母国語を最低限サポートする(Siri等は、かなり幅広い言語をサポートします)
  • 音声認識による、発話での音声入力に対応している
  • 音声でない、テキストでの入力にも対応している
  • 音声合成による、音声出力に対応している
  • テキストによる出力にも対応している
  • 天気の情報、ナビゲーション、スマートフォンの操作等、何らかの決まった対応ドメインに対して、ユーザの自然言語入力を理解し、回答する

上記は、音声アシストの非常に一般的な機能かと思います。

ここで、今までのアシストアプリケーションと、音声アシストが異なる点は、音声アシストが、ユーザの自然言語による入力を意図解釈し、それに適したリアクションをするという点かと思います。

Siriを筆頭として、意図解釈の部分の技術は大きく向上し、かなりの言い換え表現や、くだけた表現にも対応しています。

他にも、音声アシストは、一部雑談的なものに対応した対話システム的な側面や、「Hey Siri」のように、本体に話しかけたら自動起動できるような機能等も備えているものもあります。

Alexa

Amazon Echo は皆さん既にご存知の事と思います。

言わずと知れたAmazon Echoで、2015年から米国で発売開始され、世界中で話題になった、人工知能Alexa掲載の音声アシストの代表格です。

Alexa

Amazon Echoでは、AccuWeatherから天気の情報を提供したり、様々な外部のAPIを通じでニュースを提供したり、曲のストリーミング再生を行ったり、Googleカレンダにアクセスして予定を調整する等、様々なアシスト機能を提供します。

「Hey Siri」のような起動ワードが使用でき、「アレクサ」と発話すると起動させる事ができます。(起動ワードは「アマゾン」「エコー」「コンピュータ」に変更可能です)

その、中核であるアシストの機能を提供するのがAlexaという名前の人工知能アシスタントであり、Amazon Echoを通して利用できるだけでなく、他社のスマートスピーカーや、スマートウオッチ等のウエラブルデバイス、その他、冷蔵庫等の家電にも対応しています。

単なるパーソナルアシスタントの域を超えて、IoTと密接に連携した、ホームオートメーションを実現するための技術としても有効活用されています。

勿論、Amazonのプラットフォームとの連携が非常に便利で、買い物の購買記録の検索や、現在ペンディング中のオーダーを検索したり、まさに痛いところに手が届く仕様になっています。

Siriと並んで、もしくは商用分野ではSiri以上に、注目されている音声アシストと言えるでしょう。

amazon alexa

Siri

Speech Interpretation and Recognition Interface の略です。

あえてAlexaの方を先に書きましたが、音声アシスタントの紹介をする際に絶対に外せないのが、このSiriでしょう。

siri

iPhone、iPad等に標準掲載されているため、実際に使用された方も非常に多いかと思います。

まず驚くのは、その圧倒的な意図解釈の精度の高さで、天気や、ナビゲーションのような音声アシスタントとして想定される質問だけで無く、一部、雑談的な話にも対応でき、面白いジョークのような返答をしたり、まるで人間と会話を楽しんでいるかのような錯覚に陥ってきます。

もともとは、アメリカ国防高等研究計画局によって、兵士を戦場でサポートするための人工知能プロジェクトとしての開発が始まりました。

当時は、人類史上最高の人工知能プロジェクトとも言われ、巨額の資金が投じられました。

そのプロジェクトから派生してできたのがSiriという訳です。

最近では、開発者に向けてSiriのAPIを公開する等の動きもあり、ますますSiriの存在が身近になってきています。

音声アシストといえば、Siriと言わしめるほど、不動の定着感を気づいたSiriですが、これからもますます進化していくと思います。

Google Assistant

最近、日本に上陸して話題になっているGoogleの音声アシスタント。

これによりAndroidでもSiri同様の機能が使えるようになり、かなり便利になりました。

google assistant

このGoogleアシスタント、音声認識の精度も抜群で、反応も早く非常に重宝します。

スマートフォンで設定を行った後、「OK Google」と話しかけると起動できます。

Googleカレンダーと連携して予定を追加したり、天気の情報を調べたり、目的地までの最短経路を調べたり、現在の交通状況を調べたり等、Siriと同様に様々な事を検索できます。

また、当然ながらGoogle検索と連動して動作をするため、音声アシスタントがサポートできないような質問でも、本来のGoogleの検索機能を使用して、的確な回答を返す事ができます。

これで、Siriがなくて寂しいAndroidユーザも満足できるのではないでしょうか?

しゃべってコンシェル

さて今まで、ずっと世界的を代表するといっても過言でない、3大音声アシストについて紹介してきましたが、ここで日本発の音声アシスタントについても紹介しておきましょう。

ドコモのユーザにはおそらく馴染み深いかと思いますが、「しゃべってコンシェル」です。

しゃべってコンシェル

目的地までいきたい等の位置情報系取得の質問に関しては、他の音声アシスト同様にサポートします。

面白いのは、自宅の最寄駅を設定できる機能だったり、電話をかけるポーズをしたら、自動的に音声入力モードに切り替わったり、細かいディテールに配慮がある、ある意味日本らしいキメの細かいサービスが受けられます。

終わりに

今回は、日本のしゃべってコンシェルまで含めて、代表的な音声アシスタントについて紹介してきました。

勿論、他にも色々な音声アシストがあり、その応用範囲も、スマートフォンや車のカーナビとの連動だけでなく、IoTと絡んでホームオートメーションにに結びついたり、これからもっと音声アシスタントの波は加速していくと思われます。

ご質問等ございましたら、以下コメント欄よりお気軽にお問合せ下さい!

【動画あり】AI店員(人工知能)が小売業・流通業の接客を可能に!ニュースにも登場!

AI店員

お知らせ

2018/01/24 【セミナー】【世界最高レベルの精度のAIチャットボットを開発・導入する方法】 2018/03/24(土) 東京 開催

2017/12/12 【セミナー】【世界最高レベルの精度のAIチャットボットを開発・導入する方法】 2017/02/18(日) 東京 開催

2017/12/12 【プレスリリース】レッジ、ウェブライダー、SPJが共同で機械学習を用いた文章校正の共同研究を開始

2017/12/08 AI店員がテレ朝に掲載されました!弊社の対話エンジン搭載!(動画あり)

2017/12/04 【プレスリリース】【AIが人手不足を解消】小売業に特化したAI接客システムを開発、多言語対応で外国人の接客も可能に!

過去のお知らせ一覧

  • このエントリーをはてなブックマークに追加
  • Pocket

アクセス・ランキング

人気AI記事 月間ランキングTOP25

詳しくはこちら

よく一緒に読まれているAI記事

ディープラーニングで文章のカテゴリー分類を自動化する方法... 1.あらすじ 人工知能という言葉が、昨今、ますます身近になってきており、Siriなどの対話システムも日々発達してきています。 また、人間の言語を人工知能に解釈させる対話システムの需要が増えると共に、NLP(自然言語処理)のニーズも日に日に高くなって来ています。 NLP分野では、画像処理...
少ない画像から画像分類を学習させる方法(kerasで転移学習:fine tuning)... 「フルーツの画像を判別するモデルをを作ってくれませんか?」 と言われた時に、どのようにモデルを作りますか? ディープラーニングで画像分類を行う場合、通常畳み込みニューラルネットワークという学習手法を使いますが、画像の枚数によっては数週間程度がかかってしまいます。 また、学習に使用す...
音声認識の仕組みと、隠れマルコフモデル(HMM)入門... 1.あらすじ Siriや、Google音声アシスタント等、音声アシスタントアプリケーションは、すっかりと日常生活に浸透し、実際に使用している読者の方も多いかと思います。 使用された方はお気づきかと思いますが、そういったアプリの音声認識の精度はかなり素晴らしく、十分実用に達しています。 ...
ニューラルネットワークのパラメータ設定方法(scikit-learnのMLPClassifier)... ニューラルネットワークを作成する際に、層の数、ニューロンの数、活性化関数の種類等考えるべきパラメータは非常に多くあります。 そこで、これらのパラメータがどのようにモデルや学習に影響を与えるかということをscikit-learnの MLPClassifier を使って解説したいと思います。 ...
【AIが人手不足を解消】小売業に特化したAI接客システムを開発、多言語対応で外国人の接客も可能に!... 株式会社SPJ(本社:東京都千代田区、代表取締役CEO:江口 天、以下「当社」)は、小売業に特化した高精度 人工知能 接客システムを2017年12月7日(金)にリリース致します。 通常の対話システムは、雑談等幅広い話題に対応出来るようにすることを目標に開発されています。その結果、意図解釈能力が...

最新の人工知能アルゴリズムをSNSでお届けします

Leave a Reply

*