2012年3月26日月曜日

しゃべってコンシェル開発秘話



f:id:bs-android:20120326141348g:image:w301:left

f:id:bs-android:20120326102939p:image:w300

はじめに


先日、NTTドコモ様から「しゃべってコンシェル」という、Android+音声認識によるマルチ検索・端末操作アプリケーションがリリースされました。弊社はこの「しゃべってコンシェル」及びその前身となるアプリの開発でご協力させて頂きました。


しゃべってコンシェルって?


f:id:bs-android:20120326110543p:image:w180:right

ご存知ない方のために簡単にご説明します。しゃべってコンシェルは、「調べたいこと」や「やりたいこと」などをスマートフォンに話しかけると、その言葉の意図を読み取り、サービスや端末機能の中から最適な回答を画面に表示する、NTTドコモ様のサービスとして2012年3月から展開されているAndroidアプリケーションです。ドコモ様のdメニューと連動して様々なコンテンツを検索・表示できます。また、メールやスケジューラなどの端末の機能を音声によって操作することができます。

しゃべってコンシェルは、iPhoneの音声検索アプリ「Siri」とよく比較されます。

Siriをご存知の方は、しゃべってコンシェルはSiriと同等、あるいは、それ以上の機能を持ったアプリケーションと思って頂ければ間違いは無いと思います。

ところで、しゃべってコンシェルには「産みの親」、あるいは「進化前バージョン」とも言えるアプリが存在することをご存知でしょうか?

その名は「VOICE IT!」。弊社を代表するまでに成長したアプリです。

しゃべってコンシェルの前身、「VOICE IT!」


f:id:bs-android:20120326102940p:image:w180:left

2010年12月にNTTドコモ様と弊社の共同で開発が始まった、日本製の元祖・音声認識マルチコンテンツ検索アプリです(弊社では、一つのワードで様々なサイトをまとめて検索することから、”串刺し検索”と呼んでいました)。2011年5月から2012年2月までは、トライアル期間としてAndroidマーケット(現Google Play)に弊社からリリースしておりました。詳しい数は言えませんが、トライアル期間中に数万人の方にご利用頂き、様々なご意見を頂きました。

左の写真はVOICE IT!の画面です。この画面からも「しゃべってコンシェル」がVOICE IT!の後継版であることが伺えますね。

さて、Siriが日本に登場したのが2012年になってからですから、Siriよりも2年も前、Apple社によってSiriが買収された年には、既に実用的なアプリとしての開発が日本でスタートしていた事になります。

NTTドコモ様での基礎研究を含めばさらに前に遡ることでしょう。NTTドコモ様が音声を伝えることが仕事の一つとしてあることを考えれば、これは決して不思議なことではありませんよね。

開発者が教える、しゃべってコンシェルの使い方


しゃべってコンシェルには裏技が・・・・なかったりします。ゲームではありませんので。ただ、音声入力のコツはあったりします。

しゃべってコンシェルは日本語をなるべく”文章”で理解しようとします。そのため、単語の羅列よりも文章で入力した方が良いと思います。そのため、「◯◯ △△」のように検索ワードを並べるよりも、「◯◯で△△したい」とか「◯◯する場所を教えて」といったように、執事に話しかけるような形で入力すると、検索の精度が上がるかもしれません。

また、時間においてもなるべく正確に入力してあげると、思った結果が得られるかもしれません。例えば、「8時」と言うと、朝の8時なのか夜の8時なのか、しゃべってコンシェルが意図を正確に理解できないケースがどうしても存在します。もちろん、ある程度の予測をしてくれますが、ハッキリと「明日の午前8時」などと話して頂ければ、しゃべってコンシェルも安心してその日付でセットすることができます。

もう一つ、しゃべってコンシェルは「言い直し」を理解できます

例えば「京都」でグルメ情報を検索した後に、「あっ、大阪の間違いだった」って、”そもそもの検索ワードを間違う”ケースはありませんか? 先の例でいうと、「京都で郷土料理が食べたい」と言った後に間違いに気づいたら、もう一度マイクボタンを押して、「京都じゃなくて大阪」と言うと、大阪の郷土料理を再検索してくれます。

また、しゃべってコンシェルには、Siriと同様に会話をする機能があります。例えば、「こんにちは!」って話すと、しゃべってコンシェルは「こんにちは!」って返してくれます(時々、違う文言で返すこともあります)。どのように話しかけて、どのように返してくれるかはユーザーの皆様で直接試してみて下さい。

今後のしゃべってコンシェルも、どうぞご期待下さい。


VOICE IT! 開発プロジェクトマネージャー 瀬戸 直喜




140 180 Android

記載されている会社名、および商品名等は、各社の商標または登録商標です。

1 コメント:

  1. 音声をそのまま文字化して記録するソフトを開発してもらえないでしょうか。テレビの相撲中継などでは発言を瞬間的にテロップとして流しています。
    ああいう機能のあるソフトを切望します。

    返信削除

Related Posts Plugin for WordPress, Blogger...