聞き上手なSiri

Siriとは、iOS向け秘書機能アプリケーションソフトウェア

自然言語処理を用いて、質問に答える、推薦、Webサービスの利用などを行う。「Siri」とは、Speech Interpretation and Recognition Interface(発話解析・認識インターフェース)の略。Siri - Wikipedia

だいぶ前になりますがViaVoiceにPCのポテンシャルを感じたことがありました。
しかしディクテーション作業を重ねてトレーニングしなければ認識率が低く
人間同士だって聞き返しはあるのだし大変なのだなと思っていました。

それがiPhone 4SにSiriが搭載されて音声認識の印象が変わりました。
ディクテーション作業をすることなく流暢に対応するそのしくみは
話しかけた音声はAppleのサーバに送信され
その意味を分析して命令を実行するのです。

しかしビッグデータの話題は前にも投稿したことがあり
この集められたデータの行方が気になりますが
個人を特定することはできないそうです。

音声データはランダムに生成されるユーザー番号と関連付けられます。
この番号は Apple ID やメールアドレスなどとは関連付けられないので、この番号から個人を特定することはできません。
保管されてから6ヶ月後には音声データとユーザー番号の関連付けが削除されます。その後は最長で18ヶ月間、音声データは製品の開発や性能向上のために使われます。
Siri は音声を分析し、内容を理解して命令として実行しますが、そのためには音声の意味を調べられるデータベースが必要です。
このデータベースを改良していくには、音声を保管して分析し、どのような音声がどんな命令を意味しているのかを数値化して追加すると考えられます。
こうすることで、様々なしゃべり方でもそれが意味するところを理解し、命令として実行できるようになります。
Siri を使う際に音声データが一定期間保管されることは、使用許諾契約に明確には示されておらず、Siri の設定画面にある「Siriとプライバシー」でのみ記されています。Siriに話しかけた音声は最長で2年間、Appleのサーバに保存される。

また過去に,犯人がSiriに遺体の隠し場所を尋ねる殺人死体遺棄事件
あったそうですが,こういったイノベーションは
安心して使える次のフェーズに期待したいところですね。

ビッグデータつながりでいえば
以前ソーシャルIMEで利用者に無断で入力情報を自社サーバに送信するといったこともあったし,このユビキタス社会においてこの様な仕組みは,せめて概要だけでも押さえておきたいところです。