Siriは一体どのようにして新しい言語を学習するのでしょうか?本日ロイター通信とのインタビューで、Appleの音声認識チーム責任者であるアレックス・アセロ氏は、Siriに新しい言語を学習させる舞台裏について語りました。そのプロセスには、スクリプトの作成、様々なアクセントや方言の音声のキャプチャ、そして機械学習と人工知能を用いて新しい言語モデルを構築・進化させることが含まれます。このシステムでは、手作業で書き起こされたテキストを読み上げる作業を担当するチームが必要です。
Apple は、Siri を実際にアップデートする前に、まず新しい言語のディクテーション サポートを展開します。
Siriは現在、36カ国で21言語に対応しています。比較すると、MicrosoftのCortanaは13カ国向けに8言語に対応し、Google Assistantは4言語に対応していますが、AmazonのAlexaは英語とドイツ語のみに対応しています。
Siri に新しい言語を教えるには、次の手順に従います。
- 人々はさまざまなアクセントや方言でカスタマイズされたテキストを読みます
- 録音は手作業で書き起こされるので、Siriは何を学習すべきかを正確に把握できる。
- さまざまな声の音も捉えます
- 単語の順序を予測する新しい言語モデルが構築される
Apple は、Siri に追加される前に、新しい言語のディクテーション サポートを展開しています。そのため、ディクテーション機能は Siri よりも多くの言語をサポートしています (たとえば、近々リリースされる macOS Sierra 10.12.4 ソフトウェア アップデートでは、上海でのみ話されている中国語の方言である上海語のディクテーション サポートが有効になります)。
ディクテーション機能により、Appleは背景ノイズやつぶやきなどの音声を匿名化して録音できます。録音された音声は人間によって手作業で書き起こされ、Acero社によると、このプロセスにより音声認識のエラー率が半減するとのことです。
十分なデータが集まった後、AppleはSiriの音声録音を俳優に依頼します。新しいSiri言語がゴールデンタイムで使えるようになると、Appleが最もよく聞かれるであろう質問への回答とともにリリースされます。
Appleは、Siriがユーザーの質問についてより深く学習するにつれて言語モデルが徐々に進化できるよう、人工知能と機械学習に多額の投資を行ってきた。
Acero によれば、Siri は 2 週間ごとに更新され、さらなる調整が加えられるという。
YouTubeでiDownloadBlogを購読する
Ozlo というインテリジェントアシスタントの開発者 Charles Jolley 氏によると、Apple のアプローチで問題になりそうなことの 1 つは、あらゆる言語で必要なシステムを開発できるだけのライターを雇用できないことだという。
Google Now や Microsoft Cortana などの他のパーソナル アシスタントは、回答を合成することでスケーリングの問題を軽減しますが、これは Siri があまり得意ではありません。
Siriのオリジナル開発者によって設立され、昨年サムスンが買収したスタートアップ企業Vivは、まさにその取り組みを進めています。「現在の機能が限定されたバージョンを飛躍的に進化させる唯一の方法は、システムをオープン化し、世界中に教えてもらうことです。」
Siriは現在、ライバルよりも多くの言語を話しますが(GoogleとAmazonはそれぞれのアシスタントにさらに多くの言語を提供する計画があると発表しました)、前述のように、他のアシスタントの方がコンテキストを理解し、より会話的な応答を提供する能力に優れているため、ユーザーエクスペリエンスは依然として標準以下です。
クパチーノの同社は2016年8月にオーストラリアを拠点とする機械学習の新興企業Turiを2億ドルで買収しており、これはSiriの言語および知識モデルの向上に役立つはずだ。
Appleは、6月5日の基調講演で始まる毎年恒例の開発者向けイベントで、強化されたSiriの機能(iPhone 8専用かどうかは不明)を披露すると予想されている。Siriの改善には、多言語サポートが含まれる可能性がある。
iOS 10 では、キーボードを切り替えることなく 2 つの言語での入力がサポートされているため、設定 → Siri → 言語で手動で選択しなくても、Siri が複数の言語を理解できるようになるかもしれません。
多言語対応の Siri は Apple TV でも問題なく動作するはずです。
2015年11月に行われたApple TVプロジェクトマネージャー数名へのインタビューによると、俳優名、映画名、監督名の発音が様々な言語や方言で異なるため、Appleは当初セットトップボックスのSiriをわずか8カ国に限定していたという。
出典:ロイター