アシスタント戦争は本格化しており、Google AssistantとVivが参戦し、AppleのSiri、MicrosoftのCortana、Hound、Google Nowなどの既存プレーヤーも消費者の心を掴むための戦いに火がつきつつある。
VentureBeat は次世代の Apple TV だと見ているが、噂されている Apple の Amazon Echo の競合製品は、複雑な自然言語クエリの解読に関しては、他のアシスタントを圧倒する可能性がある。
そして、それを動かすのが、Appleが2015年10月に買収した高度な技術であるVocalIQだ。Tech Insiderは、VocalIQによってSiriが今よりもずっと賢くなる仕組みについて、詳細な概要を提供した。
アシスタント戦争が本格化
Tech Insiderの「AppleはGoogleや他のすべての企業を圧倒するAIシステムに取り組んでいる」という記事では、AppleがVocalIQ技術をSiri、Google Now、Cortanaに対してテストしていたと指摘している。
「ユーザーは、デジタルアシスタントで慣れ親しんでいるロボットのようなコマンドではなく、普通の言葉で各AIに質問しました」と記事には記されている。「こうしたコマンドは長くて複雑な場合があり、他のアシスタントはすべてを理解するのに苦労していました。」
研究の結果、VocalIQ は、「子供に優しい、駐車場と Wi-Fi のある近くの中華料理店」といった複雑な自然言語クエリを理解する際に Siri に明らかな優位性を与えていることが判明した。
VocalIQ は 90 パーセント以上の成功率でそのリクエストを簡単に処理しましたが、Google Now、Siri、Cortana は約 20 パーセントしか成功しませんでした。
すべては文脈次第
コンテキスト認識を組み合わせると、さらに驚くべき結果が得られます。
中華料理店の例では、1 時間後に「代わりにメキシコ料理店を探して」などと質問すると、Vocal IQ は前の質問でその場所のコンテキスト (駐車場や Wi-Fi) を使用して、より適切な結果を表示します。
他のアシスタントでは、検索セッションを最初からやり直す必要があります。
Voice IQの魔法
VocalIQ のプラットフォームも高度にカスタマイズ可能です。
「情報源が挙げた一例では、ユーザーの携帯電話がポケットの中にある状態でメールをうまく管理できるように教えることだった(映画『her/世界でひとつの彼女』でホアキン・フェニックス演じるキャラクターが携帯電話を操作するのと同じように)」と記事は続く。
VocalIQ の共同設立者兼 CEO である Blaise Thomson が、ロンドンで開催された Machine Intelligence 2015 で、人間とデバイス間の自然な会話について話している様子です。
VocalIQ は、ユーザーの発言内容をより正確に理解するために、外部のノイズを除去することもできます。また、環境内のすべてのノイズを取り込み、どの音が実際にユーザーの質問であるかを高い確率で判断できると言われています。
「VocalIQはコンテキストを非常によく理解するため、期待通りに動作しているかどうかを確認するために画面を見る必要が実質的になくなります」と記事では説明している。
「これは電話では便利ですが、Appleが開発していると報じられている自動車やスマートスピーカーシステムなど、他の野心的なプロジェクトにはさらに役立つ可能性があります。」
Brian Roemmele 氏によると、VocalIQ の主な機能は次のとおりです。
- ノイズ耐性: 高度なノイズ耐性システムにより、すべての入力がダイアログのコンテキストで解釈され、パフォーマンスが大幅に向上します。
- 迅速なプロトタイピング:堅牢で柔軟な設計により、ソフトウェア開発者とパートナーは迅速にプロトタイプを作成し、すぐにフィードバックを受け取り、即座に展開できます。
- プラットフォーム アーキテクチャ: プラットフォーム アーキテクチャは、新しいデータ エンジンとナレッジ エンジンを追加できる、拡張可能なクラウド ホスト型のハイブリッド システムです。
- インタラクションを通じて学習:このテクノロジーは、言語、意味、コンテキストの分析を通じて学習するように設計されたシステムを推進する、膨大な研究成果を活用しています。
ボーナスとして、VocalIQ は時間の経過とともにさまざまなアクセントに適応することを学習します。
Apple は、VocalIQ がわずか 3,000 回の対話で大幅に精度が向上し、ユーザーから毎週 10 億件のクエリを受け取る Siri を上回っていることを発見しました。
関連: OS X 10.12で期待するMac用Siriの10の機能
ボーカル IQ、知覚力、感情表現
英国を拠点とする VocalIQ は、自然言語処理、意思決定、メッセージ生成、信念追跡を専門としています。
2014 年の彼らのウェブサイトから引用します:
Vocal IQは、世界初の自己学習型対話APIを導入しました。これにより、人とデバイスの間でリアルで自然な会話が実現します。アプリケーションは使用されるたびに少しずつ賢くなります。過去の会話が学習プロセスの中心となり、システムが将来のリクエストをより深く理解し、よりインテリジェントに反応できるようになります。
買収後も、Apple は VocalIQ チームの大半を維持し、現在はケンブリッジのオフィスで働き、製品を Siri に統合している。
Vocal IQ は過去にゼネラルモーターズなどの自動車メーカーと提携していたため、噂されている Apple の電気自動車にもこの技術が採用される可能性がある。
Appleはまた、ユーザーデータをあまり共有せずに動作する人工知能システムを開発するスタートアップ企業、Perceptioを買収しました。この買収は、AppleのAI分野とデジタルアシスタント分野への関心、そしてプライバシーに対する明確な姿勢とユーザーデータ保護への継続的な取り組みに合致しています。
同社はまた、感情検出と感情分析を専門とする別の人工知能スタートアップ企業であるEmotientも買収した。
Emotient の技術は、顔にある 43 個の筋肉の動きを読み取り、感情的な意図を解読します。これは、Siri がユーザーをよりよく理解する上で非常に重要なものになる可能性があります。
Siri SDK
大幅に改良されたSiriに加え、AppleのEchoの競合製品にはカメラとタップによる顔認識機能が搭載される可能性があり、ユーザーが部屋に入るとユーザーを見て認識し、プロフィールを表示できるようになる。
WWDCでは、クパチーノの企業は、開発者がSiriからアクセスできるアプリを作成できるようにする、長らく期待されていたSiriソフトウェア開発キット(SDK)を発表する予定です。
Apple はデジタルアシスタントを Mac にも導入する予定だと報じられている。
出典: テックインサイダー