以前記事を書いたように、AppleはSiriをモジュール方式で開発しました。これにより、Nuance社の音声認識エンジンを類似のソフトウェアに簡単に置き換えることができました。Siriは誕生以来、Nuance社の技術に依存してきましたが、状況はすぐに変化しそうです。
同社は、Nuanceに取って代わり、パーソナルアシスタントに「ニューラルネットワーク」の強化をもたらす独自の技術の開発を任務とする音声合成および音声認識の専門家からなる社内チームを編成していると報じられている…
Wired の記者 Robert McMillan 氏は、Google と Microsoft がそれぞれ Google Now と Skype Translate に使用しているニューラル ネットワーク アルゴリズムを Apple がまだ採用していないことを指摘しています。
Apple は社内業務については秘密主義であることで有名で、この記事に対してもコメントを寄せていないが、同社は以前、おそらく最もよく知られている音声認識ベンダーである Nuance から音声認識技術のライセンスを取得していたようだ。
しかし、緊密な人工知能研究者コミュニティの人々は、この状況は変わりつつあると確信している。Appleが独自の音声認識チームを結成し、ニューラルネットワークを活用したSiriの開発が進んでいるのは明らかだと彼らは言う。
先月、NuanceのCEO自身がSiriに同社の音声認識アルゴリズムが使用されていることを認めた点に注目してください。Wiredの報道によると、トロント大学の研究者であるアブデル=ラーマン・モハメド氏は、Appleからのアプローチを受け、Appleは「音声認識研究のための非常に強力なチームを構築している」と考えていると述べています。
Appleは音声研究のために、エディンバラ大学の研究者、アルナブ・ゴシャル氏を新たに採用した。記事はさらに、Appleが過去に採用した関連人材を多数挙げており、その中には、現在Siriチームで働く元Microsoft社員のアレックス・アセロ氏や、元NuanceのSiriプロジェクトマネージャー、グンナー・エヴァーマン氏も含まれている。
Appleが自社技術でNuanceに取って代わる可能性についての噂は、昨年夏にXconomyが報じたところまで遡ります。当時、AppleはGunnar Evermann氏率いる社内チームを結成したと報じられていました。このチームはマサチューセッツ州ケンブリッジのケンブリッジ・イノベーション・センターに本部を置いているようです。
さらに、Nuance が買収した音声ソフトウェア会社 VoiceSignal Technologies の元従業員数名も主要な役割で登場すると報じられており、Nuance の元研究担当副社長の Larry Gillick 氏が Siri の主任音声科学者として挙げられている。
Siriのシニアリサーチサイエンティストとされるドン・マカラスター氏は、ギリック氏と同じく音声認識技術を開発するドラゴンシステムズに在籍していた頃に共に働いていた。Appleは以前、Siriチームを強化するため、パーソナルアシスタントのスタートアップ企業Cueと音声認識技術を開発するノバウリスを買収したとみられている。
Nouvaris は、著名な音声研究者と元 Dragon Systems のエンジニアによって 2002 年 3 月に設立され、Verizon Wireless、Panasonic、Alpine、BMW などの企業のさまざまな製品に使用されているテクノロジを提供しています。
これは非常に興味深い話ですが、最近Nuanceが売却を検討しており、サムスンが買収候補として挙げられているという報道もあることを考えると、なおさら興味深いものです。注目すべきは、アクティビスト投資家のカール・アイカーン氏がNuanceの株式を保有していることです。
社内の音声合成および認識ソフトウェアを Siri に組み込むと、Siri の AI と音声認識セグメントが同じ社内で開発され統合されるため、応答が速くなり、精度が向上すると考えられます。
iOS 8 の Siri は、Google Now と同様に、音声をリアルタイムでテキストに変換するストリーミング音声認識機能が向上したため、応答が速くなりました。
このオペレーティング システムのアップデートにより、Siri と Shazam が統合されて音楽の認識が容易になり、便利な「OK Siri」機能が追加され (そのための脱獄調整があります)、Siri のインターフェイスで iTunes コンテンツを直接購入できるようになります。
また、iOS 8 のコード文字列が示唆するものによれば、Apple はこの機能をサードパーティ製アプリに開放し、次世代の Apple TV で Siri を利用したクエリを有効にすることを計画しているようだ。
最後になりましたが、Siri は噂されている iWatch にもぴったり合うかもしれません。
参照: Jeff による Siri の究極ガイド。