ダグ・キットラウスとアダム・チェイヤーは2007年にSRIインターナショナルのスピンオフを共同設立した。このスタートアップは最終的に、後にSiriとして有名になるインテリジェントなパーソナルアシスタント技術によりAppleに買収された。
しかし、彼らは立ち止まってはいなかった。
Siri の共同創設者たちは現在、Viv でそのコンセプトを次のレベルに引き上げています。Viv は、無数のデータ ソースと次世代の人工知能アルゴリズムを組み合わせ、ユーザーが求めるほぼすべてのことを実行する新しいタイプのデジタル パーソナル アシスタントです。
Vivの影響は計り知れない。そして今回、チームは最高額入札者に身を売るのではなく、知能エージェントの未来を根本から考え直し、数十億ドル規模の産業を創出するという壮大な野望を抱いている。
火曜日にWired誌が公開した徹底的な特集記事では、カリフォルニア州サンノゼに本社を置く新興企業Viv Labsが人工知能を進化させて世界を制覇する計画について、なぜVivがAppleのSiri、MicrosoftのCortana、GoogleのGoogle Nowを凌駕するのか、そして文字通りあらゆるデジタルアシスタントとどう違うのかが説明されている…
記者のスティーブン・レヴィは、Wired の長文記事の中で、キットラウス氏の「Siri はもっと長くて大きな物語の第一章に過ぎない」という言葉を引用し、Viv Labs は私たちがコンピューター機器と関わる方法を変えるだろうと付け加えている。
Siriの共同創設者であるアダム・チェイヤー氏は次のように語った。
Siriとそれが世界に与えた影響を非常に誇りに思っていますが、多くの点でもっと大きな成果を上げることができたはずです。今、私はモバイル、コンシューマー、デスクトップ、エンタープライズの枠を超えた何か、もっと大きなことを成し遂げたいと思っています。ソフトウェアの開発方法を根本的に変えるような何かを成し遂げたいのです。
Viv は、Siri のように大量の定型応答を使用して知能を模倣するのではなく、さまざまなサービスとアプリ間の接続を活用して複雑な質問を理解し、高度な学習アルゴリズムにデータを渡して正確な回答を提供することを目指しています。
Google Now のようなサービスは Google の膨大なナレッジ グラフの恩恵を受けているが、システムが個々のデータをまとめる方法を知らないため、「エイブラハム リンカーンが生まれた都市の人口はどれくらいですか?」といった質問を Google Now に尋ねることはできないと Kittlaus 氏は指摘する。
「Siriと同様、プログラマーが明示的にプログラムしていないことは何もできない」と彼は続ける。
これは Google に限った問題ではなく、他のデジタル アシスタントも同様の技術的基盤から生じる同じ制限に悩まされています。
Appleはその後、Siriの機能を拡張し、例えばOpenTableでレストランの予約を取れるようにしましたが、スケジュールの次の空いている夜にテーブルを予約するといった簡単なこともまだできません。カレンダーの確認方法とOpenTableの使い方はSiriに分かっています。しかし、これらを組み合わせるのは、今のところSiriには無理です。
Vivが登場します。
「シャックが座れる座席のあるダラス行きのフライトをください」といった複雑なコマンドを例に挙げましょう。Viv は文を解析し、最高の技を繰り出します。Kayak、SeatGuru、NBA メディアガイドといったサードパーティの情報源をリンクする高速で効率的なプログラムを自動生成し、足元に余裕のあるフライトを特定します。しかも、これらすべてを一瞬で実行できます。
Cheyer 氏が、Google Now の元製品担当副社長である Vishal Sharma 氏に、Viv が料理によく合う最も近いワインのボトルをどのように見つけるかを実演したところ、同氏は驚愕した。
「そんな疑問に答えられるシステムは世界中どこにも知りません」と彼は言う。「いろいろと問題が起きる可能性はありますが、こういうシステムがあればいいなと思います。」
次の抜粋はおそらく Viv の力を最もよく表しているでしょう。
あるエンジニアが、「7月2日にサンフランシスコ発シャルル・ド・ゴール行きの最安の航空券を、翌週月曜日に帰りの便で入手してください」という質問に対するVivの返答をどのように改良してきたかを説明します。先週、エンジニアは飛行機の座席データベースを追加しました。仮想のスマートフォン画面を表示するラップトップベースのVivプロトタイプを使い、マイクに向かって話しかけます。ルフトハンザ航空455便が条件に合います。「ご希望に応じて61G席をご利用いただけます」とVivは答え、クレジットカードで座席を購入します。
以下のインフォグラフィックは、Viv が複雑なクエリを理解し、望ましい結果を導き出すために実行する手順の概要を示しています。
そのため、Viv は複雑なクエリに対して瞬時に正確な回答を提供できるだけでなく、その場で独自のコードを変更したり、新しいことを学習したりして、使えば使うほど賢くなれます。
Kittlaus & Co. は、興味を持つデバイスメーカーに Viv の技術のライセンス供与を計画しており、同社が「グローバル ブレイン」と呼ぶ Viv が、スマートフォン、タブレット、テレビ、自動車、その他のインターネット接続ハードウェアなどの日常的なデバイスに統合されるのを期待している。
ちなみに、彼らは「生きる」という意味のラテン語の語源にちなんで Viv と名付けました。
投稿上部の写真:アダム・チェイヤー(左)、ダグ・キットラウス(中央)、クリス・ブリガム(右)。