尊敬されるジャーナリストのスティーブン・レヴィ氏が、Wired Media Group 傘下の Backchannel で新たな記事を執筆し、Apple における人工知能と機械学習の仕組みについて、めったにない内部情報をまたも独占公開しました。
この記事には貴重な情報が満載で、Apple の幹部 Eddy Cue、Craig Federighi、Phil Schiller、そして Siri 責任者 Tom Gruber と Alex Acero が、機械学習によって Apple が Siri のエラー率を 1 ~ 2 分の 1 に削減できたという内容も含め、Apple の AI への取り組みについてこれまで知られていなかった多くの事実を披露している。
機械学習の神殿へようこそ
Apple には機械学習に取り組んでいるエンジニアが「多数」おり、その中には Apple に入社する前に必ずしもその分野の訓練を受けていなかった者もいる。彼らの作業の結果はすべて共有され、社内の他の製品チームにすぐに利用できるようになっている。
「Appleには、機械学習の殿堂のような中央集権的な組織は存在しません」と、Appleのソフトウェアエンジニアリング責任者であるクレイグ・フェデリギ氏は語る。「私たちは、適切なユーザーエクスペリエンスを提供するために機械学習を適用する必要のあるチームの近くに機械学習を配置するよう努めています。」
もちろん、一部の人材は買収によって獲得されています。Appleは最近、年間20~30社の中小企業を買収しています。「私たちは、才能を持ちながらも、素晴らしい体験を提供することに真摯に取り組んでいる人材を求めています」とフェデリギ氏は語りました。
Siriをより人間らしくする
本題に入る前に、Siri には 4 つの側面があります。
- 音声認識- 音声をテキストに変換する
- 自然言語理解- あなたが言っていることを理解する
- 実行- クエリまたはリクエストを実行する
- 応答— あなたに話しかける
Apple は依然、Siri の音声技術の多くをサードパーティ (おそらく Nuance) からライセンス供与されているが、デジタル パーソナル アシスタント用の音声機能を自社開発することを検討しているため、この状況は「変化の時が来ている」と Levy 氏は書いている。
実際、ディープラーニングによって Siri はより自然に話しかけられるようになり、機械学習技術によって個々の単語の録音が滑らかになり、Siri の応答は Nuance に頼っていたときよりも実際の人間のように聞こえるようになります。
これらすべてにより、iOS 10 および macOS Sierra でサードパーティのスキルにアクセスするために特定の言語を使用する必要がなくなり、お気に入りのアプリで Siri を利用できるようになります。
Siriの脳移植
2014年7月30日、Siriは脳移植手術を受けた。
ユーザーからコマンドの誤解釈に関する苦情が寄せられたのを受けて、AppleはSiriの音声認識をニューラルネットベースのシステムに移行し始めました。そして、大量のデータとGPUを用いてSiriのニューラルネットを学習させました。
「私たちは最大かつ最強のGPU(グラフィックス・プロセッシング・ユニット・マイクロプロセッサ)ファームを常時稼働させています」とSiriのアレックス・アセロ氏は語る。「そして大量のデータを処理しています。」アセロ氏によると、Siriは2014年11月からユーザーの意図を理解するために機械学習を活用し始め、1年後にはディープラーニングを搭載したバージョンをリリースした。
Appleは、ディープニューラルネットワーク(DNN)、畳み込みニューラルネットワーク、長期短期記憶ユニット、ゲート付き回帰ユニット、nグラムなどの機械学習技術を適用することで、Siriにディープラーニングを組み込み、すべての言語でエラー率を半分に削減することに成功した。
「これは主にディープラーニングと、それを最適化した方法によるものです。アルゴリズム自体だけでなく、エンドツーエンドの製品全体の文脈で最適化しました」とアセロ氏は語る。
iBrain はここにあります。機械学習、人工知能、Apple 設計のシリコンのパワー、差分プライバシー技術のおかげで、iOS 10 ではすでに携帯電話に搭載されています。
Apple のユーザーベースの規模により、Apple は Siri を迅速にトレーニングすることができました。
Siri の先進開発責任者 Tom Gruber 氏は次のように振り返っています。
スティーブ・ジョブズは、パイロット版のアプリがベータプログラムなしで一夜にして1億人のユーザーを獲得するだろうと言いました。突如、ユーザーが存在するようになるのです。彼らは、あなたのアプリに関連する発言を教えてくれるのでした。これが最初の革命でした。そしてニューラルネットワークが登場したのです。
しかし、機械学習は Apple を他にどのようにサポートするのでしょうか?
レヴィ氏は、機械学習が Apple の製品やサービスの進化にどのように役立っているかについて学びました。その考察の材料となる抜粋を以下に示します。
Appleはディープラーニングを活用し、Appleストアにおける不正行為の検知、すべてのデバイスのバッテリー駆動時間の延長、そしてベータテスターからの数千件ものレポートから最も有用なフィードバックの特定に役立てています。機械学習は、Appleがあなたに最適なニュース記事を選ぶのにも役立っています。Apple Watchユーザーが運動しているのか、それとも単に散歩しているのかも判断します。
写真に写っている顔や場所を認識します。Wi-Fiの電波が弱い場合は、携帯電話のネットワークに切り替えた方が良いかどうかを判断します。優れた映画制作の基準さえも理解しており、Appleはボタン一つでスナップショットや動画をミニムービーにまとめることができます。
Apple の競合他社も似たようなことを数多く行っていると主張するのであれば、その通りでしょう。
左上から時計回りに: Siri の高度開発責任者 Tom Gruber 氏、Apple のインターネット ソフトウェアおよびサービス担当 SVP Eddy Cue 氏、Siri のシニア ディレクター Alex Acero 氏。
しかし、Appleがこれらの機能を提供する方法は、ユーザーのプライバシー保護にも配慮していることを念頭に置いておく必要があります。iOSデバイスを動かす自社設計のAシリーズチップと差分プライバシー技術を活用することで、Appleのソフトウェアは、膨大なユーザーデータをサーバーに預けることなく、デバイス上で直接これらの機能を実行できるのです。クラウドに重労働を委ねる必要はありません。
関連: iOS 10とmacOS Sierraの差分プライバシーの詳細
珍しい暴露として、Apple はジャーナリストに対し、iPhone 上で機械学習を可能にする動的キャッシュが約 200 メガバイトのストレージ容量を占有していると語った。
システムは古いデータを削除しますが、キャッシュの実際のサイズは、アプリの使用状況、他の人とのやり取り、ニューラル ネット処理、音声モデラー、自然言語イベント モデリング、写真アプリでのオブジェクト認識、顔認識、シーン分類を強化するニューラル ネットのデータなど、個人データがどれだけ使用されているかによって異なります。
Appleのマーケティング責任者フィル・シラー氏はこう語る。
私たちのデバイスは、特にAppleが設計したAシリーズチップの登場により、急速にスマート化しています。バックエンドはよりスマートに、より高速になり、私たちのあらゆる行動に何らかの形で接続される理由が生まれています。これにより、学習すべきことが山ほどあり、しかもそれが私たちに利用可能であるため、ますます多くの機械学習技術が活用されるようになっています。
これらの技術は、これまで私たちができなかった「新しいこと」を実現するためにも使われていると彼は付け加えた。
しかし、それはシリコンだけではない、とフェデリギ氏は言う。
デバイスにマイクを何個搭載し、どこに配置するか。ハードウェアとマイク、そして音声処理を行うソフトウェアスタックをどのように調整するか。これらすべてが連携して機能するのです。ソフトウェアを開発して、あとは結果を見守るだけの人と比べて、これは計り知れないアドバンテージです。
Apple は差分プライバシーに少しだけ取り組んでいるのではなく、完全に取り入れています。
「この技術は、アップル社内で進化し、製品の製造方法に取り入れられていくにつれ、最終的には非常にアップルらしいやり方になるだろう」とシラー氏は語った。
目立たないAI駆動機能
人工知能は、iOS エクスペリエンスの他の側面を改善するためにも使用されます。
AI を活用した機能の例をいくつかご紹介します。
- メールアドレスに基づいて、連絡先に登録されていない発信者を特定する
- iOSのアプリスイッチャーに、次に開く可能性が最も高いアプリのショートリストを表示する
- メールに基づいて予定のリマインダーを取得する
- 入力する前に予約したホテルのマップ上の場所を表示する
- 車をどこに駐車したかを覚えておく
- Apple Pencilのパームリジェクション
- 省電力で「Hey Siri」のホットワードを認識する
- QuickTypeキーボードの候補の改善
そしてもちろん、他にもたくさんあります。
ソフトウェア部門の責任者クレイグ・フェデリギが、Apple本社でSiriの音声認識の達人アレックス・アセロが音声認識ソフトウェアについて語るのを聞いている。ああ、あの壁のハエになりたい!
「機械学習のおかげで、以前は断っていたようなことにもイエスと言えるようになりました」と、マーケティング責任者のフィル・シラー氏は語る。「機械学習は、次にどんな製品を開発するかを決めるプロセスに深く根付いてきています」とシラー氏は語り、次のように付け加えた。
典型的なお客様は、Apple製品の魅力を体現するディープラーニングを日常的に体験することになります。最もエキサイティングな事例は、あまりにもさりげない工夫で、3回目に見るまで気づかないほどです。そして、3回目に見て初めて「これは一体どうやって実現されているんだ?」と不思議に思うのです。
この記事のおかげで、iOS 上で手書きの中国語の文字を認識してテキストに変換したり、watchOS 3 で Apple Watch に文字ごとの入力機能を追加したりする AI コードの一部が、実は 1990 年代初頭に Apple が失敗した Newton メッセージパッドの手書き認識技術からヒントを得ていることも知りました。
この記事は、Appleが競合他社と比べて人工知能(AI)と機械学習にどのように取り組んでいるかについて、さらなる洞察を提供しています。非常に興味深い記事ですので、ぜひ一読をお勧めします。
出典: バックチャンネル