Mac

あまり一般的ではない意見:Appleの契約業者はサービス向上のため、Siriの音声の一部を聴いている。他に何か新しいことはありますか?

あまり一般的ではない意見:Appleの契約業者はサービス向上のため、Siriの音声の一部を聴いている。他に何か新しいことはありますか?

先週末の英国紙ガーディアンによる報道では、AppleがSiriの音声を聞く任務を負う契約社員を雇っていると詳細に報じられており、批評家らはこれをAppleのプライバシーへの取り組みが単なるマーケティング上の言い訳に過ぎない証拠だと受け止めている。

ガーディアン紙の報道からの抜粋:

ガーディアン紙が入手した情報によると、アップルの契約社員らは、同社の音声アシスタント「Siri」の品質管理、いわゆる「グレーディング」業務の一環として、機密の医療情報や麻薬取引、カップルの性行為の録音などを定期的に聞いているという。

Appleは消費者向けのプライバシーに関する文書では明確に開示していないが、Siriの録音の一部は世界中で同社で働く請負業者に渡されている。

本当に100%確信していますか?というのも、AppleのOS全体に散りばめられたプライバシー画面を調べたところ、Siriの録音の一部がSiriサービスの向上に使用される可能性があることが明確に記載されていたからです。さらに、AppleのiOSソフトウェアライセンス契約をざっと調べたところ、以下の抜粋を見つけることができました。

Siri または Dictation を使用することにより、お客様は、Apple とその子会社および代理店が、お客様の音声入力およびユーザーデータを含むこの情報を送信、収集、維持、処理および使用し、他の Apple 製品およびサービスにおける Siri、Dictation、およびディクテーション機能を提供および改善することに同意するものとします。

この一節全体が太字になっており、Apple の意図がかなり明確になっていると思います。

アップルがSiriサービス向上の一環として、Siriパーソナルアシスタントが収集した音声データをサードパーティ(Siriアルゴリズムのトレーニングを担当する請負業者)に販売しているという「暴露」は、テクノロジーに注目している人にとっては目新しいものではない。

ガーディアン紙もそれを認めている。

音声アシスタントの起動が意図的であったか偶発的であったか、質問はSiriが対応できる内容であったか、Siriの応答は適切であったかなど、さまざまな要素に基づいて回答を評価します。

Siriの音声データの一部が第三者に渡されていると「発見」されたのは今回が初めてではありません。2015年には、Walk N'Talk Technologiesという会社の匿名の従業員がRedditに、同社が分析している音声データはSiriやCortanaなどのパーソナルアシスタントからのものだったと投稿しました。

Appleはガーディアン紙などに対し、次のような声明を発表した。

Siriリクエストの一部は、Siriと音声入力機能の改善のために分析されます。ユーザーからのリクエストはユーザーのApple IDに関連付けられません。Siriの応答は安全な施設で分析され、すべてのレビュー担当者はAppleの厳格な守秘義務を遵守する義務があります。

ガーディアン紙の記事の核心は「内部告発者」、つまりアップル社の従業員が、偶発的なアクティベーション中にプライベートな情報を聞いたと報告したことから生まれたものだ。

内部告発者が新聞に語った内容は次の通り。

医師と患者のプライベートな会話、商取引、犯罪行為と思われる取引、性行為などが録音された例は数え切れないほどあります。これらの録音には、位置情報、連絡先、アプリデータなどのユーザーデータが添付されています。

ユーザーの質問の音声録音は、位置情報などのメタデータを利用して文脈をより深く理解します。懸念されるのは、そもそも請負業者がプライベートな会話を盗聴できるという事実です。報告書自体が認めているように、これはユーザーが意図せずSiriを起動してしまい、「Hey Siri」という起動フレーズの後に発せられた音声録音がサーバーにアップロードされる可能性があるためであり、Siriがユーザーの同意なしに密かに会話を録音しているからではないことは明らかです。

これに対する私の気持ちは、インターネット上の他の人々とはまったく異なります。

人工知能と機械学習の力だけで、デジタルアシスタントが時間の経過とともに進化していくことは期待できません。なぜなら、アシスタントが使用する機械学習モデルは、まず人間の編集者によって訓練される必要があるからです。他に方法はありません。

Googleフォトは、実際の人物の写真を使ってアルゴリズムを学習させていなかったら、驚くほどの精度で顔認識を行うことはできなかったでしょう。AppleのFace IDも、100万枚以上の多様な顔写真を使って機械学習を学習させていなかったら実現できなかったでしょう。音声認識のような「ありふれた」機能でさえ、学習済みデータを用いた機械学習アルゴリズムを活用することで、大幅に改善することができます。

厳しい真実は、機械は(まだ)他の機械の機械学習モデルを満足のいく結果でトレーニングすることはできないということです。それは私たち人間が得意とする仕事です。

人工知能(AI)に真剣に取り組んでいる業界は皆、サービス向上を目指し、機械学習アルゴリズムのトレーニングに人間の編集者を雇用しています。彼らは、スマートスピーカーとの音声対話中に録音された短い音声データ、写真共有サービスにアップロードされた写真、ソーシャルメディアのフィードでフラグが付けられたアイテムなど、自分たちの仕事の中核となるあらゆるコンテンツに触れています。

企業によっては、プライバシーを他の企業よりも重視しているところもあります。また、人間の編集者が目の前の作業にどのように取り組んでいるかについて、他の企業ほど透明性が高くない企業もあるかもしれません。そして最終的には、ユーザーのプライバシー保護において実績がそれほど強くない企業は、他の企業よりもメディアや一般大衆から厳しく精査される可能性が高いでしょう。

しかし、社員にパーソナルデジタルアシスタントを使った会話を盗聴させるのは、ただできるから、あるいはプライベートな会話から何らかの形で実用的な情報を引き出そうとしているからという理由で、そして誰にも気づかれず、苦情も出さずに何年もやり過ごすことが、企業にとって利益になるとは、一瞬たりとも思えません。今日のネットワーク社会では、そんなことは到底不可能です。

誤解しないでください。こうした問題を報道するジャーナリストたちの徹底的な調査には感謝しています。プライバシー擁護派に考えさせる材料を与えてくれるからです。しかし、大手IT企業が人間の編集者を雇ってSiri、Alexa、Googleアシスタントを訓練しているだけでなく、まだ明らかにされていないものの間違いなく悪意のある目的で私たちの会話を盗聴しているという、彼らが仄めかして、あるいは暗に示唆するような結論を私は一瞬たりとも信じません。

はい、Alexaのリクエストを聞いているAmazonスタッフの中には、ユーザーの自宅住所にアクセスできる人がいます。なぜなら、音声リクエストの中には位置情報が含まれるものもあるからです。また、人間が確認するGoogleアシスタントの録音には、ユーザーがデジタルアシスタントに何でも自由に話せるため、プライベートな会話が含まれている可能性があります。

結局のところ、重要なのは、これらの従業員が録音をどう扱うかです。私たちが懸念すべきなのは、サービス向上という明確な目的のために、遠く離れた安全な施設で人間が厳選された音声録音を聞いているという事実ではなく、不正な人間の編集者が顧客の個人情報を悪用する可能性があるという事実です。

ご意見は?

Milawo
Milawo is a contributing author, focusing on sharing the latest news and deep content.