パーソナル音声アクセシビリティ機能を使用して、iPhone、iPad、Mac で自分の音声を複製し、Live Speech で使用する方法を説明します。
パーソナルボイスとは何ですか?
Personal Voice を使用すると、コミュニケーションの支援が必要な人が iPhone、iPad、または Mac をトレーニングして自分の声をシミュレートできます。これは、時間のかかる音声バンキング プロセスよりも手頃です (詳細は後述)。
Personal Voiceは、Live Speechと併用することで、入力した文章をあなたの実際の声に近い音声に変換します。対面でのコミュニケーションや電話での会話で使用できます。伝えたい内容を入力すると、iPhoneやiPadがあなたの声でその文章を読み上げます。
パーソナル音声モデルは、アクセント、トーン、抑揚、リズムを模倣することで音声の忠実度を維持します。
誰のためのものなのか
Appleのパーソナルボイス機能は、話す能力を失うリスクのある方や、発話障害のある方のためのものです。パーソナルボイスを設定すると、以前話す能力があった時に作成した人工合成音声のクローンにより、「自分の」声でコミュニケーションを続けることができます。また、この機能を使えば、愛する人が亡くなった後のために、その人の声をクローン化することもできます。
Appleによると:
「最近ALS(筋萎縮性側索硬化症)と診断された方や、発話能力に徐々に影響を与える可能性のあるその他の疾患を抱える方など、発話能力を失うリスクのあるユーザーにとって、パーソナルボイスは、その人に似た声を簡単かつ安全に作成できる方法です。」
ALSと音声バンキング
ALSは、喉と口の筋肉が徐々に衰えるため、発声能力に影響を及ぼします。ALS患者は、多くの場合、自身の声をデジタル化するために、ボイスバンキングと呼ばれる時間のかかるプロセスを受けます。Personal Voiceを使えば、事前に作成されたプロンプトを読み上げるだけで、誰でも自分の声を複製できます。
「結局のところ、最も重要なのは友人や家族とコミュニケーションが取れることです」と、非営利団体チーム・グリーソンの理事でありALS支援者のフィリップ・グリーン氏はアップルのプレスリリースで述べた。
「自分の声で愛を伝えることができれば、世界は大きく変わります。iPhoneでたった15分で合成音声を作成できるというのは素晴らしいことです」とグリーン氏は付け加えた。
パーソナル音声モデルは、Apple のアプリだけでなく、AssistiveWare などのサードパーティ企業が提供する専用の補助的代替コミュニケーション (AAC) アプリでも利用できます。
この病気について詳しく知るには、ALS の Web サイトをご覧ください。
機械学習を活用することで、iPhone、iPad、Mac は、特殊な機器や音声バンキングと呼ばれる時間のかかるプロセスに頼ることなく、自分の声とそっくりなコンピューターの音声を作成できます。
パーソナルボイスを作成するには、画面に表示される150個のサンプルフレーズを話す必要があり、所要時間は約15分です。このプロセスが完了すると、iPhone、iPad、またはMacがあなたの声を分析し、話し方を学習し、最終的にコンピューターによる人工音声を生成するまで、一晩(あるいはそれ以上)かかる場合があります。生成された音声は、Live Speechでテキスト読み上げに変換できます。
パーソナルボイスの音
驚くべきことに、わずか15分のトレーニングで、あなたの実際の声に非常に近い音声が得られます。しかし、ロボット特有の癖がいくつかあり、本物ではないことがすぐに分かります。しかし、音声品質は十分に向上しているため、電話の通話では気にならない程度で、実際に人が話しているのではなく、音声合成によって人工的に生成された音声であるという事実を隠すことができます。
ちなみに、私は Live Speech with Personal Voice を使用しましたが、妻はすぐにその声が私のものだと分かりました。
必要なもの
パーソナル音声を作成して使用するには、次のものが必要です。
- iOS 17、iPadOS 17以降を搭載したiPhoneまたはiPad。注: A14 Bionicプロセッサを搭載したデバイスが必要です。そのため、iPhone XR、XS、11などの古いデバイスではパーソナルボイスを生成して使用することはできません。
- macOS Sonoma 以降を実行している Apple Silicon 搭載の Mac。
- 周囲の音や反響がほとんどない静かな環境で少なくとも 15 分の自由時間を確保します。
- 現在、Personal Voice は他の言語では利用できないため、英語または中国語を話す必要があります。
注: 1台のデバイスでパーソナルボイスを作成すると、iCloud経由で他のAppleデバイスに同期できます。そのため、デバイスごとに15分かかる設定を行う必要はありません。パーソナルボイスをiCloud経由で同期するには、「設定/システム設定」>「アクセシビリティ」>「パーソナルボイス」に移動し、「デバイス間で共有」をオンにしてください。
iPhone、iPad、Macでパーソナルボイスを設定する
似たような音声を作成するには、ランダムに選択された音声プロンプトを読み上げる必要があります。この機能では、テキスト読み上げ用の合成音声を、あなたの声と全く同じにするために、十分な音声トレーニングが必要です。このプロセスを一度に完了する時間がない場合は、中断したところから後で再開できます。
1) iPhoneまたはiPadの 設定 アプリ、またはMacのシステム設定を開き 、 「アクセシビリティ」をタップします。このチュートリアルではiPhoneを使用していますが、iPadとMacでも手順は同じです。
2) 「音声」の見出しまで下にスクロールし、「個人の音声」をタップします。
3) 「個人の音声を作成」をタップし、Face ID またはパスコードで認証します。
4) 「あなただけの音声を作成」のスプラッシュ画面で「続行」をタップし、言語を選択してください。現時点では、英語(米国)または中国語が選択可能です。
5)ここでの音声名はあなたの名前と一致する必要がありますが、一致しない場合はすぐに編集して「続行」をクリックできます。
6) 15分ほど余裕がある場合は、「デフォルトのフレーズで続ける」をタップしてください。時間が足りない場合や発音が難しい場合は、 「短いフレーズを使用する」を選択できます。こちらは所要時間が半分になりますが、パーソナル音声の品質が低下する可能性があることにご注意ください。
150個のフレーズを読み終えたら「完了」をタップし、後で「パーソナルボイス」画面の「録音を続行」をタップして再開できます。そのため、デフォルトのフレーズを使用することをお勧めします。
7)次に、赤い録音ボタンをタップし、画面上のフレーズを話して音質を確認します。
- 準備完了:背景音がなく、すべて問題ない場合、この画面が表示されます。「続行」をタップして先へ進んでください。
- 録音に関する注意事項:周囲が十分に静かな環境でない場合、デバイスから通知が表示されます。「続行」をタップすると、背景ノイズのある理想的な環境を強制的に設定できます。ただし、そうすると録音結果が悪くなる可能性があります。そのため、部屋のファンをオフにし、ドアを閉めるなど、周囲の余分な音を遮断するための簡単な対策を講じることをお勧めします。その後、「再確認」をタップし、赤い録音ボタンをタップしてこのプロセスを繰り返すと、録音が成功するはずです。
8)赤い録音ボタンをタップして、150 個のフレーズの最初のフレーズを読みます。
最初の文を読み終えると、自動的に2番目の文へと進みます。ただし、途中で休憩すると読み上げが一時停止することがあります。その場合は、赤い曲線矢印のボタンを押して読み上げを再開してください。
単語を間違えても、先に進むことができます。ただし、より効果的にするには、青い錠剤型の戻る矢印 ボタンをタップして前のフレーズに戻ることをお勧めします。次に、赤い曲線矢印アイコンをタップすると、そのフレーズをもう一度読み上げます。読み上げが終わると自動的に次のフレーズに進みますが、そうでない場合は青い進む矢印ボタンをタップしてください。
9) 150個のフレーズをすべて話し終えると、「録音完了」画面が表示されます。「続行」をタップしてください。
10)次に、iPhoneまたはiPadの充電とロックを求められます。さらに、「許可」をタップすると、Personal Voiceの処理が完了したら通知が届きます。
パーソナルボイスの準備が整うまでお待ちください
Apple のデバイスには、バッテリーに優しい方法でディープ ニューラル ネットワークを実行するための専用のコプロセッサ (Neural Engine) が搭載されていますが、すべてのサンプルを処理するには、デバイスを一晩中電源に接続したままにしておく必要がある場合があります。
上記の手順を完了したら、iOSデバイスを充電用に接続し、ロックしたままにしてください。パーソナルボイスの生成には数時間かかるため、iPhoneまたはiPadを夜間充電モードにして、就寝中にロックがかかった状態でパーソナルボイスの準備を完了させるのが最適です。
設定アプリ>アクセシビリティ>パーソナル音声で進行状況を確認できます。パーセンテージで表示されます。ただし、頻繁に実行すると処理時間が長くなる可能性があります。
初めてPersonal Voiceを作成した時は、 M2チップを搭載した12.9インチiPad Proで準備に14.5時間かかりました。そのため、古いiPhoneやiPadでは、今回はもっと時間がかかることが予想されます。
もう一つ知っておくべき点は、不要なパーソナルボイス通知です。iPhoneまたはiPadがロックされ充電されている場合でも、「パーソナルボイスの準備が一時停止されています。パーソナルボイスを生成するには、iPhone/iPadが充電されロックされている必要があります。」という通知が表示されることがあります。
これらの通知は無視しても構いませんが、デバイスを起動させることでパーソナルボイスの準備プロセスを妨げているように思います。そのため、ロックされたiPadを充電してから10時間経ってもパーソナルボイスが準備されなかったため、パーソナルボイスの通知を左にスワイプして、その日の音声をミュートにしました。次に、「おやすみモード」をオンにし、iPadをロックして充電し、就寝しました。朝(正確には午前2時35分)にはパーソナルボイスが生成され、使用できるようになりました。
パーソナルボイスの使い方
iPhone、iPad、MacのLive Speech機能を使えば、話したい内容を入力すると、スマートフォンやコンピュータが入力した単語、フレーズ、文章を読み上げます。Live Speechは、話すことができない方や、電話で話すのが難しい方にもご利用いただけます。また、対面でのコミュニケーションにもご利用いただけます。
システムの音声を選択すれば、パーソナルボイスなしでLive Speechを使うこともできます。パーソナルボイスを作成した後は、Live Speechでその音声を選択すると、iPhone、iPad、Macが一般的なコンピュータの音声ではなく、あなたの声に似た音声で話すようになり、「パーソナル」な音声になります。
パーソナルボイスを作成したら、「設定」 > 「アクセシビリティ」 > 「Live Speech」 > 「音声」 > 「パーソナルボイス」に移動します。ここで、作成したパーソナルボイスをLive Speechの音声として選択します。
ライブスピーチの音声をパーソナルボイスに設定したら、iPhoneのサイドボタンまたはiPadのトップボタンをトリプルクリックしてライブスピーチを起動します。 「読み上げ」ボックスに何か入力し、送信ボタンを押します。iPhoneまたはiPadが入力した単語をあなたの声で読み上げます。

Live Speechは、FaceTimeや通話中に入力したテキストを、まるであなたが話しているかのような音声に変換します。これはすべて、AIが生成したパーソナルボイスによって実現されています。

個人の音声録音をエクスポートする
話した 150 個のフレーズすべてを個別の音声クリップとしてエクスポートするオプションがあります。
1) iPhone または iPad の設定を開き、 「アクセシビリティ」 > 「個人の音声」に移動します。
2)個人の音声タイルをタップします 。
3) 「音声録音をエクスポート」をタップし、オプションを選択します。
私の場合は、「ファイルに保存」を選択してiCloud Driveに保存しました。録音は88MBのZIPファイルとしてエクスポートされ、解凍すると自分が話したフレーズの録音が表示されます。この小さなファイルはAppleのCore Audio Format(CAF)で、iOSとmacOSでネイティブに再生できます。
個人の音声を削除する
「設定」 > 「アクセシビリティ」 > 「個人の音声」に移動します。ここで、個人の音声名をタップし、「削除」をタップします。
その他のアクセシビリティのヒント:
- 頭の動きでiPhoneやiPadを操作する方法
- iPhoneやApple Watchを使って他のiPhoneやiPadを操作する方法