OS Xには、Macやアプリを音声で操作できる便利なディクテーション機能が搭載されています。「スピーカブルアイテム」と呼ばれる一連の音声コマンドを使えば、アプリを開いたり、メニュー項目を選択したり、連絡先にメールを送信したり、話した文章全体をテキストに変換したりと、テキスト入力が可能な場所であればどこでも操作できます。
これはiOSのディクテーション機能によく似ています。iOSとOS Xはどちらも、音声をテキストに変換するNuanceベースの同じ技術を使用しています。iOSデバイスの処理能力には限界があるため、iPhone、iPod touch、iPadのディクテーション機能を使用するには、iOS 7ではネットワーク接続が必要です(iOS 8はストリーミング音声認識と22の新しい言語をサポートしています)。
Mac では、CPU パワー、バッテリー寿命、RAM などのコンピューティング リソースは、モバイルほど重要ではありません。そのため、OS X Mavericks では、Apple のサーバーを利用せずに単語をテキストに変換する新しい拡張ディクテーション機能が提供されています。
つまり、サーバーベースのディクテーションを使えば、インターネット接続がなくても音声入力できます。音声認識処理はMac上でローカルに実行されるため、話すとすぐにテキストが表示されます。つまり、リアルタイムフィードバックによる継続的なストリーミングディクテーションが可能になります。
このチュートリアルでは、OS X で拡張ディクテーションをオンにして、オフラインでも音声テキスト変換を活用する方法を説明します。
前述の通り、拡張ディクテーションを使用すると、インターネット接続なしでも継続的にディクテーションを行うことができます。システム環境設定の「ディクテーションと読み上げ」セクションにある「ディクテーション」パネルで、ディクテーションをオンにし、拡張ディクテーションを有効にし、言語とショートカットキーを選択することができます。
このチュートリアルで取り上げる内容は次のとおりです。
目次
- ディクテーションについて
- 拡張ディクテーションの簡単な紹介
- 拡張ディクテーションを有効にする方法
- 拡張ディクテーションを無効にする方法
- ディクテーション言語の選択
- オンラインとオフラインのディクテーション
- ディクテーションの可用性
- ディクテーションとプライバシー
- 関連記事
さあ、始めましょう。
ディクテーションについて
OS Xでは、テキストを入力できる場所ならどこでも音声入力できます。音声入力を開始するには、ショートカットキーを使用するだけです。デフォルトでは、音声入力を開始するにはファンクションキーを2回押す必要がありますが、右/左/いずれかのコマンドキーを2回押すように変更できます。
独自のショートカットを選択することもできます。
あるいは、 「編集」メニューから「ディクテーションを開始」を選択することで、任意のテキストフィールドでディクテーションを開始できます。この機能を使用するのに特別な設定やトレーニングは必要ありません。ディクテーションが終了したら、「完了」を押すか、ファンクションキーをもう一度押すと、話した言葉が自動的にテキストフィールドに表示されます。
拡張ディクテーションの簡単な紹介
OS X Mavericks および Yosemite で利用可能な拡張ディクテーションは、Mac の処理能力を使用して、音声をテキストに変換し、ライブフィードバックをストリーミングします。
ディクテーションを開始すると、別のウィンドウに切り替えるか、ファンクションキーをもう一度押すか、「完了」をクリックすると、OS X は自動的に聞き取りを停止します。
ディクテーションを使えば使うほど、理解度が上がります。
このサポートドキュメントによると、「ディクテーションはあなたの声の特徴を学習し、アクセントに合わせて調整します」とのことです。そのため、システム環境設定の「ディクテーション」パネルにある「言語」メニューから適切な方言を選択することが重要です。
ステップ1:まず、Macの標準のシステム環境設定アプリを起動する必要があります。MacのDockにあるアプリケーションフォルダ内(Finderで⌘+Shift+Aのショートカットを使って素早く開くことができます)または、Spotlight検索を使ってシステム環境設定を起動することもできます。
ステップ 2:システム環境設定の「音声入力と読み上げ」セクションを開きます。
ステップ 3: [ディクテーションと音声認識]の下の[ディクテーション]ペインをクリックします。
ステップ 4:まず、「ディクテーション」の横にある「オン」ラジオ ボタンをクリックして、ディクテーションを有効にします。
拡張音声認識のために Mac に必要な言語データをダウンロードするように求められた場合は、「ディクテーションを有効にする」ボタンをクリックして確認します。
ステップ 5: 最後に、「拡張ディクテーションを使用する」チェックボックスをオンにします。
ヒント:音声入力へのアクセスは、システム環境設定の「ペアレンタルコントロール」パネルで制限できます。Macで音声入力をオンにできない場合は、この機能の使用を妨げているペアレンタルコントロールを確認してください。ペアレンタルコントロールの設定と削除は、Macの管理者アカウントのみに許可されているのでご注意ください。
拡張ディクテーションを無効にする方法
ステップ 1:システム環境設定を起動し、「ディクテーションとスピーチ」セクションをクリックして、「ディクテーション」パネルにアクセスします。
ステップ 2:「拡張ディクテーションを使用する」チェックボックスをオフにします。
「拡張ディクテーションを使用せずにテキストを音声入力すると、音声内容は Apple に送信され、テキストに変換されます」というプロンプトが表示されます。
問題がなければ、「 ディクテーションを有効にする」ボタンをクリックしてください。このボタンをクリックすると、拡張ディクテーション機能が無効になり、ディクテーションはオンのままになります。 サーバーとMacベースのディクテーションの両方を同時に無効にしたい場合は、「キャンセル」を クリックしてください。
ディクテーション言語の選択
ステップ 1:ディクテーションの言語を選択するには、「システム環境設定」>「ディクテーションと読み上げ」>「ディクテーション」の 「言語」オプションを使用します。
これにより、有効な言語のいずれかを選択できるプルダウン メニューが表示されます。
ステップ 2:希望する言語が見つからない場合は、ドロップダウン メニューの下部にある[カスタマイズ...]を選択します。
ステップ3:拡張ディクテーションで利用可能なすべての言語をリストした新しいウィンドウが表示されます。複数の言語をダウンロードできますので、追加したい言語の横にあるチェックボックスにチェックを入れてください。
下図のように、拡張ディクテーションを有効にすると、このウィンドウでチェックマークが付けられた言語には「ダウンロードされます」という行が表示され、この Mac には言語データが存在せず、サーバーからダウンロードする必要があることが示されます。
選択したすべての言語の合計ダウンロードサイズは、ウィンドウの下部に表示されます。この追加コンテンツのダウンロードに必要なディスク空き容量は、使用している言語によって異なります。目安として、各言語パックのダウンロードサイズは少なくとも500MBです。
スクリーンショットが証明しているように、中国語(中国)、中国語(香港特別行政区)、フランス語(フランス)の 3 つの言語パックを有効にするだけで、1.4 GB という膨大なダウンロードが発生しました。
ヒント:拡張ディクテーションが無効になっている場合、リストに新しい言語を追加しても、Apple のサーバーで使用するためにマークされるだけで、何もダウンロードされません。
ステップ4:言語の選択が完了したら「OK」ボタンを押します。ディクテーションパネルに戻ります。
ウィンドウの左下隅に、選択した言語のダウンロードの進行状況が表示されます。バックグラウンドでデータをダウンロードしている間も、Macを使い続けることができます。
すべてのダウンロードが完了したら、インターネット接続が利用できないときでも、これらの言語でディクテーションを開始できます。「言語」ドロップダウンメニューで、ディクテーションに使用する言語を選択することを忘れないでください(下図参照)。
ヒント:現在のダウンロードをキャンセルまたは一時停止するためのインターフェースはありませんが、ディクテーションを「オフ」に設定してから「オン」に戻すという、それほど明白ではない回避策を使用できます。これにより、進行中のすべてのダウンロードが即座に強制終了されます。
オンラインとオフラインのディクテーション
サーバーベースのディクテーションと Mac ベースのディクテーションには、それぞれ長所と短所があります。
まず、オフライン ディクテーションを使用すると多くの利点がありますが、そのいくつかを挙げると、ほぼ瞬時の音声テキスト変換とオフライン操作です。
覚えておいていただきたいのは、拡張ディクテーションを無効にすると、Mac が Apple のサーバー上の最新の言語データを利用できるようになり、より正確なディクテーション エクスペリエンスが実現される可能性があるということです。
Appleは、拡張ディクテーションが無効になっている場合、音声に加えて他のデータもサーバーに送信されることを警告しています。具体的には、名前やニックネーム、さらにはアドレス帳の連絡先の名前、ニックネーム、そしてあなたとの関係(例えば「私の父」)といった情報が、サーバー側のディクテーションを強化するために収集されます。
Apple は弁明として、クラウドがユーザーをよりよく理解し、ユーザーの発言をより正確に認識できるようにするためにこのデータが必要であると述べています。
ディクテーションの可用性
ディクテーションは一部の言語ではご利用いただけません。Mountain Lion のディクテーションにはインターネット接続が必要です。拡張ディクテーションは OS X Mavericks と Yosemite でのみご利用いただけます。
OS X Yosemite のディクテーション設定。
OS X Mountain Lion 10.8.2 以降では、次のディクテーション言語がサポートされています。
- 中国語
- 北京語
- 広東語
- 英語
- オーストラリア
- カナダ
- イギリス
- アメリカ合衆国
- フランス語
- フランス
- カナダ
- ドイツ語
- ドイツ
- イタリア語
- イタリア
- 日本語
- 日本
- 韓国語
- 韓国
- スペイン語
- スペイン
OS X 10.9 Mavericks では、通常のディクテーションと拡張ディクテーションで次の音声認識言語と方言がサポートされています。
- 中国語
- 中国
- 香港特別行政区
- 台湾
- 英語
- オーストラリア
- カナダ
- イギリス
- アメリカ合衆国
- フランス語
- カナダ
- フランス
- スイス
- ドイツ語
- ドイツ
- スイス
- イタリア語
- イタリア
- スイス
- 日本語
- 日本
- 韓国語
- 韓国
- スペイン語
- メキシコ
- スペイン
- アメリカ合衆国
近々リリースされる OS X 10.10 Yosemite では、20 を超える追加言語がリストに加わります。
本稿執筆時点では、Yosemite は次のディクテーション言語と国別のバリエーションをサポートしていました。
- カタルーニャ語
- スペイン
- 中国語
- 中国
- 香港特別行政区
- 台湾
- クロアチア語
- クロアチア
- チェコ語
- チェコ共和国
- デンマーク語
- デンマーク
- オランダ語
- オランダ
- 英語
- オーストラリア
- カナダ
- イギリス
- アメリカ合衆国
- フィンランド語
- フィンランド
- フランス語
- カナダ
- フランス
- スイス
- ドイツ語
- ドイツ
- スイス
- ギリシャ語
- ギリシャ
- ハンガリー語
- ハンガリー
- インドネシア語
- インドネシア
- イタリア語
- イタリア
- スイス
- 日本語
- 日本
- 韓国語
- 韓国
- マレー語
- マレーシア
- ノルウェー語(ブークモール)
- ノルウェー
- 研磨
- ポーランド
- ポルトガル語
- ブラジル
- ポルトガル
- ルーマニア語
- ルーマニア
- ロシア
- ロシア
- スロバキア語
- スロバキア
- スペイン語
- メキシコ
- スペイン
- アメリカ合衆国
- スウェーデン語
- スウェーデン
- タイ語
- タイ
- トルコ語
- 七面鳥
- ウクライナ語
- ウクライナ
- ベトナム語
- ベトナム
下のスクリーンショットが示すように、
ディクテーションとプライバシー
ディクテーションをオフにするか、サーバーから Mac ベースのディクテーションに切り替えると、ユーザー情報と最近の音声入力データが Apple のサーバーから自動的に削除されます。
ただし、Apple は他の音声入力データを保持します。
お客様との関連付けが解除された古い音声入力データは、Apple 製品およびサービスのディクテーションと Siri の機能を全般的に向上させるために、一定期間保持されることがあります。
音声入力データには具体的に何が含まれるのでしょうか?
Apple によれば、ハードウェア、OS バージョン、パフォーマンス統計などの診断データに加えて、Apple のサーバー上の音声入力データには、音声ファイルやユーザーが話した内容の書き起こしも含まれる可能性があるという。
いずれにせよ、Apple の誰かがあなたの会話を聞いているわけではないので、私なら Dictation のプライバシーについてあまり心配することはないと思います。
関連記事
以下の記事が役に立つかもしれません:
- レビュー:iTranslate Voice、最高に面白いiPhone音声翻訳アプリ
- アップル、SiriのNuanceをより良い技術で置き換えるため社内に音声合成チームを結成
- Siriガイド:Siriについて知っておくべきことすべて
- AppleがMac向けSiriを研究中、特許出願がヒントに
- iOS 8に35の新機能が登場
- 「NoDictation」はSiriを有効にしたまま音声入力を削除します
- Sara Dictation: 多言語対応の Siri 風ディクテーション
- Air Dictate で Siri を使って Mac にテキストを音声入力する
この記事が役に立つと思われる場合は、ぜひ他の人と共有し、コメント欄でお知らせください。
今後のハウツーのための素晴らしいアイデアを思いつきましたか?
フィードバックをお待ちしております!ご提案は[email protected]までお送りください。今後のチュートリアルに反映できるよう最善を尽くします。