音声入力について―パソコン・iPhone・iPadにおいて使用する音声入力ツール―

ITツール

前回の記事では、私が文字入力に使っているツールを紹介しました。それらはキーボードで手打ちするツールであり、今回は音声入力に用いるツールを紹介します。

パソコンの場合―Googleドキュメント―

パソコンで音声入力をする場合のツールとして有名なのがGoogleドキュメントです。

まず準備として、パソコンに、マイクなど音声入力用デバイスを接続しましょう。
そしてGoogleドキュメントを開き、右端にある「+」ボタンを押して無題のドキュメントを新規作成するなどして、ひとまずドキュメントの作成画面を作りましょう。


 
そこから、ショートカットキー「Ctrl+Shift+S」を押せば、大きなマイクのアイコンが赤く変化しますので、アイコンがグレーに戻ってしまう前に音声入力しましょう。

アイコンがグレーに戻るまでの猶予時間は、だいぶ長いです。
そして、この音声入力モード中でもキーボードで手入力を加えることができ、その間は猶予時間は延長されるので、これがかなり有り難いところです。

iPad・iPhoneの場合

iPad・iPhoneで音声入力をする場合は、もうこれはデフォルトのキーボードがベストだと思います。
私はiPadの手入力キーボードはGboardを使ってますが、これはフリック入力がしたいためであり、音声入力にあたってはデフォルトのキーボードに切り替えます。

Gboardでも音声入力はできます。できますが、最大のデメリットとして、受付時間が非常に短いです。
音声入力ボタンを押してから喋り、少し喋りが切れるとすぐ元の画面に戻ってしまうため、落ち着いて音声入力できません。

その点、iOSのデフォルトのキーボードならば、音声入力が終わったことを伝えるボタンを押してやらない限り、原則として勝手に終わったりしません。
「てん」「まる」「かいぎょう」と話せば、句読点や改行も入力してくれますし、認識精度も十分なレベルですしね。

それでは、iOSデフォルトキーボードの音声入力方法について、簡単に示します。
まず、キーボード左下にあるマイクのマークのボタンを押して、音声入力モードにします。

マイクボタン

音声入力を行い、終わったら右下のボタンを押して終了します。これを押すか、物凄く長く(約1分)待たない限り、音声入力モードは終了しません。

音声入力終了ボタン

GoogleドキュメントとiOSキーボードとの比較

上記のように、私はパソコンではGoogleドキュメント、iOSではデフォルトのキーボードと、音声入力用のツールを使い分けていますが、それらの比較を。
まず、総合的にいちばん使いやすいのはGoogleドキュメントだと思います。

Googleドキュメントは、一度「Ctrl+Shift+S」で音声入力の受入モードにすれば、音声入力する→手で打つ→音声入力する→手で打つ という、手入力と音声入力の交互実行がスムーズにできます。
iOSキーボードでもそれに近いことはできますが、音声入力のときは音声入力ボタンをその都度押さなければなりません。
やはり、パソコンのキーボード手入力と音声入力が合わされば最強というところです。

ただGoogleドキュメントは、ページの起動が面倒ですし、音声入力と手入力を交互にやってると、たまに音声を聞き取ってくれないようなことがあります。
また、句読点や改行については音声入力ではまるで打てないので、それについては手入力で補充する必要があります。
iOSキーボードなら、前述のように音声入力で句読点や改行が打てます。
もっともこれは良し悪しで、単に「丸」と打ちたくて「まる」と言っているのか間違われてはしょうがないので、もうここは手入力でやる方が良いかとも思います。

音声入力と手入力

文字の効果的な入力方法として、音声入力が最近(といっても結構前からか)大きく注目されていると思います。AIも発展していますし、音声認識の精度が非常に高くなっていることもあり、音声入力もかなりの信頼がおけると考えて良いと思います。
しかし、実際にやってみると分かりますが、 いくら認識精度が非常に良いとは言え、音声入力による文字入力というのは、意外とそう楽ではありません。

個人差はあるでしょうが、文章というのは往々にして、手で書いているうちに単語の順序など入れ替え、試行錯誤しながら組み立ててゆくものです。作家とか専門の物書きの方なら、そういった試行錯誤の割合が非常に低いのでしょうが。

私もそうやって、書いているうちに言葉の順序を入れ替えることが多いもので、なかなか音声入力を有効活用できませんでした。
このブログで音声入力をどのくらい活用しているかというと、もう正直それは、記事によって違うとしか言えません。本当にピンからキリまでの割合です。
多くて7割、少なくて1割といったところかと思います。
Excelの記事などは、ちょっと文章を書いたら画像を挿入したりするし、関数とか計算式に独自の英字用語も多いので、かなりの部分の文字が手入力になります。

やはり文字がメインの記事、それも長文の記事でないと、なかなか音声入力を多用することもないですね。
でもこれも、練習して慣れていくことが大事だと思います。やはり手入力より音声入力が効率的なのは間違いないので、少しでも多くの割合の文章を音声入力によって入力していくよう習慣づける。
言葉を入れ替えたりする試行錯誤が増えるのは、やはり書く前に頭の中で文章が組み立て切っていないからであり、それを少しでもスピーディーに組み立て形にしていく力を付けることが大事でしょう。