「へい!」と言うのは…
「へい!お待ち!」と言うのは、すし屋さん。「へい!いらっしゃい!」と言うのは、街の八百屋さんか魚屋さん。
日本人にとって、「へい!」というのは、いきな商売人の言葉であり、ふつうの人が日常で使う言葉ではなかった。
しかし今、「ヘイ!」というのは、音声認識の大事なキーワードとなっている。Siri の起動に使われる呼びかけの言葉だ。
Siri はアップル社が提供する音声認識技術。初めて日本に紹介されたのは、2007年、iPhone4Sに搭載されたときだ。当時、「Siri、明日の天気は?」などと、英語で話しかけるテレビコマーシャルがあったが、「これって日本語になっても、使う人いるのかな~?」などと思ったのを覚えている。
今や Siri だけでなく、アマゾンエコー、グーグルホーム、LINE クローバなど、音声認識の技術を使った製品が次々と発売されている。音声認識は実際のところ、便利なのか、また日本人にとって使いやすいのだろうか?
日本人は人前で声を出すのが苦手?
日本人の場合、たとえ家族であっても、自分以外の人がいるところで機械に話かけるのはちょっと恥ずかしい、という人が多いようだ。KDDIの昨年の調査では、約7割の人が、機械に話しかけるのは恥ずかしいと言っている。
また日本人の場合、スマホの音声入力を活用している人はまだまだ少ないようだ。あるブログによれば、Siri を頻繁に使う人はわずか10%とのこと。日本人にとって、音声入力はまだ「宝の持ち腐れ」段階なのかもしれない。
スマートスピーカーは定番の家電になりえるか?
世界19か国を対象に行った2017年のスマートスピーカーの調査結果がある。これによると、日本のスマートスピーカー普及率は8%で、19カ国中12位。「18年中に買う」という人の割合は16%で17位。ウェブを見ると、現時点の日本の普及率は10%程度のようだ。
一方、アメリカでのスマートスピーカーの普及率は約18%。今後も順調に伸びていくと予測されている。これと比べて、日本の10%というのは、低いとも言えないが、スマホと同様、一般への広まりは少し遅れ気味、といった感がある。定番の家電になるのは、まだ少し先になりそうだ。
話すのと指の操作とどちらが早い?
ニューズウィークに、「アレクサ、おめえ、スコットランド人嫌いだべ!?」という記事があった。ビデオも掲載されており、スコットランド人の女性が、ダナという歌手の曲をスポティファイでかけるよう言っているのだが、何度言っても歌手名を理解してもらえない。最後には切れてしまい、「ピー音」をかぶせられるような言葉を吐いてしまうことに。これだったら、スマホを指で操作したほうが、はるかに早そうだ。
私自身スマートスピーカーは持っていないので、Siri と、メールの音声入力を試してみた。面白いことに、Siri は、正確に聞き取ってくれないときでも、意図とする質問にそれなりに合った答え(ウェブリンク)を出してくれた。
一方、メール入力は、音声入力から表示までが遅いように思われた。まず、できるだけやり直しを避けるため、かなりゆっくりしゃべらなければならない。また、表示が違うときは、いったんキーボードに戻して、間違った文字を削除し、もう一度入力しなければいけない。だから、さらに時間がかかってしまう。やはりこちらも指での入力のほうが早そうだ。
ちなみに、このブログの出だしを音声入力してみた。「ヘイ」は、どうしても「平」か「Hey」にしか変換できない。漢字かなづかいも変換任せ。「すし屋」と入れたくても、「寿司屋」で妥協するしかない。また、Siri は、いったん英語表示に切り替えて、英語風に発音しないと、だめだった。なかなか面倒くさいものだ。
変換ややり直し入力がもう少し便利になれば、音声入力ももっと使われるようになっていくのでは、と思う。
おまけ
音声入力のとき、「ヘイ」や「OK」を最初に言うというのが、なかなか日本人にとって敷居が高いのではないだろうか。とは言え、スマートスピーカーを起動させるには、ふだんの会話でしょっちゅう使う言葉以外で、言いやすく、聞き取りやすい言葉が必要になる。
そこで思ったのだが、それぞれの持ち主が、スマートスピーカーにペットのように名前をつけて、それをプログラムしてしまう、というのはどうだろう。たとえば、「ポチ」「タマ」と言った、ペット風の名前であれば、呼びかけもそれほど恥ずかしくなく、自然にできるのではないだろうか。
参考:
Father Log「日本人がSiriを使いこなせないのは何故か!?
考察してみた」
Convince & Convert「15
Important Statistics About Smart Speakers in 2018」