2020年の妄想ブログ:
最近のAIスピーカーは音声認識処理をサーバではなく、スピーカー機器内のCPUである程度行えるようになり、またカメラも搭載されるようになった。その結果、いちいちAlexaとか、OK Googleとか呼びかけなくても、会話の流れや話しかけた人の目線などから、受け答えできるようになった。
一方で、ログ機能をONにすると、常時会話を聞き取り、テキストログとして残せることが可能になったのだ。そして、この会話ログをスマホ上で、LINEアプリのようにタイムライン表示で確認することができるようになった。
現段階では、某AIスピーカーは音声会話をテキストに変換したときの誤変換率は0.2%とCMしてたが、体感上は普通の人が文章に起こした時より誤変換は多い感じがする。おそらく、CMで紹介しているテストでは正しい日本語の会話のやりとりを使って判定していると思われるが、人の実際の会話では文法が間違っていたり、言葉にならない表現もあるので、誤認が多く感じるのは仕方ないことだろう。とはいうものの、概ね9割以上は合っている感じだし、前後の繋がりから大体の意味はわかるので、実用上、問題ないくらいまで進化したと思う。
そして、この機能によって解決されるようになったのが、家族間の言った、言わない問題だ。テキストログでキーワード検索できるので、例えば、、、
深夜酔っぱらって帰ってきたお父さん。
「遅くなるなら、言ってくれれば夕食用意しなかったのに」と怒るお母さん。
「今日はつきあいの飲み会だって、昨日言ったじゃないか」とお父さん。
「Alexa 飲み会で、昨日の会話を検索」とお母さん。
「昨日の20時45分31秒、お父さんが、明後日は飲み会あるので夕食はいらんと言いました。」とAlexa。
という感じで、お父さんの有罪が確定しました。確かには飲み会があるとは言っていたのですが。。。
これで世の中の「誰がいつそんなこと言った?何月何日何曜日何時何分何秒、地球が何回まわった時?」とい問題が解決されるようになったそうで。。。(40代以上じゃないとわからないネタですが)