2023年の妄想ブログ:
最近、「口パク」で電話ができるアプリ”ReadMePhone”が登場した。
”ReadMePhone”は音声を出さない口パクでもAIによる読唇術により、テキストに変換。そのテキストを人工音声に変換して相手に伝えるというアプリだ。
AIによる読唇術はかなり前から研究されていたが、ようやく実用化されたというわけだ。
これならば、大声での会話が禁止されている図書館や電車内などで急に電話を受けたときも、通話が可能なのだ。
このアプリは、利用前に口パク状態で約20のサンプル文章を読み上げて、個人の癖を学習させることに認識精度を平均97%まで改善しているそうだ。この改善に加え、通話時のアプリ動作では、読み取ったテキストを人工音声に変換、通信する前に画面上でそのテキストを確認させるので、誤って変な返事を送るという問題も極力減らせているそうだ。
また、人工音声発話も学習時の声を基に、比較的声質が似ているデータモデルで発話するので違和感なく聞こえると好評のようだ。
これで、電車が遅延したときに遅れますという電話連絡も周りを気にせずできるようになる!
と思っていたら、意外と口パクでも、その振る舞いは目立つので注目を集めます。しかし、迷惑はかけていないので、別にいいのですが。。。ちょっと恥ずかしい。