未来そうぞう日記

知的障害を持った息子と巡る日曜の東京、神奈川周辺の散歩、未来予想(妄想?)、そして気になる話題を報告します。

(未来予想)読唇術でサイレントWEB会議

2027年の妄想ブログ: 

 

2022年4月のニュースだがこんな記事があった。

www.nikkei.com

 

新幹線はWiFiも使え、ノートPCさえあれば仕事ができる。若干揺れたりするが、程よい雑音と人の気配による緩やかな緊張感があるので自宅よりも環境が良いと感じる人もいるようだ。しかし、WEB会議は周りの人に迷惑がかかるので流石に難しいため、このような個室サービスが便利だ。とは言うものの、いつも個室が空いているわけではないのでその場合WEB会議は諦めるしかなかった。

 

そんな仕事大好きなビジネスマンたちに朗報となるニュースが先日流れていた。なんと、音声を出さず喋るふり、つまり口パクをするだけで口の動きを読み、機械音声で発話するWEB会議システムが登場したのだ。

 

元々、音声をテキストに変換する機能でその認識精度を上げるためにカメラから取り込んだ口の動きを読み取る、つまり読唇術で補完する機能があったが、そちらが進化して読唇術だけで読み取ることが可能になったのだ。もちろん、単純な読唇術だけでは認識精度が悪いので、①会話の流れを考慮した推測、②口の動かし方の個性の個別学習、③打合せ資料や前の会議議事録のテキスト文で登場した専門用語、同音異義語、参加者氏名を考慮した認識などの最新技術を盛り込んで実用レベルの精度を実現しているのだ。

 

また、機械音声は今までのWEB会議での音声から個人に似せて再生するようになっていて、抑揚がない人だと機械音声なのか本人の生音声なのか区別がつかないくらいだ。

 

この機能では一応、認識内容をテキスト表示して、機械音声発言して良いかを都度本人確認することもできるが、多くの人はOFFにしているそうだ。いちいち操作するのが面倒らしく、自分がマスターで主に喋らない会議や内輪の会議など、少々の誤認識による発言ミスがあっても許容される会議に限定してこの機能を使っているそうだ。

 

なお、この機能の使い始めは口パクだけでなく、力が入るとつい声に出して気まずい思いをすることもあるが、慣れるとそんな失敗はしなくなるとか。そんな失敗をするのは感情的になったときが多いので、ある意味音声を出さないように心がけることで冷静に会議へ参加できるようになったとサービス側に感謝を伝える人もいるみたいです。

 

こんな感じで便利な機能ですが、個人的には新幹線での移動では仕事を忘れたいです。往きは出張準備で仕方ないとしても、帰りは一仕事後のビールを楽しみたいですね。

f:id:dad_aslan:20220409150446j:plain