...

リアルタイム音声合成

美濃市議会が YouTube でライブ配信しているので、その音声をリアルタイムでテキスト化してみました。

元となる動画はこちらです。(アーカイブ)

発声のプロではない方(職員さん)が話している音声かつ、YouTube -> Mac内蔵スピーカー -> USBカメラのマイク・という劣悪な環境でここまで認識しました。
独自の辞書を用意したり、音声を直接取得したらより正確になると思います。
ついでにそのテキストをそのまま音声合成しました。

2021-02-27