概要
- 放送現場で行われる映像・音声の文字起こし作業に時間を要していた
- AIを活用した音声認識・文字起こし補助ツールを開発
- 後にSaaS型ソフトとして一般への提供を開始
DXの動機・背景
放送現場では映像を撮影したあとに文字起こし原稿が作成される。1時間の映像を作るために撮影された素材映像は、当然数時間の長さになる。さらにその素材映像は撮影時間の何倍もの時間を費やして文字起こしされている。こうした文字起こし作業時間を短縮するため、株式会社TBSテレビはAIを活用して音声ファイルを認識する、文字起こし補助ツールの開発に取り組んだ。
経過・対応・取組内容
開発されたAI音声認識ソフト「もじこ」は映像・音声ファイルを、AIを用いて高速に文字起こしする。タイムラインに映像サムネイルとともに文字化された音声原稿が表示されるという、映像制作の現場に特化したインターフェースだ。また音声認識エンジンは各社のものから任意で選択できる。文字に起こされた原稿は当該箇所の音声を聞きながら人の手で修正・編集することができる。
得られた成果
文字起こしに費やす作業時間を大幅に削減。様々な言語に対応しているため、海外支社も含めて活用されている。また吉積情報株式会社にライセンス譲渡の後、一般への販売が開始された。
編集部コメント
人力では時間がかかる作業を、AIを用いて自動化しようとするときに、AIの判定精度は常に課題に上ります。年々精度は向上しているものの、あらゆるシーンで完璧に判定できるAIまでにはまだまだ時間がかかるのが実情です。こうした背景のもとに、AIで効率化しつつ、最終的な人の手での修正を加える前提で開発されているのが本事例のひとつの特徴と言えます。現場に定着する現実的なAIの使い方として、人の手作業を大まかに代替する、というのは現在のAIを使う上で必要な観点です。