「好きな芸能人と同じ声」で喋ることも…音声合成技術の進化

J-WAVEで放送中の番組「STEP ONE」(ナビゲーター:サッシャ・寺岡歩美)のワンコーナー「BEHIND THE SCENE」。2月21日(水)のオンエアでは、“声”を楽しむ新しいサービス「コエステーション」にフォーカス。自分の声を“盛る”こともできるという同サービスについて、東芝デジタルソリューションズコエステーション事業プロジェクトリーダーの金子祐紀さんに伺いました。

■声を“学習”して、同じ声でおしゃべりをする

音声合成技術を活用した新たなサービス「コエステーション」は、事前に録音した自分の声を合成して自由におしゃべりさせたり、自分の声をかわいく盛ったりできます。これは、カーナビなどに見られる、テキストを入力するだけで人工的にしゃべらせる音声合成技術の応用サービスが進化したもの。昔より格段に自然にしゃべるようになったそうです。

コエステーションはどのように声を学習するのでしょうか。金子さんによると、声の特徴量をグッと集めたような「声の元」のようなものを作り、それを音声合成のエンジンにセットすることによってしゃべれるようになる、という仕組みだそうです。一般人から有名人まで多くの人の声を集めることによって、いろいろなサービスに使ってもらえるようなプラットフォームの整理を進めているとのことでした。

スタジオでは、実際の声とそれを合成した声とを比較。「再現率が高い!」とサッシャも驚いていました。

【放送はこちら】実際の声と合成の声…radikoでチェック!

■病気で声を失っても「しゃべり続けられる」

コエステーションを利用することで、たとえば、これまで固定の声だったカーナビやスマートスピーカーなどの音声を自分の好きな芸能人の声に切り替えたり、SNSなどで友達からメッセージがきたときに友だちの声でメッセージが読み上げられるようになるのだとか。

その他、ケガや病気で声を失った場合でも、事前にコエステーションに声を登録しておくことによって、テキストを入力するだけで、自分の声でしゃべり続けることができるようになると説明しました。

音声合成技術が生活のあちこちに活用される未来は、すぐそこまで来ているのかもしれません。

この記事の放送回をradikoで聴く
PC・スマホアプリ「radiko.jpプレミアム」(有料)なら、日本全国どこにいてもJ-WAVEが楽しめます。番組放送後1週間は「radiko.jpタイムフリー」機能で聴き直せます。

【番組情報】
番組名:「STEP ONE」
放送日時:月・火・水・木曜 9時-13時
オフィシャルサイト:http://www.j-wave.co.jp/original/stepone/

関連記事