IT系メモ

興味のあったことや、勉強したことなどをメモしていきます。

音声読み上げソフトで気になること

Amazon Pollyが発表されたわけですが、まだ日本語は違和感が残ります。

書いたものを話すソフトとしては、ボイスロイドというのがあります。
個人的にはAmazon Pollyより日本語はボイスロイドの方が自然のように思います。

 

ボイスロイドに話す動画なのですが、調声をするのに結構時間がかかります。

難しいポイント: 正解がわかりにくい

読ませた場合に違和感が残るのですが、どこのパラメータを変更すればいいのかがわかりにくいです。

調声時に何度もループで聞く中で、どれが正解かわからなくなってきます。
聞き比べるときは前に聞いた音を頭の中で比較しながらすることになるのが難しくなるポイントかと思います。

 

パラメータをいくつか振ったものを出してほしい

パラメータを共有したかったり、同じ音声読み上げソフトを使っている音声を読み込ませて調整パラメータを読み取れるようにするなど、まだ色々必要になるかと思います。

あとはいくつか自動でパラメータを振ったものから、選べるようにして欲しいというのがあります。
ちょっとした違和感に対して、どのパラメータを振ればいいのかがわからないのがつらい。