3/11に発売されたVOICEPEAKを買ってあそんでいます。 動作環境はUbuntu 18.04以上ということなんですが、手元のFedora 35でも動きました。最初の体験版は日本語入力ができなかったんですが現在は問題なく入力できています。
公式で予約して15800円で買ったんですがDLsiteとかでクーポン使うほうが安くなるらしいです。
で、やりたかったblog読みあげをやってみました。かなりいい感じで読んでくれます。 「レッドハットの森若です」ってところがさわやかイケボすぎて同僚が吹きそうになったらしい。すまんw
英語の記事をDeepLで翻訳して読ませるだけでかなりそれらしくなってくれるのすごい。
なつかしの2chコピペを喋らせてあそんでみました。
ベンチマーク pic.twitter.com/XsDWkyWxZ0
— Kazuo Moriwaka (@moriwaka) 2022年3月12日
ベンチマークその2 pic.twitter.com/6iZhoPpEH1
— Kazuo Moriwaka (@moriwaka) 2022年3月12日
ベンチマークその3 pic.twitter.com/lzLZhcWPij
— Kazuo Moriwaka (@moriwaka) 2022年3月12日
ベンチマーク。感情表現強力だなあ。 pic.twitter.com/1KmuPs77ar
— Kazuo Moriwaka (@moriwaka) 2022年3月12日
voicepeakに慣れてきた気がする pic.twitter.com/4tt45NAww3
— Kazuo Moriwaka (@moriwaka) 2022年3月12日
現状のメモ
バージョンあがったらいろいろ良くなるだろうと期待しているんですが現状気付いたポイントのメモです。
発声の特徴
- 「」とか,や-でつまる時間は長め。連続すると苦しそうになる。
- 感情の設定しなくても呼気多め。文末で目立つ。
- 聞きとりやすいが圧が強いので日常会話っぽくゆるくするのは難しい。
テキスト→読みあげ変換
- 半角カナは読めない。
- アルファベットで英単語を書いてもある程度カタカナ読みしてくれるけど辞書にない単語が多い。
- 英単語は大文字小文字を区別する。辞書にある単語の最初を大文字にするとほとんど全滅する。ユーザ辞書登録に大小文字を無視するオプションが欲しい。
- なぜか「うp」とか読める
- ?をつけても疑問文になって声のトーンあげる処理はない。
- ポーズが長め。ききとりやすいがスピード感を出したい時は最小の50%にしたほうがいい。
- ブロック間の空き時間はかなり自由に設定できる。
- .srtファイルを読み込むと任意のタイミングで発声させられる。英語動画を翻訳するとかで使えそう。