voicepeak買ってあそんでる

3/11に発売されたVOICEPEAKを買ってあそんでいます。 動作環境はUbuntu 18.04以上ということなんですが、手元のFedora 35でも動きました。最初の体験版は日本語入力ができなかったんですが現在は問題なく入力できています。

公式で予約して15800円で買ったんですがDLsiteとかでクーポン使うほうが安くなるらしいです。

www.dlsite.com

で、やりたかったblog読みあげをやってみました。かなりいい感じで読んでくれます。 「レッドハットの森若です」ってところがさわやかイケボすぎて同僚が吹きそうになったらしい。すまんw

rheb.hatenablog.com

英語の記事をDeepLで翻訳して読ませるだけでかなりそれらしくなってくれるのすごい。

www.youtube.com

なつかしの2chコピペを喋らせてあそんでみました。

現状のメモ

バージョンあがったらいろいろ良くなるだろうと期待しているんですが現状気付いたポイントのメモです。

発声の特徴

  • 「」とか,や-でつまる時間は長め。連続すると苦しそうになる。
  • 感情の設定しなくても呼気多め。文末で目立つ。
  • 聞きとりやすいが圧が強いので日常会話っぽくゆるくするのは難しい。

テキスト→読みあげ変換

  • 半角カナは読めない。
  • アルファベットで英単語を書いてもある程度カタカナ読みしてくれるけど辞書にない単語が多い。
  • 英単語は大文字小文字を区別する。辞書にある単語の最初を大文字にするとほとんど全滅する。ユーザ辞書登録に大小文字を無視するオプションが欲しい。
  • なぜか「うp」とか読める
  • ?をつけても疑問文になって声のトーンあげる処理はない。
  • ポーズが長め。ききとりやすいがスピード感を出したい時は最小の50%にしたほうがいい。
  • ブロック間の空き時間はかなり自由に設定できる。
  • .srtファイルを読み込むと任意のタイミングで発声させられる。英語動画を翻訳するとかで使えそう。

UI

  • エディタは直感的だがキーボードショートカットやtabでの移動がほとんどない。マウス操作が必須。
  • 辞書登録は都度辞書ウィンドウを出して、単語登録ウィンドウで登録、登録したあと辞書ウィンドウを閉じると反映される。 複数単語を登録するときに都度単語登録ウィンドウが開くのでいったりきたりが地味にめんどくさい。あと登録語と読みの入力をtabで移動できなくてマウス必須。
  • CLIAPIはない。vppファイル(voicepeakのプロジェクトファイル)を指定して起動はできるがそこまで。複数テキストファイルをまとめて音声に変換とかは難しそう。