ELSA Speakで発音改善しようの巻
きっかけ
「えいご……べんきょうしないとしぬ……」という気分が高まったのでスマートフォンでできるCakeとELSAを3日ほどやっている。
— Kazuo Moriwaka (@moriwaka) 2020年11月14日
Cakeのほうはやっているとひたすら同じセンテンスを聞かされるので耳が慣れていい気がする。
ELSAはさすが発音専門で、うまく言えてない音がはっきりする。thとか苦手……
11月11日についに「英語勉強しよう」という気分がでてきたので英語学習アプリを2種類ためしはじめた。
Cake
CakeはYoutubeなどの動画から作った教材で英語勉強するアプリで、典型的には20秒くらい、たまに15分くらいのビデオにきっちり字幕がついて、センテンス毎に繰り返し聞いたりリスニングして選択式で文章を組み立てたりするアプリ。
良いポイントは以下。
- 教材が多様なので飽きがきにくくてよい。飽きっぽい僕でも目先がかわるし約3週間後の今も続いている。
- 動画をほとんど完璧にセンテンスごとに区切ってリピートなどをしてくれる。秒単位だと不可能な技なので自前で動画を教材にするよりだいぶ扱いやすい。
- 広告もなく完全に無料。学習アプリに広告がでてくるとそちらへ注意がそらされてしまう弊害があるので大変よい。
広告もなく無料でビジネスをどう成立させるのか謎ですが、おそらく「多くのユーザ数を背景にして、Cakeに素材として動画を提供する側が広告費を払う」ようなモデルじゃないかと推測してます。
復習など一部機能のアンロックには他の人の勧誘が要るシステムなのでよかったら以下リンクを踏んでください。勧誘された側にも同じ特典があります。 :D mycake.me
ELSA Speak
ELSA Speakは英語発音の練習に特化したアプリ。
良いポイントは以下2点。
- 音素ごとに本来の発音からのズレによりアドバイスをくれる。
コンテンツの自由度が高い
- コースのテーマに沿った特定の音だけでなく、事実上全部の発音について指摘をしてくれる「アドバンス」モードがある。
- コースにない単語や文章も、「ELSA 辞書」という機能で、単語を検索して自分で練習したい単語や文章集を作れる。
- さらに自分の発音をゆるく音声認識した上での評価と練習もできる(これは苦手な音が多いと最初の認識がうまくいかないのでカオスな結果になります)。発表練習とかによさそう。
「そもそも聴きわけもできないので教材をシャドウイングしても何が違うか合ってるかよくわからない」「(すごい専門コースなどの例外はあるかもしれませんが)先生から発音についてフィードバックをもらっても時間がかかるので回数をこなして身につけるのが難しい」というので困っていたので、2ー3秒以内に即座にフィードバックを貰えるのは凄く良いです。
しばらく前に「google 音声認識で正しく認識されるように練習する」ということをしていて、それ自体はそこそこ価値のある練習だったとは思っていますが「google音声認識がうまく推定しすぎる」のでかなり変な発音でも推測されてしまいます。この記事を読んでいる方は最初からELSA Speakでやった方がいいです。
費用はフリーミアム+一部機能はサブスクリプション制、よくあるパターンですが本家サイトから買うとちょっと安かったり、google play storeにはないlifetimeのプランがあったりします。
僕は無料で1週間やったあとで大変感動したので10900円くらい払ってlifetime会員になりました。8割引とか書いてましたが実際上はずっとやってるんじゃないかという気もします。 やる側が続くかどうかの問題もあるので、買う前に続きそうかまずは無料で1週間ためしてみることをお勧めします。
以下感想ツイート
Cake → Youtube動画から作られた教材を流してリスニングしたりする。発声もあるけど採点はゆるめ。https://t.co/ykVpKZrkVY
— Kazuo Moriwaka (@moriwaka) 2020年11月14日
ELSA → 発音矯正するために音ごとに単語や会話の発声をして練習する。音素ごと(?)に判定しているっぽい。https://t.co/yF2lV3i1ql
ELSA Speakえらくて特定の音だけ評価する他に全部評価するモードもある。一通り音を出せるようになっても後者で2周目ができる。 pic.twitter.com/xAaPijiuc0
— Kazuo Moriwaka (@moriwaka) 2020年11月23日
さらに自分が発声した言葉や文を音声認識で推定したあと評価してくれそのまま練習できる。神モードだと思う。 pic.twitter.com/JCXBlBEgvQ
— Kazuo Moriwaka (@moriwaka) 2020年11月23日
10日くらい発音練習ソフトで練習した結果。とりあえず聞き分けはできてることになっているが喋りは中の下な感じ。/j/,/dg/,/sh/とかグダグダな他に母音もあやしいorz pic.twitter.com/epmc0HMjSi
— Kazuo Moriwaka (@moriwaka) 2020年11月23日
ELSA がアップデートして音素毎に評価とアドバイス出るようになってすごい pic.twitter.com/rtdg5ZhpaL
— Kazuo Moriwaka (@moriwaka) 2020年11月28日
Red Hat Enterprise Linuxを使う前に読む資料
Red Hat Enterprise Linux (RHEL)を使う前にサポート要件やライフサイクルの考え方、更新の案内、rpmパッケージ、SLAなどについてざっくりまとめた資料。 社内で新しく入社した人むけにまとめた資料。 一般にも便利そうなので公開します。もろもろ省略されているので正確な情報は各リンク先などを参照。
続きを読むkindle本の読みあげで試行錯誤したメモ
結論
試行錯誤中だけどユーザ体験としていちばんいいのはFireタブレット
はじめに、Fire HD10でkindle読みあげ
2020年元旦に投稿された以下の記事に触発され、その時やっていたkindle本のセールで10冊くらいNHK 100分de名著シリーズのテキストを買いました。 anond.hatelabo.jp
そのちょっと前に購入していた Fire HD10のkindleアプリでは、Android版やiOS版にはない自動読みあげ機能がついていて、音声の品質はいまいち(ゆっくり音声よりいいけどAlexaよりはだいぶダメ)ながら読みあげをしてくれる。
オンラインでもオフラインでも読みあげてくれて、ページも自動でめくってくれるので良いです。私が黙読する速度は2倍速よりやや速いくらいですが、聞きとりづらくなるのと間違った読みを確認する時間の余裕もほしいので、ややゆっくり目の1.5倍速で聞いています。 文体や言葉づかいにもよりますがときどき間違えるのでその時には画面をチラッと確認して使っています。
その他のkindle本を読みあげる方法
さて、日常的にAlexaやGoogle Assistantとかを使っているのでもうちょっといい声で再生したいです。同じことを考える人は多く、既にいくつかの方法があります。
Alexaのkindle本の読みあげ機能を使う
Alexa(echo端末でもAndroidやiOSのアプリでもよい)に対して「アレクサ、○○を読んで」と言うとその本の最後に読んでいたあたりから読みあげてくれます。登場当初は速度変更ができませんでしたが現在は「アレクサ、早く(遅く)読んで」のように言うと1.25倍や1.5倍などの速度で読みあげてくれます。
- 良いところ: 読みあげ音声品質。
- 悪いところ: 操作の粒度があらい。
具体的には脚注などを大量に読みはじめたときにスキップさせたり、「ちょっとだけ戻して」みたいな操作がみあたらない。(1/21追記:「1分早送り」「30秒巻き戻し」のように言うと飛ばしてくれます。AndroidのAlexaアプリでは30秒早送りおよび巻き戻しボタンがあります。)
Androidのアクセシビリティ機能(TalkBack)、iOSのアクセシビリティ機能(VoiceOver)を使う
AndroidまたはiOSのKindleアプリを実行して、OSの画面読みあげ機能を使います。
- 良いところ: 読みあげ音声品質。電話は普段持ちあるいているので物が増えない。
- TalkBackの悪いところ: 動かない端末がある。具体的には私が電話として使っている Huawei P20 lite ではKindle本のコンテンツは読みあげられませんでした。Talkbackのほとんどは動作しているようなのですが謎です……。
- VoiceOverの悪いところ: 画面表示上のページの区切れ目と、読みあげの区切れ目がことなる。おそらく段落ごとに読みあげ開始するのですが、あるページが段落の途中からはじまっていると次の段落から読みはじめたりします。当然ページめくりも同期しません。
まとめ
読み上げ品質
どれも聞きとれるんで実用上大きな違いはないのですがおおむね以下くらいの印象。Fire HDの音声がAlexaと同じくらいになってほしい……。
Google TalkBack = Alexa > Siri(VoiceOver) >> Fire HD
画面との同期
現状の日本語音声読み上げはあたりまえに間違いが入るので、私は画面をチラ見したいです。そういう点では以下のようになります。
Fire HDのKindleアプリ > Google TalkBack >> Siri(VoiceOver) >>> Alexa(画面がないのでしょうがない)
利用の簡単さ
標準機能であるKindleアプリとAlexaはさすがに利用はスムーズです。
VoiceOverは前述のページ区切りとのズレさえ飲みこめれば利用そのものは簡単です。専用のフローティングアイコンが常に表示されるのでゲームなどをする人には邪魔かもしれません。
Google TalkBackは視覚障害者むけのアクセシビリティ機能ということで、画面をみなくても使えるよう工夫されています。今回のように「Kindleの読みあげだけさせたい」というユースケースでは普段のAndroid利用とかなり異なる独特の手順を覚えることになるので面倒です。
Fire HDのKindleアプリ > Alexa > Siri(VoiceOver) >>> Google TalkBack
画面表示がいらない人むけtips
多少間違いがあってもオーディオブックみたいな使い方をしたい場合は、以下の記事が参考になります。
Kindle以外について
Google Play BooksのAndroidアプリではごく普通に読みあげしてくれました。「100分de名著」のテキストは売ってないので今回使えませんが青空文庫を読ませたい人にはいいかもしれません。
自分の現状
もろもろ踏まえて、以下のようにおちつきました
MusicBrainz Picardで音楽ライブラリのタグ付けしたメモ
正月やすみにMusicBrainz Picardを使って音楽ライブラリのタグ付けをみなおしました。
MusicBrainz Picardとは
MusicBrainz Picardは、mp3やogg vorbisなどのファイルに「半自動で」タグをつけるソフトウェアです。名前から予想されるとおり MusicBrainzのデータをつかってタグが存在しない楽曲でもそれなりに推定してくれます。
なんでやったの?
再生に不備はないので放置していたんですが、自分の音楽ライブラリのタグがカオスでした。
- 昔のmp3には文字エンコードがSJISでタグついてたり
- そもそも自分がローマ字でタグやファイル名つけてたり
- それをoggに変換したときに使ったツールがUTF8前提にしていて文字化けしたり
- さらに自作スクリプトのバグでArtistタグが設定されていないファイルを変換したときに関係ないArtistタグが入ってしまったり……
最近Spotifyを使いはじめたら自分のライブラリをお気に入り楽曲として登録する機能があるんですね。登録するとライブラリの中身を反映していい感じのプレイリストを作ってくれるわけです。この機能には当然タグが使われるわけで、急遽「タグづけちゃんとしないとな……」という機運が高まりました。
おおまかな作業の流れ
- Add Folderからフォルダを適当に選択
- Unclustered Filesに曲がはいるのでClusterを押すと既存のタグ情報でアルバムごとに分類してくれる
- アルバムを選択したScanを押すとAcoustIDを計算し、別のペインに「マッチしそうなMusicBrainzのアルバムとその楽曲、マッチしそうな度合い(タグやAcoustIDのマッチ度から計算)
- その後検出情報を修正する。典型的には「ベストアルバムをスキャンする→複数のシングルとアルバムとして検出される→どれか1つの楽曲で検索して目当てのアルバムを指定→誤分類された楽曲を移動(アルバムからアルバムにまとめてできる)→トラックの誤割り当てがないか確認」
- Saveボタンを押してタグ書き込み
全部やるのに2日くらいかかりました。ずっとやってたわけじゃないけど7-8時間くらいかかった気がします。
誤検出は?
- AcoustIDによる曲の誤検出はほぼ無い。5000曲くらいのアーカイブで作業して2,3曲くらい。むしろ厳しすぎて該当してるのにマッチしてくれない(false negative)のは300-400曲くらいあった。
- アルバムを検出したあとアルバム内の楽曲にフィットするときにはタグ情報を加味して適当にあてはめてくれる。これはもとのタグ品質にもよるので間違い多数。もとのタグやファイル名を見て人間(=僕)ががんばってなおした。
- そしてそれよりはるかに多いのは同じ楽曲が複数のアルバムやシングルに存在していて、想定と違うアルバムに分類されてしまうこと。あと限定版とかバージョン違いとか外国版とかもある(これはOther versionsというメニューで切り替えできる)。
MusicBrainzのDBも完全ではないのでもとのCDのデータがないケースではタグづけてきないことがあります。false negativeの可能性もあるのでここの確認をどれだけするかは悩ましいところ。アルバム10曲あれば1-2曲はヒットしてくれるので全くないときは『たぶんMusicBrainzに無い』ということにしてスルーしました。
MusicBrainz Picardのえらいところ
タグつけなおしのために考え抜かれて作られていることがわかる非常にいいソフトです。
- もとのタグを利用したクラスタリング機能があるおかげで作業が大幅にはかどる。
- アルバムで全曲フィットするとディスクのアイコンが金色表示されたり、マッチ率によりtrackのアイコンや背景色がかわる、変更される可能性があるタグを色づけするなど、人間が見るべきところを見つけやすくする工夫が随所にみられる。
- 誤検出を前提にして 「Search for similar tracks...」というメタデータで探すメニューや、MusicBrainzのWebを参照する機能がある。
- MusicBrainzで推定したアルバムが複数ある場合、アルバムからアルバムにドラッグ&ドロップすると適当に推定してtrackを割りあてなおしてくれる。自動割りあてできなかったtrackはUnmatched tracksのような分類で表示される。
- 基本的にSaveしなければ他の操作でタグが変わることがない。探索的に使いやすい。
- ステータスバーにtrackのファイル名が出るしダブルクリックで詳細がでる。タグをちゃんとつけてなくてファイルの場所から推定するしかないときにとても便利。
オチ
デジタルでしか音楽買わない世代うらやま。
Nature Remoを買ったメモ
導入のきっかけ
このQiita記事を読んで「あ、ぼくもやりたい」と思ったので年末にポチってNature Remoを導入した。モニタリング好きなんですよね。
12月31日に注文して1月1日に到着しました。たしかにヨドバシのサイトには1月1日って書いてたけど、持ってきてくれた郵便局の人に申し訳ない感。"いそがなくていい便"がほしいすな……。
赤外線操作の家電を登録
Nature Remoを買ったからにはウリの赤外線リモコン操作したいんで設定しました。2個だけですけど。
- エアコン (富士通ゼネラル ASE2205T (2005年製))
エアコンはすんなり認識、基本機能はカバーされているのでまあOK。 よく使う「ダッシュ」ボタンがなかったけど、リモコンから学習させてボタンを追加することはできないみたい。別のデバイスとして見せればなんとかはなるかもしれない。
- 扇風機 (ZEPEAL ゼピール DFT-A3409 )
扇風機はその他の機器扱い。電源on/offがトグルスイッチなので「offにする」と言ってもonになったりする。自動化に不向きだけどon/off明示的に分かれてたり状態管理してそうな扇風機のリモコンって見たことないなあ……。
注意点としては、電源ボタンを登録するときにアイコンを「Google Assistant対応のアイコン」から選ぶこと。「全てのアイコン」から選ぶとGoogle homeなどからデバイスの存在は見えるけど操作できない。
副作用
我が家ではTP-Linkのスイッチを1つ使ってディスプレイや机の電灯、電気ポットがつながっているテーブルタップの電源on/offをしている。今まで「OK Google、電源をいれて」「OK Google、電源を切って」と言って操作していたのですが、上記の設定をしたら扇風機もつくようになってしまった。
これからは「OK Google、机をオン」とかで生きていこう……。
設置場所
環境モニタリングが主な目的なので自分の体感に近いものを測定したい。ちょっと考慮して机の横においてあるカラーボックスに貼りつけることにした。普段座っている位置からも近いしリモコンもちゃんと届く。
ダッシュボード
冒頭の記事にあったリビング環境監視ダッシュボードは詳細な手順のおかげであっけないほど簡単にできました。
GASの時間ベースのトリガー、1時間ごとが一番短い単位みたい。15分おきとかがよかったけどEnterprise版だとあったりするのかしら。(1/10修正: 「時間ベースのトリガー」とは別に「分ベースのトリガー」などがありごく普通に15分おきの設定できました。
Googleデータポータルのグラフ、カスタマイズの範囲がめちゃくちゃ狭いのでExcelみたいなのを期待して作り込みしたい人にはきびしいかも。でもちゃっちゃとダッシュボード作るという点では良いバランスな気がする。
「Linuxデスクトップ元年」から20年経った
僕にとってはLinuxデスクトップ元年は学部4回生だった1999年あたりにきて、一瞬(研究室でMacbookを買ってもらって結局firefox+emacs+端末しか触らなくなったという)浮気した時期があったものの20年ほど主なデスクトップ環境としてはLinuxだけを使う生活をしています。
たまにバグレポートをするくらいで積極的に開発に参加しているわけではない身ですが、いろいろなものが順当に進化しているなと思っています。
あとこれは僕がたまたまそうなだけで一般的には言えない話なのですが、仕事でLinuxに詳しくなったのがそのまま日常生活に有益だし、その反対もあるのでLinuxデスクトップすごくいいです。日常でちょっとハマッた時に仕事の知見がつかえるのはかなりお得感があります。
ちょうど2019年も今日で終わりですので、僕の記憶からここ20年くらいのLinuxデスクトップについての思い出や感想をつらつら書いていきます。裏をとらずに記憶や気分で書くので間違いも多いかと思います。気になることがあればコメントください。
デスクトップ環境の大幅な進化
綺麗なフォント
- 良い日本語アウトラインフォントがなかったのが昔話になったの、本当にありがたいです。
- IPAフォント関係者の皆様ありがとうございます。本当に助かりました。
- Notoフォント関係者の皆様ありがとうございます。ウェイトもたくさんあって素晴らしいです。
StarOffice → OpenOffice → LibreOffice
- 学生や前職のあいだはオフィススイートを使うことはほぼなくて、Red Hatに入社してから使うようになりました。StarOffice(日本では商標の関係でStarSuite)は機能はともかくクラッシュ頻度がやばかったですね。LibreOfficeになる前後あたりから本当にすごく良くなった気がします。
- 直接関係ないですがRed Hat社内にはlibreoffice-list というメーリングリストがあって「このファイルがバグった。たすけてー」って投げられるの最強の福利厚生だと思ってます。
ブラウザ上で動くもの、ブラウザをベースとしたアプリケーションの進化と普及
- これはLinuxデスクトップが良くなったという話ではないのですが、日常的に「ドキュメント書くのもメールもチャットもカレンダーもビデオ会議も他社サービスのコンソールも社内システムもみんなブラウザで1日ブラウザばっかり使ってた……」というような日が増えてきました。
- LinuxにはFirefoxもChromiumもChromeもあるので「Safari/Edgeでの見た目を確認したい」というケースでなければ日常ほとんど困ることはありません。環境チェックが厳しいサイトはひっかかることがあるのですが、できればe-taxみたいに「警告はわかったけど強行する」みたいな選択肢がほしいです。
- 2015〜17年ごろは Adobe flashのバージョン差異のため動作しないサイトを見ることがたまにありました。flashそのものが2020年に終わるということで現在ではこの問題も事実上なくなりつつあります。
systemdやNetworkManagerによる足回りの整備
ソフトウェア開発環境としてのLinux地位向上
Waylandがついにきそう
- 長い、本当に長い開発期間を経て各種ディストリビューションでWaylandがデフォルトになっています。
- まだスクリーンキャプチャあたりに過渡期感がありますが、既に一般的なデスクトップ用途ならWaylandの方がいいんじゃないかと思うようになっています。
かな漢字変換、入力メソッド
Steamによるゲーム
flatpak, snapdなどによる配布
- Linuxにはさまざまなディストリビューションがあり、間違いなくLinux利用者にはよいことなのですが、デスクトップアプリケーションを開発する側からみると「それぞれのパッケージング技術、ポリシー、リリースタイミング、現在のライブラリバージョンなどがバラバラなのに対応するのは大変しんどい」という点が大きな問題です。
- ArchのAURや、Gentooなどのようにユーザが自前でビルドするのだと割りきってしまえればいいのですが個人的には選んでダウンロードしてすぐ使いたいです。
- flatpak, snapdなどコンテナ技術を参考にした配布方式が登場したことで、ディストリビューションのパッケージや、新旧バージョンの競合を心配せずに複数ディストリビューションへ対応したバイナリを配る基盤がととのいつつあります。
- 間にディストリビューションが介在しないこのモデルは、ユーザがサポート窓口などを必要とする場合にはうまくマッチしませんが、upstream開発者とエンドユーザの距離が近くなること自体は最新版へのフィードバックが増えることに繋がります。エンドユーザむけ掲示板などとの組み合わせでうまい形で広まるといいなと思っています。
オンラインサービス・デバイスとの連携
- ブラウザ上で各種の操作ができるのはいいのですが、オンラインサービスと連携して動作する点は不安のあるところです。
- たとえばGNOME Online AccountsではGoogle, Facebook, Microsoft, Nextcloudなどとの連携が可能で Google DriveをNetwork Driveのように扱うこともできますが、数えきれないほど沢山あるオンラインサービス(の内デスクトップと連携できるといいもの)から考えるとほんのわずかです。
- またデバイスも、wacom製以外のペンタブレットでは設定ツールがないなど対応が手薄です。
- オンラインサービス・デバイス側に十分なモチベーションがない限りこの手の問題は解決しませんので、たくさんのユーザに使ってもらい、シェアをとっていく活動は大事です。
来年こそみんなにとってのLinuxデスクトップ元年がきますように (-人-)