とある出張での議事録をまとめるために、iPhoneで録音した音声ファイルを後から文字起こししたくて、色々方法を探っていると、無料のオーディオ編集ソフトの”Audacity”に、OpenVINOのプラグインを追加すると、Whisper”を使って文字起こし出来るとの情報に行き着いた。
Audacityは結構前から使っているソフトだったので、あとはプラグインを入れるだけだな、と軽く考えて、Audacityの公式サイトから最新版にアップデートして後に、OpenVINOのプラグインの紹介ページからGithubのOpenVINOプラグインのダウンロードページに飛んでプラグインをダウンロード~インストール。
簡単簡単♪・・・と思ったのだが、Audacityの「解析」メニューの下にOpenVINOのメニューが表示されずに、文字起こしが使えない。。。なんでだろうかと悩んだ挙げ句、あらためて、Githubのダウンロードページを見てみると…
Note! This release is also compatible with the latest Audacity 3.7.3 Release. This means if you are currently running 3.7.1 or 3.7.2 with these plugins installed, feel free to simply install 3.7.3 and you should be good to go! 🤙
と書いてある。つまり、「今回リリースのプラグインを使うならAudacity本体のバージョンは3.7.3までにしてね」とのことだったが、先にアップデートしたAudacityのバージョンは3.7.6。これが原因か!、と気付くまで2~3時間を費やしてしまった。
Audacityのサイトには、old versionsのダウンロードサイトもリンクされているので、そこからOpenVINOプラグインと同じバージョンの3.7.1を選択して、インストールし直すことに。
これで、無事に「解析」メニューの下に”OpenVINO Whisper Transcription…”の表示が出てきて、文字起こしが出来るようになった。
詳しい使い方は、他の方の解説記事の方が適切だと思うので、バージョン違いでつまずいた人向けの情報ということで、備忘録的に載せておきます。
