LINE Messaging API、夢が広がります。LINEで通知するだけでなく、やりとりしたテキスト、動画、音声をアプリケーションでダウンロードして扱うことができます。

ただ、音声そのままだと「あの〜」とか無音とかが多くて使いにくい。
そこで、LINEで録音した音声メッセージから文字起こしをするため Amazon Transcribe を試してみた。

Google広告


基本的には Amazon Transcribe を使用して音声を文字起こしする方法 | AWS の通りです。
さらに aws-cli だと Amazon Transcribeで音声の文字起こしを行う。 - Qiita が詳しい。

UIが最近変わったみたいでそれなりに つまずきポイント があった。

  • ダウンロードしたファイルの名前を transcribe-sample.5fc2109bb28268d10fbc677e64b7e59256783d3c.mp3 から transcribe-sample.mp3 に変える
  • 東京リージョンでOK
  • バケット名は trnsrb-test-20210905 とした
    • バケット名は一意じゃないといけない。適当なsuffixをつけること
  • アップロードしたファイルのURLはファイル名をクリックして表示された詳細画面から行える。チェックボックスはない。
    • s3://trnsrb-test-20210905/transcribe-sample.mp3

あと、アナウンサーとかPro PodCaster ではない素人、しかも中学生の音声認識はだいぶ難しいことがわかった。テキストはあきらめて音声でやりとりしよう。空白を消したり、1.2倍速にしたりすることでストレスを少なくしよう。


余談です。

ブログを書くときにタイトルとURLのセットが必要になるんだけど、URLはともかくタイトルのコピーが面倒。
そこで、 Chrome 拡張 a01sa01to / TitleAndURL_Picker です。
この手のものは変なことをされるといやなのでソースコードも公開されていて、さらに その解説 まであるのはありがたい。
すごく便利なのでみなさんも使ったらいいと思います。

カテゴリー:

更新日時: