Amazon Transcribeの文字起こしの精度は如何ほどなのか!?

以前Twitterでふと目に入ったもので、

Amazon Transcribeをどこかで試したいなーとboostで一緒に仕事してるぽんさんと話していたのですが、

 

先日HADO WORLD CUP 2019にて取材させていただいた際、

テクノスポーツ最前線!HADO WORLD CUP 2019に突撃!!

 

ボイスレコーダーで撮らせていただいた音声がある!

Amazon Transcribeを使って文字起こししてみよう!

ということで、せっかくなのでAmazon Transcribe と Google Cloud Speech API の文字起こしを比較してみてやることに!

Amazon Transcribeの料金は?

https://aws.amazon.com/jp/transcribe/pricing/

無料利用枠
12 か月間、1 か月あたり 60 分

Amazon Transcribe の無料利用枠は、最初の文字起こしリクエストを作成した日から 12 か月間利用できます。無料使用の有効期限が切れた場合、またはアプリケーションでの使用量が無料利用枠を超えた場合は、従量課金制での標準料金が発生します。

なんとびっくり、最初のリクエストから12か月間は60分/月で無料!!!

試すしかない!!!!!

 

Amazon Transcribeを試してみる

やるときに、ぽんさんに「やりますよー!」って伝えてみた。

ぽんさん「S3とかが分かんないと思うから、分かんなかった聞いてw」

エル「S3🤔? いや、きっと説明が書いてる!分かるはず!」

 

 

 

 

 

 

 

 

 

 

 

 

 

 

エル「いやいや、S3って何ドライブやねん😭😭😭」

 

ということで、こういう系はぽんさんがめっちゃ詳しいので、

ぽんさんと話すときによく使っている、タンデムを使って会話しながら進めることに!

 

普通に調べると国際結婚用のアプリが検索に引っ掛かるので、下記にURLをば!!

https://tandem.chat/

タンデムは別記事で紹介するとして、

会話しながら、画面共有した状態で、相手のマウスの位置も分かるので、

フォローしたり、されやすいというメリットが!!!

 

早速使いながら、S3の正体をAmazon S3ということを教えてもらいました(笑)

 

 

 

 

 

 

 

 

 

 

 

 

Amazonのストレージだったとは…

https://docs.aws.amazon.com/s3/index.html

Amazon Simple Storage Service だから S3

 

言われてみればクラウドかぁ…ってくらい馴染みが無かったので勉強になりました(笑)

 

そこからS3のバケットを作成し、該当のmp3ファイルを入れたパスを設定するとこんな感じに

 

 

 

 

 

 

 

 

NEXTを押すと

 

 

 

 

 

 

 

 

 

 

 

 

 

こんな感じになるのですが、人数の部分だけ設定すれば大丈夫かなと。

Createを押すと、ジョブが走り始めるのですが、2分30秒程度の文字起こしに5分掛からないくらい!!

めっちゃ速い!!

 

そして驚愕の結果が!?

皆さんお待ちかねの文字起こし結果ですが、こちら!!

 

  • Amazon Transcribe

えーっと まず こう 波動 の こっち も 思い付き しかけ まし た 元々 その 陰 スポーツ の 団体 っていう ふう に いか さん 聞い てる です ね 何で その ハード な スポーツ に 寄っ た コンテンツ の チーム を 作ろ う と 思っ た か って いう ところ お 聞き し たい です けど そう です よ ね 元々 えーっと ま など の あの メリック あのー など を 使っ て また えーっと 本木 さん っていう メリクロン 型 と もともと 知り合い で 我々 元々 スポーツ チーム やっ て て で ま 一緒 に は ま なんか も やれ ない か って いう こと で えーっと ま にとって チーム 持っ て み ない か みたい な 話 が あっ て ね それで あの 新津 の あの メンバー って 今 ちょっと 一緒 に チーム を 組ん で やっ て みよ う と 思っ た ん です ね LENCE] まし た ね 今 の 明朝 練習 量 って くらい と 笑っ て しまう ん です か ね えーっと ソレ は ちょっと 天津 市 で 貰っ た 方 が いい です よ ね と 一応 練習 場所 は えーっと あの センター あ、 センター 北 の あのー スマータープラネット っていう ところ で の あのー 波動 の 施設 で 練習 は し て ます で えーっと 理論 的 に は 週 に つらい 目 に えーっと 的 的 練習 し て て 二、 三 時間 ぐらい やっ て て まずは まあ そういう 大概 前 に なっ たら 別 に 練習 は し てる みたい な ん です けど ちょっと 細かい こと まで 分かっ てる ので それで ちょっと 選手 に 聞い て 貰っ た 方 が いい と なる じゃ ない 強い チーム を 作る 上 で 入力 し て いる 点 と か 努力 し てる ん です か ね そう でし た ね と ま 凄い なんか あの お金 かけ て なんか やっ たり って いう こと は 正直 し て ない です けど ま 選手 と コミュニケーション を 取っ て ま 選手 の 気持ち を 組ん で やる っていう こと は 位置 を 心掛け て おり ます ね。 やっぱり こう メンバー 同士 仲良く は チーム として こう 仲良く し て いく って いう そう です ね ま、 なんか やっぱり 僕 ら ま えーっと LENCE] ま 運営 し、 てる 自分 側 の 人間 って ま みんな 三 十 オーバー の 人間 で ま せん し たく て ま みんな 二 十 代 前半 とか で 若い って 結構 やっぱ ジェネレーションギャップ とか ある って ま 若い 頃 から し て みれ ば あの 年上 の 人 たち と 話す こと 自体 が ま 慣れ て なかっ た と 思っ た ん です けど ま そう いう ところ の が 壁 を 取っ 払っ て ま あの なるべく コミュニケーション 時代 に は し て ます 最後 に これから の 後 自分 の ビジョン とか っていう の は まだ 決まっ て い たら 教え て いただき たい です けど チーム の ビジョン でし たら これ は えーっと チーム メンバー に 聞い て。 もらう って こと じゃ ない って いう の は あり ます 僕 個人 の 思い が ある ん。 です けど えーっと 新津 っていう チーム は ちょっと えーっと チーム の メンバー の みんな に 聞い て 貰っ た 方 が あのー 伝わり やすい か な と 思う んで これ を じゃ 選手 に ネット で な さ そう に なり まし た! で ござい まし た

 

エル「思ったより出来ていないですねw」

ぽんさん「えー!めっちゃ出来てるやーん!」

 

あれ?他を知らないので分からないな~と思っていたら、

流石というべきか、ぽんさんがGoogle Cloud Speech APIとやらでも文字起こしをしていたようで、

比較用に教えて頂きました!

  • Google Cloud Speech API

乙葉ののご注文を賃借人か聞いてるんでした本当にかかってきても窓の中のポリープを作った元木さんていうミルク飲んだと知り合いでもともと一つのチームやっててでも一緒に行って今何かもしれないかっていうことでチームを組みたいかみたいな話あってそれであのあのあのね待って今ちょっと一緒にチーム組んじゃった今それはちょっと話し聞いてもらった方がいいかなセンターセンター北サードプラネット鳩の節電しています基本的には週2くらいと定期的に練習してて3時間ぐらい後はまあそれが今になったらお礼正殿市はしてるみたいなんですけどちょっとたい言葉では監督してるぜんですかねすごいなんかねなんかやったらいっていうことはしてないんですけど待っているとコミュニケーションを取って気持ちを汲んでやるって言うことは道を心掛けてはいませんメンバー同士仲良く送信元指定校仲良くしていくいつもやっぱり車真上木村の人間ってみんな30オーバーの人間で魔戦士たちてまみな二十代前半とかでは帰って来ればジェネレーションギャップとかある 今からしてみればあの年上の人達と話すこと自体は慣れてなかったと思うけどあそういうところのな壁を取っ払ってまああのなるべくイミテーション東京都これからのこっちものビジョンとかっていうのが決まっていたら教えて頂きたいんだけどチームの日じゃんですかそれは8チームメンバーに聞いてもらってもいいかなというのありますか僕個人の思いはあるんだけど誰っていうチームのメンバーのみんなに聞いてもらった方が伝わりやすいかなと思うんで

 

もう、最初からどういうことやねんwwwっていうwww

 

AmazonとGoogleで比較した結果

文字起こしの精度的にはAmazonで試した方が良いかなぁ~という印象です!

料金的にはどちらも無料分があるのと、文字起こしの速さ的にも同じくらい!

手順的にも、Googleでやる方が面倒らしく、pythonのコードを書く or コピペしてくる必要があるようで、

Amazonの方がストレージに入れて、設定ポチポチするだけなのでお手軽!

 

ちなみに音声データがどうなっていたかというと、

ブログの方にまとめているので、ご覧になれば精度が分かるかと!

テクノスポーツ最前線!HADO WORLD CUP 2019に突撃!!

 

文字起こしは手動だと面倒なのと、普通に頼むと結構なお金もかかるため、

機械学習で自動で出来るのは魅力的でした♪

 

興味ある方は、無料分を使用して試してみてはいかがでしょうか!!

 

 

 

 

ブログの進捗や、普段のつぶやきなど、Twitterの方で更新中です!
良かったらフォローよろしくお願いします♪

youtubeの方にもゲームチャンネル作ってみたので、お時間あれば覗いてみてください!
エルのゲームチャンネル / El Games

 

関連記事一覧

  • コメント ( 0 )

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。