untrace.inc

https://untrace.co.jp/wp-content/uploads/2024/03/ai-transcription.jpg
AI文字起こしツール

おすすめの“AI文字起こしツール”2024年版<第3回 アントレース社内勉強会レポート>

AI技術の進化によって、文字起こし作業を効率化するツールは急速に実用性が高まっています。この記事では2024年1月19日に「文字起こしツール」をテーマに行われた「第3回 アントレース社内勉強会」の様子をレポートし、最新ツールの「精度」や「機能」について解説していきます。

企業や人物の情報・魅力を引き出し、言葉や思いを読者にわかりやすく伝える「インタビュー記事」。アントレースが制作しているコンテンツの中でも、多くのインタビュー案件を手掛けています。

インタビュー取材を終えてから記事化するまでに必要になるのが、録音した音声を文章にする「文字起こし」。文字起こしは、一般的に再生時間の約5倍の時間がかかる(1時間の音声なら約5時間)とも言われ、多大な時間と労力が費やされてしまう作業です。

しかしAI技術の進化によって、文字起こし作業を効率化するツールは急速に実用性が高まっています。この記事では2024年1月19日に「文字起こしツール」をテーマに行われた「第3回 アントレース社内勉強会」の様子をレポートし、最新ツールの「精度」や「機能」について解説していきます。

社内メンバーはどんなツールを使っている?

後藤:これまでアントレースでは、定期的に勉強会を開催しています。今日の第3回のテーマは「文字起こしツール」です。皆さんで、積極的に意見交換をしていきましょう!

――よろしくお願いいたします。では皆さんの中で、文字起こしツールを実際に使ったことがある方は何人いらっしゃいますか?

中嶋:私はNottaというツールを使っています。渡辺さんから紹介していただいて、知ったツールです。

渡辺:最初はGoogleドキュメントの音声入力やフリーソフトから試していって、3・4年前からNottaを使い始めました。有料ですが、当時から文字起こしの精度が高かったので、今でも活用しています。

野田:私もNottaです。

「Notta」の利用者が多数。便利だと感じる機能とは

――3人とも「Notta」を使われているんですね。利用してみて、使い勝手はいかがですか?

中嶋:以前、スマホのNottaで録音をしている途中に着信があり、アプリが落ちて録音が中断してしまったことがあります。その後からは、機内モードに切り替えて、ボイスレコーダーのアプリで録音するようにしています。

渡辺:私も同じ経験がありますね。電話やLINE、ニュースが入ってきたときにも録音が停止することがあって困ったことが。

――なるほど。確かにアプリの録音機能を使うと、アプリが落ちてしまうと録音が止まってしまうという難点はありますよね。

中嶋:ただインポート機能があるので、それを知ってからは、機内モードに切り替えて、ボイスレコーダーのアプリで録音するようにしています。Nottaには簡単にアップができて、取り込む時間も速かったです。

渡辺:でも気に入っている点もたくさんありますよ。中でも一番は、話者判別ができること。例えばインタビュー対象が2人いて、片方を「渡辺」に設定するとしっかりと話し手を分けてくれます。あとはツールを使っているときにも、生成された文字起こしの文章をクリックすると、その部分の音声が再生されます。専門用語などをピンポイントで解読しやすいのは便利ですね。

2024年最新版!5つのAI文字起こしツールを比較

次は、他のツールにはどんなものがあるのかを見ていきましょう。比較の対象として用意したのは「Rimo Voice」「Notta」「CLOVA Note」「toruno」「文字起こしさん」の5種類。全てAIによる文字起こしツールです。

まず「Rimo Voice」はRimo合同会社が提供するサービスです。日本語に特化した自然言語処理技術というのが一番の売りだと思います。

続いて、皆さんも利用しているNotta株式会社の「Notta」。104言語に対応し、リアルタイムの文字起こしや録音機能、音声ファイルなど様々なスタイルで文字起こしができます。

最近、注目を集めているのがLINE株式会社のAIテクノロジーブランド、LINE CLOVAが提供する「Clover Note」。こちらはオープンベータ版であり、無料で利用できます。精度も高いと評判になっています。

「toruno」はプリンターやコピー機で有名な株式会社リコーが運営しているサービスです。オンライン会議に対応していて、音声の記録や文字起こしをしてくれます。表示している資料なども記録されるので、説明会やカンファレンスの取材にも使えるかもしれません。

株式会社さんが提供している「文字起こしさん」は、オンラインで文字起こしできるツールです。ネットにつながっていれば、ブラウザ上などから使うことができ、医療やITなど専門用語の文字起こしにも対応しています。

ツール 特徴・機能 気になる口コミ 料金
Rimo Voice ・日本語に特化したAI・自然言語処理技術
・マイク機能でリアルタイム録音
・文字起こしテキストと連動した音声再生機能
・音声、録画データの文字化による検索
・編集画面で人手による修正(オプションサービス)
・自動話者判別あり
・ChatGPTを利用したAI要約
×固有名詞の誤りや句点の抜けなどは
修正が必要
無料トライアルあり
従量課金制あり
【定額制】
月3万円~
12万円(ビジネスプラン)
Notta ・104言語に対応したAI技術による文字起こし
・アップロードデータ・リアルタイム音声・URL貼り付けなど多彩
・文字起こしテキストと連動した音声再生機能
・タグ付け機能
・ChatGPTによるAI要約
・共同作業可能なワークスペース
・音声・録画データの文字化による検索
×無料プランでは話者分離された文字起こしを
出力できない
無料プラン
月に120分間までのデータを文字起こし可能
【プレミアム】
月1,800分の文字起こしが可能
月1,200円~
CLOVA Note ・AI技術を使った文字起こし(日本語、英語、韓国語、中国語)
・マイクによるリアルタイム録音
・メモ機能やブックマーク機能 ・音声データの文字化による検索
・精度が高いと評判
×ケバ取り機能はなし オープンβテスト中
300分の利用無料
アプリは無料
toruno ・AI技術による文字起こし
・マイクによる録音とリアルタイム文字起こし
・画面キャプチャの記録、文字起こしテキストとの連動
・文字起こしテキストと連動した音声再生
×音声がMP3以外の形式の場合、
変換に手間がかかる
×句点の抜けなども
無料プラン
合計3時間まで
月1,650円~など
文字起こしさん ・AIによる音声、動画データの文字起こし(約30種の言語に対応)
・画像や文書データに含まれる文字のテキスト化
・単語の認識精度を高める辞書機能
・テキスト修正可
・自動話者判別なし
・会員登録不要
×精度が低め? ベーシックプラン
月1,000円~ 4時間まで
プレミアム
月3,000円~

AI文字起こしツール5種類の比較

音声認識に大きな差は無い?違いが出るポイントとは

唐:文字起こしツールの裏側は、実は基本的にGoogleの音声入力を元にしています。つまり音声認識自体はそれほど性能が変わらないと思います。解読の部分で、AIを自社開発しているようなツールだと、日本語に強いなどの特徴があるかもしれないですね。

後藤:なるほど。あとは、録音の環境にもよりますよね。ノイズが多かったり、声が小さかったり、早口だったり、方言やイントネーションによっても差が出てくるかもしれません。

――文字起こしさんは、医療やITなどの業界を選択して、専門用語を解読するような機能もあるようです。

唐:特化型やカスタマイズなどの機能で、取り込んだ音声データや文字起こしテキストをディープラーニングさせて、AIを成長させていくようなサービスに広がっていっている分野だと思います。医療系や法律系には需要が多いイメージがありますね。

後藤:本間さんに、周りの方が利用されているツールについてリサーチしていただいたのですが、どんな結果がありましたか?

本間:インスタのストーリーの質問機能で編集仲間に聞いてみたのですが、上の3つに集中していました。フリーランスの方だと、Clover Noteを利用する人が多く、Nottaも少し気になっているという状況でしたね。

――最新の状況だと、「Rimo Voice」「Notta」「Clover Note」の3つが日本でよく使われているツールという認識でよろしいのではないでしょうか。

3つのツールを実際に使ってみる。解析結果の違いは

後藤:では、実際に「Rimo Voice」「Notta」「Clover Note」の3つのツールを使ってみましょう。サンプルとして、メジャーリーガーの大谷翔平選手のドジャースへの入団会見の音声を用意しました。

「ドジャースにお願いしますと 契約しますという決断を伝える 前の日の夜というか 発表したのは次の日のお昼なので その前の晩ですかね。
あとは決断理由ですか? 決断理由に関しましては これが1つというわけではなくて 本当に交渉させていただいたすべての球団の皆さんと話をさせていただいて 本当にどの球団も素晴らしかったですし
ただ何球団お誘いいただいても答えられる、『YES』と答えられる球団は1つしかないので そこに対して自分が最終的にここでプレーしたいなという気持ちに 素直に従った結果かなという感じがします」

大谷翔平選手 ドジャース入団会見内容の原文

1.「Rimo Voice」の文字起こし結果

「Rimo Voice」の文字起こし結果

「ドジャース2お願いしますっていう契約をしますという結論を伝える。前の日の夜っていうか発表したのは、次の日のお昼なので、その前の晩ですか。あとは決算ですか。決算に決断理由に関しましては、これが一つというわけではなくて本当に交渉をさせていただいた、全ての球団の皆さんと話をさせていただいて、本当に他の球団も素晴らしかったですしただ、何球団かもさせていただいても、答えれるイエスと答えられる球団は一つしかないので、そこに対して自分が最終的にここでプレーしたいなという気持ちに素直に従った結果かなという感じはします。」

2.「Notta」の文字起こし結果

「Notta」の文字起こし結果

「ドジャース2お願いしますっていう契約しますという結論を伝える。前の日の夜に、発表したのは次の日のお昼なのでその前の晩ですか。あとは決算ですか。決算に決断理由に関しましては、これが一つというわけではなくて本当に交渉させていただいた全ての球団の皆さんと話をさせていただいて、本当に他の球団も素晴らしかったですしただ、何球団かもさせていただいても答えれるイエスと答える。
球団は一つしかないので、そこに対して自分が最終的にここでプレーしたいなという気持ちに素直に従った結果かなという感じがします。」

3.「Clover Note」の文字起こし結果

「Clover Note」の文字起こし結果

ドジャスに、お願いしますっていうをしますという決断を伝える。前の日の夜というか、 まー発表したのが次の日のお昼なので、その前の番ですね。あとは決断理由ですか。決断理由。決断理由に関しましては、 えー、まこれが1つというわけではなくて、本当に交渉させていただいた、あのー全ての球団の皆さんと話をさせていただいて、もう本当にあの球団も素晴らしかったですし、ただ 球団、こう撮影をいただいても、答えれる、イエスと答えれる球団は1つしかないので、そこに対して自分が最終的にえー、 まここでプレーしたいなという気持ちに素直に従った結果かなという感じはします。」

――この3ツールの文字起こし結果からわかるのは、まず「Rimo Voice」「Notta」についてはかなり結果が似ているということですね。誤字の箇所はほぼ同じで、句読点の位置だけが違うようです。

後藤:これが先ほど唐さんが言われていた、同じGoogleの音声入力システムを使っている結果なのかもしれないですね。

――「CLOVA Note」については、口コミの通り「えー」や「まぁ」などの言葉のケバが取られていないのがわかりますね。逆に言うと、「Rimo Voice」「Notta」はケバ取り機能がしっかりと動作しているとも言えそうです。

後藤:ただ、「決断」などの言葉が読み取られていて、文字起こしの精度は「CLOVA Note」も十分に高いように見えました。

文字起こしツールを使う上で注意したいポイント

――実際に使ってみて、皆さんはどう感じましたか?

後藤:私は個人的に、「CLOVA Note」の文字起こしに好印象を感じました。間違いが少なく、そのまま正確に文字起こししてあったので。

渡辺:今、「Notta」を使っているのもありますが、話者判別という機能も使いやすいですし、価格も年14,400円と手頃なNottaは使い勝手が優れていると思っています。

――「Rimo Voice」は月10時間分の文字起こしができる定額プランで30,000円。と少し高額な印象もありますね。「CLOVA Note」は現在のところ無料で利用できるので、利用者が増えているのも納得できます。

また、「Rimo Voice」と「Notta」にはChatGPTを使ったAI要約機能があります。長い文章ならその機能を試すことができるので、使い勝手は少し変わるかもしれないですね。

後藤:今回、文字起こしが完了するまでにかかる時間は一瞬でしたが、音声データが長いとその分時間がかかるのでしょうか?

渡辺:1時間ほどの音声でも、5分ほどで文字起こしが完了しますよ。

――文字起こしツールを使う上で、注意しておきたいポイントにはどのようなことがあるのでしょうか?

渡辺:先ほども話しましたが、やはりアプリ落ちですね。私の場合も、スマホで録音をして、後から音声ファイルを文字起こしツールにインポートしています。

中嶋:後は、別にボイスレコーダーを用意して使う方法でしょうか。

――マイクの性能が高いボイスレコーダーだと、遠くからでもしっかりと録音ができるので便利ですよね。

唐:スマホに取り付けられる高性能マイクもありますよ。あるとないとでは、かなり音質が変わります。

本間:記者をやっていた頃は、いつもスマホとボイスレコーダーの両方で録音していました。さらに、パソコンで文章を書きながら……。文字起こしツールの登場は画期的に感じますね。

――最後に今日の勉強会の感想をお聞かせください。

本間:おそらく、これからも進歩していくツールだと思いますので、話題になったものがあったら取り入れて、自分をアップデートさせていきたいです。ただ、記事化するときには、AIでのまとめなどに頼りきらずに、自分で判断する必要もあるのではないでしょうか。

野田:皆さんの文字起こしツール使い方が知れて、参考になりました。早速自分でも試してみようと思います。本間さんの言う通り、ツールだけに依存せず、インタビュイーの「生の声」を自分で聞いて、記事に反映することも大切だと感じました。

中嶋:以前、「CLOVA Note」の共有機能を使って、編集部内で構成の見直し作業をしたことがあります。編集をする上で、全員が音声を全て聞ける時間があるわけではないので、文字起こしを共有できるだけでもとても便利だと感じました。ライターさんだけではなく、編集にとっても活用できるツールだと思います。

山本:私はインタビューをする機会はありませんが、このようなツールがあることを始めて知って、実際に使用している様子を見て、新しい学びになりました。

後藤:大事な会議の議事録などにも活用していきたいですね。

唐:こういったツールは、AI技術の進歩と共に数ヶ月単位でアップデートがかけられていくものだと思います。またどこかのタイミングで、その時のトレンドを確認していければいいですね。

渡辺:文字起こしの時間が短縮できるようになったのは、本当に画期的だと思っています。編集・ライターとしての理想は、「文字に起こす」ではなくて、「そのまま原稿になる」なのかもしれないですが、それはまだまだ先ですかね。

――とても有意義な意見交換ができたと思います。本日はありがとうございました!

【編集後記】「Notta」のAI要約を検証!驚きの結果が

「第3回 アントレース社内勉強会」を終え、後日「Notta」を使ってChatGPTを利用したAI要約機能(ベータ版)を試してみました。NottaのAI要約機能では、「スタンダード」「インタビュー・面接」「商談」の3種類からテンプレート形式を選択して、文章を要約することができます。

「Notta」のAI要約を検証

今回は「第3回 アントレース社内勉強会」を録音した音声を使い、「インタビュー・面接」のテンプレートで要約を生成してみました。全体の要約文と、音声内の質問と回答、行動項目が2分ほどで表示されます。
要約の箇所を見ると、ほぼ完ぺきに勉強会の内容を表していると感じました。記事をまとめる上でも、活用できる可能性は大いにあるのではないでしょうか。

「Notta」AI要約の結果

↓↓↓↓↓↓↓↓↓

要約
この記事は、文字起こしツールについての比較検証を行ったインタビューの内容です。Notta、リモボイス、ClovaNoteの3つのツールを実際に使ってテストし、精度や機能の違いなどを確認しました。参加者からは、これまでの利用経験や今後の期待などについての意見も出されました。

質問と回答
Q: 文字起こしツールを使っている人は何人いますか?
A: 3人(中嶋さん、渡辺さん、野田さん)

Q: どのようなツールを使っていますか?
A: 中嶋さんはNottaを使っている。渡辺さんと野田さんもNotta。

Q: Nottaの欠点は何ですか?
A: 通話が入ってきた時に録音が途切れること

Q: 文字起こしツールの比較表を見せてもらえますか?
A: 5つのツールを比較した表を画面共有。精度などの違いを説明。

Q: 口コミで評判のいいのはどれですか?
A: クローバーノートの精度が高い

Q: 音声データの形式に制限があるツールがあるんですか?
A: ある。MP4は使えないことがある。

Q: 文字起こし後の作業フローは?
A:文字起こし後に音声を聞き直して文章を書く。

Q: 実際に文字起こしをしてみましょうか?
A: 3つのツールを使って文字起こしを試す。結果を比較する。

Q: 要約文を生成できますか?
A: クローバーノートに要約生成機能がある。生成結果を確認する。

Q: 文字起こしツールをどのようなタイミングで使いますか?
A: 中嶋さんは取材時に使うことが多い。渡辺さんは取材後に使うことが多い。

行動項目

  • 各文字起こしツールの特徴をまとめる
  • 文字起こし結果を記事化する
  • 文字起こしツールを会議の議事録にも活用していく
  • クローバーノートをさらに試してみる
  • 文字起こし後の作業フローを検討する