音声をテキスト化する方法とは?音声認識技術を用いた議事録作成の効率化

トレンド

音声認識技術は現在ではずいぶん一般的なものになりました。音声認識技術がいろいろなシーンで使われるようになり、音声をテキスト化するための方法も多様になっています。この記事では、音声認識技術を使って議事録を作成するにはどのような方法があるかを紹介します。

音声認識は大きく進歩している

スマホやスマートスピーカーのCMで見られるとおり、音声認識技術はかなり普及してきました。音声認識を使ってスマホを操作するユーザーも増えてきています。数年前には話を正確に聞き取ってくれないことも多かったのですが、現在はかなりスムーズな認識が可能です。

ビジネスシーンにおいても、音声認識は広く使われています。よく目にするのは、通訳や施設案内などです。また、コールセンターでも広く使われています。

さらに近年では、経営会議や株主総会、セミナーなどの議事録作成にも利用されるようになりました。音声認識を利用することで人による文字起こしの作業が不要となり、作成にかかる時間を大きく削減できるので、導入が進みつつあります。

音声認識で議事録を作成する手順

音声認識で議事録を作成するには、一般的に、次のような手順で行います。

  1. 会議中、マイクで拾った音声をリアルタイムに認識(テキスト化)させる。または、会議の音声を録音し、音声ファイルを認識(テキスト化)させる。
  2. テキスト化された文章のうち、正しく認識されていない部分を修正する。
  3. 修正したデータの書式を整え、所定の議事録フォーマットに書き換える

従来、議事録作成は、会議をレコーダーに録音したものを一から手作業で文字に起こしたり、議事録担当者が作成したメモから議事録を作成したりと、とても大変な作業でした。しかし、音声認識技術を使えば、従来の方法よりもずっと速く、簡単に議事録を作成することができます。

音声認識技術にも苦手なものがある

ただし、音声認識技術があれば、全てが自動的に議事録が作成できるわけではありません。現在の音声認識技術は、複数人が同時に発言するようなシチュエーションでは認識を苦手としています。また話者とマイクとの距離が遠くて音を拾いにくかったり、1人が話し終える前に次の人が話し始めたりすると、正確に認識しにくくなります。

音声認識で議事録を作成するツールやデバイス

音声認識技術を使って議事録を作成するには、いくつか手段があります。

  • 無料:音声認識が可能なスマートフォン、Googleドキュメント、無料アプリなど
  • 有料:議事録作成のための専用ツール

スマートフォンを使う方法

スマートフォンで音声認識技術を使って議事録を作成するには、次のような方法があります。

  • スマートフォンの文書作成用アプリの音声認識機能を活用する
    スマートフォンで無料で使える文書作成アプリの代表は、Microsoft WordGoogleドキュメントです。どちらも音声入力が可能で、PCでも文書を編集でき、画像や動画を取り込むこともできます。
  • スマートフォンの音声認識アプリを利用する
    スマートフォンで文字起こしに使える音声認識アプリは、通常のメモアプリの音声入力に比べ、句読点や改行、記号などが入力しやすく、多言語対応や他のアプリとの連携機能もあり、後から使いやすい形のデータを作成できます。
  • スマートフォンで音声を録音し、PCのツールで認識させる
    スマートフォンで会議中の音声を録音し、そのデータをPCで音声認識させます。スマートフォンではボイスレコーダーアプリで録音のみを行い、PCでGoogleドキュメントなどを使用して音声認識を行います。Googleドキュメントなら、タブレットからも利用できます。

ただしスマートフォンの音声認識には、下記のようないくつかの弱点があります。これらを踏まえて、スマートフォンで録音したデータはそのまま使うのではなく、文書作成アプリやPCから編集する必要があります。

iPhoneの場合

  • 日本語に英語が交じると、アルファベットではなくカタカナになりやすい。
  • 数字が交じると、アラビア数字ではなく漢数字になる傾向がある。
  • 英語入力モードでは日本語入力ができない。

Androidの場合

  • 句読点を音声で強制的に入力できない。
  • 間が空くと、強制的に半角の空白が入力される。
  • 無音状態が1分間程度続くと、音声認識が終了してしまう。

Googleドキュメントを利用する方法

Google ドキュメントの音声認識を使って直接入力し、議事録を作成する方法です。

Google ドキュメントは、誰でも無料で利用できビジネスでも広く使われています。データはクラウド上に保存されるので、スマートフォンやPC、タブレットからも入力や編集が可能です。Googleの音声認識はかなり精度が高く、長い文章でも賢く変換できます。利用手順は以下の通りです。

  1. PCならChromeブラウザ、スマートフォンならアプリからGoogleドキュメントを開く。
  2. 新しいドキュメントを作成する。
  3. マイクのマークをクリックするか、「ツール」→「音声入力」をクリックして音声入力に切り替える。
  4. 音声入力を行う。

ただし、Googleの音声入力には次のような弱点があります。あらかじめ理解して、対策を考えておきましょう。

  • ノイズが入ると音声入力が停止してしまう。
  • 他のアプリに切り替えると音声入力が停止してしまう。
  • 何もしなくても、1分程度で音声入力が停止することがある。
  • 句読点や改行を音声で強制的に入力できない。
  • 入力以外の操作は音声認識ではできない。
  • 辞書登録ができないので、専門用語や業界用語に弱い。

市販の議事録作成支援ツール

議事録作成のための支援ツールも、いろいろなものが販売されています。議事録作成に特化しているので、辞書登録、話者の認識など、便利な機能を持ったものも多くあります。短時間で録音が停止してしまうこともありません。

PCへインストールするオンプレミス型だけでなく、手軽に利用できるクラウド型のツールもあるので、自社の使い方に合わせて選んでください。

代表としてアドバンスト・メディアの「AmiVoice MinutesWriter」と「クラウド型文字起こしサービスProVoXT」を紹介します。

AmiVoice MinutesWriter

AmiVoice MinutesWriterを利用すると、会議中にリアルタイムで音声認識を行いテキスト化することができます。さらに、会議中にリアルタイムで編集作業を行えるため、迅速かつ簡単に議事録を作成することが可能です。

AmiVoice MinutesWriterは、PC1台(スタンドアローン)で使うことも、サーバーとクライアントでデータを共有して使うことも可能です。社内の体制に合わせて使い方を選んでください。

・AmiVoice®MinutesWriter(ミニッツライター)の詳細はこちら

AmiVoiceを構成するソフトウェア

  • 音声認識ソフト AmiVoice Recorder・AmiVoice Recognizer
    AmiVoice Recorder はマイクから入力された音声に、直接音声認識の処理を行うソフトウェアです。録音した音声ファイルからの音声認識も可能です。
    また、発言者を自動的に認識して名前を振り分けたり、単語登録はもちろん、音声認識エンジンモード・言語モデルカスタマイズにより文脈も含めた、より正確な音声認識を行うことができます。
  • 音声認識結果編集ソフト AmiVoice Rewriter
    認識結果編集ソフトです。音声とテキストが連動しており、見やすいインターフェースを実現しています。
  • データ管理ソフト AmiVoice ControlManager
    音声認識しながらリアルタイムでデータ編集ができ、複数人でデータを編集することができます。

AmiVoice MinutesWriterの使い方(スタンドアローンの場合)

  1. リアルタイムで音声認識を行う場合はAmiVoice Recorder、録音したデータを使用する場合はAmiVoice Recognizerを使用する。
  2. 認識結果が文字に書き起こされる。
  3. 書き出されたデータをAmiVoice Rewriterで編集。
  4. 汎用ファイル形式(Wordファイル、CSVファイル、テキストファイルなど)に書き出し、議事録を完成。

クラウド型文字起こしサービスProVoXT(プロボクスト)

ProVoXTは、クラウド型のツールで議事録作成支援ツールとして活用できます。リアルタイムで音声認識を行うのではなく、あらかじめ録音した音声を使用します。リアルタイムで音声認識を行うことはできません。

クラウド型なので、インターネットにつながる端末とアカウントがあれば、各自で使用できます。

ProVoXTの使い方の一例です。

  1. 専用のアプリやボイスレコーダーで録音した音声ファイルや動画ファイルを、ブラウザからアップロード。
  2. 認識結果が文字に書き起こされる。
  3. 書き起こされたデータは、ProVoXTのポータルサイトからダウンロードPC内の任意の場所に保存可能。
  4. 書き出されたデータをAmiVoice Rewriterで編集。
  5. 汎用ファイル形式(Wordファイル、CSVファイル、テキストファイルなど)に書き出し、議事録を完成。

ProVoXTは、国内に分散したデータセンターで運用されております。データセンターではデータの暗号化やセキュリティの定期診断なども行われているので、機密性の高い会議での利用も安心です。

・ProVoXT(プロボクスト)について詳細はこちら

音声認識により、議事録作成の手間と時間を減らすことができる

会議、セミナーなど、ビジネスシーンでは議事録を作成する機会がたくさんありますが、そのたびに大きな手間と時間をかけているのではないでしょうか。議事録は情報の共有や確認に必要不可欠なものなので、なくすわけにはいきません。音声認識技術の発展で、どんどん便利なツールが出てきています。議事録作成の手間や時間を減らせる議事録作成支援ツールを利用すれば、ほかの仕事により多く時間をかけることができるはずです。一度試してみてはいかがでしょうか?

 

図書印刷では、効率的かつ簡単に議事録を作成するソリューションとして、「AmiVoice®」を提供しています。議事録に関するお悩みがあれば、お気軽にお問い合わせください。

ソリューションの詳細はこちらから:
AmiVoice®について|図書印刷
AmiVoice®MinutesWriter|図書印刷
ProVoXT(プロボクスト)|図書印刷

 

また、「セミナーの議事録を効率的に作成したい」、「はじめてセミナー運営を任されてしまった…」という場合におすすめのeBookをご用意しています。セミナーの事前準備・開催中・フォローアップのコツを知って、セミナーを成功に導きましょう。

ダウンロードはこちらから:
セミナーの満足度は、ファシリテーターで決まる! セミナーを成功に導くファシリテーションのコツ


参考:

検索