tape

編集部は“テープ起こし”から解放されそうな気配…クラウド型音声認識の正しい使い方

  • このエントリーをはてなブックマークに追加

by [2013年12月10日]

 先日、クラウド型音声認識を採用した文字起こしサービス『VoXT』レビューをお届けしましたが、メーカーが推奨する環境には程遠い素材を使用したため(すみません!)、残念な仕上がりとなりました。

2人分のピンマイクを分配器経由でレコーダーに接続

 そこで今回は、VoXTの真の実力を測るべく、ピンマイクを使用して同じ内容を撮り直してみました。

 前回のようにすでに録音してしまってある素材や、ピンマイクを使えないインタビュー等に有効な“リスピーク”で録音し直してから変換した結果も織り交ぜて比較します。

 いかがでしょうか? ピンマイクを着けて録音するだけで、かなり認識してくれるようになりました。ここから編集は必要になりますが、しゃべった内容と変換結果の対応が分かるのが嬉しい! 辞書についてはどんどん良くなることを期待するとして、文字起こしの第一段階としては大きな進歩といえるのではないでしょうか。

意外に“使える”リスピーク
 録音データを聞いてから、自分でしゃべって録音し直すリスピークは、録音のクオリティがイマイチなときに有効ですが、話しているとどうしても混入してしまう「まあ」「えーと」といった単語を省くことで認識の精度をさらにあげることが可能です。また、「入れれる」「なるほどですね」等のおかしな日本語もこの段階で言い直しておけば、編集を効率的に進められるでしょう。

 文字起こし作業は、録音物が1時間の場合、人力では6~8時間かかると言われていますが、VoXTを使えば2~4時間で仕上げることが可能です。実に4時間もの短縮ということは、半日分、他の仕事ができると考えると、結構大きいと思いませんか? 編集長!

文字起こしサービス『VoXT』の料金プラン

  • 基本プラン(従量制):30円/分
  • お得プラン(月額制):2,000円/月
    ※2時間までの音声文字変換を含む。以降は30円/分で利用可能。
  • VoXT公式サイト

    ▼ICレコーダーのみの録音環境で検証した記事はこちら
    編集部は“テープ起こし”から解放されるのか?クラウド型音声認識を採用した『VoXT』を試す

    コメントは受け付けていません。

    PageTopへ