ハイクオリティなAI音声で参戦 「ビジガク」がオーディオブック業界に新風を巻き起こす

ハイクオリティなAI音声で参戦 「ビジガク」がオーディオブック業界に新風を巻き起こす

出版

「図書印刷の強みである、出版社とのコネクションを活かした新事業を興せ」との命を受け、2020年10月、ひとつのプロジェクトが発足。事業内容もまっさらな状態の中、さまざまな候補が検討され、たどり着いた答えは、オーディオブックへの参入でした。

海外ではかなり定着しているオーディオブック。特に、国土が広く移動距離の長いアメリカや中国では時間を有効に活用する手段の筆頭になっていると言います。日本でもここ最近は「Clubhouse」の流行などから音声メディアへの注目が高まり、コロナ禍でおうち時間が増えたことも相まって、オーディオブック需要も増えているようです。

なぜ今、図書印刷がオーディオブックに参入するのか。また、先発組との違いや自社ならではの特長をどう打ち出していくのか。2022年3月に開始した図書印刷のオーディオブックサービス「ビジガク」の全貌を、プロジェクトマネージャーとして新事業を牽引する山形茂雄氏に聞きました。

AI音声を使う
それがオーディオブック参入の大前提

 オーディオブック市場に参入するに当たり、「AI音声を使うことが大前提でした」と山形氏。そこには、オーディオブック業界の現状を打破するための戦略がありました。

audiobook_interview1.jpg
山形茂雄
図書印刷株式会社 新事業開発室

電子書籍に続く、出版の第3の柱として期待が高まるオーディオブックですが、これまで何度かブームになりかけるもののブレイクできないジレンマを抱えていました。

その原因ともいえる大きな課題はふたつ。ラインナップの少なさ高価格です。従来のオーディオブックは声優や有名人を起用する場合が多く、収録や編集に時間がかかり量産は難しいのが現状です。また、コストもかかるため、それが価格にも反映して紙の本よりも割高になってしまうのです。その問題点を一気に解消できるのが、AI音声の採用でした。

さらに、AI音声を使うことのメリットを山形氏はこう語ります。

差し替えがしやすいことですね。間違っている部分があれば打ち直せばいいので修正作業が圧倒的に楽です」

人であれば、録り直しをするために時間もコストも、手間もかかるところですが、AI音声ならその必要はありません。さらに、

「オーディオブックは長時間の収録になるので、疲労などからクオリティを一定に保つのは難しくなります。それに加えて、人間は半年もすると声は微妙に変わってしまい、リリース後の修正対応などに不都合が出てしまうのです」

AI音声であれば、いつでも、どんな長時間でも同じクオリティ、同じ表現を再現することができます。なるほど、「人を使うつもりは最初からありませんでした」と言う山形氏の言葉にも頷けます。

ならばなぜ、他社はAI音声を積極的に採用しないのか。その理由こそ、プロジェクトの大きな鍵を握るポイントでした。

いかに肉声に迫るか
他社には真似できないクオリティを目指す

AI音声と聞いてまず思い浮かべるのは、「Alexa」や「Siri」のような機械的な音声。人間の声とは別物というイメージがあります。しかし、今図書印刷が採用しているAI音声は「かなり肉声感がある」と山形氏は胸を張ります。

audiobook_interview2.jpg

「これまでのAI音声はどうしても棒読みになりがちで、違和感が拭えませんでした。そこをいかになめらかにしていくかが我々の課題でした」

様々なパートナーとの協業を模索しながら、ようやく及第点のレベルに達したAI音声にたどり着く事が出来たと言います。

こだわりは、AIのベースとなる「声の辞書」の録音とのこと。マイク・スタジオといった収録環境のテストを何度も重ね、肉声に肉薄する音声を作り上げていきました。

「目指したのは、ニュートラルで、倍速視聴に適した音声です。聴きやすく、長時間聴いても疲れない声を追求しました」と山形氏。このボイスへのこだわりが、「もし同じシステムを他社が使ったとしても、同じクオリティは出せないと自負しています」と言えるほどの仕上がりを実現したのです。

さらにクオリティを高めるために図書印刷が取り組んでいるのは、編集の見える化です。

AI音声の読みは一定になりがちで、緩急をつけた文体のリズムを反映させるには、さまざまな調整が必要になります。この調整を誰が担当しても同じレベルでできるよう、見えない音をどう共有化するかが課題です。

しかし、クオリティをただ闇雲に高めればいいかと言うと、それは違うと山形氏は言います。

「クオリティを高めすぎると量産するのが難しくなります。こだわりすぎれば事業として成り立ちません。けれど、クオリティが低いものでは読者は納得してくれませんから、クオリティを保ちつつ、効率よく生産していく程よいバランスを見極めなくてはなりません」

目標は月間100冊発行。それを達成するため、クオリティと効率のせめぎ合いは今後も続きそうです。

扱う本のジャンルをビジネス書に特化
差別化を図る工夫と戦略

オーディオブック業界では後発企業となる図書印刷には、AI音声を使うという特長に加え、もう一つ、戦略がありました。それは、ビジネス書に特化するという点です。

「ビジネス書は中身がわかればいいので、感情のこもった表現などはむしろ邪魔になる場合があります。また、ビジネス系のオーディオブックは倍速で聴く人が多いので、フラットに語るAI音声はビジネス書と相性がいいと思いました」

とは言え、ただビジネス書に特化するというだけでは先発企業と勝負はできません。そこで、売り方や見せ方にも図書印刷らしさを出そうと考えています。

売り方については、なるべく新しいもの、他社では出てないものを中心にラインナップの充実を目指しつつ、新刊本とオーディオブックを同時発売することです。

「新刊が発売される前にテキストが手に入るのは印刷会社の特権です。そうした強みを活かせば、実現は難しくないのではと思います」

さらに、価格を紙の本より少し安く、と山形氏は考えています。これも、AI音声を使うからこそできること。

「今や音楽はストリーミングが主流で、サブスクリプションサービスが当たり前となっていますが、オーディオブックもその流れになっていくと思います。あえて高価格なオーディオブックを買うのは、たとえば、好きな声優さんや有名人が読んでいる、などの付加価値がある場合に限られるでしょうね」

オーディオブックは立ち読みができません。中身がわからないからタイトルを見て買うしかなく、結局、ベストセラーを追いかけることになりがちです。どれを聴いたらいいのかわからない。そんな現状を打破したいという思いが、山形氏にはあります。

audiobook_interview3.jpg

「ビジネス書を読もうという人は、何かしら課題や悩みを抱えている人だと思います。けれど、自分の課題に必要なオーディオブックに出会えていないのでは、とも思っています。

たとえば、リアルな本屋さんのように分類をきちんとしたり、サンプル視聴のやり方にもひと工夫したり。読み手の立場からよりわかりやすく選びやすい環境を作りたいです。その人に本当に必要な一冊に出会うことで、オーディオブックが課題を解決する手段になれたらいいと思っています」

先発企業の手が届いていない部分を、後発企業である図書印刷が補っていく。そこにあるのは、ライバルとしての競争心ではなく、互いにない部分を補い合って、ともに成長し、オーディオブック業界を一緒に盛り上げていきたいという思いの現れです。

 

音声メディア時代が来たとき、
その一端を担う存在でありたい

オーディオブック業界の中で、独自の路線を切り拓こうとしている図書印刷。その幕開けを目前に控え、改めてその見通しを山形氏に尋ねました。すると、意外な答えが返ってきました。

「実は、サービスの名称やそのPRの際に、既存の「オーディオブック」や「AI」という表現は使わないという案が出ていました。すでにイメージが広まっている言葉は、ユーザー側に先入観を抱かせやすく、時にマイナスに作用する場合もあります。特にAIなどは先入観からあら捜しをされやすく、何か別の名称を考えたほうがいいのではという意見は根強かったんです」

事実、今プロジェクト開始以前は、山形氏自身も聴いたことのなかったオーディオブックに先入観があったのだと言います。だからこそ、聴いてほしいという強い想いがあるのです。

「既存の印象を払拭するには、我々の音声合成AIを聴いてもらう機会を増やしていくのが一番だと思っています。聴いてもらえれば、これまでのAIとの違いは絶対にわかっていただけると確信していますから。イヤホンで聴けば、さらに違いは明確にわかるはずです」

体験さえしてもらえれば、と山形氏は大いなる自信をのぞかせます。その言葉には、それだけの努力と準備をしてきたのだという、揺るぎないものを感じずにはいられません。

今後の展望についても聞いてみました。

「ビジネス書を出発点に広く横展開していけたらと考えています。実際、絵本やエッセイは「ビジガク」に向いている、という感触を持っています。その他には、資格本なども音声メディアとの相性はいいだろうと思います」

すでに次、次の次、とさまざまな展開が山形氏の頭の中にあるようです。さらに本に限らず、さまざまなテキストの音声化を考えていると言います。たとえば、WEB記事やメールマガジンなどです。今現在もそういったネット上の記事を音声化しているものはありますが、より精度の高い、ストレスのない音声を提供していくことが、図書印刷の目指すところです。

これからスマートフォンやイヤホンなどのデバイスはどんどん進化し、それに伴って音声メディアの果たす役割も大きくなっていくことでしょう。そんな未来を見据え、山形氏は言います。

「近い将来、音で本を消費する時代がやってくると思います。その時、我々がその時代の一端を担う存在でいたいですね」

図書印刷のオーディオブックサービス「ビジガク」

「ビジガク」は、ビジネス書に特化したAI音声合成オーディオブック配信サービスです。

コンセプトは『“ながら”で書籍を耳学問』。検索・購入・視聴までひとつのWebアプリケーション上で行うことができ、移動中やトレーニング中などのスキマ時間・ながら時間を使って手軽に“聴いて”学べる環境を提供します。

bizgaku_topview_s_800.png

【AI音声を使った「ビジガク」の推しポイント】

①収録の手間がいらない
②リリース後の修正も簡単
③制作期間の短縮
④予算の軽減
⑤量産が見込める

 

下記リンクの書籍ページにて、無料試聴をすることができます。
「ビジガク」の音声合成サンプルをぜひ一度お試しください。
https://bizgaku.jp/books/1728013

検索