ミライスピーカーは、テレビの言葉が聞き取りやすくなるスピーカーとして、多くの方にご利用いただいていますが、今回は、その“聞こえやすさ”が、音声認識の精度にも影響を与えるのではないか──という仮説のもと、東京都市大学で行われた研究結果をご紹介します。
研究の出発点は、東京都市大学の大谷先生のご自宅でミライスピーカーを使用した体験。そこから関心が深まり、研究へと発展しました。研究内容をさらに掘り下げるため、当社の技術責任者であり、ミライスピーカー・ミニのドライブユニットを開発した田中が大谷先生の研究室を訪問。「聞こえやすさ」とは何か、互いの立場から意見を交わしました。
聞こえにくさにどう寄り添い、どう届けるか──
研究と技術、それぞれの視点から、“言葉が聞こえやすい音”の可能性を探ります。
大谷紀子教授プロフィール
東京都市大学 メディア情報学部
情報システム学科 教授
博士(情報理工学)1993年、東京工業大学工学部卒業。95年、東京工業大学大学院理工学研究科修士課程修了後、キヤノン入社。2000年に東京理科大学理工学部助手、02年に武蔵工業大学(現・東京都市大学)環境情報学部講師、同学部准教授などを経て、2014年より現職。
進化計算で“あなたのための音楽”を
東京都市大学メディア情報学部の大谷紀子教授は、生物の進化の仕組みを計算に応用する「進化計算アルゴリズム」を専門とされています。このアルゴリズムを活用して、個人の感性に即した自動作曲や、人工知能とアーティストのコラボによる楽曲生成、さらには、CO2排出量最小経路探索など、様々な分野にAIを活用する研究に取り組まれています。
例えば、「AI子守唄」や「歯磨きの3分間を楽しくする音楽」など、一人ひとりの感覚や生活に寄り添う“パーソナルな音楽”を届ける研究は、従来のみんなが好む音楽をつくる自動作曲とは異なり、個人の感性を重視したアプローチをされています。
大谷研究室の活動概要について詳しくはこちら↓
https://www.comm.tcu.ac.jp/otani-lab/
また、大谷先生が所属するメディア情報学部は、文系と理系が共存するユニークな学部構成で、教員同士のコラボレーションが活発なことも特徴のひとつ。研究と社会実装が近い距離にある環境が、今回のような実証研究にもつながっています。
研究の出発点は、母のテレビ音量問題
「きっかけは、実家のテレビの音がとても大きくなっていたことでした。特に、私の母が大好きなのが昔の時代劇。セリフが聞こえにくくてテレビの音量を上げていました。」
1階のお母様の部屋のテレビの内容が、2階の大谷先生の部屋でもわかるくらいの大音量だったとのこと。「もう、1日中その音を聞いていると、こちらがどうかなってしまいそうで……。チャンバラシーンの時は特にうるさくて、在宅勤務の時に支障が出ていました」
そんな悩みを抱えていたある日、ミライスピーカーのCMをご覧になり「こんなスピーカーがあるけど使ってみない?」とお母様に勧めていただいたとのこと。でも、お母様は「効果もわからないし、必要ない!」と断られたそうです。その後、知人から紹介を受けたことをきっかけに、ミライスピーカー・ミニを自宅で試すことに。テレビに繋いで使ってみると「音量を下げても言葉がはっきり聞こえる」と感じたとのこと。ミライスピーカーを導入して、お母様のテレビの音量を抑えることができ「母親は好きな時代劇を見られるようになり、私から音量について怒られることもなくなった」「“家庭内音量戦争”も解消された」と笑顔で語ってくださいました。
音声認識技術とミライスピーカー音質の関係を探る
ミライスピーカーは、大谷先生のご自宅でもお困りだった、テレビの音量を上げないと聞こえづらいと感じる高齢の方などに、音量を上げずに言葉をはっきり届けることができる“言葉が聞こえやすい”スピーカーです。今回の研究では、その“言葉の聞こえやすさ”が、音声を文字に変換する「文字起こし」の場面でも有効に働くのではないか、という視点から実験が行われました。
東京都市大学メディア情報学部大谷教授・岡部教授の【インタビュー音声の文字起こしにおけるミライスピーカーの活用】論文の概要について
大谷先生と、同じ東京都市大学メディア情報学部の岡部大介教授(社会メディア学科、認知科学専門)は、ミライスピーカーの音声認識能力に関する実験を行いました。
実験では、Microsoft Wordに搭載されている「ディクテーション機能」(自動で音声を文字にする機能)を使い、以下の3種類のスピーカーでインタビュー音声を再生し、それぞれの文字起こしの正確さを比較しました。
1)ミライスピーカー・ミニ :言葉の聞き取りやすいスピーカーで、2万円以下という手ごろな価格が特徴です。
2)音質のよい高価なスピーカー:一般的に音質が良いことで知られる高価なスピーカーです。
3)パソコン内蔵スピーカー:パソコンに最初からついているスピーカーで、手軽に使えるものとして比較対象とされました。実験では、音を出す機器と、マイクを繋いだ文字起こし用のパソコンを1メートル離して設置。それぞれの3つの機器から再生されたインタビュー音声(岡部教授らの研究で使われた男性1名への15分間のインタビュー音声)をマイクで拾い、Wordで自動文字起こしを行いました。
文字起こしの正確さは、人が手作業で作った正しい文字と比べて、言葉の
「消え間違い(削除誤り)」
「違う言葉になる間違い(置換誤り)」
「余計な言葉が入る間違い(挿入誤り)」
の数で評価されました。<実験結果からわかったこと>
この比較実験から、以下の点が明らかになりました。
【1】文字起こしの総合的な正確さ:ミライスピーカーと音質のよい高価なスピーカーは、どちらもパソコン内蔵スピーカーよりも文字起こしの正確さが大幅に高くなり、パソコン内蔵スピーカーでは、特に文字が消えてしまう間違いが多く見られました。ミライスピーカーと音質のよい高価なスピーカーを比べると、ミライスピーカーの方がわずかに正確さが上回る結果となりました。
【2】間違いの内容の詳しい分析:意味に影響しない言葉、「えっと」「あの」「うんうん」といった、話している途中で入る「つなぎ」の言葉や相槌は、どのスピーカーでも文字になりにくい傾向がありました。
【3】日本語の語尾と意味の理解:日本語では、文の終わりにある「語尾」が意味を大きく変えることがありますが、この部分は声が小さくなりがちです。ミライスピーカーは、意味が変わってしまうような語尾の間違いが音質のよい高価なスピーカーに比べて少なく、会話の大事な部分をきちんと文字にできることが分かりました。
【4】人名や専門用語:あまり一般的ではない名前やペンネームは間違いやすい傾向がありましたが、ミライスピーカーは、知らない言葉でも何か意味があるかもしれない音として文字に出そうとする特徴が見られました。
この研究から、ミライスピーカーがインタビューの自動文字起こしにおいて、パソコン内蔵スピーカーよりずっと高い精度を示し、音質のよい高価なスピーカーとほぼ同じか、それより少し良い性能を持つことが実証されました。手ごろな価格と設置のしやすさを踏まえると、文字起こし作業の効率化において、ミライスピーカーは非常に有効な選択肢であるといえるでしょう。
論文の全文は以下のURLよりご確認ください。
https://www.comm.tcu.ac.jp/cisj/26/assets/26_1.pdf
「人が話しているような音」がするミライスピーカー

構造がわかりやすい様に、前面のカバーを外してあります
大谷先生は、ご自宅や実験で聞いたミライスピーカーの音について、「まるで、その場に誰かいるみたい」「スピーカーで 聞いているという感じがしない」「目の前で人が話しているみたい」という、これまでの製品 では感じたことのない独特の聞こえ方がすると感じているそうです。
これに対して、開発者である田中さんは「『まるで人がそこにいるみたい』という感覚は、ミライスピーカーが他の普通のスピーカーとは違う、特別な構造だからからかもしれない」と、以下の2点についてお話しました。
まず、1つめの違いは、振動板の形が違います。
普通のスピーカーの音を出す部分(振動板)は、コーン型(円錐のような形)をしていますが、ミライスピーカーは平らな板を少し曲げたような形をしています。

実際の製品の振動板の色は黒ですが、形状を表現するために色をグレーにしています。
2つ目として、音の広がり方が違います。
普通のスピーカーは、音がまっすぐ正面に伝わるように作られています。しかし、ミライスピーカーは、わざと色々な方向へ音が拡散するように作られています。普通のスピーカーを設計する人から見ると、音が広く拡散するのは「良くない設計」だと言われることもあります。なぜなら、元の音を「正しくそのまま出す」ためには、音が正確に前方に伝わる方が良いと考えられているからです。しかし、ミライスピーカーは「色々な方向へ音が拡散する 」おかげで、人が実際に話す声が部屋の中に広がる様子とよく似た音の出方をしているのかもしれないと語りました。
つまり、ミライスピーカーは、元の音を完璧に再現することよりも、「言葉が一番はっきり聞こえる」ということを大切にして作られました。言ってみれば「普通のスピーカーとは全く違う考え方」で作られた製品なのです。この特別な作り方のおかげで、ミライスピーカーの音は「人の声に近く」感じられ、「言葉が聞きとりやすい」と感じられる、ということも言えそうです。
“聞こえにくさ”に向き合う音の技術
今回の論文から見えてきたのは、ミライスピーカーの「人の声に近い」特性が、音声認識の分野でも有効に働く可能性でした。
高音質でなく、言葉の聞こえやすさにこだわった『曲面サウンド』技術に、広がりが見えた結果となりました。
ミライスピーカーは、これからも“人に寄り添う音”を届けるための進化を続けていきます。
大谷先生、ありがとうございました!