サイトマップ - ヘルプ - お問い合わせ
 
 
現在位置: トップページ > トピック記事 > 高齢者・障害者支援サービス・取組 > 音の情報を音声トリガーで文字化 イノベーションの可能性を秘めた音のユニバーサルデザイン(2/4)

音の情報を音声トリガーで文字化 イノベーションの可能性を秘めた音のユニバーサルデザイン

2 「1対不特定多数」の情報の問題点を解決する

SoundUDが開発された経緯を教えてください。

森口:音楽を扱うヤマハとして、音で困っている人たちを助けたいという想いが背景にあります。耳の聞こえない方や日本語がわからない外国人まで、日本語の音の情報が届かない人が日本に増えてきています。
そこで、私たちが得ているものと同じレベルの情報を、外国人や聴覚の不自由な方が受け取れるような社会を目指したいというのが、弊社の行う「音のユニバーサルデザイン化事業」です。

それは、これまでの音声認識技術では達成できなかったのでしょうか?

森口:音声認識技術は、1人がデバイスに音声を読み込ませ、相手に変換された文字を見せるというような、1対1のコミュニケーションの場では有用です。ただ、1対不特定多数への配信を想定すると、物足りなさが否めません。天井スピーカーだと距離があったり、周りの雑音、話し声で聞き取れなくなったりしますから。そのため、音声認識だけではすべての音の情報をカバーできないので、別の技術を開発する必要がありました。

ちなみに、緊急地震速報のように、1対不特定多数への音声情報は、人命に関わる情報がものすごく多く重要度は高いです。そのため、とりわけ公共性の高い音の情報を上手く届けるためにも、従来の音声認識技術とは異なる音声トリガーという技術を開発するに至りました。

普通の聴覚を持っている人にはわからない問題点は多そうですね。

森口:弊社のユニバーサルデザインの考えは、聴覚が不自由な方の情報を健常者が得ている情報と同等のレベルまで押し上げるのが基本です。街中に溢れるたくさんの音声情報を選択できる状態に持っていくのが正しいユニバーサルデザインの姿なのかなと。
ただ、それとは反対に、何でもかんでも配信するのではなく、ある程度優先順位を整理してから配信してほしいという声もあります。

そうした意見はどのように吸い上げているのでしょうか?

森口:現在、SoundUD推進コンソーシアムとして、総務省の字幕支援事業と連携しているのですが、その事業には聴覚が不自由な学生さんが協力してくれています。
だから、いわゆるスマホネイティブの方たちに、スマートフォン、ICT技術を使ったサービスを体験していただいて、フィードバックをもらっています。

実際に聴覚が不自由な若い人たちの声を聞けるのは大きいですね。どういった声が多いのでしょうか??

森口:以前「誤っているのと、リアルタイムでしっかり出てくるのとどちらが大事?」という点を調査しました。多少間違っていても前後でだいたい推測できるので、誤っていても良いから情報を出して欲しいという声の方が圧倒的に多かったですね。
健常者にとっては、字幕は誤字がなく100点満点が当たり前ではないかと思うところですが、その精度でサービスを作るとどうしても無理が出てくるし、聴覚が不自由な方に本当に必要なものがわからない。そういう意味でも自社参加は大きなポイントかと思います。

人命に関わる情報はたくさんあるが、聴覚の不自由な方や外国人には伝わりにくい
人命に関わる情報はたくさんあるが、聴覚の不自由な方や外国人には伝わりにくい

ページの先頭に戻る

前へ 目次へ 次へ