情報処理学会 インタラクション2024

文献情報

タイトル
WhisperMask:騒音環境で音声入力可能なマスク型マイク
著者
  • 平城 裕隆(東大/産総研)
  • 金澤 周介(産総研)
  • 三浦 貴大(産総研)
  • 吉田 学(産総研)
  • 持丸 正明(産総研)
  • 暦本 純一(東大/ソニーCSL)
アブストラクト
説明画像

騒がしい環境や複数人が同時に話す場合,意図しない音声の干渉により,音声入力を使用することは困難である.既存のマイクは遠くの音や皮膚に接触するノイズも拾ってしまうほか,既存のノイズ除去ソフトウェアは囁き声のような小さな声をノイズの中から分類することが難しく,声を強調して話す必要がある.本研究では騒音環境で利用可能なコンデンサマイク,WhisperMaskを提案する.WhisperMaskは,コンデンサマイクの振動板を導電布で作成することで,装着者の声のような導電布を駆動させるような音しか入力されない.特に,200Hzから5kHz以下の周波数帯域では,装着者による約80 dBの音声は,周囲の雑音の入力に対して10dB大きく入ることを明らかにし,騒音環境下における囁き声の音声認識が既存のマイクより優れていることを示した.提案するマイクは,騒音環境以外においても音声の後処理なくユーザーの声のみをクリアに拾えるため,通話や音声入力,音声変換など様々な音声インタラクションに応用可能である.

雑誌名
インタラクション2024論文集
© 2024 情報処理学会
論文ID
INT24009
ページ
78-87
発行日
2024年2月28日
発行所
発行人 一般社団法人 情報処理学会
住所 〒101-0062 東京都千代田区神田駿河台一丁目5番地 化学会館4F
TEL. 東京 (03) 3518-8374 (代表)
E-mail