時空間音圧分布画像を用いたマイクロホンアレイ信号処理プロジェクト

本文へジャンプ
JST科研費による助成を受けたプロジェクト


 複数の音源が存在する空間において,所望の音のみを収録することが目標です。そのために,当プロジェクトでは以下の手順を踏みます。
  • マイクロホンアレイからの出力である「瞬時音圧の時系列」→「輝度の時系列」と変換することで時空間音圧分布画像を生成します。
  • その画像に2次元フーリエ変換を適用して,2次元スペクトルを得ます。所望の音源からの音に対しては,その2次元スペクトルが「空間周波数の直流成分に局在する」という特徴があります。
  • この性質に基づき,「直流成分に漏れ出した不要な音」を人工知能技術などを利用して推定します。推定した値を引き去ることで,所望の音のみを抽出できます。

下図は,焦点距離2 mの円弧状アレイで捉えた音の時空間音圧画像と2次元振幅スペクトルです。

直線状アレイによる方向選択性の実現
 平面波が到来した場合に,アレイと直交する方向からの音は空間周波数の直流成分に局在します。
 その直流成分に漏れ込んだ雑音のスペクトルを,「直流成分以外のスペクトル」を利用して,4層の中間層をもつニューラルネットワークにより推定することに成功しました。
 右図は,3雑音源があるとき「1つの雑音源の角度を60°に固定」し,「他の2つの雑音源の角度を様々に変化」させて,雑音の減衰量を計算したものです。3つの雑音源が同側にある場合には20 dB以上,対側に分かれて存在する場合でも15 dB程度の抑制が得られます。


円弧状アレイによる距離選択性の実現
 球面波が到来した場合に,円弧の中心位置にある音源からの音は空間周波数の直流成分に局在します。
 やはり,直流成分に漏れ込んだ雑音のスペクトルを,「直流成分以外のスペクトル」を利用して推定します。例えば,2 m 位置に焦点を当てたアレイでは,4 m 以上の距離にある音源の2次元スペクトルはほぼ同等とみなせます。そこで複数雑音源があっても,「4 m に1個の雑音源がある」と仮定して引き去るという,簡単な処理で15 dB 以上の雑音抑制を達成できます。(右図は,4.5 m, 5.5 m に2個の雑音源を固定し,3個目の雑音源の距離を 0〜6 m に変化させて,雑音抑圧量を計算した結果です)。


平面状アレイによる方向選択性の実現
 マイクロホンを平面状に配置した場合には,「3次元の時空間音圧分布画像」→「3次元スペクトル」を用いた処理が必要です。ただし,平面波がアレイの正面から到来した場合には,「全てのマイクロホンに同時に到達する」という性質から,「x-zの空間周波数の直流成分にスペクトルが局在する」という特徴があります。それゆえ,直線状アレイと全く同様な処理が可能です。
 右図は,9個のマイクロホンを「3×3個の平面配置」した場合の,x-zの空間周波数に対する振幅スペクトルです。音の到来角(水平角θと仰角φ)によって,様々なパターンが見られますが,平面内の横側(θ=90°, φ=0°)から到来した場合は,z軸空間周波数の直流成分に局在することが分かります(左上パネル)。また,平面内の上側(θ=0°, φ=90°)から到来した場合は,x軸空間周波数の直流成分に局在することが分かります(右上パネル)。このことから,正面(θ=0°, φ=0°)から音が到来すると,x-z空間周波数が「0-0のビン」に局在することが予想できるでしょう。