情報処理学会 インタラクション2015

文献情報

タイトル
市販楽曲中の歌声の分離と音高推定に基づく歌唱表現編集システム
著者
  • 池宮 由楽(京大)
  • 糸山 克寿(京大)
  • 吉井 和佳(京大)
アブストラクト
説明画像

本稿では,市販CDのような複雑な音楽音響信号に含まれる歌声に対して,

伴奏音に影響を与えることなく歌唱表現(ビブラート・グリッサンド・こぶしなど)の

編集を行うためのシステムについて述べる.

近年,既存楽曲をユーザが自分好みに編集・加工することを可能にする

能動的音楽鑑賞システムの研究が盛んである.

なかでも,混合音中の歌声の編集は最も実現が難しい課題の一つであり,

既存の歌声の声質を他の歌唱者の声質に直接変換する技術は提案されているが,

歌声がもつ特徴的な音高軌跡,

すなわち歌唱表現を編集する技術は実現されていなかった.

我々は,歌声・伴奏音の分離と歌声の音高推定の相互依存性に着目し,

従来独立に利用されていたRobust PCA (RPCA) とSubharmonic Summation (SHS) を

相補的に組み合わせることで,両タスクの精度を改善する手法を提案する

(国際的な音楽認識コンテストMIREX2014の歌声分離トラックで世界最高性能を達成).

この技術を応用して,既存楽曲に含まれる歌声の任意の箇所に対して,

任意の歌唱表現(あらかじめテンプレートを準備するか他の歌唱者から抽出しておく)を

直感的に付与するためのGUIを実現した.

実験により,提案システムの優れた歌声解析精度を定量評価し,

実際にGUIを用いて市販楽曲を高品質かつインタラクティブに編集可能であることを確認した.

雑誌名
インタラクション2015論文集
© 情報処理学会 2015
論文ID
15INT015
ページ
128 ~ 135
発行日
2015年2月26日
発行所
発行人 一般社団法人 情報処理学会
住所 〒101-0062 東京都千代田区神田駿河台一丁目5番地 化学会館4F
TEL. 東京 (03) 3518-8374 (代表)
E-mail