情報処理学会 インタラクション2024

文献情報

タイトル
FastPerson: ユーザ中心の学習体験のための視覚・音声情報に基づく講義動画要約
著者
  • 河村 和紀(東大/ソニーCSL)
  • 暦本 純一(東大/ソニーCSL)
アブストラクト
説明画像

時間が限られている学習者や多様なトピックに関心を持つ学習者にとって,長時間の講義動画を短時間で理解することは学習効率の向上に不可欠である.動画の重要なシーンのみを閲覧することを支援する動画要約は広く研究されているが,これらの研究は主に動画の視覚情報または音声情報のいずれか一方に焦点を当て,動画中の重要なセグメントを抽出する.そのため,講義動画のように教師の発言と黒板やスライドの視覚情報が双方とも重要である場合,重要な情報を見落とすリスクがある.そこで,本研究では講義動画の視覚情報と音声情報の両方を考慮して要約動画を生成する「FastPerson」を提案する.この手法は,動画の音声の書き起こしと動画中の画像やテキストを用いて要約動画を生成し,個々の学習者にとって重要な情報を見逃さないようにする.さらに,動画の各チャプターごとに要約動画と元の動画を切り替える機能を提供し,学習者が興味や理解度に応じてチャプターごとに適切な動画を選択し,学習のペースを柔軟に調整することが可能である.この手法の有効性を検証するために40名の実験参加者による評価を行った結果,提案手法を用いることで元の動画を視聴するのと同等の理解度を維持しつつ,視聴時間を53%削減することが可能であることが確認された.

雑誌名
インタラクション2024論文集
© 2024 情報処理学会
論文ID
INT24002
ページ
11-20
発行日
2024年2月28日
発行所
発行人 一般社団法人 情報処理学会
住所 〒101-0062 東京都千代田区神田駿河台一丁目5番地 化学会館4F
TEL. 東京 (03) 3518-8374 (代表)
E-mail