情報処理学会 インタラクション2025

文献情報

タイトル
ファインチューニングしたBERTとGPT-4oを用いた相談・助言形式動画の自動切り抜き
著者
  • 岡崎 光栄(日大)
  • 北原 鉄朗(日大)
アブストラクト
説明画像

本研究では, ファインチューニングした日本語文脈理解モデルTohokuBERTとGPT-4oを用いて, 視聴者からの質問や相談を出演者が読み上げ, 同じ出演者が回答や助言を行う単独出演動画から「相談」と「助言」を自動的に切り抜き, 要約するシステムを試作した.YouTube などの動画共有プラットフォームで需 要が高まる切り抜き動画の自動生成を目指し, 音声認識技術で動画から音声を書き起こし, TohokuBERT で各文を「相談」, 「助言」, 「その他」に分類する. その後, 「相談」と「助言」が連続するグループを特定し, GPT-4o を用いて文脈の一貫性を評価・修正するプロセスを構築した. 結果, TohokuBERT は一定の分 類精度を示したものの, 音声認識の誤りにより一部の文が誤分類されるケースが確認された. また, GPT-4oによる文脈評価では, 一貫性の欠如する文が残留する課題が明らかとなった.

雑誌名
インタラクション2025論文集
© 2025 情報処理学会
論文ID
1B-49
ページ
424-429
発行日
2025年2月23日
発行所
発行人 一般社団法人 情報処理学会
住所 〒101-0062 東京都千代田区神田駿河台一丁目5番地 化学会館4F
TEL. 東京 (03) 3518-8374 (代表)
E-mail