文献情報
タイトル | |
---|---|
ファインチューニングしたBERTとGPT-4oを用いた相談・助言形式動画の自動切り抜き | |
著者 | |
|
|
アブストラクト | |
![]() 本研究では, ファインチューニングした日本語文脈理解モデルTohokuBERTとGPT-4oを用いて, 視聴者からの質問や相談を出演者が読み上げ, 同じ出演者が回答や助言を行う単独出演動画から「相談」と「助言」を自動的に切り抜き, 要約するシステムを試作した.YouTube などの動画共有プラットフォームで需 要が高まる切り抜き動画の自動生成を目指し, 音声認識技術で動画から音声を書き起こし, TohokuBERT で各文を「相談」, 「助言」, 「その他」に分類する. その後, 「相談」と「助言」が連続するグループを特定し, GPT-4o を用いて文脈の一貫性を評価・修正するプロセスを構築した. 結果, TohokuBERT は一定の分 類精度を示したものの, 音声認識の誤りにより一部の文が誤分類されるケースが確認された. また, GPT-4oによる文脈評価では, 一貫性の欠如する文が残留する課題が明らかとなった. |
|
雑誌名 | |
インタラクション2025論文集 © 2025 情報処理学会 |
|
論文ID | |
1B-49 | |
ページ | |
424-429 | |
発行日 | |
2025年2月23日 | |
発行所 | |
発行人 | 一般社団法人 情報処理学会 |
住所 | 〒101-0062 東京都千代田区神田駿河台一丁目5番地 化学会館4F |
TEL. | 東京 (03) 3518-8374 (代表) |
sig@ipsj.or.jp |