一種視頻字幕的提取方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202010356689.7 申請日 -
公開(公告)號 CN111539427A 公開(公告)日 2020-08-14
申請公布號 CN111539427A 申請公布日 2020-08-14
分類號 G06K9/32(2006.01)I;H04N21/488(2011.01)I 分類 -
發(fā)明人 李欽;王正航 申請(專利權(quán))人 武漢譯滿天下科技有限公司
代理機構(gòu) 武漢智權(quán)專利代理事務所(特殊普通合伙) 代理人 武漢譯滿天下科技有限公司
地址 430000湖北省武漢市東湖新技術(shù)開發(fā)區(qū)關山大道355號光谷新世界T+寫字樓B棟2007
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種視頻字幕的提取方法及系統(tǒng),涉及圖像處理領域,該方法包括選取視頻畫面中的特定區(qū)域作為字幕識別區(qū)域,并對視頻畫面中字幕顏色進行選取;基于確定的字幕識別區(qū)域,對視頻的每一幀畫面進行裁剪,并基于圖像識別算法,對每一幀畫面的字幕識別區(qū)域進行識別,以判斷每一幀畫面的字幕識別區(qū)域是否含有字幕,以及判斷前后相鄰兩幀畫面的字幕識別區(qū)域是否相似;基于判斷結(jié)果,將視頻中含有相同字幕且相鄰的幀歸為一組,并記錄每組中首尾幀的時間戳;對每組中首幀畫面的字幕識別區(qū)域進行OCR,得到字幕,則當前組首尾幀的時間戳為當前得到字幕的開始時間戳和結(jié)束時間戳,并生成字幕文件。本發(fā)明能夠有效節(jié)省視頻字幕的提取時間。??