一種視頻字幕的提取方法及系統(tǒng)
基本信息

| 申請?zhí)?/td> | CN202010356689.7 | 申請日 | - |
| 公開(公告)號 | CN111539427A | 公開(公告)日 | 2020-08-14 |
| 申請公布號 | CN111539427A | 申請公布日 | 2020-08-14 |
| 分類號 | G06K9/32(2006.01)I;H04N21/488(2011.01)I | 分類 | - |
| 發(fā)明人 | 李欽;王正航 | 申請(專利權(quán))人 | 武漢譯滿天下科技有限公司 |
| 代理機構(gòu) | 武漢智權(quán)專利代理事務所(特殊普通合伙) | 代理人 | 武漢譯滿天下科技有限公司 |
| 地址 | 430000湖北省武漢市東湖新技術(shù)開發(fā)區(qū)關山大道355號光谷新世界T+寫字樓B棟2007 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種視頻字幕的提取方法及系統(tǒng),涉及圖像處理領域,該方法包括選取視頻畫面中的特定區(qū)域作為字幕識別區(qū)域,并對視頻畫面中字幕顏色進行選取;基于確定的字幕識別區(qū)域,對視頻的每一幀畫面進行裁剪,并基于圖像識別算法,對每一幀畫面的字幕識別區(qū)域進行識別,以判斷每一幀畫面的字幕識別區(qū)域是否含有字幕,以及判斷前后相鄰兩幀畫面的字幕識別區(qū)域是否相似;基于判斷結(jié)果,將視頻中含有相同字幕且相鄰的幀歸為一組,并記錄每組中首尾幀的時間戳;對每組中首幀畫面的字幕識別區(qū)域進行OCR,得到字幕,則當前組首尾幀的時間戳為當前得到字幕的開始時間戳和結(jié)束時間戳,并生成字幕文件。本發(fā)明能夠有效節(jié)省視頻字幕的提取時間。?? |





