一種視頻字幕文本提取和識別的方法

基本信息

申請?zhí)?/td> CN201110315054.3 申請日 -
公開(公告)號 CN102332096B 公開(公告)日 2013-01-02
申請公布號 CN102332096B 申請公布日 2013-01-02
分類號 G06K9/20(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉成林;白博;殷飛 申請(專利權)人 北京中科閱深科技有限公司
代理機構 中科專利商標代理有限責任公司 代理人 周國城
地址 100190 北京市海淀區(qū)中關村東路95號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種視頻字幕文本提取和識別的方法,其步驟包括:輸入視頻中字幕區(qū)域的圖像;將輸入圖像轉化為灰度圖;判斷字幕區(qū)域中字符排列的方向;將豎直排列的字幕區(qū)域逆時針旋轉90°得到水平字幕區(qū)域;對字幕區(qū)域進行分行得到單行字幕圖像;對單行字幕區(qū)域圖像自動判斷前景顏色,得到單行字幕二值圖像;對單行字幕二值圖像進行過切分得到字符片段序列;對過切分后的單行字幕二值圖像進行文本行識別。本方法能有效分割水平和豎直的視頻字幕文本行,準確判斷字符前景顏色并濾除噪聲,并得到準確的字符切分與識別結果,可以適用于視頻和圖像內容編輯、索引與檢索等多種用途。