一種識(shí)別PDF文件中的空格的方法

基本信息

申請(qǐng)?zhí)?/td> CN201210455707.2 申請(qǐng)日 -
公開(公告)號(hào) CN103810148B 公開(公告)日 2016-12-21
申請(qǐng)公布號(hào) CN103810148B 申請(qǐng)公布日 2016-12-21
分類號(hào) G06F17/22(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 周美玲 申請(qǐng)(專利權(quán))人 福建福昕軟件開發(fā)股份有限公司北京分公司
代理機(jī)構(gòu) 北京科龍寰宇知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 代理人 孫皓晨
地址 350003 福建省福州市鼓樓區(qū)軟件大道89號(hào)福州軟件園G區(qū)5號(hào)樓
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種識(shí)別PDF文件中的空格的方法。該方法包括:步驟1:遍歷PDF文件,記錄各對(duì)相鄰字符之間的距離;步驟2:確定各對(duì)相鄰字符之間的距離中的最小值h;步驟3:用各對(duì)相鄰字符之間的距離減去h,得到各對(duì)相鄰字符之間的相對(duì)距離;步驟4:依次判斷各對(duì)相鄰字符之間的相對(duì)距離是否小于預(yù)知的空格寬度,是則該對(duì)相鄰字符之間的空隙不是空格,否則,該對(duì)相鄰字符之間的空隙包括空格。本發(fā)明能提高相鄰字符之間是否存在空格的判斷準(zhǔn)確率。