基于單詞的類內分布與類間分布的電子病歷特征選擇方法

基本信息

申請?zhí)?/td> CN201810208599.6 申請日 -
公開(公告)號 CN108346474B 公開(公告)日 2021-09-28
申請公布號 CN108346474B 申請公布日 2021-09-28
分類號 G16H50/70(2018.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I 分類 物理
發(fā)明人 彭訪;方勝群;蔡志平;吳喜軍;孫文成 申請(專利權)人 湖南省藍蜻蜓網絡科技有限公司
代理機構 湖南省國防科技工業(yè)局專利中心 代理人 馮青
地址 410073 湖南省長沙市開福區(qū)德雅路109號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及基于單詞的類內分布與類間分布的電子病歷特征選擇方法。本發(fā)明首先構建了疾病、藥品詞典,其次總結了中文病歷中癥狀詞分布的三大特點,然后對收集到的病人病歷進行預處理,將分詞結果保存到數據庫中。本發(fā)明根據關鍵癥狀詞在疾病內的分布情況及疾病間的分布情況計算單詞對于不同疾病的代表度,且在考慮疾病間分布情況時,分析了疾病與疾病間的關聯(lián)性對于特征選擇的影響,在特征選擇時保證關聯(lián)性高的疾病間的特征盡量相似,關聯(lián)性低的疾病間的特征盡量排斥。