一種高維特征空間中基于聚類算法的就診人群分組方法

基本信息

申請?zhí)?/td> CN202010469507.7 申請日 -
公開(公告)號 CN111738304A 公開(公告)日 2020-10-02
申請公布號 CN111738304A 申請公布日 2020-10-02
分類號 G06K9/62(2006.01)I;G16H10/00(2018.01)I 分類 -
發(fā)明人 陳明東;黃越 申請(專利權(quán))人 思派健康產(chǎn)業(yè)投資有限公司
代理機構(gòu) 北京市盛峰律師事務(wù)所 代理人 思派健康產(chǎn)業(yè)投資有限公司
地址 510700廣東省廣州市黃埔區(qū)中新廣州知識產(chǎn)權(quán)騰飛一街2號619房
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種高維特征空間中基于聚類算法的就診人群分組方法,所述方法包括以下步驟,S1、以患者為匯總維度進行聚類前的特征提取,提取的特征包括疾病種類、限額使用率、個人自費占比、有無住院以及就診間隔;S2、計算各個特征之間的相關(guān)性,依次判斷各個相關(guān)性是否大于設(shè)定閾值,若是,則剔除該相關(guān)性對應(yīng)的特征,并執(zhí)行步驟S3;若否,則直接執(zhí)行步驟S3;S3、獲取聚類算法中的最優(yōu)選擇聚類數(shù);S4、將最優(yōu)選擇聚類數(shù)輸入聚類算法中,對步驟S2中的特征進行聚類,并對聚類結(jié)果分別進行業(yè)務(wù)解釋。優(yōu)點是:本方法中的聚類算法能夠?qū)lbow方法中的損失函數(shù)進行歸一化,且引入了類外和的概念,用以刻畫描述聚類后不同類之間的距離遠近。??