一種低延遲的機器學習即服務的生成方法

基本信息

申請?zhí)?/td> CN201910796537.6 申請日 -
公開(公告)號 CN110490334A 公開(公告)日 2019-11-22
申請公布號 CN110490334A 申請公布日 2019-11-22
分類號 G06N20/00(2019.01); G06F17/50(2006.01); G06K9/62(2006.01); G06N3/08(2006.01) 分類 計算;推算;計數(shù);
發(fā)明人 李攀登 申請(專利權(quán))人 上海丙晟科技有限公司
代理機構(gòu) 北京盛凡智榮知識產(chǎn)權(quán)代理有限公司 代理人 上海丙晟科技有限公司
地址 200040 上海市靜安區(qū)靈石路718號A5幢101室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種低延遲的機器學習即服務的生成方法,模型抽象層提供了一個通用的API,可以抽象出現(xiàn)有機器學習框架和模型的異構(gòu)性;模型參數(shù)尋優(yōu)層位于模型抽象層的上方,負責動態(tài)選擇、組合和優(yōu)化預測模型的參數(shù);模型管理層通過模型存儲層的信息對模型進行管理,以實現(xiàn)應用端可以動態(tài)并無感知的情況下獲取最優(yōu)的預測服務;事件服務層,這層負責與應用端交互,并存儲應用端用戶請求的信息,反饋給模型層,以實現(xiàn)動態(tài)自動優(yōu)化模型參數(shù);模型監(jiān)測層負責對上線模型服務的調(diào)用監(jiān)測,以及時發(fā)現(xiàn)調(diào)用過程中出現(xiàn)的問題,提高模型運維的透明性。降低現(xiàn)有預測服務棧的復雜性,并實現(xiàn)預測服務的低延遲、高吞吐量、模型準確性等關(guān)鍵屬性。