家人們,撰寫和修改病歷 這事兒,那個讓無數(shù)醫(yī)生耗時耗力的環(huán)節(jié)——
病歷內(nèi)涵質(zhì)控 ,現(xiàn)在有了大模型來當(dāng)?shù)昧褪帧?/p>
所謂病歷內(nèi)涵質(zhì)控,簡單來說指的就是對病歷內(nèi)容的質(zhì)量控制 。
那它為什么會讓醫(yī)生們?nèi)绱撕臅r耗力呢?
首先,病歷本身就會完整、真實地反映出診療的全過程,不論對于患者或者醫(yī)生,還是對醫(yī)院的管理而言,重要程度都不言而喻。
畢竟從前期的出診,到后期的治療方案、查房、手術(shù)等眾多環(huán)節(jié),病歷都會貫穿其中,收納、承載和呈現(xiàn)所有相關(guān)信息。每一份病歷涉及到的信息量都是非常大,也是非常關(guān)鍵的。
而病歷內(nèi)涵質(zhì)控,強調(diào)的是一種邏輯質(zhì)控 ,難點就是邏輯非常抽象,定義和規(guī)則也不通俗;要把控它的質(zhì)量就需要深厚且全面的臨床經(jīng)驗和知識。
也正因如此,一般人還真做不了這事,醫(yī)院傳統(tǒng)的“解法”就是——
組建專家團隊 ,定時對歸檔病歷(尤其是重點病患)進行人工質(zhì)控。
這種解法自然費時費力,著實是費時費力 ,而且它還很難對所有病歷進行遍歷,更多時候只能針對少部分病歷進行抽查。
圖:由DALL·E 3生成
正如我們剛才提到的,現(xiàn)在這件難事兒,已經(jīng)靠大模型的輔助,找到了一種能兼顧效率和質(zhì)量的解法。
而且縱觀整個“AI+醫(yī)療”賽道,很多醫(yī)療信息化廠商都將大模型應(yīng)用落地的箭頭指向類似病歷內(nèi)涵質(zhì)控這樣的應(yīng)用“靶點”。
之所以如此,是因為處理病歷這項工作,正與大模型的“氣質(zhì)”極其相符——專治繁瑣、量大的信息處理工作。
由此便可以讓醫(yī)生從中解放出更多的時間,投入到更匹配其專業(yè)方向的工作中。
那么具體效果如何?是否能達到醫(yī)院的標(biāo)準(zhǔn)呢?
醫(yī)療大模型,已經(jīng)可以做到“快準(zhǔn)狠”了
在專攻用大模型搞病歷內(nèi)涵質(zhì)控這件事上,惠每科技 可以說是擁有相當(dāng)豐富的經(jīng)驗,是已經(jīng)在多家醫(yī)院(包括三甲醫(yī)院)“上崗”并收獲大量好評的那種。
醫(yī)療大模型效果如何,我們不妨來看下惠每科技交出的“作業(yè)”。
圖:基于不同質(zhì)控規(guī)則的大模型缺陷定位實例
在惠每科技醫(yī)療大模型的加持之下,現(xiàn)在從醫(yī)生書寫病歷開始,它就會伴隨在旁,像個隱形的“專家級”助手,同步就會開始糾錯 、提醒 的工作了。
例如在上圖的三個場景中,分別對應(yīng)的情況是:
●初步診斷中提及“前列腺術(shù)后”,但在現(xiàn)病史、既往史、手術(shù)外傷史中均缺少相關(guān)描述
●主訴“發(fā)現(xiàn)皮疹45分鐘”,但現(xiàn)病史中的癥狀描述與主訴大相徑庭
●病歷記錄患者“否認(rèn)手術(shù)外傷史”,但體格檢查中明確記載有大腿可見局部手術(shù)瘢痕
這些細節(jié)內(nèi)容要是放在之前,都是需要醫(yī)生們仔細比對校驗,并根據(jù)經(jīng)驗知識來甄別、挑錯的,可實際上,不同醫(yī)生在經(jīng)驗、資歷甚至是專業(yè)方向上的差別,都會讓這些細節(jié)的發(fā)現(xiàn)、校驗和應(yīng)對變得異常復(fù)雜。
但現(xiàn)在,有了醫(yī)療大模型的輔助,這個助手總會默默地在合適的時機出現(xiàn),把可能存在問題的內(nèi)容給pick出來,供醫(yī)生們快速做判斷。
具體到病歷內(nèi)涵質(zhì)控的運行機制,惠每科技則是以數(shù)據(jù)中臺為核心,向下對接醫(yī)院的醫(yī)院信息系統(tǒng)(HIS)、影像歸檔和信息系統(tǒng)(PACS),以及電子病歷歸檔系統(tǒng)(EMR)等。
在自動抓取內(nèi)容信息之后,會通過自然語言處理、術(shù)語標(biāo)準(zhǔn)化后構(gòu)建患者畫像,再經(jīng)由惠每醫(yī)療大模型推理計算做出提醒或預(yù)警,同時大模型還可以基于用戶的反饋持續(xù)進行優(yōu)化。
圖:惠每科技病歷內(nèi)涵質(zhì)控方案架構(gòu)
最終,在界面的呈現(xiàn)上,惠每科技這個系統(tǒng)會有醫(yī)生端 和管理端 兩種:
醫(yī)生在醫(yī)生端快速做錯誤檢測和處理,專家在管理端做更進一步的專業(yè)性查缺補漏。
由此,原先那種費時費力、費人費腦的病歷內(nèi)涵質(zhì)控,不但實現(xiàn)了自動化,而且效率也一下子就有了翻天覆地的變化,更重要的是,質(zhì)控之后的病歷質(zhì)量也隨之同步提升??芍^一箭雙雕,甚至是一箭三雕!
眼見為實!咱們瞧瞧來自一線用戶的真實反饋:以某三甲醫(yī)院 為例,上線了惠每科技的這套方案之后,病歷內(nèi)涵質(zhì)控效果的“打開方式”就變成了這樣:
全院的甲級病歷(下圖中的綠色曲線)從原先的75%直接暴漲到了95%!
病歷質(zhì)量的大幅提高就像“作用力與反作用力”,此舉反過來也讓醫(yī)生診療工作的規(guī)范性和病案管理質(zhì)量得到了提高。
由此雙管齊下,有問題的病歷數(shù)量就變得越來越少,以某醫(yī)院為例——
僅10個月時間,病歷平均問題數(shù)從最開始的7.42個,下降到了3.28個,下降比率高達55.79%!
像這樣的實際應(yīng)用效果還可以從某省級病案管理質(zhì)量控制中心的病歷質(zhì)控監(jiān)測指標(biāo)看出。
方案在該省某醫(yī)院落地后,病案首頁質(zhì)量相關(guān)的主要診斷編碼正確率從78%提升至97%、病歷文書相關(guān)的手術(shù)相關(guān)記錄完整率從92%提升至99%、CT/MRI檢查記錄完整率從81%提升至90%、抗菌藥物使用記錄符合率從82%提升至91%,不合格復(fù)制病歷發(fā)生率則從12%下降至8%,很好地滿足了該中心的質(zhì)控監(jiān)測要求。
圖:某醫(yī)院多項病歷質(zhì)控監(jiān)測指標(biāo)的變化趨勢
那么接下來的一個問題是,畢竟醫(yī)療場景涉及患者隱私,就這么交由大模型來訓(xùn)練和推理,夠安全嗎?
對此,惠每科技也有自己深入的理解和切實可靠的實踐路徑:
>私有化部署,數(shù)據(jù)不出醫(yī)院。
圖:惠每醫(yī)療大模型技術(shù)架構(gòu)
具體而言,惠每科技是以ChatGLM等流行的基座大模型為基礎(chǔ),鋪于醫(yī)學(xué)知識庫和醫(yī)學(xué)知識圖譜等,還結(jié)合了RAG(檢索增強生成)技術(shù),在垂直領(lǐng)域做模型的訓(xùn)練和微調(diào)等工作。
與此同步,專家的反饋也會通過RLHF(人類反饋強化學(xué)習(xí))技術(shù)加入到上述過程,并最終形成面向不同醫(yī)療場景的醫(yī)療大模型。
而這整個過程中都采用的是私有化部署的方式,微調(diào)也是基于SFT(監(jiān)督微調(diào))來展開,因此便更好地保障了安全性。
由此總結(jié)來看,醫(yī)療大模型“上崗”醫(yī)院后,在病歷內(nèi)涵質(zhì)控這件事上起碼做到了三點:
更專業(yè)、更安全、更效率。
但有一說一,在如此醫(yī)療大模型和系統(tǒng)的背后,還有一個關(guān)鍵因素在默默發(fā)力。
不僅能力到位,更要輕松落地
醫(yī)療大模型方案要想真正落地并發(fā)揮價值,除了算法模型本身要夠強大之外,還必須克服私有化部署所面臨的種種挑戰(zhàn)。
不論是出于數(shù)據(jù)與隱私安全、業(yè)務(wù)便捷還是成本考量,部署在本地、把控在自己手上,始終是越來越多行業(yè)用戶的期盼。
特別是對醫(yī)療行業(yè)來說,私有化的部署和落地的更是一種“剛需”。
畢竟不同醫(yī)院的病歷格式本身差異就較大,加之涉及患者隱私,惠每科技的私有化部署策略,幾乎成了醫(yī)療大模型落地的最基本前提。
這樣一來,在基礎(chǔ)設(shè)施的選擇上,又面臨一系列問題。
成本角度上,現(xiàn)代化醫(yī)院本來就是各行業(yè)信息化領(lǐng)域的主力軍,此前多年在通用計算類IT基礎(chǔ)設(shè)施上曾有大量投入,在此基礎(chǔ)上再導(dǎo)入專用AI加速器需要額外投入,而且這些加速器中如今獲取難度還在不斷加大(你懂的)。
從性能角度看,也要求硬件平臺能滿足AI模型推理所需的性能,特別是要滿足實時性或近實時性標(biāo)準(zhǔn)。
那么有沒有一種方案,既可以讓醫(yī)療大模型更順滑地落地,還能充分利用現(xiàn)有軟硬件設(shè)施,并同時兼顧性能、總擁有成本和獲取難度呢?
面對這一系列難題,惠每科技可謂是“有備而來”。
它選擇了與英特爾合作,基于英特爾? 至強? CPU Max系列處理器、OpenVINO?工具套件及開源大模型加速庫IPEX-LLM,打造了一套"高性價比醫(yī)療大模型私有化落地方案"。
作為業(yè)界首款內(nèi)置高帶寬內(nèi)存 (HBM) 的x86架構(gòu)CPU,至強? CPU Max系列集成了高達64GB容量的HBM2e內(nèi)存,其理論帶寬可達主流DDR5內(nèi)存的4倍,足以應(yīng)對大模型推理時對內(nèi)存性能的嚴(yán)苛要求。
此外,該處理器還內(nèi)置有英特爾? AMX(英特爾? 高級矩陣擴展)加速技術(shù),經(jīng)特定優(yōu)化后,其每時鐘周期可完成多達2048個INT8運算,較上一代同類指令實現(xiàn)了8倍性能飛躍。
圖注:英特爾? 至強? CPU Max 系列處理器
除硬件優(yōu)勢之外,在軟件方面,英特爾也為惠每科技提供了成熟的優(yōu)化工具與技術(shù)支持。
例如借助IPEX-LLM 大模型庫實現(xiàn)推理加速的低精度量化方案,以及基于 OpenVINO? 工具套件開展的非量化優(yōu)化方案,雙管齊下,能讓醫(yī)療大模型在至強? 平臺上的推理效率得到顯著提升。
據(jù)惠每科技實測,經(jīng)非量化方案優(yōu)化后,當(dāng)輸入文本為2K時,模型首詞時延由優(yōu)化前的 4.03秒驟降至2.1秒,性能提升達1.92倍。平均時延則由182.86毫秒每Token縮短至47.96毫秒每 Token,提升幅度高達3.81倍。而這,已經(jīng)十分接近專用AI加速芯片的性能水平了。
圖注:英特爾優(yōu)化方案帶來的性能提升
而且,除了讓醫(yī)療大模型私有化落地從“不可能”變?yōu)椤翱赡堋?#xff0c;基于英特爾? 至強? 平臺還有一個容易被忽視但至關(guān)重要的優(yōu)勢,那就是上線效率。
得益于英特爾? 架構(gòu)平臺成熟的生態(tài)以及雙方的深度協(xié)同,更重要的是醫(yī)療行業(yè)對于該平臺廣泛的部署和較高的應(yīng)用水準(zhǔn),醫(yī)院開展惠每醫(yī)療大模型方案私有化部署時,從準(zhǔn)備到最終產(chǎn)出收益,僅需3.5 個月左右。
這就讓 AI 智能化帶來的變革成果顯得更加"立竿見影"。
跨平臺技術(shù)助力行業(yè)加速應(yīng)用
通過惠每科技病歷質(zhì)量控制這一用例,不難看出:英特爾? CPU平臺+AI加速工具,不失為大模型從實驗室走向行業(yè)、加速落地與實踐的一劑"良方"。
其實在智慧醫(yī)療的背景下,病歷質(zhì)控只是一個縮影。
從智能導(dǎo)診到輔助診斷,從藥物研發(fā)到疾病預(yù)測,AI正以多種方式為醫(yī)療行業(yè)帶來更多變革。
智慧醫(yī)療又何嘗不是“人工智能+”時代的一塊重要拼圖呢?
更廣泛的視角下,類似醫(yī)療這樣涉及隱私、對AI私有化部署有強要求的行業(yè),還有金融、法律、教育、出行……可以說,越是距離每個人生活更近的行業(yè),就越需要考慮這個問題。
如果再考慮到在數(shù)字化轉(zhuǎn)型中已有一定投入,希望充分利用原有IT基礎(chǔ)設(shè)施,以總擁有成本更低的方式開展AI實踐的行業(yè),那就更多了。
所以說在這一輪推進智能化轉(zhuǎn)型的浪潮中,像英特爾與惠每科技合作打造的這種"一石多鳥"且“更接地氣”的方案,無疑是一個值得參考的選擇。
英特爾未來能不能繼續(xù)以更高性價比、更易于獲取和應(yīng)用的軟硬件平臺為基礎(chǔ),全力加速AI在各個行業(yè)的創(chuàng)新應(yīng)用,讓科技為人類社會持續(xù)賦能,就很值得期待了。
相關(guān)稿件