全球首個(gè)基于全國家健康記錄訓(xùn)練的生成式人工智能(AI)模型正式亮相。這款名為 “前瞻”的模型能夠預(yù)測(cè)住院風(fēng)險(xiǎn)、心臟病發(fā)作及數(shù)百種其他疾病,研究人員利用英格蘭國民醫(yī)療服務(wù)體系(NHS)5700萬患者的去標(biāo)識(shí)化數(shù)據(jù)對(duì)其進(jìn)行了訓(xùn)練。
目前,“前瞻” 僅可用于與新冠病毒相關(guān)的研究,且必須在 NHS 運(yùn)營的安全 “數(shù)據(jù)環(huán)境” 中運(yùn)行。在5月6日的新聞發(fā)布會(huì)上,英國劍橋大學(xué)健康數(shù)據(jù)科學(xué)家Angela Wood表示,這是首次在5700萬人的健康研究中使用AI模型,是真正的突破性進(jìn)展。
“如果該AI的預(yù)測(cè)在不同人群中被證明具有價(jià)值,,它最終可能指導(dǎo)個(gè)體患者的診療,并幫助分配 NHS 資源?!彼a(bǔ)充道。
隨著AI通過疾病診斷和其他醫(yī)療任務(wù)逐漸融入醫(yī)學(xué)研究,在部分任務(wù)上的表現(xiàn)甚至超越人類,此類技術(shù)發(fā)展正成為趨勢(shì)。
“前瞻”的早期版本曾基于倫敦約150萬人的健康記錄進(jìn)行訓(xùn)練,并測(cè)試其根據(jù)患者病史預(yù)測(cè)未來診斷的能力。在一項(xiàng)研究中,該模型大多數(shù)情況下做出了正確的判斷。
該模型整合了多個(gè)數(shù)據(jù)源,包括醫(yī)院記錄、疫苗接種記錄、全科醫(yī)生就診記錄以及英國國家死亡登記系統(tǒng)。最新版本的數(shù)據(jù)覆蓋2018年至2023年,總計(jì)約100億條醫(yī)療事件。
這些數(shù)據(jù)已去除了患者姓名、地址和出生日期等標(biāo)識(shí)信息。作為額外保護(hù)措施,NHS英格蘭數(shù)據(jù)訪問主管Michael Chapman在發(fā)布會(huì)上表示,該模型只能在NHS計(jì)算機(jī)系統(tǒng)上運(yùn)行,且任何由其生成的研究預(yù)測(cè)在發(fā)布前都將接受篩查。
然而,英國牛津大學(xué)數(shù)據(jù)隱私研究員Luc Rocher在向組織發(fā)布會(huì)的英國科學(xué)媒體中心發(fā)表的聲明中指出,完全杜絕從模型中提取患者隱私數(shù)據(jù)可能極具挑戰(zhàn)。他表示:“數(shù)據(jù)的豐富性使其對(duì)AI有價(jià)值,但也讓匿名化難上加難。這些模型應(yīng)始終處于 NHS 的嚴(yán)格控制下,以確保安全使用?!?
目前,“前瞻”僅限于用于約100個(gè)與新冠疫情相關(guān)的現(xiàn)有項(xiàng)目,這些項(xiàng)目由英國心臟基金會(huì)和NHS英格蘭合作開展,旨在研究疫情對(duì)醫(yī)療預(yù)約取消和其他中斷的影響。Chapman表示,任何超出這一范圍的研究使用均需額外審批。
研究人員還將測(cè)試“前瞻”在給定2018-2022年病史的情況下,能否準(zhǔn)確預(yù)測(cè)患者在2023年將發(fā)展的約1000種疾病中的哪一種。英國倫敦大學(xué)學(xué)院健康數(shù)據(jù)科學(xué)家Chris Tomlinson在發(fā)布會(huì)上表示:“這使我們能夠盡可能接近‘真實(shí)情況’?!?
“NHS數(shù)據(jù)在PG電子官網(wǎng)訓(xùn)練此類生成式健康模型方面提供的潛力令人興奮。”德國癌癥研究中心的健康數(shù)據(jù)科學(xué)家Moritz Gerstung認(rèn)為,NHS數(shù)據(jù)的龐大規(guī)模將提升醫(yī)療AI的準(zhǔn)確性,使其更能預(yù)測(cè)罕見疾病或解讀非典型病史。目前,他已申請(qǐng)權(quán)限,計(jì)劃在NHS數(shù)據(jù)上訓(xùn)練其團(tuán)隊(duì)開發(fā)的名為Delphi的模型。