世界看熱訊:從“最罕見(jiàn)變異”中找到“最易患病個(gè)體”,AI精準(zhǔn)預(yù)測(cè)基因變異致病性

來(lái)源:文匯網(wǎng)


(資料圖)

通常而言,幾乎每個(gè)人都會(huì)攜帶有幾十個(gè)潛在有害的罕見(jiàn)變異。無(wú)法有效識(shí)別出可能罹患疾病的高風(fēng)險(xiǎn)個(gè)體,是通過(guò)常見(jiàn)變異進(jìn)行臨床評(píng)估所遇到的最大困難之一。在靈長(zhǎng)類基因組計(jì)劃的研究中,科學(xué)家利用人工智能神經(jīng)網(wǎng)絡(luò)PrimateAI-3D,以“用最罕見(jiàn)的變異找到最易患病的個(gè)體”的思路,通過(guò)演化分析定位高致病性的罕見(jiàn)突變,并將其用于預(yù)測(cè)個(gè)體患病風(fēng)險(xiǎn)。

西班牙托馬斯·馬奎斯-博內(nèi)特教授團(tuán)隊(duì)、I l l umina人工智能實(shí)驗(yàn)室聯(lián)合多個(gè)課題組,通過(guò)對(duì)233種靈長(zhǎng)類物種的共809個(gè)樣本進(jìn)行全基因組測(cè)序數(shù)據(jù)比較,鑒定出人類直系同源蛋白上430萬(wàn)個(gè)可能導(dǎo)致蛋白結(jié)構(gòu)變化的基因變異位點(diǎn)。

研究人員以上述基因變異位點(diǎn)為數(shù)據(jù)集基礎(chǔ),將其加入人類疾病基因數(shù)據(jù)中,用包含450萬(wàn)種可能造成良性變異的基因數(shù)據(jù)集訓(xùn)練PrimateAI-3D人工智能神經(jīng)網(wǎng)絡(luò),使之能夠更準(zhǔn)確預(yù)測(cè)基因變異的致病性。

基因變異是導(dǎo)致疾病的最主要原因之一?;诜侨遂`長(zhǎng)類與人類的親緣關(guān)系,相同的基因突變可能帶來(lái)相似的結(jié)果,在靈長(zhǎng)類中常見(jiàn)的突變可能意味著這些變異更可能是無(wú)害或危害極其有限的。

那么,如何預(yù)測(cè)一個(gè)人的遺傳因素給諸如糖尿病、心血管疾病等常見(jiàn)疾病帶來(lái)的患病風(fēng)險(xiǎn)呢?是用數(shù)千種影響較小的常見(jiàn)遺傳變異的總和來(lái)進(jìn)行評(píng)估,還是用少數(shù)影響顯著的罕見(jiàn)突變的總和進(jìn)行評(píng)估更好?

綜合研究表明,常見(jiàn)變異和罕見(jiàn)變異在預(yù)測(cè)人類疾病風(fēng)險(xiǎn)方面具有互補(bǔ)作用。常見(jiàn)變異可以平均識(shí)別出更多可能患病的個(gè)體,而罕見(jiàn)變異更容易識(shí)別出最高風(fēng)險(xiǎn)的異常個(gè)體。因此,在臨床評(píng)估上納入罕見(jiàn)變異可能比僅使用常見(jiàn)變異更能識(shí)別出極端個(gè)體,而這些極端個(gè)體才是大部分疾病的最終病患群體,也是最需要治療或遭受嚴(yán)重早期病變的群體,這對(duì)預(yù)防性篩查具有重要意義。

這一研究成功演示了將靈長(zhǎng)類群體測(cè)序數(shù)據(jù)與深度學(xué)習(xí)模型相結(jié)合的應(yīng)用,有助于我們了解人類基因變異的致病性,可幫助個(gè)性化基因組醫(yī)學(xué)在臨床上提供更佳診斷指導(dǎo)。

標(biāo)簽:

推薦

財(cái)富更多》

動(dòng)態(tài)更多》

熱點(diǎn)