leiphone Blake
Nature雜誌論文——使用機器學習來預測自閉症基因
普林斯頓大學最新一項研究發現了一些新的與自閉症相關的候選基因。
雖然研究人員估計存在有數百個與自閉症相關的基因,但實際上只有一小部分有明確的實驗證據證明<其與自閉症有關。
8月1日發表在自然雜誌上的一項研究;旨在改變這種現狀,他們通過使用大數據和機器學習的方法來進行一個有關泛自閉症障礙(ASD)的全基因組預測。該研究的第一作者Arjun Krishnan告訴我們;他們的結果將如何幫助泛自閉症障礙(ASD)的早期診斷和治療。
Nature雜誌論文——使用機器學習來預測自閉症基因
普林斯頓大學最新一項研究發現了一些新的與自閉症相關的候選基因。
雖然研究人員估計存在有數百個與自閉症相關的基因,但實際上只有一小部分有明確的實驗證據證明<其與自閉症有關。
8月1日發表在自然雜誌上的一項研究;旨在改變這種現狀,他們通過使用大數據和機器學習的方法來進行一個有關泛自閉症障礙(ASD)的全基因組預測。該研究的第一作者Arjun Krishnan告訴我們;他們的結果將如何幫助泛自閉症障礙(ASD)的早期診斷和治療。
Q:你能簡單總結下你的研究嗎?
Arjun Krishnan:泛自閉症障礙(ASD)具有很強的遺傳基礎,預計有400-1000相關基因,但是目前只有約65種自閉症基因被發現。由於泛自閉症障礙(ASD)十分複雜,光排序或僅僅進行基因研究是相當不夠的,不足以揭示自閉症的遺傳基礎。
因此,我們決定採取一種補充數據驅動的方法,來解決這一問題。我們使用的方法是,基於對先前已知自閉症基因的學習模式,與人腦中特定基因網路之間,是如何聯繫的,我們用這些模式來辨識新的自閉症基因。
最重要的結果,是對基因組中自閉症相關的基因,做了一個全面的補充預測。在研究的其他部分中,利用這些基因組,泛自閉症障礙ASD候選基因和大腦網路,我們已經確定大腦發育的階段和區域,以及自閉症患者身上,可能會被破壞的特定細胞功能。我們還建立了一個交互網站,任何生物醫學研究人員或臨床醫生,都可以訪問和查閱使用我們的研究結果。
Q:你的研究結果意義是什麼?
Arjun Krishnan:我們預測了數百個「新的」候選基因,這些都是在以前的自閉症相關遺傳研究,從來沒有被確定或者涉及的。對於遺傳學家來說,這意味著他們可以使用我們的預測,來直接進行測序研究,更快、更便宜的發現自閉症相關基因。
研究人員可以利用它們來區分,和解釋有關研究ASD全基因組測序的結果。最後,生物醫學研究人員,可以使用這些數據以及相關分析,全力研究新的自閉症基因,以及它的相關功能、發育和在結構上的影響。
Q:你能向我們解釋下是如何將機器學習方法應用到這項研究上嗎?
Arjun Krishnan:這項技術基本上類似於Facebook使用的「社交網路」方法,人們在社會背景下是互相關聯的,Facebook首先通在社交網路中尋找你的朋友,建議你將一位中學同學「添加為好友」,然後通過你們在社交網路中的共同好友進行推薦。
我們建立了一個特定的大腦基因網路,它是一個關於基因如何在大腦中,依靠對方正常運轉的地圖。利用這個網路,我們採用類似的理念來預測新的ASD基因——首先,我們在大腦網路中發現,與已經ASD基因相關的同伴,然後確定網路中,與這些協作基因相關的其他基因。
這個設想和其他一些設想一起,形成了一個我們進行系統預測的機器學習框架。
Q:你們實現這些成果用了哪些方法?
Arjun Krishnan:我們用來做ASD基因預測的是一種機器學習方法,它能學習如何辨識在基因網路與其他基因關聯的自閉症基因,然後使用這些模式來預測新的ASD基因。我們使用的基因網路表明基因,是如何一起在大腦中以細胞發揮作用的,或直觀地說是一副大腦分子水平的功能圖。
我們從所有可能的來源收集了與自閉症相關的基因,包括那些有直接證據或者間接證明的,同時對每個基因的證據是否可靠進行跟蹤。然後我們建立了一個,基於網路證據加權疾病基因分類器,學習在大腦網路中已知ASD基因的連接模式(考慮到每個基因的證據級別),然後使用數據驅動模式,來預測基因組中的每一個基因,潛在的與ASD的相關性。
Q:這種方式與以前的基因預測方法有什麼不同呢?
Arjun Krishnan:我們的研究對傳統的基因預測方法,有兩個主要的貢獻,首先是我們使用了一個基因組規模的組織特異性網路。人類疾病的起源,和表現在人體中特定的組織和細胞類型,例如高血壓—腎臟,或自閉症—大腦。
因此,要準確地描述哪些基因,與自閉症類似的疾病相關,我們需要瞭解和預測這些基因在大腦中發生了什麼,而不是在大腦以外其他人體部分。我們通過在人類基因組中,使用特定的大腦網路基因,實現了這個結果,基於成千上萬的基因組實驗,融合成了特定的大腦信號。
第二個貢獻是使用證據加權進行分類,我們在多個來源精心策劃了一組與ASD相關的基因,並追蹤這些來源是否可靠,使用他們的證據層級,為我們的機器學習作出新的預測方法。這種方式作出的預測,比基於高置信基因的預測要準確的多。
Q:你的研究對於泛自閉症障礙(ASD)來說意味著什麼?
Arjun Krishnan:目前非常需要一個基因,或分子測試來對ASD進行診斷,在腦發育早期,盡可能地基於ASD患者的基因組成,對其進行藥物或其他干預治療。通過對這些候選基因的實驗,幫助研究人員有效地縮小ASD的遺傳基礎和遺傳篩選,我們的研究結果,使他們離這些目標更近了一些。
Q:你認為機器學習在醫學研究中最大的潛力是什麼?
Arjun Krishnan:我所看到的機器學習的最大潛力是用其處理這個問題——針對個人的基因組成,準確預測其健康和疾病的狀態。我們的工作是在重大疾病這一方面邁出的巨大一步,幫助找出基因的「特性」可能定義的疾病,希望它可以用來對疾病進行預測。重要的是在追求這一目標的過程中,不單純是在機器學習或者生物醫學研究領域中,進行獨立研究,更要考慮這兩個領域,如何能協同合作一起發揮巨大的潛力。
Q:下一步打算如何進行研究?
Arjun Krishnan:下一步我們正在思考的如何將我們的預測結果,應用到自閉症患者的全基因組測序研究上,這令我們十分激動。對全基因組測序研究,需要面對相當複雜的情況,我們的預測結果,可以幫助研究人員集中在一個變量上,落在其附近或接近的基因,我們就可以將其辨識為與ASD基因高度相關的選項。
0 comments:
張貼留言