查看完整版本: GWAS研究後,如何縮小對基因的搜索範圍?
頁: [1]

lonelong 發表於 2019-5-22 10:05 AM

GWAS研究後,如何縮小對基因的搜索範圍?





全基因組關聯研究(GWAS)針對大量人群尋找有助於常見的多基因特徵(如身高或肥胖)的基因。這些全面的調查經常發現大量微小的遺傳變異,這些變異在高齡,肥胖等人群中更常出現。但這種關聯並不意味著變異實際上有助於引起這種特性;它可能只是為了騎行。

那麼科學家應該優先考慮哪些基因用於進一步研究?許多計算算法可用於幫助提取GWAS結果,每個結果使用不同的標準和假設。但是很難知道選擇哪一個。

用於評估此類算法的大多數方法都會使研究人員偏向已經充分錶徵的基因,從而使他們遠離發現真正新事物的機會。其他方法需要訪問並非總是隨時可用的獨立參考數據。

“我們有不同的優先級算法,但我們實際上並不知道如何確定哪一個是最好的,”哈佛醫學院博士候選人Rebecca Fine說道,他一直在研究這個問題。 “我們不想依賴先前的'黃金標準'或引入除原始GWAS數據之外的任何其他內容。”

波士頓兒童醫院內分泌科主任,醫學博士,醫學博士Joel Hirschhorn開發了他們認為是一種有效,無偏見的方法,稱為Benchmarker,本月早些時候在美國人類遺傳學雜誌中有所描述。

借用機器學習

借助“交叉驗證”的機器學習概念,Benchmarker使調查人員能夠將GWAS數據本身作為自己的控制。我們的想法是採用GWAS數據集並挑出一條染色體。然後,基準測試的算法使用來自剩餘的21條染色體(除X和Y之外的所有染色體)的數據來預測單個染色體上的哪些基因最有可能對所研究的性狀有貢獻。由於依次對每個染色體重複該過程,因此匯集算法標記的基因。然後通過將這組優先基因與原始GWAS結果進行比較來驗證該算法。

“您在GWAS上訓練算法,並保留一條染色體,然後返回到該染色體,並詢問這些基因是否與原始GWAS結果中的強p值相關聯,”Fine解釋說。 “雖然這些p值並不能代表確切的”正確答案“,但它們確實可以告訴您一些真正的遺傳關聯。最終產品是對每種算法執行情況的評估。

基準測試基準測試

Fine,Hirschhorn及其同事將這種方法貫穿於20個不同特徵的步伐中,得出的結論是,結合多種策略通常可以獲得最佳結果。他們還發現了某些算法在尋找某些特徵的基因時表現最佳的證據。

“我們希望在GWAS之後開發更多算法來回答關鍵的下一個問題:哪些基因和變異與人類特徵和疾病有因果關係,”Hirschhorn說。 “基準測試方法可以作為一種無偏見的方法來確定用於回答這個問題的算法。”

...<div class='locked'><em>瀏覽完整內容,請先 <a href='member.php?mod=register'>註冊</a> 或 <a href='javascript:;' onclick="lsSubmit()">登入會員</a></em></div><div></div>
頁: [1]