【佳學(xué)基因檢測】如何設(shè)計和評估用于基因檢測的糖尿病多基因風(fēng)險評估模型?
糖尿病風(fēng)險評估基因檢測導(dǎo)讀:
糖尿病是世界上發(fā)展最快的慢性病之一,糖尿病患者的數(shù)量自 1980 年以來幾乎翻了兩番。最常見的糖尿病類型是 2 型糖尿病 (T2DM),約占所有患者的 90%。 T2DM 的危險因素包括遺傳易感性,以及生活方式因素,如肥胖和缺乏運動。 T2DM 的特點是胰島素抵抗,導(dǎo)致血糖控制不佳和高血糖。 這可能導(dǎo)致許多健康并發(fā)癥,包括神經(jīng)損傷、心臟病和腎衰竭,估計全球負擔(dān)為 3.1 萬億美元。
2019 年,糖尿病是全球第九大死亡原因,在 20-79 歲的成年人中,每 10 個中就有超過 1 個患有這種疾病。 到 2045 年,患病率預(yù)計將上升 45% 左右,預(yù)計中低收入國家的增幅最大。 中國的糖尿病患者人數(shù)居世界第二,占所有患者的六分之一。 在高遺傳易感性和日益惡化的生活方式因素的推動下,預(yù)計到 2045 年中國的糖尿病患病率將進一步增加 74%。未確診或未控制的 T2DM 病例可導(dǎo)致微血管和大血管損傷。 微血管疾病的發(fā)展可導(dǎo)致視力受損(視網(wǎng)膜病變)、腎臟損傷(腎?。?、神經(jīng)損傷(神經(jīng)?。┖徒刂炔l(fā)癥。 由大血管損傷引起的心血管疾病是糖尿病患者死亡的主要原因,通常由冠心病、中風(fēng)和外周動脈疾病引起。
低診斷率加劇了中國 T2DM 的負擔(dān),估計有 57% 的糖尿病患者未被確診。 這使得許多糖尿病患者得不到治療并出現(xiàn)并發(fā)癥,之后大部分醫(yī)療費用都自掏腰包。 以殘疾調(diào)整生命年 (DALY) 衡量時,疾病流行率高和醫(yī)療保健不足的結(jié)合導(dǎo)致 T2DM 在中國的非傳染性疾病中具有最高的健康負擔(dān)。
T2DM 是一種多因素疾病,風(fēng)險主要由生活方式因素驅(qū)動,例如肥胖、缺乏運動和飲食不良。 中國人對 T2DM 的易感性很高,與西方國家相比,該病發(fā)病年齡更小,體重指數(shù) (BMI) 值更低。 研究表明,與其他種族相比,在給定的 BMI 下,中國人通常具有更高的體脂和更高的中心性肥胖,以及更大的血脂異常和胰島素抵抗傾向。 散居中國的糖尿病患病率高于這些國家的本地人口,也證明了 T2DM 易感性的增加。 T2DM 也是一種具有高度遺傳性的多基因疾病。 全基因組關(guān)聯(lián)研究 (GWAS) 已經(jīng)確定了超過 150 個基因座,這些基因座貢獻了大約 10-15% 的遺傳易感性,盡管對中國人群的綜合研究仍然有限。
如何設(shè)計和評估用于基因檢測的糖尿病多基因風(fēng)險評估模型?
糖尿病風(fēng)險評估基因檢測的研究是基于 UKB 項目進行的,這是佳學(xué)基因賴以依賴的的前瞻性隊列研究數(shù)據(jù)。 在 2006 年至 2010 年的基線評估訪問期間,從英國招募了近 50 萬年齡在 40-69 歲的參與者。 收集樣本(例如血液、尿液和唾液)。 然后,它將生物樣本中包含的有限信息轉(zhuǎn)換為廣泛共享的隊列范圍基因分型和全外顯子組測序數(shù)據(jù)。 有關(guān) UKB 項目的研究設(shè)計、方法和參與者的更多詳細信息已在別處提供)。
最初從 UKB 收集了總共 487,409 個具有可用基因分型陣列的個體和總共 625,394 個變異。糖尿病風(fēng)險評估的多基因檢測模型執(zhí)行了 Marees 等人描述的嚴格質(zhì)量控制 (QC) 步驟。 (2018) 基于來自 https://www.cog-genomics.org/plink2 的 PLINK 2.0。 具體來說,糖尿病風(fēng)險評估首先過濾掉 SNP 和缺失程度非常高的個體。 基于 0.2 (>20%) 的寬松閾值,糖尿病風(fēng)險評估刪除了 89,752 個變體和 30,855 個受試者。 還有 262,751 個 SNPs 被移除,次要等位基因頻率 <0.03,1,204 個 SNPs 被移除,Hardy-Weinberg 平衡 Fisher 正確檢驗的 p 值 < 1×10−6。 最后,456,451 個個體和 271,687 個變體通過了 QC,并被納入以下分析。
T2D 的確定基于自我報告、國際疾病分類第九版 (ICD-9) 代碼 25000 和 25010 以及國際疾病分類第十版 (ICD-10) 代碼 E11 的組合 . T2D 相關(guān)風(fēng)險因素的個體水平數(shù)據(jù),包括性別、年齡、身體指標 [例如 BMI、腰圍 (WC)、DBP 和 SBP] 和臨床因素 [例如 GL、CL、TL、高密度 UKB 項目還收集了脂蛋白 (HDL)、低密度脂蛋白 (LDL)]。 糖尿病多基因檢測風(fēng)險評估通過它們的方式進一步估算了這些因素不可避免的缺失值。 為了分析具有相對同質(zhì)血統(tǒng)的個體,人口是根據(jù)自我報告的血統(tǒng)和使用前 10 個主要成分(即 PC1,…,PC10)的遺傳確認血統(tǒng)的組合集中構(gòu)建的。 為了構(gòu)建、測試和進一步驗證 T2D 多基因預(yù)測因子的穩(wěn)健性,糖尿病風(fēng)險評估將整體數(shù)據(jù)隨機分為兩部分,即測試和驗證數(shù)據(jù)集。 糖尿病風(fēng)險評估基因檢測分配了所有個體的 40% 作為 UKB 測試數(shù)據(jù)集 (n = 182,422),其余 60% 作為 UKB 驗證數(shù)據(jù)集 (n = 274,029)。 還嘗試了其他比率來劃分測試和驗證數(shù)據(jù)集,即 30-70%、50-50%、60-40% 和 70-30%。 UKB 驗證數(shù)據(jù)集中的個體與 UKB 測試數(shù)據(jù)集中的個體不同。 研究設(shè)計的詳細信息如圖 1 所示。
圖 1:2 型糖尿病多基因風(fēng)險評分 (PRS) 模型評估與建立的流程圖
全基因組多基因評分構(gòu)建、測試和驗證
佳學(xué)基因多基因風(fēng)險評估模型《PRS 模型》是用于評估多個基因的共同作用,從而提供遺傳因素對疾病風(fēng)險發(fā)生的影響。通常,PRS 模型可以是未加權(quán)的或加權(quán)的。 假設(shè)我們有 n 個受試者和 K 個通過第一步過濾程序的 SNP。 未加權(quán)的 PRS 模型定義為:,
其中 Gk(k = 1,….,K) 表示在加性遺傳模型下編碼為 0、1 或 2 的每個遺傳變異的風(fēng)險等位基因數(shù)。 對于加權(quán) PRS 模型,權(quán)重通常根據(jù)與給定疾病的關(guān)聯(lián)強度分配給每個遺傳變異。 加權(quán) PRS 模型可以寫成,
PRSw=β^1G1+…,β^KGk,
其中 β^k(k=1,…,K) 是外部大規(guī)模 GWAS 中邊際遺傳效應(yīng)的估計。 未加權(quán)或加權(quán) PRS 模型均可由 PRSice-2 軟件實施。
對于 PRS 模型構(gòu)建,糖尿病多基因風(fēng)險評估使用了來自 60,786 名參與者的 T2D GWAS 的匯總統(tǒng)計數(shù)據(jù),其中包含 12,056,346 個歐洲血統(tǒng)的 SNP2。 請注意,UKB 樣本與發(fā)現(xiàn) GWAS 中的樣本不重疊。 佳學(xué)基因糖尿病多基因風(fēng)險評估首先根據(jù)從上述 GWAS 獲得的關(guān)聯(lián) p 值 (p≤‹5׋10−2) 選擇 SNP,并保留了 50,224 個 SNP。 然后,根據(jù) Khera 等人的建議,佳學(xué)基因糖尿病風(fēng)險評估考慮了多個 r2 閾值(0.2、0.4、0.6 和 0.8) 和 p 值閾值(5×10-2,5×10-4,5×10-6 和 5×10-8)也在 DIAGRAM 摘要數(shù)據(jù)集上進行第二和第三次過濾程序。 基于具有 182,422 名參與者的 UKB 測試數(shù)據(jù)集,為 T2D 創(chuàng)建了總共 16 個候選 PRS 模型。
具有最佳判別正確度的 PRS 模型是根據(jù)以下邏輯回歸模型中的最大 AUC 確定的,該模型針對性別、年齡和祖先的前 10 個主要成分進行了調(diào)整。 佳學(xué)基因糖尿病風(fēng)險基因檢測評估使用 X1,X2 和 PC = (PC1,…,PC10)T 分別表示性別、年齡和祖先的前 10 個主成分的值,其中 T 表示向量或矩陣的轉(zhuǎn)置。 令 Y 為 T2D 狀態(tài),其中 0 和 1 代表對照和病例。 T2D 的預(yù)測模型可以表示為,
其中 β0 是截距,β1、β2、βPC=(βPC1,…,βPC10),βg 是 X1、X2、PC 和 PRSw 的回歸系數(shù)。 然后,AUCs 可以用梯形計算 (Fawcett, 2006),它們的 95% 置信區(qū)間 (CI) 可以用 Delong 的方法計算 (DeLong et al., 1988)。 AUC 及其 CI 都可以由 R 3.6.34 中的“pROC”包 3 直接實現(xiàn)。 在測試數(shù)據(jù)集中創(chuàng)建的最佳分數(shù)將帶入后續(xù)驗證步驟。
驗證數(shù)據(jù)集中的統(tǒng)計分析
研究人群的基線特征被描述為平均值±標準偏差(M±SD)或百分比。 使用兩個獨立樣本 t 檢驗或卡方檢驗來比較 UKB 測試和驗證數(shù)據(jù)集之間的基線特征。 應(yīng)用 Wilcoxon 符號秩檢驗來提供有關(guān) T2D 個體和非 T2D 個體之間 PRS 差異的更多信息。 PRS 和 T2D 之間的關(guān)系是在 UKB 驗證數(shù)據(jù)集中基于對性別、年齡和祖先的前 10 個主要成分(模型 1)進行調(diào)整的邏輯回歸模型確定的,可以表示為,
T2D∼PRS+sex+age+PC
糖尿病風(fēng)險評估基因檢測根據(jù) PRS 的百分位數(shù)將 UKB 驗證數(shù)據(jù)集中的 274,029 名參與者分為 100 組,然后可以確定每組內(nèi)的 T2D 患病率。
為了進一步觀察 PRS、性別、年齡、身體測量和其他臨床危險因素對 T2D 的貢獻,糖尿病多基因風(fēng)險評估提供了其他四種類型的預(yù)測模型:
模型2:T2D∼sex+age+PC; (1)
模型3:T2D∼PRS; (2)
模型4:T2D~sex+age+PC+BMI+GL+CL+HDL+LDL+TL+WC+DBP+SBP;(3)
模型5:T2D~PRS+性別+年齡+PC+BMI+GL+CL+HDL+LDL+TL+WC+DBP+SBP。(4)
糖尿病風(fēng)險評估基因檢測已經(jīng)檢查并沒有發(fā)現(xiàn)上述變量之間存在共線性。 以上所有統(tǒng)計分析均使用 R 3.6.3 版軟件進行。
- 【佳學(xué)基因檢測】糖尿病的正確用藥基因解碼:離子通道突變基因檢測...
- 【佳學(xué)基因檢測】如何設(shè)計和評估用于基因檢測的糖尿病多基因風(fēng)險評估模型?...
- 【佳學(xué)基因檢測】糖尿病藥物齊格列酮使用前需要做基因檢測嗎?...
- 【佳學(xué)基因檢測】糖尿病藥物repaglinide瑞格列奈正確使用基因檢測...
- 【佳學(xué)基因檢測】阿爾法1型糖苷酶抑制劑糖尿病藥物基因檢測正確性評估標準...
- 【佳學(xué)基因檢測】如果沒有做基因檢測,糖尿病用藥至少要知道這些要點...
- 【佳學(xué)基因檢測】二甲雙胍用藥指導(dǎo)基因檢測——藥物作用靶點的基因解碼分析...
- 【佳學(xué)基因檢測】糖尿病治療藥物維達列汀會有并發(fā)癥出現(xiàn)嗎?怎么做基因檢測?...
- 【佳學(xué)基因檢測】糖尿病基因檢測包括甲苯磺丁脲用藥指導(dǎo)嗎?...
- 【佳學(xué)基因檢測】妥拉唑胺基因檢測可以避免無效用藥,檢測機構(gòu)可以確定!...
- 【佳學(xué)基因檢測】糖尿病藥物西他列汀有用藥指導(dǎo)基因檢測了!...
- 【佳學(xué)基因檢測】這個糖尿病正確用藥基因檢測包含沙格列??!太好了!...
- 【佳學(xué)基因檢測】如何通過基因檢測判斷瑞格列奈是否適合糖尿病患者?...
- 【佳學(xué)基因檢測】格列吡嗪可以控制我的血糖嗎?基因檢測的好處有哪些?...
- 【佳學(xué)基因檢測】格列美脲基因檢測是如何降低糖尿病的并發(fā)癥的?...
- 【佳學(xué)基因檢測】glibenclamide格列苯脲基因檢測單位列表...
- 【佳學(xué)基因檢測】氯磺丙脲片控制血糖效果怎么樣?基因檢測有答案...
- 【佳學(xué)基因檢測】糖尿病藥物阿格列汀適合你嗎?基因檢測告訴你...
- 來了,就說兩句!
-
- 最新評論 進入詳細評論頁>>