百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

GWAS——复杂疾病相关的遗传因素的研究方法及实操

haoteby 2025-03-18 22:28 26 浏览

尔云间 一个专门做科研的团队

原创 小果 生信果


前言:与复杂疾病相关的遗传因素的研究方法

基于当前流行病学研究的进展及研究热点,小果在这里为大家简单介绍一下关于全基因组关联研究(Genome-wide association study,GWAS)(以下简称GWAS)。全基因组关联研究发展已有二十多年了,研究人员们发现了大量和人类疾病以及其它表型相关联的基因,GWAS是现代遗传学的重要组成部分,推动了孟德尔随机化和多基因风险评分的发展与应用。


基本概念

GWAS是对多个个体在全基因组范围的遗传变异(标记)多态性进行检测,获得基因型,进而将基因型与可观测的性状,即表型,进行群体水平的统计学分析,根据统计量或显著性 p 值筛选出最有可能影响该性状的遗传变异(标记),挖掘与性状变异相关的基因。

相对于连锁分析的优势

关联定位的相对优势:
o 分辨率高(单碱基水平)
o 研究材料来源广泛,可捕获的变异丰富
o 节省时间


材料选择与群体设计

材料选择的基本原则

1)遗传变异和表型变异丰富
2)群体结构分化不能过于明显(如亚种以上,发生生殖隔离是不能做GWAS的)

样本量
非稀有变异中,对中等变异解释率(10%左右)的位点的检测功效要达到80%以上时,需要的样本量在400左右。
位点的效应越低,需要的样本量越大。

关联分析的三要素

o 测定某一群体的表型数据

o 测量该群体的基因型数据

o 进行关联计算


实操

作为生信分析里最基础的技能之一,有人花了很大的时间和精力都不能够完成一次GWAS。

小果在这里用最简单的数据和代码跑一遍GWAS,希望能够帮助大家更好的理解GWAS。

数据:测试一组狗全基因组的遗传变异与分类形状(毛皮颜色)之间的关系。


操作系统:Linux


1 下载样品vcf文件和表型数据

Wget https://de.cyverse.org/dl/d/E0A502CC-F806-4857-9C3A-BAEAA0CCC694/pruned_coatColor_maf_geno.vcf.gz
wget https://de.cyverse.org/dl/d/3B5C1853-C092-488C-8C2F-CE6E8526E96B/coatColor.phen


2 解压VCF文件之后 查看数据

gunzip pruned_coatColor_maf_geno.vcf.gz

#表型数据 前两列也是FID and IID,第三列是表型。

##查看文件发现,这个数据涉及53只小狗的476840个SNP,表型:24只黄毛犬 29只深色毛犬。


3 安装pink和vcftools

###安装plink
wget http://zzz.bwh.harvard.edu/plink/dist/plink-1.07-x86_64.zip
rm -f plink_linux_x86_64.zip
cd plink-1.07-x86_64/
echo export PATH=$PATH:$(pwd) >> ~/.bashrc
source ~/.bashrc
###安装vcftools
git clone https://github.com/vcftools/vcftools.git
cd vcftools
./autogen.sh
./configure
make
sudo make install

当然也可以直接用conda 装


4 将vcf文件转换成map、ped格式,然后转换为Plink二进制格式(fam,bed,bim)

vcftools --vcf pruned_coatColor_maf_geno.vcf --plink --out coatColor
 plink --file coatColor --allow-no-sex --dog --make-bed --noweb --out coatColor.binary


5 候选等位基因列表创建,awk编辑文本

cat pruned_coatColor_maf_geno.vcf | awk 'BEGIN{FS="\t";OFS="\t";}/#/{next;}{{if($3==".")$3=$1":"$2;}print $3,$5;}'  > alt_alleles


6 关联分析

plink --bfile coatColor.binary --make-pheno coatColor.phen "yellow" --assoc --reference-allele alt_alleles --allow-no-sex --adjust --dog --noweb --out coatColor


7 画图

#数据处理
unad_cutoff_sug=$(tail -n+2 coatColor.assoc.adjusted | awk '$10>=0.05' | head -n1 | awk '{print $3}')
unad_cutoff_conf=$(tail -n+2 coatColor.assoc.adjusted | awk '$10>=0.01' | head -n1 | awk '{print $3}')


#R绘图
data=read.table("coatColor.assoc", header=TRUE); data=data[!is.na(data$P),]
bitmap("coatColor_man.bmp", width=20, height=10)
library(qqman)
png(“man.pdf”)
manhattan(data, p = "P", col = c("blue4", "orange3"),suggestiveline = 12,genomewideline = 15,chrlabs = c(1:38, "X"), annotateTop=TRUE, cex = 1.2);
dev.off();


最后的结果图和生成文件,是不是很简单呢?关注小果,下期将为大家带来更多使用生信技巧。

最后小果祝大家学业有成,事事顺心。

推荐阅读

GO的概念及用R做简单的富集分析

R语言ConsensusClusterPlus包无监督聚类

柱状图-肿瘤某一指标的比较和GSVA结果展示

看小果演示CIBETSORT、xcell两种常用的R语言包

小果教你三分钟看懂多条线共存的ROC图的R语言画法

相关推荐

法网公开赛再遭雨水突袭“三无赛事”困局一年后破解

大雨突降,比赛被迫取消。广州日报全媒体记者孙嘉晖摄今天,法网公开赛进入正赛第11个比赛日,突如其来的大雨让本该在当地时间14时开球的女单1/4决赛被迫延迟,最终组委会官方确认,当天比赛因恶劣天气全...

AC米兰队史今天:2005年3比1尤文,马尔蒂尼PK伊布+众将围殴穆图

AC米兰队史今天:2005年3比1尤文,马尔蒂尼PK伊布+众将围攻穆图2005年10月29日,2005-2006赛季意甲第10轮的一场焦点对决在圣西罗上演,AC米兰坐镇主场迎战老妇人尤文图斯。强强死磕...

如果2005年西部全明星阵容VS2021年全明星阵容

#NBA全明星#如果2004-05赛季的西部全明星阵容,分别对阵今年的詹姆斯和杜兰特队,会孰强孰弱呢?首先我们来看看2004-05赛季西部全明星的阵容,首发球员是:科比、麦迪、加内特、邓肯、姚明;替补...

EtherCAT从站EEPROM更新操作指南_ethercat stm32从站

@ZHangZMo升级EtherCAT从站EEPROM...

LAN8820I-ABZJ/MICROCHIP/微芯/代理现货库存/以太网/太航半导体

描述微芯片lan820/lan820i是低功率100BASE/100BASE/1000BASE-TX/1000BASE-TX/100000base是由IEEE802.3和802.3ab...

汽车的发明者到底是谁?哪一年?百年历史的汽车品牌有哪些

今天是解读大学本科汽车专业教材《汽车构造》解读的第一期“总论”部分。后面将以教材内容为基础,并结合汽车发展现状做有一些更丰富的延展,同时补充进一些相关的常见故障及维修内容。华歌通俗易懂讲原理的讲解方...

嵌入式Linux自学不走弯路!670+讲课程!应用层+底层系统学习路线

在智能设备爆发式进化的今天,智能设备正从单点控制迈向系统级智能。从工业机械臂的精准控制到智能座舱的多屏交互,从边缘AI推理到云端协同,...

从cpu角度理解PCIe_cpuz pcie

举报Herok...

什么是big.LITTLE,你真的了解吗_big 是什么

2015年最佳智能手机阵容处理器均基于ARM的big.LITTLE架构,采用该架构处理器的手机工作速度更快更高效。三星GalaxyS6、HTCM9、LGG4等手机均采用基于big...

网上疯传的乌克兰战争片段,其实是一段游戏视频

希望人没事。...

《爱奇艺视频》UWP已悄悄更新ARM版,支持Win10 Mobile部署安装

此前IT之家报道过,爱奇艺视频(Beta版)已经推出Win10UWP版,适配Windows10PC系统,Win10Mobile还不能下载,不过现在有IT之家网友发现,爱奇艺视频(Beta版)商店里已...

Arm版Chrome/Edge浏览器新改进:加速视频渲染、延长续航时间

IT之家6月29日消息,科技媒体WindowsReport昨日(6月28日)发布博文,挖掘ChromiumCommit发现了“EnableMediaFoundationA...

ARM全新视频处理器Mali Egil曝光:支持VP9编解码

5月30日,ARM正式发布了其最新的图形处理器Mail-G71,基于ARM全新的GPU架构“Bifrost”,并且结合了线程级并行(TLP)设计。实际上,完整的MaliGPU基于ARM图形产品堆栈设...

2020年手机最全资源app网站合集,你要的基本上都有

手机最全资源app合集,你要的基本上都有聚BT:(最强资源聚合网站)https://jubt.net安卓老子追剧+安卓南瓜影视破解版+安卓香蕉影视+韩剧TV安卓:https://www.lanzous...

闰秒宣布取消,网友:让Linus本人与谷歌微软达成一致,只有它了

詹士发自凹非寺量子位|公众号QbitAI决定了!这一秒,程序员们不用再续了!...