百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

GWAS——复杂疾病相关的遗传因素的研究方法及实操

haoteby 2025-03-18 22:28 20 浏览

尔云间 一个专门做科研的团队

原创 小果 生信果


前言:与复杂疾病相关的遗传因素的研究方法

基于当前流行病学研究的进展及研究热点,小果在这里为大家简单介绍一下关于全基因组关联研究(Genome-wide association study,GWAS)(以下简称GWAS)。全基因组关联研究发展已有二十多年了,研究人员们发现了大量和人类疾病以及其它表型相关联的基因,GWAS是现代遗传学的重要组成部分,推动了孟德尔随机化和多基因风险评分的发展与应用。


基本概念

GWAS是对多个个体在全基因组范围的遗传变异(标记)多态性进行检测,获得基因型,进而将基因型与可观测的性状,即表型,进行群体水平的统计学分析,根据统计量或显著性 p 值筛选出最有可能影响该性状的遗传变异(标记),挖掘与性状变异相关的基因。

相对于连锁分析的优势

关联定位的相对优势:
o 分辨率高(单碱基水平)
o 研究材料来源广泛,可捕获的变异丰富
o 节省时间


材料选择与群体设计

材料选择的基本原则

1)遗传变异和表型变异丰富
2)群体结构分化不能过于明显(如亚种以上,发生生殖隔离是不能做GWAS的)

样本量
非稀有变异中,对中等变异解释率(10%左右)的位点的检测功效要达到80%以上时,需要的样本量在400左右。
位点的效应越低,需要的样本量越大。

关联分析的三要素

o 测定某一群体的表型数据

o 测量该群体的基因型数据

o 进行关联计算


实操

作为生信分析里最基础的技能之一,有人花了很大的时间和精力都不能够完成一次GWAS。

小果在这里用最简单的数据和代码跑一遍GWAS,希望能够帮助大家更好的理解GWAS。

数据:测试一组狗全基因组的遗传变异与分类形状(毛皮颜色)之间的关系。


操作系统:Linux


1 下载样品vcf文件和表型数据

Wget https://de.cyverse.org/dl/d/E0A502CC-F806-4857-9C3A-BAEAA0CCC694/pruned_coatColor_maf_geno.vcf.gz
wget https://de.cyverse.org/dl/d/3B5C1853-C092-488C-8C2F-CE6E8526E96B/coatColor.phen


2 解压VCF文件之后 查看数据

gunzip pruned_coatColor_maf_geno.vcf.gz

#表型数据 前两列也是FID and IID,第三列是表型。

##查看文件发现,这个数据涉及53只小狗的476840个SNP,表型:24只黄毛犬 29只深色毛犬。


3 安装pink和vcftools

###安装plink
wget http://zzz.bwh.harvard.edu/plink/dist/plink-1.07-x86_64.zip
rm -f plink_linux_x86_64.zip
cd plink-1.07-x86_64/
echo export PATH=$PATH:$(pwd) >> ~/.bashrc
source ~/.bashrc
###安装vcftools
git clone https://github.com/vcftools/vcftools.git
cd vcftools
./autogen.sh
./configure
make
sudo make install

当然也可以直接用conda 装


4 将vcf文件转换成map、ped格式,然后转换为Plink二进制格式(fam,bed,bim)

vcftools --vcf pruned_coatColor_maf_geno.vcf --plink --out coatColor
 plink --file coatColor --allow-no-sex --dog --make-bed --noweb --out coatColor.binary


5 候选等位基因列表创建,awk编辑文本

cat pruned_coatColor_maf_geno.vcf | awk 'BEGIN{FS="\t";OFS="\t";}/#/{next;}{{if($3==".")$3=$1":"$2;}print $3,$5;}'  > alt_alleles


6 关联分析

plink --bfile coatColor.binary --make-pheno coatColor.phen "yellow" --assoc --reference-allele alt_alleles --allow-no-sex --adjust --dog --noweb --out coatColor


7 画图

#数据处理
unad_cutoff_sug=$(tail -n+2 coatColor.assoc.adjusted | awk '$10>=0.05' | head -n1 | awk '{print $3}')
unad_cutoff_conf=$(tail -n+2 coatColor.assoc.adjusted | awk '$10>=0.01' | head -n1 | awk '{print $3}')


#R绘图
data=read.table("coatColor.assoc", header=TRUE); data=data[!is.na(data$P),]
bitmap("coatColor_man.bmp", width=20, height=10)
library(qqman)
png(“man.pdf”)
manhattan(data, p = "P", col = c("blue4", "orange3"),suggestiveline = 12,genomewideline = 15,chrlabs = c(1:38, "X"), annotateTop=TRUE, cex = 1.2);
dev.off();


最后的结果图和生成文件,是不是很简单呢?关注小果,下期将为大家带来更多使用生信技巧。

最后小果祝大家学业有成,事事顺心。

推荐阅读

GO的概念及用R做简单的富集分析

R语言ConsensusClusterPlus包无监督聚类

柱状图-肿瘤某一指标的比较和GSVA结果展示

看小果演示CIBETSORT、xcell两种常用的R语言包

小果教你三分钟看懂多条线共存的ROC图的R语言画法

相关推荐

Chrome OS 41 用 Freon 取代 X11_chrome os atom

在刚发布的ChromeOS41里,除了常规的Wi-Fi稳定性提升(几乎所有系统的changelog里都会包含这一项)、访客模式壁纸等之外,还存在底层改变。这一更新中Google移除...

苹果iPad Pro再曝光 有望今年六月发布

自进入2015年以后,有关大屏iPad的消息便一直不绝于耳,之前就有不少媒体猜想这款全新的平板电脑将会在三月发布,不过可惜的是我么只在那次发布会上看到了MacBookPro。近日@Ubuntu团队便...

雷卯针对香橙派Orange Pi 5 Max开发板防雷防静电方案

一、应用场景高端平板、边缘计算、人工智能、云计算、AR/VR、智能安防、智能家居、Linux桌面计算机、Linux网络服务器、Android平板、Android游戏机...

Ubuntu Server无法更新问题解决_ubuntu server not found

上周老家的一台运行UbuntuServer的盒子无法连接上了,中秋这两天回来打开,顺手更新一下发现更新报错。提示`E:Releasefileforhttps://mirrors.aliyun...

虚幻引擎5正式版发布:古墓丽影&巫师新作采用、新一代实时渲染

机器之心报道编辑:杜伟、陈萍虚幻引擎5的目标是「助力各种规模的团队在视觉领域和互动领域挑战极限,施展无限潜能」。...

AMD Milan-X双路霄龙7773X平台基准测试曝光 CPU缓存总量超1.5GB

OpenBenchmarking基准测试数据库刚刚曝光了AMDMilan-X双路霄龙7773X平台的跑分成绩,虽然很快就被撤下,但我们还是知晓了高达1.6GB的总CPU缓存。早些时...

ROS机器人建模_ros机器人硬件搭建

...

全网最新的Dify(1.7.2)私有化离线部署教程(ARM架构)

Hello,大家好!近期工作中有涉及到Dify私有化离线部署,特别是针对于一些国产设备。因此特别整理了该教程,实测有效!有需要的小伙伴可以参考下!本文主要针对Dify1.7.2最新版本+国产操作系...

在ubuntu下新建asp.net core项目_创建ubuntu

本文一步步讲述在ubuntu下用visualstudiocode创建asp.netcore项目的过程。step1:环境操作系统:virtualbox下安装的lubuntu。请不要开启“硬件...

在晶晨A311D2处理器上进行Linux硬件视频编码
在晶晨A311D2处理器上进行Linux硬件视频编码

在KhadasVIM4AmogicA311D2SBC上,我更多的时间是在使用Ubuntu22.04。它的总体性能还不错,只不过缺少3D图形加速和硬件视...

2025-08-26 17:22 haoteby

Nacos3.0重磅来袭!全面拥抱AI,单机及集群模式安装详细教程!

之前和大家分享过JDK17的多版本管理及详细安装过程,然后在项目升级完jdk17后又发现之前的注册和配置中心nacos又用不了,原因是之前的nacos1.3版本的,版本太老了,已经无法适配当前新的JD...

电影质量级渲染来了!虚幻引擎5.3正式发布:已开放下载

快科技9月8日消息,日前,Unrealengine正式发布了虚幻引擎5.3,带来了大量全方位的改进。...

2025如何选购办公电脑?极摩客mini主机英特尔系列选购指南

当下,迷你主机的性能越来越强,品类也越来越多。但是CPU是不变的,基本都是AMD和英特尔的。有一个小伙伴在评论区提问,我应该如何在众多机器中选购一台符合自己的迷你主机呢?那今天我们优先把我们的系列,分...

ubuntu 20.04+RTX4060 Ti+CUDA 11.7+cudnn

ububtu添加国内源sudocp/etc/apt/sources.list/etc/apt/sources.list.backupsudovim/etc/apt/sources.lis...

Linux Mint 18将重新基于Ubuntu 16.04 带来更好硬件支持

项目负责人ClementLefebvre在本月6日披露了关于LinuxMint18“Sarah”操作系统的大量信息,包括带来全新扁平化体验的Mint-Y主题。而现在,这款将于年底之前上线的操作...