电脑桌面
添加文秘网到电脑桌面
安装后可以在桌面快捷访问

基于基因组和系谱信息的不同选配方案效果模拟研究

栏目:毕业论文发布:2022-11-02浏览:2911下载263次收藏

张鹏飞,何 俊,王立贤*,赵福平*

(1.中国农业科学院北京畜牧兽医研究所 农业部动物遗传育种与繁殖(家禽)重点实验室,北京 100193; 2.湖南农业大学动物科技学院,长沙 410128)

在基因组选配提出之前,主要是利用系谱信息进行优化的选种选配,如最佳遗传贡献选择(optimal contribution selection,ocs),是将选择反应和近交组合成候选亲本遗传贡献的函数,以平衡遗传进展、近交和共祖系数。最佳遗传贡献选择在动物育种中应用较多,用以改良近交水平较高的群体。最佳遗传贡献选择理论提出后被不断改进,并且加入一些额外的约束条件进行优化,其中包括有最小共祖选配(minimum coancestry,mc)和最小化祖先间遗传贡献的协方差(minimising the covariance between ancestral contributions,mcac)。通过增加具有遗传贡献祖先的独立性和降低它们之间的混乱性来实现低近亲繁殖率,分散了它们在育种种群中的贡献,从而增加了每个后代具有贡献的祖先数量。这使得祖先更接近确切的阈值线性关系,从而降低近亲繁殖率。kinghorn等使用配偶选择来最大化预测后代的价值。配偶选择包括两个组成部分:1)配偶选择指数(msi);2)用于寻找最大化msi的配偶集合的配偶选择算法。这些策略被称为前瞻性配偶选择(look ahead mate selection,lams)。

基因组选配充分地利用基因组信息来计算亲本间的遗传关系,并结合标记效应来决定哪些基因组合来获得下一个优秀的育种群体。基因组选配可以控制群体近交的增长速率,维持遗传多样性,同时实现长期且可持续的遗传进展。然而基因组选配是对群体中所有个体进行选配,找到最优的交配组合,这与实际的育种工作有点相悖。因此,本研究将通过计算机模拟在选择gebv排名靠前的最优秀的个体后,比较不同的选配方案下后代群体的遗传进展、近交系数、遗传方差的变化情况,评估基因组选配的效果,以期为在畜禽育种中开展基因组选配提供参考。

1 材料与方法1.1 基础群个体数据的模拟

表1 基因组参数设置table 1 genome parameter settings

1.2 gebv估计及其个体选留

本研究使用bayesb方法计算基因组估计育种值(gebv)。将基础群中具有表型值和基因型的9 000头个体作为参考群,使用r语言软件包bglr计算标记效应,bayes模型参数设定迭代次数为20 000次,预烧(burn-in)为1 000次,并将公畜和母畜根据gebv高低进行排序,选出gebv排名前30头公猪、900头母猪作为种用个体繁育下一代。

在每个世代中,都采用上述方案选留个体。将每个世代中有表型和基因型的个体加入到参考群中,用于参考群的更新,并且每个世代重新估计标记效应。

1.3 基因组选配

本研究在基因组选配的目标函数中考虑遗传进展、近交系数和家系间方差来优化选配,遗传进展和近交系数的具体计算公式如下:

其中,为nc×n的交配矩阵,n为亲本的个数,nc为后代的数量;为基因组关系矩阵;为孟德尔抽样离差;为基因型矩阵。

使用r包trainsel进行基因组选配。基因组关系矩阵(genomic relationships matrix,)使用vanraden文章中的公式计算,通过r包rrblup完成。参数设置:公畜30,母畜900,交配组合数设置为900,遗传算法参数中群体大小设置为200,迭代次数设置为800,其余参数设为默认值。

1.4 传统选配方式

1.4.1 随机交配 对选留的个体以随机交配的原则进行交配。

1.4.2 同质选配 根据个体的gebv大小进行排序,将公畜按照降序的顺序与按照降序排序的母畜依次进行交配,每头公畜配30个母畜。

1.4.3 异质交配 根据个体的gebv大小进行排序,将公畜按照升序的顺序与按照降序排序的母畜依次进行交配,每头公畜配30头母畜。

1.5 后代基因型、育种值和表型模拟

1.5.2 后代个体育种值和表型值的模拟 个体真实育种值用以下模型模拟:

其中,是个体的近交系数,是个体的父亲到共同祖先的相关通径链的数量,是共同祖先a的近交系数。

个体性状表型值用以下模型模拟:

=++

以上过程通过r语言自写程序实现。

1.6 评估标准

1.6.1 遗传进展的计算 每个世代的遗传进展计算公式如下:

1.6.2 近交系数的计算 本研究计算了2种近交系数,第一种是由wright提出的系谱近交系数(),其计算公式:

其中,是个体的近交系数,是个体的父亲到共同祖先的相关通径链的数量,是共同祖先的近交系数。

第二种,基于snps估计的近交系数(),其计算公式:

其中,是snp的数量,是等位基因频率,是第个snp的拷贝数。

近交系数每世代增长量(Δ)计算公式:

Δ=1-

其中β是ln(1-)在世代的线性回归的斜率,是在世代出生的动物的平均近交系数。

1.6.3 后代遗传方差的计算 本研究将每个世代9 000头个体的基因组估计育种值(gebv)的方差作为群体的遗传方差。计算公式:

1.7 模拟试验

本研究假设世代间不重叠,每个世代群体规模设置为9 000。每个世代选出gebv排名前30个公畜和前900个母畜作为种用个体繁育下一代,后代数设置为10,具体过程见图1。每种方案模拟选育5个世代,并计算每代群体的平均gebv、遗传进展、近交系数以及遗传方差,重复5次取平均值,并且在每个世代对不同选配方案的平均gebv、近交系数以及遗传方差进行t检验。

图1 模拟试验技术路线fig.1 technical schematic of simulation study

本研究在linux系统下通过调用r统计编程语言编写完成的所有数据模拟和计算的脚本实现,linux服务器配置为40核2.40 ghz intel(r) xeon(r) gold 6148的处理器和768 gb内存。

2 结 果2.1 基因组选配方案的确定标准

本研究采用遗传进展、近交和家系间方差3个因素对选择效果进行评估,三者之间并不是独立的,而是彼此间相互牵制。trainsel通过对这3个指标进行优化权衡后会得出一系列帕累托最优解(pareto optimality),通过三维图可以表示(图2)。图中的每一个点都对应着该3个指标下的一组交配组合,在没有其他限定条件下,图上的曲面上所有的点都可以作为一个交配方案。本研究根据这3个指标指定的不同交配方案,在每个世代分别选取遗传进展最大的交配方案、家系间方差最大的交配方案、近交最小的交配方案进行连续5个世代的选育。

图2 基因组选配计算得到的最优解fig.2 the optimal solution of genomic mating

2.2 遗传趋势和平均每世代的遗传进展

图3比较了6种方案在5个世代中的遗传趋势。基因组选配中选取遗传进展最大的方案在每个世代的平均gebv均极显著高于随机交配和异质选配(

基于基因组和系谱信息的不同选配方案效果模拟研究

点击下载
分享:
热门文章
    热门标签
    确认删除?
    QQ
    • QQ点击这里给我发消息
    回到顶部