您的位置:首页 >生活 >

高光谱数据和 DCGAN 的创新使用增强了大米蛋白质含量的估计

导读 水稻 (Oryza sativa L ) 是养活全球一半以上人口的重要作物。对优质、富含蛋白质的大米的需求正在增加,因此准确估算谷物蛋白质含量 (

水稻 (Oryza sativa L.) 是养活全球一半以上人口的重要作物。对优质、富含蛋白质的大米的需求正在增加,因此准确估算谷物蛋白质含量 (GPC) 对于培育优良品种至关重要。

尽管 GWAS 等基因组学工具取得了进展,但传统的表型分析仍然需要大量劳动力且成本高昂,从而造成了瓶颈。光学和光谱成像领域的最新发展提供了高通量表型分析解决方案。然而,小型且不平衡的数据集限制了模型的性能和泛化。

《植物表型学》上发表的一项研究旨在通过使用 DCGAN 生成模拟数据、提高 GPC 模型准确性并探索基因解剖潜力来解决这些问题。

该研究利用高光谱数据和 DCGAN 改进了水稻 GPC 的估算。原始和归一化光谱数据揭示了对 GPC 分析至关重要的不同吸收特征。DCGAN 在 8,000 个时期后生成的模拟数据与测量数据非常接近,提高了模型准确性。

使用这些特征的偏最小二乘回归 (PLSR) 模型实现了较高的验证准确率 (R 2 = 0.58, RRMSE = 6.70%)。

此外,使用模拟数据进行全基因组关联研究(GWAS) 分析发现了显著的 SNP,包括与谷物储存蛋白相关的 OsmtSSB1L 基因。

这种方法展示了高泛化 GPC 模型的潜力,促进了水稻品种的高级遗传分析和育种。

该研究首席研究员郑恒彪介绍说:“这项研究为基于高光谱技术进行水稻表型性状的高效遗传研究提供了一种新技术。”

展望未来,在不同生态地点和更广泛的数据集上的进一步改进和验证将增强该方法的稳健性和适用性,为更精准、更有效地培育优质水稻品种铺平道路。

免责声明:本文由用户上传,如有侵权请联系删除!