利用自动编码器和SNP标记进行开创性植物表型分析
全基因组测序的进步彻底改变了植物物种表征,提供了大量的基因型数据进行分析。基因组选择和神经网络(尤其是深度学习和自动编码器)的结合已成为从这些数据预测复杂性状的一种有前景的方法。尽管在植物表型分析等应用中取得了成功,但将图像中的视觉信息准确转化为基因组研究的可测量数据仍然存在挑战。
2023年11月,PlantPhenomics 发表了题为“ GenoDrawing: An Autoencoder Framework for Image Prediction from SNP Markers ”的研究文章。
该研究引入了一种创新方法,使用自动编码器网络和嵌入预测器将苹果图像简化为 64 维,并根据分子数据 (SNP) 预测水果形状。这种方法称为 GenoDrawing,涉及使用大型苹果图像数据集来训练自动编码器。然后使用生成的嵌入以及 SNP 数据来预测和重建苹果形状。该方法表明,在预测图像嵌入方面,目标 SNP (tSNP) 始终优于随机选择的 SNP (rSNP),从而可以更准确地预测水果形状。与 rSNP 相比,使用 tSNP 的最佳模型实现了较低的平均绝对误差 (MAE),并且生成的分布更接近原始数据。此外,基于 tSNP 的版本预测了更广泛的水果形状,证明了其在捕捉苹果表型多样性方面的有效性。然而,该研究也暴露出局限性,包括该模型无法准确捕捉某些水果特征以及环境因素对苹果表型的影响。尽管存在这些挑战,该方法代表了基因组预测的重大进步,展示了将图像分析与分子数据相结合以理解作物复杂性状的潜力。
总之,研究结果表明,选择相关的 SNP 对于准确预测至关重要,并且当给予适当的标记时,GenoDrawing 可以有效地学习预测水果形状。这项研究为未来的研究奠定了基础,旨在通过整合图像数据和改进 SNP 选择策略来提高基因组预测模型的准确性和适用性。
版权声明:本文由用户上传,如有侵权请联系删除!