布里斯托大学的专家已经发现了使用以数据为中心的方法设计生物学所带来的危害,目的是使未来的研究更加安全。
以数据为中心的方法在合成生物学中可能被滥用,这会带来巨大风险。数据科学工具的易用性可能会让不法分子开发有害生物制剂,用于生物恐怖主义等目的或故意破坏生态系统。
该研究结果发表在《合成生物学》杂志上,建议增加数据危害标签来描述合成生物学领域的数据相关风险。
源数据准确性不确定——基础数据的准确性未知,因此其使用可能会导致错误结果或引入偏差。
源数据的完整性不确定——基础数据的完整性不确定,并且缺少值,从而导致结果出现偏差。
不兼容数据的集成——不同类型和/或来源的数据一起被使用,并且可能彼此不兼容。
可能造成生态危害——即使使用得当,该技术也有可能造成广泛的生态危害。
潜在的实验危险——将技术转化为实验实践可能需要采取安全预防措施。
这项工作是布里斯托尔工程生物学中心 (BrisEngBio) 和 Jean Golding 数据密集型研究所研究人员合作的成果。
论文合著者、工程数学与技术学院细胞建模人工智能专业的博士生 Kieren Sharma 表示:“我们正在进入一个变革时代,人工智能和合成生物学融合,彻底改变生物工程,加速新型化合物的发现,从救命的药物到可持续生物燃料。
“我们的研究发现了用于训练最新系统生物学模型的特定类型数据的潜在风险。例如,复杂且动态的生物体测量结果不一致以及隐私问题可能会危及基于人类基因组数据训练的下一代模型的安全性。”
该项目扩展了数据危害项目的工作,该项目旨在创建一份关于数据科学研究潜在危害的清晰词汇表。
数据危害项目的共同作者兼联合负责人、心理科学学院的尼娜·迪卡拉博士解释说:“拥有清晰的危害词汇表可以让研究人员更容易主动思考他们的工作风险是什么,并帮助采取缓解措施。这也使跨领域工作的人们更容易沟通,他们有时使用不同的语言来谈论相同的问题。”
为了获得这些清晰的词汇,跨学科合作至关重要。
吉恩·戈尔丁研究所所长、数学学院数据科学副教授丹尼尔·劳森博士指出:“随着数据集的规模和规模不断增长,人们开发出越来越复杂的算法来获得新的见解。这种复杂性使得采用非孤立的协作方法来识别和防止下游危害变得至关重要。”
生物科学学院生物工程副教授、资深作者 Thomas Gorochowski 博士补充道:“数据科学将彻底改变我们设计生物学的方式,利用其独特的能力来应对包括材料可持续生产在内的全球挑战,并推动创新疗法的发展。
“我们团队开发的扩展将帮助生物工程师考虑和讨论以数据为中心的研究方法的风险,并有助于确保以安全的方式实现生物基解决方案的巨大优势。”