打破
周四

新数据科学工具大幅加速我们环境的分子分析

由加州大学河滨分校的科学家领导的研究团队开发了一种用于分析代谢组学领域大数据集的计算工作流程,代谢组学是研究细胞、生物体液、组织和整个生态系统中发现的小分子。最近,团队将这一新的计算工具应用于分析南加州海水中的污染物。他们迅速捕捉到了沿海环境的化学特征,并突出了潜在的污染源。“我们对了解这些污染物如何进入生态系统感兴趣,”领导研究团队的加州大学河滨分校生物化学助理教授Daniel Petras说。

“弄清楚海洋中哪些分子对环境健康重要并不简单,因为海洋的化学多样性极其庞大。我们开发的协议极大地加速了这一过程。更高效的数据排序意味着我们可以更快地理解与海洋污染相关的问题。”Petras和他的同事在《自然协议》杂志上报告称,他们的协议不仅为有经验的研究人员设计,也用于教育目的,使它成为学生和早期职业科学家的理想资源。

这个计算工作流程配有一个易于访问的带图形用户界面的网络应用,使非专业人士也能在几分钟内获得统计数据的见解。“这款工具对广泛的研究人员从绝对初学者到专家来说都很容易访问,并且专为与我的团队正在开发的分子网络软件一起使用而设计,”共同作者、加州大学河滨分校计算机科学与工程助理教授Mingxun Wang说。“对于初学者,我们提供的指南和代码使理解常见的数据处理和分析步骤更加容易。

对于专家,它加速了可重复的数据分析,使他们能够共享他们的统计数据分析流程和结果。”Petras解释说,这篇研究论文是独特的,通过一个名为Virtual Multiomics Lab (虚拟多组学实验室, VMOL)的虚拟研究小组组织成一个大型教育资源。来自世界各地的50多位科学家参与了VMOL,这是一个社区驱动的开放获取社区。

它旨在简化和民主化化学分析过程,使其无论背景或资源如何都能让全球研究人员访问。“看到这个项目演变成一个影响深远的项目,涉及来自世界各地的专家和学生,我感到非常自豪,”Petras组的博士生也是论文的第一作者Abzer Pakkir Shah说。“通过消除物理和经济障碍,VMOL提供了计算质谱和数据科学培训,并旨在将虚拟研究项目作为一种新的合作科学形式启动。”团队开发的所有软件都是免费且公开的。

软件开发始于2022年在图宾根大学举办的非靶向代谢组学暑期学校期间,那时团队也启动了VMOL。Petras预计,该协议将特别对环境研究人员、在生物医学领域工作的科学家以及进行微生物组科学临床研究的研究人员有用。他说:“我们的协议的多功能性延伸到包括组合化学、兴奋剂分析、食品、药品和其他工业产品的痕量污染在内的广泛领域和样本类型。”