联系我们

热点关注:  
放射性同位素 粒子加速器 辐照杀菌 无损检测 高新核材 辐射成像 放射诊疗 辐射育种 食品辐照保鲜 废水辐照 X射线 中广核技 中国同辐

伯克利实验室在自主发现方面取得了长足的进步,以应对数据泛滥

2021-08-09 15:39          粒子加速器伯克利实验室 二维码 联系我们

数据生产正在超过人类处理所述数据的能力。无论是巨大的射电望远镜、新的粒子加速器还是来自自动驾驶汽车的激光雷达数据,随着研究人员争先恐后地获取计算资源并开发算法以利用信息宝库,所产生的数据的庞大规模正日益导致大量未开发的数据存储。现在,劳伦斯伯克利国家实验室的研究人员在一个名为“自主发现”的领域取得了长足的进步,该领域使用算法有效地决定对人类参与程度较低的数据集进行哪些调查。
 
在过去几年中,自主发现变得越来越普遍。一种更突出的方法依赖于高斯过程回归,这是一种非常适合小数据集的贝叶斯方法,它通过检查一小部分数据并进行概率分类来实现自主发现。“与深度学习相比,随机过程可用于基于相对较小的数据集做出决策,并且它们提供了可以优化学习过程的不确定性估计,”CAMERA 的研究科学家、新论文的第一作者 Marcus Noack 说。 在接受伯克利实验室的 Kathy Kincade采访时。

伯克利实验室能源研究应用高级数学中心 (CAMERA) 的研究人员应用高斯过程回归开发了一种名为 gpCAM 的工具。在 CAMERA 中,研究人员一直在使用 gpCAM 进行同步加速器光束线实验——但最近,它的用途已扩展到其他领域。“越来越多的实验领域正在利用这种新的最佳和自主数据采集,因为归根结底,它总是关于近似某些函数,给定噪声数据,”Noack 说。

这些新领域之一是材料科学。伯克利实验室分子铸造厂的研究人员正在使用 gpCAM 来帮助了解薄膜半导体的特性。“利用人工智能和机器学习算法的纳米级应用,特别是用于扫描探针系统,已经引起了人们的兴趣……一段时间以来,”Foundry 的博士后研究员 John Thomas 说。“在 2020 年夏天,我们开始对使用高斯过程进行自主发现感兴趣。”

在其他地方,研究人员正在使用 gpCAM 来研究 DNA 自组装。哥伦比亚大学研究生研究员 Aaron Michelson 解释说:“在追求自组装功能材料方面,DNA 纳米技术在对大参数空间进行采样以进行合成方面的能力有限。” “这要么需要收集大量数据,要么需要更有效的实验解决方案。自主发现可以直接纳入挖掘大型数据集和指导新实验。这使研究人员能够避免盲目地制作更多样品,让我们坐在驾驶座上做出决定。”

而且,研究人员说,这仅仅是个开始,gpCAM 的应用范围从环境研究到药物发现。

“Noack 的工作和领导力汇集了一个广泛的、跨学科的协同设计社区,”CAMERA 主管、该论文的合著者 James Sethian 说。“这种科学社区建设是 CAMERA 尝试做的事情的核心。”


推荐阅读

阅读排行榜