最近一项研究表明, 深度卷积神经网络能够大幅提高PandaX-III实验中无中微子双贝塔信号和本底的区分效率, 从而提高探测灵敏度, 《中国科学: 物理 力学 天文学》英文版2018年第10期报告了这一结果。未识别的网络-
来自上海交通大学和北京大学的研究者利用了深度卷积神经网络技术来区分不同粒子在气体探测器中的径迹特征, 大幅提高了分辨效率, 该研究可以应用在PandaX-III无中微子双贝塔衰变实验当中, 以提高探测灵敏度, 有利于增进我们对于中微子本质的理解。
这项研究题为Signal-background discrimination with convolutional neural networks in the PandaX-III experiment using MC simulation, 发表于《中国科学: 物理学 力学 天文学》英文版2018年第10期上, 北京大学的硕士研究生乔颢为论文第一作者。
双贝塔衰变是自然界里已被确认的现象, 该过程会产生两个电子和两个中微子。而没有中微子产生的双贝塔衰变过程, 即所谓的“无中微子双贝塔衰变”则与中微子的本性直接相关, 还尚未在实验中被观测到。只有中微子是其本身的反粒子、也就是马约拉纳费米子的情况下, 无中微子双贝塔衰变才可能发生。科学家认为, 寻找无中微子双贝塔衰变, 从而确认中微子是否是马约拉纳费米子是理解我们宇宙里面正反物质不对称性的关键之一。未识别的网络
由于无中微双贝塔衰变过程属于极端稀有的物理过程, 只有特别设计的实验仪器才可能在大量本底当中找到这个过程的可能信号。PandaX-III实验计划利用高压气氙时间投影室技术来寻找氙-136同位素的无中微子双贝塔衰变过程。这种探测技术不仅能够记录该过程产生的电子的能量, 还能对其在探测器内的运动径迹“拍照”, 得到它们在与漂移方向平行的两个相互垂直平面上的投影, 从而通过径迹的特征更好地将其与放射性本底的信号进行区分。但是由于径迹由随机过程生成的漂移电子信号来生成, 其随机性使得定义和寻找其运动径迹的特征变量变得相当困难。图1给出了一个模拟得到的无中微子衰变事例在探测器中的径迹。未识别的网络
研究合作者, 北京大学的王思广副教授说: “目前传统的拓扑识别方法仅仅使用了两个定义的特征, 看上去还有很大潜力可挖, 但是很难。”未识别的网络
另一方面, 基于卷积神经网络的图像识别技术近年来取得了巨大进步。这让这项研究的合作者们联想到类似的技术可以应用在不同类型信号径迹的识别上。论文的通讯作者, 上海交通大学的谌勋助理研究员认为这可能取得比传统方法更好的结果。
研究者在计算机内构建了PandaX-III探测器的细致结构, 使用蒙特卡洛技术生成了信号及本底事例探测器中的模拟数据。他们将这些数据转化成为图片, 探测器所得到的两个不同的快照被编码到图片的不同颜色通道上。
“在把事例转换为图片的时候, 你需要同时考虑探测器真实接收到的信号的时间和空间分布, 并进行截断, 因为能够作为神经网络的输入图片大小是有限的。”乔颢说。未识别的网络
研究者生成了56万张无中微子双贝塔衰变的事例图片和56万张高能伽马本底的事例图片数据, 并利用了其中80%的图片来训练卷积神经网络模型。
研究合作者, 上海交通大学本科生陆纯钰表示: “我们从一个最简单的三层卷积模型开始, 逐渐采用了更加复杂的模型, 最后选择了ResNet50模型。”
最终训练好的模型的信号本底的分辨能力相当优异, 从图2可以看出, 训练好的模型能够在足够高的本底排除效率情况下保持足够好的信号识别效率。其相对于PandaX-III实验设计的信号本底基准分辨能力提高了62%。这意味着PandaX-III实验对无中微子衰变过程的探测灵敏度也会有相应的巨大提升。未识别的网络
研究合作者, 上海交通大学的韩柯特别研究员评论说: “深度卷积神经网络技术让PandaX-III的径迹识别技术在类似的实验里面脱颖而出, 更有吸引力。”未识别的网络-