研究论文

基于MobileNetV3的核素能谱快速识别方法

  • 欧开发 , 1 ,
  • 周书民 2 ,
  • 陈锐 2
展开
  • 1 东华理工大学信息工程学院,江西 南昌 330013
  • 2 东华理工大学 江西省新能源工艺及装备工程技术研究中心,江西 南昌 330013

欧开发,男,1997年生,硕士研究生,主要从事核数据处理与计算机视觉的研究。E-mail:

收稿日期: 2025-01-13

  修回日期: 2025-01-24

  网络出版日期: 2025-11-07

基金资助

国家自然科学基金项目(12165001)

A rapid identification method for nuclide spectra based on MobileNetV3

  • Kaifa OU , 1 ,
  • Shumin ZHOU 2 ,
  • Rui CHEN 2
Expand
  • 1 School of Information Engineering,East China University of Technology,Nanchang 330013,China
  • 2 Jiangxi Engineering Research Center of Process and Equipment for New Energy,East China University of Technology,Nanchang 330013,China

OU Kaifa,male,born in 1997,master,focusing on nuclear data processing and computer vision. E-mail:

Received date: 2025-01-13

  Revised date: 2025-01-24

  Online published: 2025-11-07

Supported by

National Natural Science Foundation of China(12165001)

(12165001)

摘要

放射性核素的快速识别是核材料检测系统的关键组成部分,对于提高放射性检测的性能和效率至关重要。然而,传统的核素能谱识别方法通常需要经历去噪、本底扣除和特征提取等多个复杂步骤,这些过程计算复杂度高、耗时较长且识别效率有限,难以满足实际应用中的快速响应需求。针对这些问题,提出一种基于MobileNetV3神经网络的核素能谱快速识别算法,通过改进数据处理与模型训练方法,实现对核素的高效识别。利用蒙特卡罗(MCNP)模拟软件生成一系列仿真数据,包括不同放射源及粒子数、NaI探测器与放射源的距离,以及混合核素场景下的能谱数据。这些多样化的数据用于训练和验证网络模型,增强模型的泛化能力。为更有效地处理γ能谱中的全能峰特性,设计一种基于滑动窗口的预处理方法,将一维能谱数据逐道进行变换。随后,采用希尔伯特曲线对经过滑动窗口处理的能谱数据进行二维映射,将其转换为灰度图像形式输入到MobileNetV3模型中进行训练和预测。实验结果表明,构建的神经网络模型在快速处理滑动窗口后的能谱数据方面表现优异,能够在高效学习的同时实现对不同核素的高精度识别。在模型性能方面,选用滑动窗口大小为23和25时,模型不仅收敛速度更快,还显著提高识别的准确率。

本文引用格式

欧开发 , 周书民 , 陈锐 . 基于MobileNetV3的核素能谱快速识别方法[J]. 世界核地质科学, 2025 , 42(1) : 203 -210 . DOI: 10.3969/j.issn.1672-0636.2025.01.018

Abstract

The rapid identification of radionuclides is a critical component of nuclear material detection systems,essential for improving the performance and efficiency of radiation detection. Traditional nuclide spectrum recognition methods typically involve multiple complex steps,such as noise reduction,background subtraction,and feature extraction,which are computationally intensive,time-consuming,and inefficient,making them unsuitable for rapid response in practical applications. To address these issues,this paper proposed a rapid nuclide spectrum recognition algorithm based on the MobileNetV3 neural network,which achieved efficient nuclide recognition by optimizing data processing and model training methods. A series of simulated datasets were generated using Monte Carlo (MCNP) simulation software,including scenarios with different radioactive sources and particle counts,varying distances between NaI detectors and the sources,and mixed nuclide environments. These diverse datasets were used to train and validate the network model,enhancing its generalization capability. To better process the full-energy peak characteristics of gamma spectra,this study designs a preprocessing method based on a sliding window approach,which incrementally transforms one-dimensional spectral data. Subsequently,the transformed spectral data is mapped into two-dimensional grayscale images using Hilbert curves and input into the MobileNetV3 model for training and prediction. Experimental results demonstrate that the proposed neural network model performs exceptionally well in rapidly processing spectrum data handled by the sliding window method,achieving high-precision recognition of different nuclides while maintaining efficient learning. In terms of model performance,using sliding window sizes of 23 and 25 results in faster convergence and significantly improved recognition accuracy. This study highlights the effectiveness of integrating deep learning with nuclide spectral characteristics,providing a novel and efficient solution for nuclear material detection systems.

核素识别在地质矿石核元素分析、公共卫生和安全设施检测等领域具有广泛的应用。核素识别主要通过测量和分析γ能谱信息来确定核素种类。传统的核素识别通常基于γ能谱中的全能峰与核素库匹配来确定所含核素。相关的研究方法包括几何建模[1]、二阶导数拟合法[2]和Boosted-Gold算法[3][4-5]。然而,这些传统方法需要经过本底扣除、数据平滑、归一化、能量刻度和漂移矫正等多个步骤,处理过程繁琐且计算复杂,耗费时间较长。此外,在低计数率条件下,光谱的波动性也使得放射性核素的识别变得更加困难。
随着人工智能技术的不断发展,全连接神经网络、卷积神经网络和生成对抗网络等在图像分类和目标检测等领域取得显著的成果,逐渐被应用于γ能谱的自动识别中。部分研究人员[6-13]将神经网络用于核素识别,并取得了良好的识别结果。与依赖先验知识、人工构造并提取特征的传统模式分类方法不同,卷积神经网络能够自适应地提取原始数据深层次的特征描述。其独有的局部感受野和权值共享机制不仅能够简化模型结构,还能更加灵活地进行特征提取,无需人工干涉。基于深度学习的γ能谱识别方法通过多层神经网络对能谱进行端到端的训练,能够自动提取不同物质的特征信息,并在较复杂的背景中依然保持较高的识别准确率。
本文通过MCNP软件模拟核素能谱数据,并基于MobileNetV3[14]神经网络搭建用于核素识别的模型训练及测试样本数据。根据核素能谱的特性,本文提出基于滑动窗口的数据预处理变换方法逐道处理一维核素能谱来增强凸显特征峰,并利用希尔伯特曲线将变换后的一维能谱数据映射到二维空间转变成灰度图像输入到网络模型中训练识别。本文提出的基于MobileNetV3的核素能谱快速识别方法充分利用滑动窗口与希尔伯特曲线的优势,通过优化数据处理与模型训练策略,实现对核素能谱的快速、准确识别。这一研究为解决核素检测中高效识别的问题提供技术支撑,同时为基于深度学习的放射性检测系统开发提供新思路。

1 能谱数据预处理

1.1 滑动窗口

γ能谱中存在不同的全能峰,由于探测器能量分辨率以及电离过程中统计涨落等原因,全能峰存在一定的展宽。在能谱数据中,不同道址上的计数差异较大,高计数的全能峰可能会掩盖低计数的全能峰。为了提高模型的收敛速度和鲁棒性,本文提出了一种基于滑动窗口的变换方法。该方法通过在能谱数据中的当前道址上,根据窗口范围内的数值进行数据变换,有效保留全能峰的特征,并凸显出原本容易被湮灭的低计数全能峰。具体而言,滑动窗口的数学表达式如公式(1)所示:
y i = d a t a i - i - s i z e i - 1 d a t a l + i + 1 i + s i z e d a t a r 2 × s i z e
式(1)中:datai—能谱数据中第i道数据;size—窗口大小1/2向下取整;dataldatai左侧[i-size, i-1]范围内的数据值;datardatai右侧[i+1,i+size]范围内的数据值;yi—第i道上变换后的值,窗口大小设置为奇数。
图1展示了在原始γ能谱数据50~400道址数值,图2为经过滑动窗口处理后的γ能谱数据。可以看到,原始能谱数据中存在的高计数全能峰往往会掩盖附近的低计数全能峰,而经过滑动窗口变换后,这些低计数的全能峰被凸显出来。
图1 原始能谱部分道址

Fig. 1 Partial channels of the original spectrum

图2 滑动窗口变换后的能谱

Fig. 2 The spectrum after the sliding window transformation

1.2 希尔伯特曲线

希尔伯特曲线(Hilbert)是由数学家David Hibert提出,主要用于解决如何将一个一维空间映射到二维空间的问题,是一种在平面上填充空间的连续曲线。与其他空间变换不同,它的输出序列总是收敛的。由于Hilbert编码是连续的且没有断点,其空间排列具有良好的聚集性能,Hilbert曲线上相邻的点,在原始一维空间上一定是相邻的。LIANG等人[15]的研究表明,经过希尔伯特曲线映射后的数据输入到网络模型中时,模型的损失函数收敛速度更快,且收敛于更小的值。
图3所示,长度为64的一维数据通过希尔伯特曲线变换为8×8的二维矩阵的编码顺序。图4展示1 024道的能谱数据经过滑动窗口处理后,利用希尔伯特曲线映射为二维图像的结果。变换后的图像很好地保留了能谱数据中的空间相关性,确保数据结构在转换后的二维空间中的完整性。
图3 8×8 Hilbert曲线

Fig. 3 8×8 Hilbert curve

图4 60Co灰度图像

Fig. 4 60Co grayscale image

2 基于MobileNetV3神经网络对能谱核素的识别

2.1 数据集构建

卷积神经网络的训练需要大量的数据,由于实验获取的数据数量不足以支撑神经网络的训练,故需要采用模拟的方法构建数据集。本文采用MCNP软件,基于蒙特卡洛方法生成γ能谱。MCNP是一个广泛应用的计算机模拟代码,用于进行蒙特卡罗方法的粒子输运计算,特别是在核工程、辐射防护、医学物理、核反应堆设计、辐射源建模和放射性废物处理等领域,用于模拟中子、γ射线、电子等粒子的传播和相互作用,其允许用户编写MCNP的输入文件,其中包括问题的几何结构、粒子源定义、材料属性、物理过程和计算设置等内容。
模拟设置不同点源(40K、60Co、133Ba、137Cs和152Eu)、不同粒子数、点源与NaI探测器不同距离,以及不同点源的组合共15个类别,核素能谱为1 024道,为了增强神经网络模型的泛化能力,将经过本底扣除的实测能谱数据混入模拟的数据当中,共形成18 030组数据。将获取的数据按照上文提到的滑动窗口以及希尔伯特曲线变换方法进行预处理,将处理后的数据按照7∶2∶1的比例将数据集中的每个类别随机划分到训练集、验证集和测试集中。

2.2 MobileNetV3核素识别

MobileNetV3是一种高效的卷积神经网络架构,主要用于移动设备和嵌入式设备上运行深度学习模型。它在前两个版本(MobileNetV1[16]和MobileNetV2[17])的基础上进行了改进,通过结合神经架构搜索(Neural Architecture Search,简称NAS)和人工设计,进一步优化性能和效率,在计算量和精度之间实现较好的平衡。MobileNetV3继承MobileNetV2中的倒置残差结构(Inverted Residual Block)和线性瓶颈(Linear Bottleneck)的设计,通过将信息流传递给瓶颈层以减少冗余计算,进一步提升效率。
MobileNetV3在某些块中加入Squeeze-and-Excitation(SE)模块,如图5所示,其核心思想是通过学习每个通道的权重,自适应地调整特征通道的重要性,增强关键特征的表达,抑制无关特征,从而增强通道间的特征表示能力以及提升神经网络的表达能力。其中Squeeze为在每个通道特征(H*W)上进行全局平局池化,将一个通道上的特征压缩成1个实数,Excitation为每个通道生成一个权重值,Scale将每个通道得到的权重值加权到每个通道特征上。
图5 SE模块

Fig. 5 SE module

MobileNetV3使用基于硬件友好的激活函数h-swish(Hard Swish)[14]替代部分Swish激活函数。它在保持Swish激活函数优良性能的同时显著降低计算复杂度,从而计算效率更高,但性能相似,因此非常适合资源受限的设备。具体如公式(2):
h - s w i s h x = x R e L U 6 ( x + 3 ) 6
其中ReLU6[16]是ReLU函数的一个变体,具体如公式(3):
R e L U 6 x = m i n   ( m a x 0 , x , 6 )
MobileNetV3神经网络提供两种模型结构,分别为MobileNetV3-Large和MobileNetV3-Small,适合不同的计算资源和任务需要。考虑到模型的计算效率以及能谱灰度图像的特点,本文基于MobileNetV3-Small搭建核素识别模型。
标准的MobileNetV3-Small网络模型输入图片大小为224×224,降采样次数为5次后特征图为7×7大小。而本文使用的能谱灰度图片大小为32×32,经过5次降采样后特征图为1×1大小,所有空间维度的信息被聚合为一个点,这意味着原始输入的空间结构几乎完全丢失,因此将降采样次数减少一次为4次,特征图变为2×2大小。其次,在原始MobileNetV3-Small的网络结构中,部分卷积核大小为5×5,而本文小尺寸灰度图片经过多次降采样后的大小会小于卷积核,导致卷积操作无意义且计算资源浪费严重,因此本文将其中大小为5×5的卷积核替换为大小为3×3的卷积核,提高计算效率。
具体的MobileNetV3核素识别模型如表1所示。其中,Input表示输入特征图的空间维度(Heigh×Width×Channels),bneck是网络的核心模块倒置残差模块(Inverted Residual Block,简称bneck),Operator表示当前模块或层执行的操作类型,exp size表示通道扩展的大小,也就是瓶颈模块中输入通道数经过扩展后的通道数,#out表示当前模块的输出通道数,SE表示该层是否使用SE模块(通道注意力机制),NL表示激活函数的类型,s表示卷积操作的步幅(stride),即在特征图上移动卷积核的步长。
表1 MobileNetV3网络模型

Table 1 MobileNetV3 network model

Input Operator exp size #out SE NL s
322×1 conv2d,3×3 - 16 - HS 2
162×16 bneck,3×3 72 24 - RE 2
82×24 bneck,3×3 72 24 RE 1
82×24 bneck,3×3 120 48 HS 2
42×48 bneck,3×3 144 48 HS 1
42×48 bneck,3×3 288 96 HS 2
22×96 bneck,1×1 576 96 HS 1
22×96 bneck,1×1 576 96 HS 1
22×96 conv2d,1×1 - 576 HS 1
22×576 pool,2×2 - - - - 1
12×576 conv2d,1×1,BN - 1 024 - HS 1
12×1 024 conv2d,1×1,BN - k - - 1

注:-—未使用;√—使用;k—类别数;RE—表示ReLU激活函数;HS—h-swish激活函数。

2.3 评价指标

对于多分类任务评价指标,本研究使用针对多分类的精度(Macro-P)、召回率(Macro-R)和F1值(Macro-F1)。评价指标及计算公式如表2所示。
表2 评价指标

Table 2 Multiple classification evaluation indicators

指标名称 计算公式
Macro-P Macro-P=n-1·∑Pi(i=1,2,…,n)
Macro-R Macro-R=n-1·∑Ri(i=1,2,…,n)
Macro-F1 Macro-F1=(2×Macro-P×Macro-R)/(Macro-P+Macro-R)

注:n—类别数。

其中Pi为第i类中,神经网络模型预测为正例(Positive)的所有数据中,实际为正例的数据所占比例。Ri为在第i类中,所有实际为正例的数据中,神经网络模型成功预测为正例的比例。F1值是精度和召回率的调和平均值,是一个综合评价指标,用于权衡精度和召回率之间的关系。

3 实验

本实验使用Pytorch深度学习框架,基于Python3.8搭建神经网络模型。计算机硬件配置CPU:Core(TM) i5-12600KF @3.7GHz,GPU:NVIDIA GeForceRTX 3060Ti G6X,RAM:32GB。
本研究分别选取滑动窗口大小为11、13、15、17、19、21、23、25、27和29共10种尺寸,对一维能谱分别进行数据变换,形成10组训练集、验证集和测试集。将滑动窗口大小作为网络模型训练中的超参数之一,通过调整超参数来训练并获取最优模型。
图6展示网络模型在部分训练集中使用不同滑动窗口大小进行训练时的性能表现。由图6可见,当滑动窗口大小设置为23和25时,模型的收敛速度相对较快,且评价指标的波动较小,表现出较为稳定的训练过程。图7显示网络模型在部分验证集中使用不同滑动窗口大小进行验证时的性能表现,而表3则汇总各组模型在验证集上取得的最佳权重对应的评价指标结果。由图7表3可知,当滑动窗口大小为23和25时,模型的性能表现最佳,并在验证集上展现出良好的泛化能力。在达到最佳权重时,Macro-P、Macro-R和Macro-F1均达到了99.8 %。
图6 不同大小的滑动窗口在训练集上的评价指标结果

Fig. 6 Evaluation index results of sliding windows of different sizes on training sets

a—Macro-P;b—Macro-R;c—Macro-F1。

图7 不同大小的滑动窗口在验证集上的评价指标结果

Fig. 7 Evaluation index results of sliding windows of different sizes on verification sets

a—Macro-P;b—Macro-R;c—Macro-F1。

表3 不同大小的滑动窗口在验证集上的最优评价指标结果

Table 3 Different sizes of sliding windows in the verification set of optimal evaluation index results

窗口大小 11 13 15 17 19 21 23 25 27 29
Macro-P 0.983 0.987 0.993 0.991 0.984 0.995 0.998 0.998 0.996 0.995
Macro-R 0.983 0.987 0.993 0.991 0.984 0.995 0.998 0.998 0.996 0.995
Macro-F1 0.983 0.987 0.993 0.991 0.984 0.995 0.998 0.998 0.996 0.995
表4则显示滑动窗口大小为23和25的最优模型权重用于对应测试集的识别结果。表4可以看出,滑动窗口大小为23和25的最优模型在对应测试集上的评估指标均为99.9 %,这表明模型学习到复杂特征,并在处理未知数据时具有很好的识别效果,展现出良好的泛化能力和鲁棒性。与传统的核素能谱寻峰识别方法相比,本文提出的方法不需要复杂的处理过程,能够实现高效、准确识别。
表4 最优大小的滑动窗口在测试集的评价指标结果

Table 4 The evaluation index results of the optimal size sliding window on the test set

窗口大小 acc Macro-P Macro-R Macro-F1
23 0.999 0.999 0.999 0.999
25 0.999 0.999 0.999 0.999

4 结论

本研究基于MobileNetV3卷积神经网络,构建用于核素能谱识别的模型,实现对单源和多源核素的识别,主要研究成果和结论如下:
1)本文在MobileNetV3网络模型的基础上进行结构优化,使其更适用于核素能谱的识别任务。优化后的模型能够有效提取核素能谱特征,大幅提升识别速度和准确性,尤其在处理经不同滑动窗口大小预处理的核素能谱数据时表现出色。
2)提出的滑动窗口变换预处理方法显著增强特征峰的凸显效果,进一步加快模型对核素能谱特征的学习效率,并提高识别性能。实验表明,当滑动窗口大小设置为23或25时,模型性能达到最佳水平。
3)与传统方法相比,本研究提出的深度学习模型简化核素识别流程,同时显著提高识别精度。该模型为核素识别技术在便携式移动设备中的应用以及实际场景中的快速响应提供有力支持,具有广泛的应用前景。
1
MERIO S, MERIC I, SILVA F B M, et al. A geometric approach to spectral analysis[J]. 2017.doi:10.48550/arXiv.1711.07782.Radiation Physics and Chemistry.

2
FINDLAY D. Analysis of a gamma-ray spectrum by fitting the second derivative of the spectrum in its entirety[J]. Nuclear Instruments and Methods in Physics Research Section A:Accelerators, Spectro-meters,Detectors and Associated Equipment, 2022.doi:10.1016/j.nima.2022.167708.

3
SHUANG Z, SAN-JUN H, FENG L, et al. Analysis of the unfolded energy spectrum based onBoosted-Gold algorithm[J]. Acta Physica Sinica, 2022, 71(10).

4
LIANG X Z, PANG X Y, ZHANG Z M, et al. A quantitative spectral component analysis method based on maximum likelihood[J]. Optics Express, 2019, 27(5):7160.doi:10.1364/OE.27.007160.

5
LI F, GU Z, GE L, et al. Review of recent gamma spectrum unfolding algorithms and their application[J]. Results in Physics, 2019, 13. doi:10.1016/j.rinp.2019.102211.

6
KIM J, PARK K, CHO G. Multi-radio isotope identifi-cation algorithm using an artificial neural net-work for plastic gamma spectra[J]. Applied Radiation and Isotopes, 2019,147:83-90.

7
WANG Y, YAO Q, ZHANG Q H, et al. Explainable radionuclide identification algorithm based on the convolutional neural network and class activation mapping[J]. Nuclear Engineering and Technology, 2022, 54(12):4684-4692.

8
CHENG K Y, SHAYAN H, KRYCKI K, et al. “Prompt-gamma neutron activation analysis (PGNAA)” Metal Spectral Classification using Deep Learning Method[J]. arXiv preprint arXiv:2208.13909, 2022.

9
祝美英, 袁成前, 刘艳芳, 等. 基于BP神经网络的核素快速识别算法[J]. 核电子学与探测技术, 2018, 38(2):284-288.

ZHU Meiying, YUAN Chengqian, LIU Yanfang, et al. Research on the fast recognition algorithm of nuclide based on BP neural network[J]. Nuclear Electronics & Detection Technology, 2018, 38(2):284-288 (in Chinese).

10
王瑶, 刘志明, 万亚平, 等. 基于长短时记忆神经网络的能谱核素识别方法[J]. 强激光与粒子束, 2020, 32(10):154-161.

WANG Yao, LIU Zhiming, WAN Yaping, et al. Energy spectrum nuclide recognition method based on long short-term memory neural network[J]. High Power Laser and Particle Beams, 2020, 32(10):154-161 (in Chinese).

11
杜晓闯, 涂红兵, 黎岢, 等. 基于径向基神经网络仿真γ能谱模板库的核素识别方法[J]. 清华大学学报(自然科学版), 2021(11):1308-1315.

DU Xiaochuang, TU Hongbing, LI Ke, et al. Radionuclide identification method based on a gamma-spectra template library simulated by radial basis function neural networks[J]. Journal of Tsinghua University(Science and Technology), 2021(11):1308-1315 (in Chinese).

12
QIS, WANG S, CHEN Y, et al. Radio nuclide identification method for NaI low-count gamma-ray spectra using artificial neural network[J]. Nuclear Engineering and Technology, 2022, 54(1):269-274

13
卢大宇, 周书民, 陈锐. 基于Resnet神经网络的地层核素能谱快速识别方法研究[J]. 世界核地质科学, 2023, 40(2):360-367.

LU Dayu, ZHOU Shumin, CHEN Rui. Method Research of resnet neural network-based fastiden-tification for stratigraphic nuclide energy spectrum[J]. World Nuclear Geoscience, 2023, 40(2):360-367 (in Chinese).

14
HOWARD A, SANDLER M, CHEN B, et al. Searching for MobileNetV3[C]//2019 IEEE/CVF International Conference on Computer Vision (ICCV). IEEE, 2020.doi:10.1109/ICCV.2019.00140.

15
LIANG D, GONG P, TANG X, et al. Rapid nuclide identification algorithm based on convolutional neural network[J]. Annals of Nuclear Energy, 2019,133:483-490.

16
HOWARD A G, ZHU M, CHEN B, et al. MobileNets:Efficient convolutional neural networks for mobile vision applications[J]. 2017. doi:10.48550/arXiv.1704.04861.

17
SANDLER M, HOWARD A, ZHU M, et al. MobileNetV2:Inverted residuals and linear bottlenecks[J]. IEEE, 2018.doi:10.1109/CVPR.2018.00474.

文章导航

/