Excel 在γ 谱分析数据统计处理中的应用
黄飞
台山核电合营有限共公司 化学环保部环境监督科 广东省江门市 529000
1 前言
Excel 作为微软开发的一款办公软件,因其强大的数据处理与统计功能备受欢迎。对于尚未建立实验室信息化管理系统(LIMS)的实验室,充分利用 Excel 软件基础数据管理、计算公式、数据可视化与分析等功能,可极大提高工作效率,并减少人因失误,促进实验室管理水平的提升。
高纯锗 γ 能谱分析方法常用于辐射监测实验室中 γ 放射性核素的定量测量,具有测量高效、准确的特点。在核电厂环境实验室与流出物实验室 γ 能谱分析中,每个样品需同时对十几个关注核素进行检测,产生大量的数据。采用传统人工方式对数据进行抄录、修约与统计效率低下,且极易发生人因失误。本文介绍了实验室通过开发专用 Excel 表实现 γ 能谱分析数据自动转录、修约与异常数据甄别的方法,其他实验室数据的统计与处理可供参考。
2 原始报告数据导入
要实现原始报告中数据向 Excel 电子表格的批量导入,可首先对报告文档的格式、检测数据的排列方式等基本信息进行检查,分析是否具备将检测结果直接整体复制粘贴至电子表的条件,进而再考虑通过公式按照需要的数据统计格式对数据进行抓取。
以 Gamma Vision 软件输出的
格式原始报告为例,报告中所有核素测量结果排列方式较为统一,具备数据批量导入 Excel 表格的条件。数据导入的第一步,可将检测结果区域数据批量复制粘贴至Excel 表格中,并通过数据分列功能将所有数据分列显示。
因测量结果中同时存在大于探测限与小于探测限的数据,导致每列的信息并不统一,为此需执行第二步——对数据列进行对齐。数据对齐的方式可通过单元格判断和条件函数结合使用,判断条件可根据情况设置,如是否为数字或特殊符号等。可使用 ISNUMBER 函数对单元格信息进行条件判断,再通过 IF 函数决定是否对数据进行列进行移动对齐。
完成数据信息对齐后,可开展第三步——对数据信息进行合并。例如小于探测下限的数据在最终统计表格中需写作“ 最后,如果需要统计的核素与并非检测报告中的所有函数,则可通过 LOOKUP 函数以核素名为查找条件,在包含检测结果的指定单元格区域内查找对应数据。 上述步骤中仅第一步检测报告粘贴需要手动操作,之后的步骤均通过 Excel 公式自动完成,最后再将按格式排列好的数据粘贴至统计表格即可。堪培拉高纯锗原始报告数据导入流程与上述流程类似,此处不再赘述。 3 数据修约 检测结果数据的修约需满足相关标准规范的要求,如《辐射环境监测技术规范》(HJ 61-2021)规定测量结果通常保留2\~3 位有效数字,同时测量结果需与测量不确定度末位对齐,《测量不确定度的评定与表示》(JJF 1059.1-2012)规定不确定度取 1\~2 位有效数字,《环境及生物样品放射性核素的 γ 能谱分析方法》(GB/T 16145)规定探测限首位大于2 时,保留两位有效数字,小于等于2 时保留3 位有效数字。 面对标准规范中诸多数据修约要求,通过手动方式进行数据记录修约时,往往容易发生人因失误,此时借助 Excel 表公式对数据进行批量修约则可以很好的解决这个问题。 (1)有效数字修约 针对有效数字保留位数的要求,Excel 中 ROUND 函数仅能对固定小数位数进行修约,对于量级不固定的数据,无法直接实现固定有效位数的数据修约。例如 12345 保留 3 位有效数字,则需要使用科学计数法记录为1.23E+03。针对该问题,可以考虑先将数据降低量级转换为1\~10 之间的数,对其进行正常修约后再恢复至原来的量级。 首先第一步需要确定数字的量级,即找到数字的指数部分,在 Excel 中可以用 LOG 函数来获取以 10 为底的对数,然后再利用 INT 函数取整数部分得到。如 LOG(12345)=4.0915,取整数部分 INT(4.0915)=4,即得到该数据的量级。第二步将原数据除以10 的该量级指数,则成功将数据转换为介于 1\~10 之间的数据,如12345/104=1.2345。第三步使用 ROUND 函数对这个介于 1\~10 之间的数据进行修约保留 2 位小数,得到 1.23。第四步将修约后的数据乘以 10 的其量级指数,恢复为原来的量级,即 1.23×104。几个步骤公式串联后,结构为:ROUND(X/10^INT(LOG10(X),(n-1)*10^INT(LOG10(X),其中 σX 为待处理的数据单元格,n 为需保留的有效数字位数。需要注意的是,当原数据为0 时,以上公式将会报错,所以在使用时,应根据情况先判断是否有可能存在为 0 的数据,再利用公式进行转换。 (2)GB/T 16145 探测下限值修约 针对 GB/T 16145 中探测限首位大于 2 时保留两位有效数字、小于等于 2 时保留 3 位有效数字规定的修约,总体思路如下:第一步取出检测结果的首位数值并判断该数据是否大于 2,取出首位数字可利用 LEFT 函数,如 LEFT(12345)=1。第二步根据判断情况,利用上述有效数字修约方式对数据进行相应有效数字位数的修约。第三步对修约后的数据添加小于号。 值得注意的是,在 Excel 中直接使用 & 合并符对小于号与数据进行合并时,数据将自动转换为非科学计数法,如单元格 A1 数据为1.23E+04,利用公式“<”&“A1”将得到 <12300,这将使原本已完成有效位数修约转换的数据不再以科学计数法显示。针对该问题,可利用 TEXT 函数将修约后的数据转化为文本格式再与小于号进行合并,如在单元格输入公式“<”&TEXT(A1)即可得到 <1.23E+04。将第一步与第二步公式串联起来,公式结构如下:IF(LEFT(X)>2,Y,Z),X 为待处理数据单元格,Y 为按照 2 位有效数字修约的数据转换为 TEXT 格式并增加小于号后的单元格数据,Z 为按照 3 位有效数字修约的数据转换为TEXT 格式并增加小于号后的单元格数据。 4 异常数据自动判断 对对大批量数据进行统计时,通过人工检查方式通常难以对所有异常数据进行有效识别,在 Excel 中可通过设置合适的条件格式对异常数据进行标记,以方便快速定位和分析。 Excel 提供了多种条件格式判断规则,包括大于、小于、等于、介于、文本包含等。在 γ 能谱分析统计表格中,主要有 3 种可能的异常情况需要关注,一是本应大于探测限的数据小于探测限,如土壤与生物样品中钾 -40 等天然核素通常应大于探测限值,如测量结果小于探测限,则表明仪器可能存在道漂等异常,需分析查找原因。二是本应小于探测限的数据大于探测限,如 Co-60、Ag-110m 等人工放射性核素在环境样品中正常均应小于探测限,如大于探测下限则表明流出物的排放可能存在异常情况。三是大于探测限的数据超出正常数值范围,如受核爆试验、切尔诺贝利核事故等影响,自然环境中本身存在微量的 Cs-137,但其活度浓度通常极小,如样品中检测该核素活度浓度明显高出正常范围,则需要进行关注。 针对上述第一种异常情况,可通过文本包含进行判断,即对文本中是否含有“<”进行识别;第二种异常情况可通过设置介于条件格式进行判断,如设置数据范围为极小值到极大值之间;第三种情况则可简单设置大于条件格式对数据进行判断。 5 总结 本文对 Excel 在实验室高纯锗 γ 能谱分析数据处理转换与修约等过程中的应用方法进行了介绍,受限于作者对 Excel 软件的掌握程度,文中介绍的数据处理方法可能并非最优方式。在 Excel 使用中,应结合实际应用需求,选择合适的函数公式与处理工具,开发适宜的电子表格,以充分发挥软件功能,促进工作效率的提升。 参考文献: [1] 辐射环境监测技术规范 HJ 61-2021 [2] 测量不确定度评定与表示 JJF 1059.1 -2012 [3] 环境及生物样品放射性核素的 γ 能谱分析方法 GB/T 16145