在食品宁静治理领域,建立食品冷链物流跟踪与追溯体系,是生鲜食品宁静的有效包管。目前,海内外学者就冷链物流治理展开了广泛的研究。外洋学者结合欧美等兴旺国家冷链物流的生长现状,提出建立高度协调的一体化冷链物流体系,海内学者剖析了我国冷链物流生长的特点,指出应完善冷链基础设施,整合冷链上下游各环节,从而实现冷链的协调控制[1,2,3,4,5,6]。然而冷链物流系统是一类典范的庞大的漫衍式系统,它需要各环节之间的高度配合、协调,而这正是古板冷链物流体系无法实现的,除此之外,各环节收罗的大宗监控数据没有获得有效利用,导致大宗有价值的信息没有被发明[2,5]。
关联规则挖掘技术能够发明大宗数据中项集之间有趣的关联或相关联系,是数据挖掘中的一个重要的课题,被业界广泛研究及应用。以往的研究学者在食品质量宁静方面主要是从宏观或微观的角度建立质量宁静指标体系,然后接纳层析剖析法、时间序列法等进行质量宁静预警[8,9,10],主观性因素比较大,而本文则旨在充分利用肉类食品冷链物流监控数据,接纳关联规则技术挖掘有价值的信息,建立模型,发明肉类食品冷链物流历程质量宁静包管因素以及进行质量宁静预警,这样发明的因素更贴合实际的肉类食品宁静治理因素,预警效果更能反应实际情况。
挖掘肉类食品冷链物流订单流(如从工厂A到分销商B)与端到端的联系(如运输模式、产品类型、配送周期等)数据库中纪录了每次配送的所有物流相关的数据,如图1所示:
整个冷链物流数据流包括产品信息(如产品类型、数量、重量等)和运行信息(如运输模式、业务事件时间、所处业务阶段、情况数据等)。通过关联规则和食品质量的限制条件就可以挖掘出某些内在联系,构建基于规则技术的肉类食品冷链物流质量宁静包管因素以及质量宁静预警总体模型,如图2所示:
图2 基于关联规则的肉类食品冷链物流质量宁静包管因素发明及预警模型
该模型主要分为两步:
第一步:关联规则挖掘,发明质量宁静包管因素,并确定权重。标准的关联规则由前置条件(如X)和结果(如Y)组成,体现如下:X->Y(X,Y包括于I,I是一个项目集),在我们的系统中,X就是案例的相关属性荟萃,好比产品数量、产品重量、产品类型、温度等,而Y就是质量宁静包管属性;而是否是感兴趣的规则由支持度(前置条件和结果在知识库中同时爆发的概率)和置信度(条件概率)决定。
支持度(X->Y)=所有包括X、Y案例的数目/总案例的数目
置信度(X->Y)=所有包括X、Y案例的数目/包括X案例的数目
通过关联规则挖掘算法获得质量包管属性的权重:
Wj=Max{置信度(a1->dj),置信度(a2->dj),置信度(a3->dj),…,置信度(am->dj)},即寻找最大关联规则的历程。好比:(0.95)产品类型->温度,(0.65)产品数量->温度,(0.70)产品重量->温度,那么温度的权重就是0.95。
第二步:质量宁静预警。
整合第一步中发明的质量宁静包管因素,对其各因素的权重标准化处理:Ni=Wi/(W1+…+Wj)。然后新将案例中各项相应的质量宁静包管因素属性值归一化预处理, ,即为与各因素的权值进行加权盘算,得质量宁静预警值Y,并将结果发送给相关治理人员,凭据预警信息,案例检索异常事件处理源案例库,寻找相似度最大的异常事件所对应的异常处理战略或行为,为相关治理人员决策提供支持。
在第一步寻找规则的历程中,接纳的是Apriori算法,该算法是一种最有影响的挖掘布尔关联规则频繁项集的算法[7]。算法使用频繁项集性质的先验知识,首先找出频繁1-项集的荟萃,记作L1。L1用于找频繁2-项集的荟萃L2,而L2用于找L3,如此下去,直到不可找到频繁k-项集。
为了提高频繁项目集逐层爆发的效率,Apriori算法利用了两个重要的性质用于压缩搜索空间:
(1)若X是频繁项集,则x的所有子集都是频繁项集。
(2)若x是非频繁项集,则X的所有超集都是非频繁项集。
Apriori焦点算法剖析
算法:Apriori算法,使用逐层迭代找出频繁项集。
输入:事务数据库D;最小支持度阈值min_sup。
输出:D中的频繁项集L。
算法描述:
首先爆发频繁1-项集L1,然后是频繁2-项集L2,直到有某个r值使得Lr为空,这时算法停止。在第k次循环中,历程先爆发候选k-项集的荟萃Ck,Ck中的每一个项集是对两个只有一个项差别的属于Lk-1 的频集做一个(k-2)-连接来爆发的。Ck中的项集是用来爆发频集的候选集,最后的频集Lk必须是Ck的一个子集。
频繁1-项集可以是食品的温度、湿度、微生物含量以及冷链运输时间等。
通过关联规则技术,从大宗的已经收罗的质量宁静信息挖掘出有价值的信息,好比某类产品宁静运输的温度条件、湿度条件、微生物含量等,这样就能给治理者提供决策支持,从而间接实现对冷链质量宁静的提前预防。
本文涉及的肉类食品冷链物流数据是来源于某肉类食品冷链物流追溯系统(CCQSM)的溯源数据库中的数据,包括了肉类食品冷链物流历程中运输、配送、仓储所爆发的相关数据,抽取、清洗所需要的数据,获得产品从产地抵达目的地所包括的部分数据纪录,见表1。
表1 原始数据表
凭据本文所建立的模型,挖掘感兴趣的规则,最后凭据挖掘的规则进行整合寻找包管食品冷链物流质量宁静的因素,并向食品冷链物流相关治理者提供质量宁静包管的决策支持。具体操作如下:
凭据表1,我们先将数据表中的某些字段值进行定性化。通过视察数据,将凭据临界值进行定性处理,见表2。
表2 字段属性值离散化
凭据表2,将表1 的数据处理后获得表3 所示的数据定性表:
然后,接纳Weka软件连接My SQL数据库,直接获取数据库中的预处理数据,然后对产品重量、产品数量、平均温度、微生物含量、重金属含量、运输时间进行基于Apriori算法的多维关联规则挖掘,发明肉类食品冷链物流质量宁静包管因素。取最小支持度=0.2,最小置信度=0.9,最大规则数=500,实验进行了16 轮的搜索,爆发11 个频繁1 项集和184 条关联规则。选取置信度最大的部分关联规则,见表4。
那么满足条件的且可以作为此肉类食品冷链物流的质量宁静包管因素只有温度、重金属含量、微生物含量和运输时间,而产品重量和产品数量作为规则的后件,其相关规则的置信度不满足条件,不包括在所发明的关联规则中。另外,通过检察整理国家食品药品监管总局宣布的2015年第1-3期食品表3 数据定性表宁静监督抽检结果,造成肉类食品泛起质量宁静问题的主要因素见表5。
这些因素与本文所发明的因素(微生物含量、重金属含量)相对应,说明本文接纳关联规则技术来发明肉类食品冷链物流质量宁静包管因素是可行的。这些因素中,重金属含量是不可逆的,如果超标,产品就需要被召回;运输时间会影响销售商或分销商对产品的满意度,时间的是非又与运输配送路径有关,如果运输配送历程中泛起路径异常,延长了时间,除增加特另外本钱外,还会使得其他因素泛起异常,好比微生物的含量、温度异常等,进而增加食品变质的危害;微生物含量直接影响产品的品质,并且一般肉类产品的糜烂变质都与微生物保存很大的关系;温度的波动影响微生物含量的变革,温控不当会使得食品的腐败变质加速,间接影响着食品的品质。所以增强对这些内在因素的宁静控制,可以使得肉类食品的质量宁静得以包管。
凭据前面模型办法一所述,确定这些质量宁静包管因素对应的权重,并将进行标准化处理,见表6。
表6 因素权重及标准化
从表6可以看出因素权重的巨细,说明肉类产品质量宁静各包管因素重要性水平,可以凭据重要水平对食品的质量宁静进行重点防控。
在进行上述剖析后,确定了肉类食品冷链物流质量宁静包管因素,以及它们相应的权重值,接下来进行食品的质量宁静预警:
(1)归一化。由表2中的划分标准,将本文数据中的微生物含量、温度值按下式进行归一化处理:
时间因素、重金属含量的归一化处理:凭据运输距离和以往的运输经验史,当产品在划准时间之内送达,则为0;凌驾划准时间,则为1。因为重金属含量是食品宁静中重要因素之一,一旦超标,那么产品就需要处理掉或者召回[6],当其含量在标准规模内即不凌驾0.03,为0,凌驾标准规模即为异常状态为1。
(2)预警盘算。当接收到新案例后,将案例中各因素的值进行归一化处理后,求质量宁静预警值Y =∑inNipi。随机选取数据库中的5条原始数据,包括异常数据和正常数据,盘算每条数据的质量宁静预警值,结果见表7。
表7 危害预警结果
表7 中结果分为两种情况:如果预警值为0,说明未泛起任何异常;若果预警值为大于0,说明泛起异常,需要向相关人员进行预警,这样相关人员针对异常数据,通过案例检索CCQSM系统中的异常事件处理源案例库,为其决策提供支持,表8所示为异常处理源案例:
通过盘算出该异常事件与案例库中所有事件的相似度[6],选择相似度最大的异常案例所对应的战略或者行为。例如当新案例泛起异常:温度、微生物泛起异常,凭据检索相似度最大的异常事件所对应的战略,相关人员可以检查冷藏车制冷器,实时将温度调解到正惯例模;运输时间超时,则通知车主,检测运输路径是否正确等。这样,一方面可以包管肉类食品冷链物流的质量宁静,另一方面可以规范冷链物流操作,增强宁静治理。
本文剖析了冷链物流历程的数据流,提出基于关联规则技术的肉类食品冷链物流质量宁静包管因素发明以及质量宁静预警模型,该模型分为两步,第一步是关联规则挖掘,通过关联规则算法Apriori发明冷链质量宁静包管因素,并确定权重;第二步质量宁静预警,预警之后相关人员可以案例检索系统中的异常事件处理源案例库,寻找相似度最大的相似案例,为其决策提供支持。最后通过实证研究标明该模型能有效发明肉类食品冷链质量宁静包管因素以及预警,给治理者提供决策支持,抵达有效增强食品质量宁静治理的目的。
【本文标签】
【责任编辑】yd2333云顶电子游戏云仓