计算机技术下食品安全信息的收集与处理

作者: 刘水文

计算机技术下食品安全信息的收集与处理0

食品安全问题是关系到国家发展和人民生活的重要问题,在信息技术飞速发展的今天,如何运用相关技术来保障食品安全已经是一个新的研究方向。通过技术手段获取有关食品安全的资料,然后对其进行分析,挖掘内部的价值,对于解决中国的食品安全问题具有重要意义。本章从食品安全的角度出发,探讨了食品安全的数据收集和处理技术。

一、研究意义

在社会主义市场经济条件下,农业、食品加工业和餐饮行业不断发展壮大,食品的品种越来越多样化,但与此同时,食品的质量安全问题也越来越突出,并逐步发展成了重大的社会问题。比如,部分食品生产厂家为了追求一时的经济利益,在生产中违规添加食品添加剂,造成了严重的食品安全事件。在市场上销售的食品没有达到国家安全标准、食品生产过程没有达到标准生产要求、食品原料质量低劣、消费者购买食品的期待得不到满足等问题不断出现,使得食品安全问题已经引起了国内外学者的普遍关注。

食品是一种具有专业性、技术性和滞后性特点的体验性商品,因此在获取食品信息的过程中会遇到许多困难。加上食品的制造和销售场所分散、范围广、产品销售不透明等诸多制约条件,使得各相关方之间的信息不对称,从而让食品安全信息成为导致食品安全事故的主要根源。通过对国内外相关学者的研究成果进行全面分析,发现目前中国的食品安全问题主要是源于信息不完整、信息不对称、信息不通畅。

为了保障食品安全,国家出台了各种法律法规,并要求加强监管。随着互联网技术的发展,“互联网+”逐渐在食品安全监管中发挥出重要的作用。在互联网大环境下,网络上的信息量呈爆炸式的增加。IDC公布的报告指出,到2025年,世界上的数据总容量将从目前的58ZB增至175ZB,相当于平均每日产生491EB的数据;世界范围内的互联网使用者之间的交互将从目前的1426个增加到4090个;全球范围内的互联网接入装置将从307亿部增至754亿部。与常规信息相比,互联网信息具有实时性、覆盖范围广、数据量大等特性,如果能将数据采集、信息处理等技术应用到食品安全研究中,将有助于控制和监管食品安全问题。

二、食品安全数据采集及处理方法研究

食品保障关系到每个国民,因为各国发展水平的差别,使得食品保障无论是在发达国家还是发展中国家,都有其各自的侧重点。在互联网环境下,各种食品安全数据呈现出多种形态,我们首先要做的就是确定特定的目标和数据源,然后通过三种不同的文本形式对食品安全进行深入的探讨。在信息技术方面,根据食品安全数据的表达方式,可以划分为文字信息、多媒体信息和超文本信息;按结构化的不同,可以划分为非结构化信息、半结构化信息、结构化信息。本文所采集的食品安全数据在结构与形式上属于一种非结构性的文字资料。

在互联网上,食品安全信息的语料以不具结构性的自由文字为主导,包括不同的新闻机构对有关的食品安全问题进行的报道、专门的检测单位出具的检测结果、有关部门颁布的食品卫生法规等。这些只是食品安全性文字资料中的一小部分,有关食品安全资料的种类和数量则更多。由于受到科研经费和技术条件的限制,无法收集和统计完整的食品安全资料,为此,本文选择了一些特定类型的语料进行分析。

在食品安全领域,违法使用的添加剂往往是导致食品安全问题的主要原因,可以通过抽象的形式将食品和违禁的添加剂之间的内在联系表现出来。此外,在生产、加工、销售等环节,因不法经营活动也会造成食品中毒、食源性疾病、食品污染等重大问题。从性质上讲,中国的食品违法行为具有广泛的普遍性和不确定性,在全国各地、每年的不同时段都会出现,在空间和时间上存在着一定的不稳定因素,使得食品安全事件的防范工作变得十分困难。如果能够以可视的形式呈现出食品安全违法行为的发生时间、地点等特征,将有利于揭示其时间与空间的规律性,为今后的防控工作提供有益的借鉴与参考。

因为这些信息都是以中文的方式呈现,所以在对其进行处理和解析时,除了采用常规的数据分析技术外,还需要与自然语言处理(NLP)技术相配合。在食品安全数据中使用的方法主要包括数据预处理、文本筛选和信息抽取等,其中,数据预处理技术是对爬虫获得的原始资料进行格式转换、删除无用符号、数据信息去重和数据集成等;本文采用的文字筛选技术是从收集到的原始资料中选出符合标准的食品安全性指标;信息抽取技术则是食品安全数据的关键技术,对食品安全数据进行有效的抽取和分析。

三、食品安全数据

结构化处理及可视化方法研究

从网上直接获取的数据格式多样,信息密度低,且不适合存储。为了克服以上问题,本文采用了三种食品安全性数据的结构形式,分别是食品安全新闻报道、食品检测公告、食品安全刑事判决文件,提高了数据的查询和管理水平;同时,以 ECharts为主要的辅助手段,实现了从抽象到具象的转换。尽管这三种不同的形式均以食品安全为话题,但其论文的结构和具体的内容却不尽一致,所以在构造这些模型前,必须根据它们不同的特征,分别进行相应的结构化。本文从语料库的组织和内涵入手,对三类数据的特征进行了分析。

1.食品安全新闻报道。食品安全新闻是一种典型的新闻形式,目的是利用简洁的语言报道有关食品安全的事实。从论文的结构上看,主要包括标题、导语、正文、结语和落款;在表达方法上,先用一段文字概括新闻的由来和报道的时间,再用简洁、明了的文字来描写事情的细节。

2.食品检测公告。食品检测公告是指有关部门负责对市场上所销售的产品和加工产品进行抽样检测,并将其结果以书面方式通知消费者。在论文的组织方面,食品检测公告由标题、正文和落款三个方面构成;在具体的检测项目中,题目以简短的形式说明检测目标和检测批次等,正文包括检测食品、检出非法添加剂、超标项目、处理结果等,落款的主体是检测单位和检测时间。

3.刑事案件的食品安全法律文件。食品安全犯罪判决文件是一部专门记录法院对食品安全案件进行审判的司法文件。从论文的组织上看,包括标题、正文及结尾部分;在具体的内容上,包括被告人的基本情况、案件详情、涉案食品、审判结果和审判时间等。

从以上的分析可以看出,三种不同文本形式的食品安全信息具有不同的表达要点:食品安全新闻报道是对食品安全信息的发展历程进行描述;食品检测公告强调了食品安全检测和添加违禁添加剂之间的联系;食品安全犯罪案件判决文件包括审判时间、地点、人员、食品等方面的内容。

在食品安全领域,食品安全问题的发生常常由于非法添加剂的滥用。如果能将食品与非法添加剂抽象为一个个实体节点,并按照共现关系将它们用线连接,就能更有效地展示各类食品与非法添加剂之间的内在联系。本文利用 ECharts技术,根据对公告进行结构化的数据分析,建立了食物和违法添加剂的关系,以显示其与违法添加物的联系。具体的构造方式可以分成以下步骤:一是抽取资料。抽取数据库中的食品信息结构检测公告数据,并将其转换成列表形式。二是产生结点资料。将食物信息和违法添加剂的数量单独地在统计清单中显示,将其作为一个参数来设定结点尺寸,并将其分为以下几种:“节点名称”:节点名称、“SymbolSize”:结点尺寸、“x”:座标位置、“y”:座席地点、“category”:结合部类型,从而更直观地将食物与违法添加剂之间的关系展现出来。

在资料收集上,本文首先对目前网络媒介中的食品安全性信息的特征进行分析,确定了评估标准,并据此分析出了特定的调查目标和信息的来源;然后对食品安全信息的收集系统进行详细的描述和实现,利用此方案从新华网、食品安全网、无讼网等网站收集食品安全新闻、食品检测通告和食品安全犯罪裁判文书等三大类食品安全信息,并给出了收集结果。

四、结论

在现代社会,尤其是在全球经济日益融合发展的今天,食品安全管理成为十分关键的社会公共问题,为社会提供必要的食品安全管理公共服务,也成为当代政府必须承担的社会管理责任。重视食品安全问题需要不断进行有关食品安全管理的探讨与交流,分析相关法律、制度和行政管理是解决食品安全问题比较有效的方法。通过对食品安全行政管理的历史、行政管理机构、相关法规、食品安全管理相关法规及路径等方面进行探讨与分析,可以归纳出目前食品安全管理中存在的问题;通过对国内外相关学者的研究成果进行全面分析,发现目前中国食品安全问题的根源是信息不完整、信息不对称、信息不通畅。

随着互联网技术的发展,“互联网+”逐渐在食品安全监管中发挥出重要的作用,因此,本文围绕计算机技术下食品安全信息的收集与处理进行分析与研究。在互联网媒介中,食品信息以多种形式存在,常规的信息收集技术无法实现对信息的全面覆盖,在今后的工作中,可以从更加丰富的资源中获取多样化的食品安全数据,提高其普适性。同时,在信息加工上也要进行智能化的改进,可以将其与大数据的分析技术结合起来,以全面提高信息处理水平。

作者简介:刘水文(1974-),男,汉族,江西高安人,讲师,大学本科,研究方向为计算机网络。

经典小说推荐

杂志订阅

友情链接