推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

利用python分析无害化处置工作数据

更新时间:2019-12-23 09:03:33 大小:3M 上传用户:songhuahua查看TA发布的资源 标签:python 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

自2015年起,四川省彭州市全面实施了养殖、屠宰环节病害畜禽集中无害化处置工作,养殖场、屠宰场病害畜禽尸体不再由业主自行无害化处置,而是按规定转运至指定地点由专业机构进行集中无害化处置。3年多来,无害化处置工作开展卓有成效,对减少动物疫病传播风险、确保畜牧业健康发展发挥了重要作用,但是,业务工作产生的数据量大、维度多,采用传统图表可视化分析手法已力有不逮,无法达到较精准定位目标群体,并无法达到针


部分文件列表

文件名 大小
利用python分析无害化处置工作数据.pdf 3M

部分页面预览

(完整内容请下载后查看)
☆2019年第11期  
科技与推广  
Science and Technology Promotion  
利用python分析无害化处置工作数据  
文│刘巍申(四川省彭州市动物卫生监督所)  
自2015年起,四川省彭州市全 于工商业的python语言对数据进行 体抗体免疫合格率分析更具指导意  
面实施了养殖、屠宰环节病害畜禽集 了“聚类”分析。根据“死亡发生 义。因此,挖掘发现数据背后隐含的  
中无害化处置工作,养殖场、屠宰场 数、发生频次、死亡发生率、首次 信息,关系到过往工作成果检验与后  
病害畜禽尸体不再由业主自行无害化 死亡时间、末次死亡时间”重点字 续工作思路拟定,影响深远。  
处置,而是按规定转运至指定地点 段特征,采用K-Means聚类算法分  
数据挖掘手法多样,如分类、  
由专业机构进行集中无害化处置。3 析,将全部数据聚为5类,有效甄别 聚类、预测、关联规则。对生猪无  
年多来,无害化处置工作开展卓有 不同特征类别,从而为后续防疫工 害化处置数据而言,从动物卫生监  
成效,对减少动物疫病传播风险、 作开展提供支撑。  
督 工 作 角 度 出 发 , 类 比 商 业 中 的  
“客户价值分析”理念,从全部数  
确保畜牧业健康发展发挥了重要作  
用,但是,业务工作产生的数据量  
一、需求分析  
动物防疫工作质量高低,很大 据中甄别一定时间窗口内表现出不  
大、维度多,采用传统图表可视化 程度上取决于数据及数据分析。与工 同发生数量、频次、时序特征的养  
分析手法已力有不逮,无法达到较 业、商业、服务业类似的,动物防疫 殖场群体、进而调查分析其生猪是  
精准定位目标群体,并无法达到针 工作同样存在“数据驱动”,比如免 否存在异常死亡及原因,以针对性  
对性开展防控的目标。  
疫抗体合格率、畜禽发病率、死亡 开展整改,促使其提高生物安全水  
对此,彭州市卫生监督所积极 率、病死率、发生频次等,过往工作 平、降低发病死亡率,提升经济效  
学习借鉴数据挖掘技术在其他行业 质量与后续工作愿景均需通过数据表 益,确保公共卫生安全。  
的有效应用,积极探索数据挖掘技 达和驱动。那么,针对养殖环节病害  
术和畜牧兽医业务工作的有效结合 畜无害化处置工作,收集、整理、分  
二、资料来源与方法  
根 据 四 川 省 成  
1 . 资 料 来 源 。  
途径,将现代商业中的“客户价值 析相关数据就显得尤为重要。以生猪 都市畜牧兽医主管部门安排部署,  
分析”理念引入到动物卫生监督工 无害化处置为例,工作数据关系到生 2015年彭州市实施病害畜禽集  
作中,对该市近3年来积累的6000 猪死亡率,包含着大量动物疫病发 中无害化处置工作制度以来,对养  
余条工作数据,利用时下广泛应用 生、传播和流行的信息,相比畜禽群 殖、屠宰环节病害畜禽按国家规定  
57  
☆中国畜牧业  
科技与推广  
Science and Technology Promotion  
进 行 无 害 化 处 置 , 历 年 来 积 累 了  
6000余条工作数据。根据本次分析  
工作需求,首先挑选出“场名、无  
害化处置头数、无害化处置发生时  
间、生猪存栏量、死亡率”字段,  
形成本次数据挖掘的源数据。整理  
发现,源数据存在少量“异常值、  
缺失值、错别字”,影响到后续分  
析工作。因此,对源数据进行“数  
据清洗”,包括修正异常值、填补  
缺失值,更正错别字等。重点是补  
充完善源数据中少量遗漏的“生猪  
存栏量”字段信息。方法是通过查  
找最接近时间段内该场户存栏量,  
估算遗漏的存栏量信息。对于多次  
事件中均空缺存栏量的,直接通过  
电话询问填补。然后,将源数据通  
过Microsoft Excel“数据透视表”  
功能,形成以“场名”为主键、以  
“无害化处置头数汇总、无害化处  
置频次汇总、首次无害化处置距今  
月数、末次无害化处置距今月数、  
死亡率标准差”为字段的工作数据  
表。工作数据表即为本次数据挖掘  
资料来源。  
第一,“死亡量低、发生时间距今较 象 和 其 他 养 殖 场 甄 别 出 来 。 无 差  
长”、占比25%;第二,“频繁、大 别、全面覆盖的防疫工作策略无法  
量死亡、死亡量波动大、发生时间距 达到“精准定位、有效甄别”的目  
今很近”,占比3%;第三,“较频 标。因此,应通过数据挖掘技术,  
繁死亡、死亡量较高”,占比3%; 对不同特征的养殖场户分类治理,  
第 四 , “ 死 亡 间 隔 期 长 、 死 亡 量 对于频繁、大量发生生猪病害现象  
低”,占比31%;第五,“死亡量较 的 养 殖 场 户 , 重 点 关 注 、 积 极 治  
首 先 进 行 “ 数 低、但波动大”,占比38%。  
理,从而达到降低养殖环节生猪死  
不难发现,针对上述第二、三类 亡率、节约财政补助资金、深度发  
特征群体,应加大工作力度,通过开 挥财政资金实效的目标。  
2 . 分 析 方 法 。  
据变换”。整理发现,上述各字段  
数值数量级差异较大。因此,通过  
python语言中的panda库“标准差标  
准化”功能将数据标准化至-1到1  
之间,便于算法分析,减少数值数  
量级差异对分析工作的不利影响。  
然后进行“导入模型分析”,通过  
python语言的sklearn.cluster库,利  
用K-Means聚类算法进行分析。针  
对6000余条小规模数据,选择聚类  
类别数为5。运行算法,将全部养  
殖场数据聚为5类,即为本次分析  
结果。  
会约谈、现场调查、流行病学调查、  
数据挖掘技术还可应用于兽药  
病原学监测等措施,有针对性开展防 经营企业GSP监管、畜禽群体免疫抗  
疫工作。  
四、讨论与展望  
体监测等防疫工作。比如,收集整  
理辖区内全部兽药经营企业GSP规范  
数据的获得是有一定成本的, 经营数据,通过“关联规则”分析  
数 据 分 析 工 作 质 量 高 低 首 先 取 决 技术,挖掘分析全部兽医处方笺,  
于 数 据 质 量 。 相 较 于 问 卷 调 查 所 探索兽用处方药之间联合使用或相  
获 得 的 数 据 , 兽 医 主 管 部 门 投 入 互排斥的现象,分析兽医处方笺背  
财 政 资 金 统 一 进 行 的 病 害 畜 禽 集 后隐含着的动物疫病发生、传播、  
中 无 害 化 处 置 所 获 得 的 数 据 质 量 流行信息,对动物疫情预警分析将  
更 高 , 成 本 也 相 应 提 高 。 因 此 , 是极大的助力。  
三、结果与分析  
更 应 有 效 利 用 工 作 数 据 , 切 实 发  
挥信息支撑作用。  
总之,将数据挖掘等工商业上  
结果显示,全部数据按病害生猪  
发生时间先后,发生量(率)高低等  
维度特征,聚为5类,5类数据分别对  
应了不同维度特征的养殖场户。  
重点表现为5类群体主要特征:  
广泛应用的分析技术导入畜牧兽医监  
绘制事件-时序趋势图、计算平 管工作,帮助发掘多年来累积工作数  
均值等手段对6000余条无害化处置 据背后的信息,精确指导动物疫病监  
数据进行分析,往往难以将大量、 测、检测、流行病学调查工作的开  
频繁生猪死亡的重点关注养殖场对  
展,具有积极的现实意义。  
58  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载