推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

基于Python的中药材价格信息爬虫的设计

更新时间:2019-12-20 22:59:37 大小:2M 上传用户:songhuahua查看TA发布的资源 标签:python 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

为了收集大量、真实、可靠的中药材价格信息,为中药材价格的预测研究提供强有力的数据支撑。将数据来源方向瞄向互联网,在前期筛选的基础上,最终确立以中药材天地网为目标网站。在深入分析目标网站结构的基础上,基于Python语言设计了一款中药材价格信息爬虫。详细介绍了爬虫模拟请求网页、目标信息提取、信息存储及定时启动部署等环节的实现方法。实际测试结果显示,所设计的爬虫运行稳定,能高效、完整无误的抓取目标网站的信息条目。


部分文件列表

文件名 大小
基于Python的中药材价格信息爬虫的设计.pdf 2M

部分页面预览

(完整内容请下载后查看)
2019  
03  
Mar. 2019  
Vol. 36 NO. 2  
枣庄学院学报  
JOURNAL OF ZAOZHUANG UNIVERSITY  
36  
2
Python  
基于  
的中价格信息爬虫设计  
红  
(
州职技术程系 州  
236800)  
、 、 。  
为了大量 的中材价信息 材价研究提力的数  
, , 。  
向互联在前的基为目标目标结构的  
基于  
Python  
。 、 、  
材价信息目标信息提取 信息存  
, , 、  
及定动部定 能高效 取目标  
信息目  
[ ] Python;  
关键词  
;
虫  
TP391  
A  
1004 - 7077 ( 2019) 02 - 0067 - 06  
中图分类号  
文献标识码  
文章编号  
0
引言  
, ,  
代的来 人们进而决  
1 - 2]  
.
, ,  
用大材价撑  
. ,  
场有序具研究意义 的方主要其一是基于响  
; .  
因素用特技术进行推理 其是基于的推理法 因素法由于子  
;  
变 因原因 建模 时间是一基于规  
.  
测未的方是当前的主之一 时间点在于如  
3]  
.
足够相对整的据  
, , 、  
互联技术以来 得到广泛的应用 互联在中医 中药领的应用到  
.  
所未的广了相网络数了相量的中材  
. 、  
信息 时间法提力的网络上速 高效这  
, , . 、  
其整理便于分的结构化数为关的一网络提取网络数  
4 - 5]  
.
的主技术段  
, ,  
基于上述背景 为了满足基于时间展中材价研究据需于  
Py-  
thon  
、 、 ,  
面具有便本文为目标  
Python Requests  
基于  
用于中材价信息网络用  
Beautifulsoup  
用  
网  
Http  
的  
现了目标信息提取 目标便  
、  
于分的结构文本文件数进行绍  
.
1
爬虫理分  
从互联取相关信息 的方浏览入  
URL  
Http  
求  
服务起  
2018 - 11 - 30  
收稿日期  
[ ]  
基金项目 年人目  
( gxyq2018215) ;  
( KJ2016SD41) .  
科学研究重目  
[ ]  
作者简介 红  
( 1983 - ) ,  
(
) ,  
, , , ,  
西州职技术硕士 山东大学访学者 主要  
族  
.
计算技术应用方研究  
·67·  
2019  
2
枣庄学院学报  
年第  
Response,  
.
浏览器解如果统  
服务一个目标的  
, ,  
某个信息条 若浏览访的方进行 不仅效率下  
6]  
.
, , ,  
基于此 概念便是一访动定向  
错  
提取目标信息的程网络程大动调用  
Python Request  
相关法向服务模  
.
:
;
页浏览在  
使用  
, ,  
待响一个多种的  
Response.  
提取含  
Beautifulsoup 、  
应方法 定位  
;
目标信息 即过  
XPath、  
达式或  
. ; , ,  
提取目标信息 提取目标信息文本 据  
.
件  
2
价格信息爬虫设计与实现  
2. 1  
目标的分析  
、 、 4  
以来 实时市  
, ,  
信息 的中材价材价测  
.
URL : http: / /  
浏览页  
址  
得到信息格  
,  
1
, ,  
当前信息 接  
. , , :  
信息 上述知 在程中 解决取各个分的  
URL  
接  
;
提取各信息目标信息  
.
1
天地网市场价格栏部  
2. 2  
目标信息取  
, ,  
提取信息 首先需将过  
·68·  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载