- 1
- 2
- 3
- 4
- 5
基于Linux的python多线程爬虫程序设计
资料介绍
微博作为国内最受欢迎的社交平台,海量的微博数据必然包含丰富的知识资源。如何获取这些非结构化的数据,是进行微博数据挖掘的基础。根据微博网页的特点,提出了一种基于Linux的python多线程爬虫程序设计方法,通过模拟登录新浪微博,自动获取网页内容,再从网页内容中抽取微博和用户数据,以结构化的CSV数据格式存储或存入MySQL数据库,从而获取微博海量数据和用户信息。通过和基于开放API的爬虫程序进行比较,结果表明,从较长时间考虑,基于Linux的python多线程爬虫程序拥有更加优异的性能。
部分文件列表
文件名 | 大小 |
基于Linux的python多线程爬虫程序设计.pdf | 1M |
部分页面预览
(完整内容请下载后查看)最新上传
-
21ic下载 打赏310.00元 1天前
用户:w178191520
-
21ic下载 打赏310.00元 1天前
用户:小猫做电路
-
21ic下载 打赏310.00元 1天前
用户:zhengdai
-
21ic下载 打赏210.00元 1天前
用户:gsy幸运
-
21ic下载 打赏230.00元 1天前
用户:jh0355
-
21ic下载 打赏260.00元 1天前
用户:xzxbybd
-
21ic下载 打赏70.00元 1天前
用户:jh03551
-
21ic下载 打赏60.00元 1天前
用户:sun2152
-
21ic下载 打赏80.00元 1天前
用户:铁蛋锅
-
21ic下载 打赏60.00元 1天前
用户:xuzhen1
-
21ic下载 打赏60.00元 1天前
用户:liqiang9090
-
21ic下载 打赏30.00元 1天前
用户:wangcunxia
-
21ic下载 打赏20.00元 1天前
用户:玉落彼岸
-
21ic下载 打赏15.00元 1天前
用户:kk1957135547
-
21ic下载 打赏15.00元 1天前
用户:w993263495
-
21ic下载 打赏15.00元 1天前
用户:x15580286248
-
21ic下载 打赏15.00元 1天前
用户:w1966891335
-
21ic下载 打赏15.00元 1天前
用户:hp860629
-
21ic下载 打赏10.00元 1天前
用户:staven630
-
21ic下载 打赏10.00元 1天前
用户:我觉得八行
-
21ic下载 打赏10.00元 1天前
用户:曾多次
-
21ic下载 打赏10.00元 1天前
用户:272586851
-
21ic下载 打赏10.00元 1天前
用户:熄欲
-
SYFSSYYFF 打赏3.00元 3天前
-
我是蒙帆 打赏1.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
21ic下载 打赏310.00元 3天前
用户:w178191520
-
21ic下载 打赏310.00元 3天前
用户:小猫做电路
-
21ic下载 打赏310.00元 3天前
用户:gsy幸运
-
21ic下载 打赏210.00元 3天前
用户:zhengdai
-
21ic下载 打赏210.00元 3天前
用户:jh0355
-
21ic下载 打赏210.00元 3天前
用户:jh03551
-
21ic下载 打赏210.00元 3天前
用户:xzxbybd
-
21ic下载 打赏70.00元 3天前
用户:铁蛋锅
-
21ic下载 打赏60.00元 3天前
用户:sun2152
-
21ic下载 打赏60.00元 3天前
用户:xuzhen1
-
21ic下载 打赏60.00元 3天前
用户:liqiang9090
全部评论(0)