推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

基于Python的微信群聊特点统计与分析

更新时间:2019-12-25 05:19:34 大小:2M 上传用户:songhuahua查看TA发布的资源 标签:python 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

如今微信已经成为了个人社交的很大一部分,其及时通讯和朋友圈功能极大地丰富了移动互联时代人们的生活.在微信平台超大流量的呵护下,微信群成了各大圈子群体交流的首选.那么,在微信日以万亿级的信息量背后,以一种可视化的方式,通过Python编程分析群聊的特征,让朋友之间更了解彼此,将是非常有意义的.


部分文件列表

文件名 大小
基于Python的微信群聊特点统计与分析.pdf 2M

部分页面预览

(完整内容请下载后查看)
基于Python的微信群聊特点统计与分析  
陈 彬  
(重庆工程学院ꢀꢀ重庆巴南区ꢀꢀ400056)  
摘 要:如今微信已经成为了个人社交的很大一部分, s(.+)', line)  
其及时通讯和朋友圈功能极大地丰富了移动互联时代人们的生  
活。在微信平台超大流量的呵护下,微信群成了各大圈子群体  
交流的首选。那么,在微信日以万亿级的信息量背后,以一种  
可视化的方式,通过Python编程分析群聊的特征,让朋友之间  
更了解彼此,将是非常有意义的。  
(二)按天统计发言总数  
# 统计  
date_msg_counter[time_match.group(1)] += 1  
# 图表展示  
item_name_list,item_num_list=dict2sorted_by_  
key(date_msg_counter)  
关键词:微信 群聊 特征分析 Python  
line=Line("群心情走势图")  
line.add("", item_name_list, item_num_list)  
效果如图1:  
一、前言  
随着移动互联的飞速发展,微信成为当前最重要的移动社  
交工具,微信群逐渐取代QQ群成为各种圈子群体交流的首选平  
台,如何通过对群聊数据分析,发现一些隐藏在聊天背后的有  
趣现象或有价值的商业逻辑,对微信用户来说,都有着不同程  
度的意义。Python作为近年被人工智能带热的“老”语言,在  
数据分析领域独树一帜。本文借助Python及其三方库,通过对  
微信群聊天记录进行抓取和分析,辅以可视化图表展示,得出  
一些有趣的结论。  
二、准备工作  
(一)服务器的搭建  
因为本次要抓取的是微信群日常聊天数据,所以需要一  
台服务器来运行Python程序,本文的服务器搭建在腾讯云主机  
上,运行环境为Ubuntu16.04+Python3.6.5+Anaconda4.5.4。  
(二)Python三方库的安装  
图1  
(三)聊天情感归类  
# 统计  
本文主要借助了itchat开源微信个人号接口进行微信群的  
数据抓取,jieba开源项目对文本聊天信息进行关键词提取,  
snownlp开源项目对文本聊天进行情感判断,pyechats开源项目  
实现图表展示。上述开源项目均可通过pip命令安装。  
nlp = SnowNLP(content_match.group(3))  
emotions.append(nlp.sentiments)  
# 图表展示  
bar = Bar("群聊情感分析")  
item_name_list, item_num_list = emotions_  
count(emotions)  
三、群聊监视的代码实现  
设计思路:首先通过itchat模块监听文本聊天记录,通过  
群名对重点监控对象进行过滤。然后将数据通过logging模块写  
入日志文件,用于后续分析。  
bar.add("",item_name_list,item_num_list)  
效果如图2:  
参考代码:  
@itchat.msg_register(TEXT, isGroupChat=True)  
def group_msg_monitor(msg):  
if msg['FromUserName'] == _notify_groups:  
# 将发言人和发言内容写入日志  
ꢀcustom_logger.logmessage(msg['ActualNick  
Name'], msg['Content'])  
四、数据分析的代码实现  
设计思路:首先在服务器上将按天分割的日志文件合并  
成一个新的文本文件;其次通过Python读取该文件,并逐行解  
析;然后进行各类统计,比如按天统计发言总数、当月发言总  
数、日均发言数、发言最多及发言最少的数量、当月最早和最  
晚的发言时间及内容;最后进行一些特点分析,比如聊天情感  
归类和词频分析等。  
图2  
(四)词频分析  
# 统计  
get_tag(content_match.group(3), keywords_counter)  
# 图表展示  
(一)解析固定格式的日志文件  
for line in logfile:  
i t e m _ n a m e _ l i s t , i t e m _ n u m _ l i s t =  
counter2list(keywords_counter.most_common(100))  
wordcloud = WordCloud("话题排行")  
wordcloud.add("",item_name_list,item_num_list,  
time_match = re.search(r'^#(.{5}).{5}\s(.{8}).+?#\  
资助项目:三特行动、重庆工程学院移动互联工程研究 word_size_range=[9,108])  
中心。  
2018.No26  
32  
幕课在妇产科临床教学中的应用探索  
杨晓ꢀꢀꢀ华媛媛(通讯作者)ꢀ  
(重庆医科大学附属第二医院妇产科ꢀꢀ重庆ꢀꢀ400010)  
妇产科临床教学问题突出,包括:教学内容丰 传统课堂一般仅可容纳几十名或数百名学生,而MOOC的规模不  
设上限,凡是感兴趣者,无论天南海北、国内国外皆可在线参  
加,不受空间限制。一门精彩的MOOC动辄有上万人参与。  
正是由于这种即时性和大规模性,使MOOC可以在紧急状况  
下,如疾病爆发或自然灾害时成为有效的培训策略。2013年墨  
西哥霍乱爆发,卫生部门组织开展MOOC“霍乱的正确遏制和管  
理措施”[3]供医务工作者学习参考;2015年巴西大规模爆发寨  
卡疫情,相关领域专家制作了MOOC“寨卡的脚步……接近未知  
的真相”[4],介绍相关流行病学特征及其不确定性。二者均取  
得了良好的宣传、学习效果。  
富,但课时数不足;操作技术多,但是展示方法受限;患者病  
情复杂,长期随访困难;涉及患者隐私,大规模床旁教学难以  
实现。此时,我们迫切需要改进教学方法以解决上述问题。幕  
课(massiveꢀopenꢀonlineꢀcourses,MOOC)自2013年引入中国  
以来迅速发展,给传统教学模式带来冲击,同时也为之带来改  
革契机。本文结合妇产科学教学过程中所面对的问题,简要阐  
述了MOOC法的教学特点,对MOOC背景下如何提升妇产科学教学  
质量进行了初步探索。  
关键词:幕课 临床教学 妇产科  
幕课(massive open online courses,MOOC),即“大  
规模开放式在线课程”,它借助网络平台,将教学视频、课  
(二)知识点碎片化  
MOOC是以微课[5]作为载体,它将系统的知识切割成小块的  
件、习题集等资源公开提供给广大需求者。同时,MOOC也是一 知识点,每个知识点做成10~20min的微视频,这样一方面有利  
个网络交流平台,它将有共同爱好和目标、共同专业领域的学 于学习时的精力集中,便于理解和记忆;另一方面,方便学生  
习者聚集在一起,供大家讨论交流[1]。MOOC自2013年引入中国  
以来,其网络平台、课程数量和参与人数均迅速增长[2],为教 可满足不同层次学生个体化的临床学习需求。有一定基础的学  
育工作注入了新的活力。 员,不必再次完整、系统地学习,仅针对自身需求选择某些重  
医学教育需要将理论知识与临床实践相关联,但医学生 点、难点章节学习即可。  
灵活利用时间,不必利用整段时间集中学习。碎片化的知识点  
在有限的临床实习期间往往遇到的病种有限;临床操作技能繁  
多,然而由于手术室的人数限制,加之术野暴露不充分,给操  
(三)整合优质教学资源  
MOOC平台上汇集了各大高校精心制作、国内外顶级教授  
作学习带来一定困难;医学知识的快速更新要求医务人员保持 在线讲解、学员反复论证的精品课程,学生可以尽情汲取其  
终身学习,但医生普遍存在工作强度大、作息不规律等情况, 中的知识;教师也可以借鉴许多优秀课程的授课资料和方法,  
影响学习积极性。MOOC在一定程度上可弥补临床教学中的上述 以提高自身的教学水平[6]。MOOC的实时在线,给答疑和讨论带  
不足,改善教学质量。  
来了便利,不仅是教师和学员之间答疑互动,学员之间也方便  
交流。便捷、有效的沟通可以及时反映学员的需求和存在的问  
题,有利于授课方式和内容的不断改进[7]。  
一、MOOC的教学特点和优势  
(一)不受时间、空间等条件限制  
MOOC具有时间的灵活性,使学员针对自己的知识情况,灵  
活安排学习时间和进度,可利用空闲时间随时随地学习,将传  
(四)手段多样化  
MOOC的教学手段多样化,既有理论讲解又有现场演示,  
统的集体、被动学习模式向个性化、主动学习转变。MOOC可以 结合影像、动画、声音、图片等,带来全方位立体化的感官接  
通过各种联网媒体终端设备进行学习,如电脑、Pad、手机等。  
触,使学生形成由理性到感性的认识,对知识具有整体而系统  
的把握,以达到更好的教学效果。MOOC 的教学形式更加方便学  
生接受,学生先进行MOOC学习,然后参与临床实践教学,往往  
基金项目:庆市卫计委项目(项目编号:2012-2-  
068);重庆医科大学附属第二医院人才工程项目。  
效果如图3:  
对词频分析做进一步过滤,去掉一些停用词,让经营者清晰了  
解什么话题能引爆流量。本文在此抛砖引玉,希望对微信群分  
析有兴趣的同仁继续挖掘其中奥秘。  
六、结束语  
通过将当下最热门的两个技术词汇微信和Python融合,  
让司空见惯的群聊变得生动形象起来,是一名技术人的应有之  
义。通过技术发现规律,分析规律放大价值,是技术创新的必  
经之路。  
参考文献  
[1]婷,文欣秀,赵嘉豪,等.基于Python的可视化数  
据分析平台设计与实现[J].计算机时代,2017(12):54-56.  
[2]松丽.基于微信的社会舆论热点挖掘及分析模型研  
究[D].华中师范大学,2016.  
图3  
五、延伸话题  
由于篇幅有限,文中提到的其它统计与分析功能未做铺  
陈,详细代码可以到作者github主页查看。如有必要,还可以  
进行更为深入的分析,比如对于商业运营群,可以按小时统计  
聊天频次,让经营者掌握哪个时段投入广告效果最佳。也可以  
[3]一星,严素蓉.基于Python的中文文本分类的实现  
[J].福建电脑,2016,32(12):6.  
2018.No26  
33  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载