推荐星级:
- 1
- 2
- 3
- 4
- 5
基于Python的超市O2O营销数据分析
资料介绍
数据挖掘是分析数据的关键技术,利用Python语言及其IDE工具——Py Charm可以有效地对超市O2O(Online to Offline)营销产生的大量数据进行统计分析,从而加速线上线下资源整合,有利于超市的发展.通过对河南某大型连锁超市O2O营销产生的数据集进行去除无关属性、空数据、无效数据等预处理操作后,利用Python的第三方库Numpy、Pandas、Matplotlib等对预处理后的总数据集进行分析,得到了该数据集在年龄、用户等级、用户注册时间等不同维度上的分布情况.其中会员表所包含的用户中,大部分为年轻用户,小孩和老年人较少;另外,结合用户等级与他们的注册时长可以得出,大体上用户注册时间越长,等级就越高.超市决策人员可以根据统计分析的结果,调整营销策略,更好地服务客户、赢得客户.
部分文件列表
文件名 | 大小 |
基于Python的超市O2O营销数据分析.pdf | 2M |
部分页面预览
(完整内容请下载后查看)(
哈 尔 滨 商 业 大 学 学 报 自然科学版
)
35
4
期
Vol. 35 No. 4
Aug. 2019
第
卷 第
2019
8
年
月
Journal of Harbin University of Commerce ( Natural Sciences Edition)
Python
O2O
营销数据分析
基于
的超市
,
赵雅欣 宁士勇
(
,
哈尔滨商业大学 计算机与信息工程学院 哈尔滨
150028)
:
,
Python
IDE
———PyCharm
可以有效地对
摘
要 数据挖掘是分析数据的关键技术 利用
语言及其
工具
营销产生的大量数据进行统计分析 从而加速线上线下资源整合 有利于
O2O
O2O( Online to Offline)
,
,
超市
超市的发展 通过对河南某大型连锁超市
Python
.
、
、
营销产生的数据集进行去除无关属性 空数据 无效数
,
Numpy、Pandas、Matplotlib
据等预处理操作后 利用
的第三方库
等对预处理后的总数据集进行
, 、 、 .
分析 得到了该数据集在年龄 用户等级 用户注册时间等不同维度上的分布情况 其中会员表所包
, , ; ,
含的用户中 大部分为年轻用户 小孩和老年人较少 另外 结合用户等级与他们的注册时长可以得
, , . ,
出 大体上用户注册时间越长 等级就越高 超市决策人员可以根据统计分析的结果 调整营销策略
,
、
更好地服务客户 赢得客户
.
: O2O ; Python;
营销
: TP391
;
数据分析 超市
; Numpy ; Pandas ; Matplotlib
库 库 库
关键词
中图分类号
: A
: 1672 - 0946( 2019) 04 - 0431 - 05
文章编号
文献标识码
Analysis of marketing data of supermarket O2O based on Python
ZHAO Ya-xin,NING Shi-yong
( School of Computer and Information Engineering,Harbin University of Commerce,Harbin 150028,China)
Abstract: Data mining is the key technology for analyzing data,using Python language and
its IDE tool PyCharm can effectively analyze the large amount of data generated by supermar-
ket O2O ( Online to Offline) marketing,thus accelerating the integration of online and off-
line resources,which is beneficial to the development of supermarket. This paper used Py-
thon’s third - party libraries Numpy,Pandas,Matplotlib to analyze the pre - processed total
dataset through removing irrelevant attributes,null data,and invalid data from the dataset
generated by O2O marketing in a large supermarket chain in Henan,the distribution of the
dataset in different dimensions such as age,user level,and user registration time was ob-
tained. Among them,most of the users included in the membership table were young users,
children and the elderly were less; in addition,combined with the user level and their regis-
tration duration,it can be concluded that the longer the user registration time,the higher the
level. Supermarket decision - makers can adjust marketing strategies based on the results of
statistical analysis to better serve customers and win customers.
Key words: O2O marketing; Python; data analysis; supermarket; Numpy; Pandas; Mat-
plotlib
,“
如今 互联网
+ ”
,
成为热词 超市作为典型的
,
式 逐渐演变为利用现代信息技术进行
O2O
营销
,
模式下的超市营销 会由于消费
[1 - 2]
,
传统零售企业 其发展由开始的人工数据管理模
. O2O
而
管理
: 2018 - 12 - 17.
收稿日期
:
作者简介 赵雅欣
( 1994 - ) , , , : .
女 硕士 研究方向 商务智能与数据挖掘
·432·
(
)
35
第 卷
哈 尔 滨 商 业 大 学 学 报
自 然 科 学 版
、
者的在线浏览 支付购买等活动留下大量的数据
,
,
有效数据 若按照传统查询方式对数据进行分析
,
, ,
很容易导致信息过时 致使数据无效 最终无法发
若能有效地利用数据挖掘技术对其进行研究和挖
, ,
掘 就可以加速线上与线下资源整合 使商家以更
.
挥其作用
[3 - 4]
、
低的成本高效率地服务客户 赢得客户
.
本文
3 Python
O2O
营销数据
分析超市
Python O2O
语言对超市
结合
营销产生的海量数据
, ,
进行分析与挖掘 从中得到一些有价值的信息 以
3. 1
数据集
,
帮助超市管理者更好地了解超市的基本情况 促进
本文使用的数据来自河南地区某大型超市的
.
,
真实营销数据 原始数据集中包含了该超市的会员
超市的发展
、 、 .
信息 商品信息 销售信息等数据 其数据结构和基
1 Python
数据分析
.
本信息如下
①会员信息表
Python
t_hyml.
、
包括会员编码 会员名
是一门简单易学而又功能强大的编程
, ,
语言 它以开发效率著称 致力于以最短的代码完
、 、 、 、 、 、
称 会员类型 年龄 性别 会员积分 累计金额 总
,
成任务 利用
Python , Py-
进行数据分析 仅仅只是
.
积分等
②商品信息表
[5]
thon
.
t_spml.
、
包括订单编号 商品编
众多功能中的一部分
Python
,
本身的数据分析功能并不强 需要安装
、 、 、 、 、
码 商品名称 商品产地 零售价 会员价 计量单
,
Numpy、Pan-
提供了真正的数
,
、
位 保质期等
.
一些第三方库来增强它的能力 例如
[6]
das、Matplotlib
.
,Numpy
t_skmx. 、
包括流水号 销售日
等
其中
③销售信息表
,
、 、 、 、 、
期 销售时间 商品编码 会员编码 销售价格 销售
组功能 以及对数据进行快速处理的函数 它是很
[7 - 8]
; Pandas
Py-
、
数量 销售金额等
.
多更高级的扩展库的依赖库
是
thon
,
下最强大的数据分析和探索工具 支持类似于
3. 2
数据处理
、
原始数据集中存在大量的空数据 无效数据以
SQL
,
的数据的增删查改 并且带有丰富的数据处理
,
; Matplotlib
,
及无关属性 故为了更好地对数据进行统计分析
,
函数 支持灵活处理缺失数据等
是最著
名的绘图库 主要用于二维绘图 它不但提供了一
Matlab
[14]
,
,
.
需要对原始数据集进行处理
,
整套和
以非常快捷地用
出达到出版质量的多种图像格式
相似但更为丰富的命令 让我们可
将存于数据库的原始数据集中的相关联属性
Python
,
, , 2. 43G
进行表连接操作 去除无关属性 共得到 的
可视化数据 而且允许输
[9 - 10]
.
, 、
数据 在此基础上进行去除空数据 无效数据操作
, ,
后 得到最终有效的总数据集 包括
hyml(
会员目
2
O2O
营销数据特征
超市
)
录表 和
xsb(
) .
销售表 两个表 部分样例如表
1、2
O2O
.
所示
模式下超市营销数据是指大型超市在日
、 、
常经营中产生和积累的与用户 商品 销售相关的
,
经过数据处理后 原始数据转换成可以用
Py-
[11]
.
,O2O
thon
,
进行分析的数据 具备了统计分析的能力
.
一系列数据
与传统的线下营销模式不同
,
模式下超市营销数据的来源更为多样化 其中不仅
1
hyml
表
表
,
有来自用户在实体店购物的交易数据 还有来自用
hybm
sfzh
sex
女
女
男
女
男
女
fkrq
hyjf_total
、
户在线上平台的浏览记录 网上搜索引擎的搜索记
[12]
[13]
60091044 410101197007101366
60091045 410103198805190145
60091046 410581198701099030
60091047 410126197007150042
60091048 410421197312055011
60091049 410103197304173748
2011 - 01 - 03 1 623
.
.
录等
其主要具有以下几点特征
1)
.
数据量大 超市每天除了会获取大量的线
2011 - 01 - 03
2011 - 01 - 03
2011 - 01 - 03
2011 - 01 - 03
975
515
861
380
,
下交易数据 还会有来自线上数据的采集和加入
,
O2O
,
模式下的数据不仅量大 来源也很广泛
.
所以
2)
.
O2O
,
模式下 可以通过多种
类型繁多 在
途径获得超市营销数据 不再仅限于用户信息 商
O2O
,
、
,
、
平台用户行为数据 用
品交易信息等 还包括
2011 - 01 - 03 1 231
、
户反馈和评论数据 线上商品搜索记录等
.
: : , , , ,
注 表中字段 会员编码 身份证号 性别 注册日期 会员总
3) . O2O
速度较快 超市
营销所产生的数据在
.
积分
,
网络环境下具有瞬时性 所以必须实时处理以获取
全部评论(0)