研发案例 电商数据分析用 Excel 也可以做 来源: 发表时间: 2022-06-18 来源:火狐体育最新官网登录入口 作者:火狐体育app

  编辑导语:我们在面对海量数据时,需要先明确方向,心里有所规划后再去进行分析。本文从明确问题、理解数据、数据清洗和数据分析四个步骤讲述如何利用 Excel 进行实操,推荐给对数据分析感兴趣的童鞋阅读。

  在手头拿到数据后,不要着急做清洗和分析,而是先根据掌握的信息进行脑暴,通过这份数据我 / 我们能大体确定些什么问题,可以通过脑图(比如 Xmind)在罗列的诸多猜想后,根据重要性进行排序。

  为什么要怎么做?古话云:磨刀不误砍柴工,先把问题了解清楚,有利于后期的分析,而不是贸贸然上手,花费了诸多功夫,到头来悲凉地发现得出的结论与要分析的方向南辕北辙。

  猴子聊数据分析里的短视频小姐姐的一个说法让我印象深刻,她将 理解数据 比作炒菜前准备的 葱蒜姜末 等佐料,对于数据分析这道大餐,表格中的不同字段,其背后的含义要能理解清楚,否则就是菜不对味儿。

  切记:数据清洗不要在原始表格上直接处理,可以复制表格再生成一份,防止原始数据被破坏,影响工作效率。

  以产品信息表为例:7 个字段中,商品属性初步来看分析价值不大,可隐藏,后面可视具体情况如有用再取消隐藏

  缺失值处理:容易忘记的一个环节,尤其是遇到大量级的数据,一定要检查一下,可以使用 countblank()函数,补全的 4 个方法:缺失值较少可手动补齐、删除、数值的话采用平均值代替和通过统计模型算出的值进行替代。

  一致化处理:将表格中不规范数据进行批量处理,2 张表中的日期数据需要处理成正确可计算的日期型数据,可以先用 len ( ) +left/mid/right ( ) +find ( ) 函数进行组合,本例中的数据比较齐整,也可以采用分列来拆分,具体使用以实际情况为准。

  在分析版块中,我重点采用了 Excel 的【数据透视表】、【数据分析】中的【描述统计】和 Vlookup ( ) 函数,具体详见如下:

  产品信息表的分析思路:在对一级类目进行基础汇总统计时发现不同类目之间的销量差异明显,对该表的销量进行描述统计发现极值差悬殊,在此基础上针对销量这一列进行分组产生新的字段【订单类型】,由此结合一级类目、订单类型和购买日期 3 个维度组合分析(注:购买数量默认统一为当天单笔订单)。

  使用Vlookup ( ) 模糊匹配进行分组,根据电商业务场景,存在批发订单的可能,5 个以内为个人常规订单范畴,6 个及以上都算作批发订单,再根据实际购买数量分成:小、中及大批量,具体见如下截图:

  用户信息表的分析思路:相对于产品信息表,用户的数据量较少,算是产品的一个小样本,在使用 Vlookup ( ) 进行多表关联后,在拼接字段后,根据用户 ID 的唯一性可以分为 2 张表:其一不含交易信息(字段包括:用户 ID、购买日期、性别、出生日期、年龄和年龄分类)不具有重复值,另一张则包含交易信息(在 Vlookup 产品信息表时会发现复购的交易记录),根据年龄新增字段 年龄分类 ,通过年龄分类、性别、用户 ID 及购买数量进行多维分析。

  作者:杭州 @阿坤,母婴电商行业数据分析师兼数据产品经理,致力于研究电商行业的数据驱动增长以及数据产品从 0 到 1 的搭建; 数据人创作者联盟 成员。

上一篇:数据库 (一)--MySQL - SegmentFault 思否 下一篇:数值小数数据类型SQL
关注我们
©2022 火狐体育最新登录网址_官网app入口 京公网安备110177777720125 火狐体育最新登录网址|火狐体育app