数据分析

如何做数据分析?

在运营互联网产品时,怎么做数据分析?
关注者
154
被浏览
180,758

29 个回答

文科出身,在数据分析上算是一路摸爬滚打。现在带着5个人的团队,组建了信息部,主要负责公司的营运数据分析。分享一些我的经验。

如何做数据分析,不难,难在如何做好。拆分成两块:Excel数据分析技能+其他数据分析硬核经验。

一、快速掌握excel分析技能

1、excel学习

excel教程不要太多,如何快速学习excel,我之前也回答过,反正就是逮住一本教程,照着练:

把一本体系化的excel教程吃透了,就足以应对业务工作所需的数据分析了。

如果觉得书籍太枯燥,那把视频课看起来。对数据分析有帮助的一些还不错的视频课,我梳理了一下:

在有了Excel的基础上,可以再去适当学习一些数据分析的基础课程,二者在很多地方都是相通的,注意:不要一开始就去啃那种很难的数据分析课程,否则很容易放弃。

2、excel实操

好用的函数能让你数据分析时,如有神助,下面是我在数据分析时常用的函数:

常用函数(加总求和、计数、平均、最值、排序、乘积、除余、取整)
逻辑运算(if、iferror、and、or)
文本编辑(文本提取、文本查找、文本替换、文本转换及合并)
引用与查找(vlookup、hlookup、lookup、indirect、index、match)

1)排序函数

rank(排序的目标数值,区域,逻辑值)

逻辑值如果输入0或者不输入时,为降序排列(数值越大,排名越靠前);逻辑值输入非0时,为升序排列(数值越大,排名越靠后)

  • 比如:对业绩排名的计算,小李排名第5

2)逻辑判断

if(计算条件的表达式或值,满足条件返回true,否则返回false)

根据指定条件来判断其“满足”(TRUE)、“不满足”(FALSE),从而返回相应的内容。

  • 比如:判断团队业绩是否达标,小李和小军均不合格

3)计算文本长度

len(要计算字符长度的文本),用来计算文本串的字符数

  • 比如:判断手机号是否有效,小李手机号少一位,为无效信息

不全部列举了,这篇讲的比较全,可以参考:

数据处理上,可以使用一些excel插件,提高处理速度:

1)慧办公 :适用版本:Office2003/2007/2010/2013/2016/365等、WPS013/2016等

2)Excel易用宝-V2018 :Excel Home出品,适用版本:Excel 2007/2010/2013/2016和Office 365

3)方方格子 :除了常见的Excel工具箱外,在公式/审计/财务/图片/邮件等领域还有一些付费插件。适用版本:Excel 2007~2016

4)Excel必备工具箱 :适用版本: EXCEL2007/2010/2013/2016

5)Excel精灵-8.0版 :Excel精灵7.2网络版的功能比较全,但有捆绑软件。适用版本:Excel 2007、2010、2013和2016

6)Easycharts :图表制作插件

注:插件方便也不用贪多,挑顺手的数据处理和图形制作的各一个即可。

缺实操的伙伴,可以从199it上找点数据练练手。常见的公开数据网站都可以搜索到:

或者进一些综合类的商业数据网站:镝数聚,除了研究报告,还可以找到很多当下最新的热点数据。

另外,好的图表可视化是一份分析报告的点睛之笔。平时要多看美图、多参考:

关于如何制作干净漂亮的excel表格,在这篇回答有我的一些经验:

二、数据分析的几点硬核经验

1、务必提升数据采集的效率

因为读了四年社会学(社会调查专业户),经常需要大面积采集数据,所以吃够了数据收集的亏。excel重处理而弱采集,尤其在大体量的公司,跨部门收集、汇总四面八方的数据,很崩溃。

所以我从去年5月找了一些表单工具(j简道云、麦客、金数据、氚云等),一圈试下来,碰上年初的疫情我们公司上了钉钉,现在是【钉钉+简道云】搭配使用,数据收集效率还是很可观地,目前在库存管理、销售管理上都已形成了规范的数据采集管理:

关于实际使用的心得,我就不展开讲了,以后再作分享。

数据采集还涉及线上数据爬取,但这方面我了解不多,就不班门弄斧了。有意者可以参考这篇回答:

2、业务知识大于工具选择

所有数据分析师都会告诉后来人“业务知识很重要”,因为大家在踩了坑之后才恍然大悟分析中遇到的很多难题问题都源于对业务的不了解。

例如,同样是对客户进行分析,互联网电商的客户与保险客户具有明显区别,前者重视来源,活跃度,购买率,流失率,后者关注渠道,报价,理赔风险,投诉。业务知识包括这种大方向的行业知识,也包括公司内部特殊情况,了解得越详细可以避免绕很多弯路。

例如,有些行为是内部人员参与的造成的数据异常要提前做处理,有些业务开展是带地区特性的,分析时候要区分对待等。

而真正做分析时候,你会发现市面上有太多的分析工具,需要掌握的实在是太多了,其实不必纠结于此,依据个人能力,配合当前的数据分析环境,适用的工具自然会被选出。

数据分析过来人都会说80%的时间都在做数据处理工作,所以数据处理能力是必须的,简单工具有Excel、SQL,复杂的有R,Python,Java。专业点的是fineBI、tableau等。

3、规范良好的数据思维

分享几本在我成长过程中帮助较大的【数据分析书籍】,整理了PDF版本,大家按需自取:

1、《深入浅出数据分析》

数据分析入门第一本。通俗简单,能够让你对数据分析的相关概念有大致的了解。这本书蕴含的思想逻辑和分析原则,要好好体会,会对你以后的学习有很大的帮助。

2、《深入浅出统计学》

号称“文科生也能看懂”的统计书。阅读起来相当容易,一口气就能看完。这本书所讲的知识在数据分析中都是常见且必须掌握的,比如基本的统计量,基本上每个分析项目中都会用到;比如基本的概率分布,总体与样本的概念、置信区间、假设检验、回归分析,都是关于数据分析的统计学知识。

“HeadFirst类的书籍,一向浅显易懂形象生动,可以对分析概念有个全面的认知。”

3、《精益数据分析》

“此书优势在于将企业分成了几个大的行业类别,并分门别类的讲解了每个行业的商业模式特点及分析技巧,对使用者的分析能力要求较高,且必须具备相应的业务知识。”

书中并没有讲到具体的数据分析技术,主要分析了各种产品中用到的指标、模型和“数据驱动型产品”的一些思路。

4、《决战大数据》

阿里巴巴前数据副总裁车品觉所著,讲解了阿里巴巴在企业内部治理数据过程中的心得,所讲“存-通-用”数据管理三板斧和“从数据化运营到运营数据”,字字珠玑,可堪借鉴。


最后,数据分析,不难,难在如何做好,数据分析也不是一蹴而就的,需要不断在业务、工作中打磨。

相关阅读:

  • 数据可视化图表: 如何制作有趣好看的数据可视化图表?
  • 入门数据分析: 如何入门数据分析?
  • 数据报告网站: 有哪些不错的数据报告网站?
  • 数据分析方法: 你最常用的数据分析方法有哪些?
  • Python数据分析: 如何学习python数据分析?

更多内容,欢迎关注 @老贱

发布于 2022-11-14 16:33

基于题主给出的数据分析对象是互联网产品,所以这篇里我就讲讲,针对互联网产品运营,数据分析怎么做。

无论时是做搜索引擎的百度,做综合门户的新浪,做即时通讯的腾讯,还是做电子商务方面的阿里,任何一家互联网企业的产品运营,其实看来看去,看的总是那三项:新用户的引流、用户的转化和老用户的留存。so,我们就分别从引流、转化、留存这三个方面的数据来看,要怎么进行分析。


本文使用的BI分析工具为FineBI

一、引流

互联网流量数据分析方面,总结主要有如下四种数据常用分析方法:

  • 对比分析流量规律,针对时段进行企业服务以及推广活动调整
  • 对比分析结构占比,指导进行定向群体营销推广
  • 对比分析异常情况,及时追责并且进行调整
  • 对比追踪活动流量变化,总结活动效果经验以便后续有针对性调整

1、用户浏览量周分布

对于互联网企业来说,流量数据往往都会呈工作周相关。对此,我们可以先宏观地统计出周一到周日中的总的平台流量柱状图数据对比情况。首先我们可以仔细观察工作日和非工作日的数据,发现周末的平台流量较工作日流量要高,这在互联网行业来说都是一个比较普遍的现象。

用户浏览量周分布

掌握了用户流量的周分布规律之后,我们就大致有一个推广方向,周末休息时间用户群体较大,相较于工作日可以投入更多的和丰富有吸引力推广活动来进行新用户引流和老用户活跃。

接着我们可以进行下一步思考,那工作日和周末我们的活动推广时间如何制定?

有的同学们可能会觉得全天活动都可以,不需要关注具体的活动时间。但是对于互联网行业来说,每个时间段的推广费用都是较为昂贵的,我们完全可以分析出工作日和周末的用户流量趋势,进行有针对性的时间段投入推广,通过更小的成本获取到更多的用户流入。

首先是工作日的时间段流量统计分布,我们通过BI工具分时间段作图得到如下所示的流量分布图。可以看出,工作日的流量主要集成在每日的9点(上班时间)、13点(午餐时间)、20点(晚间娱乐休息时间),那么在得到这样的一些用户流量规律之后,便可以在这些用户活跃高峰期时间段有针对性对白领群体多做一些相关商品推广活动,以实现最小时间成本和推广费用最大化用户引流效果。

各时间段流量分布

再来看周末的各时间段流量分布走势,和工作日所不同的是,周末的流量早高峰期延后到了10点,这可能和各位小伙伴们周日作息较晚有关(同学们周末都是几点起床呢),除此之外,晚上的流量高峰退潮期也有延后。针对与周末用户流量分布的特性,互联网企业在周末时可以将活动开始时间和活动结束时间都适当进行延后,这个时候不能再套用工作日制定好的活动时间计划了,因为符合用户群体作息规律的推广促销活动才能达到更好的效果。


2、推广渠道流量分布

对于互联网行业的推广渠道分布主要分为三级渠道:

  • 线上渠道(百度、Google等)
  • 线下渠道(活动、会议、行业峰会等)
  • 新媒体营销(今日头条、知乎、微信、脉脉等)

我们需要对比分析每个渠道对企业所带来的价值占比差异,以指导制定有针对性营销策略。

推广渠道流量分布

如上图所示,由于推广渠道是分多层级的,我们通过BI工具的多层饼图进行数据的分析统计再合适不过了。分析下图的数据我们可以看出,首先是一级渠道的主要战斗力来自于新媒体营销,当今的微信、知乎等社交媒介社区时代受众广泛,用户群体非常庞大,是公司需要投入主要成本进行推广的。其次线上渠道的效果也不容忽视,对于互联网企业来说,做好百度、Google等SEO搜索引擎关键词推广也是很重要的一部分工作。相较于线上渠道和新媒体营销,线下渠道说所需要的经费和时间、人力成本较大,受众又相对较小,所以此类活动往往针对核心粉丝进行运营即可。

推广渠道用户数


3、各月份指标对比走势

互联网营销常用的几个指标概念:

  • 浏览量(pv)
  • 访问次数(visits)
  • 访客数(uv)

以上三个基础指标常用来衡量流量数据的多少。另外平均访问深度(总浏览量/访问次数)、平均停留时间(总停留时间/总浏览量)、跳失率(跳出次数/访问次数),这三个指标通常可用于衡量流量指标的优劣性。

各月份浏览指标对比

我们仔细分析上图中的平台流量指标,可以发现10月份是2017全年的流量高峰期,应该跟企业在国庆黄金假期所做的促销引流活动有关。浏览量、跳失次数、访问次数分别为4941、1290、2182,对比计算可得到跳失率为59.12%,明显低于其他时间段的跳失率,说明10月份的活动效果还不错,其经验对以后的营销推广可以起到参考作用。


4、访问深度用户群体分布

访问深度用户群体分布分析(跳失率=跳出次数/访问次数)

用户群体访问深度分析

我们通过BI工具将企业的VIP用户、老用户、新用户分别进行分时间段的用户群体访问深度分析统计。总体来说可以发现平台的VIP用户访问深度较老用户以及新用户稍微高些,但是不是太明显,说明平台运营的VIP这部分群体的活跃度还有待提升。

同时,平台老用户访问深度和新用户更是相差无几,公司对于用户这方面的活跃运营明显需要加油了,建议将平台的部分忠诚度较高的老用户以VIP用户组建起来,共建平台生态圈,增加整体的用户活跃度。也可以向老用户以及VIP用户实施一些优惠政策,如定向商品折扣、根据用户画像进行喜好商品特惠推送等。


二、转化

在引流,即获取到了用户流量之后,我们也就获取到了平台的一批潜在用户。第二步,就需要通过一系列的运营策略,让用户顺利完成搜索商品-浏览商品-下单商品-交易付款的过程转化,即,转化。

成功交易转化率逻辑图

1、下单转化率

对于平台经营方来说,我们希望一旦有用户流量进入平台网站,他们就能够顺利按照我们平台运营设定好的系列要求一步步进行下去,最终完成交易付款操作。那么对于互联网运营方来说,就需要做好用户在会员注册、商品收藏、购物车添加、交易付款等一系列转化操作。对于这样需要进行逐级转化的平台运营,那么我们首先可以通过漏斗图进行宏观的流程转化数据分析找出目前阶段最需要优化的运营环节,有效地进行针对性治理,最终提高整体平台用户下单转化率。

  • 会员注册转化率=新增会员总人数/新访客总人数

对于互联网平台运营方来说,往往用户进行平台消费行为之前都需要注册为网站会员。而网站会员机制有利于平台进行定向运营推广,以增强用户和平台之间的黏性,故而提升网站平台的会员注册转化率对于提高用户复购率来说非常重要。在当下这样的一个的互联网社交时代,除了做好自己的网站直接会员注册运营之外,打通跟其他社交平台比如微信、QQ等平台账号共享能够明显提高网站平台的注册转化率。

  • 商品收藏转化率=商品收藏总数/商品浏览总数

这一指标通常在平台举行大型促销活动之前需要时刻关注的一个指标,因为在这个时间段内的商品收藏量有很大几率能够直接转化为成功交易订单,与此同时,该指标对平台活动促销效果也能够起到一定预估作用。

  • 品牌/单品转化率=单品成功交易订单/单品浏览量

这一指标通常用户平台进行商品受欢迎程度统计,通过分析品牌/单品转化率,从而引导商铺进货品牌种类,提高单品转化率高的货物进货量的同时降低单品转化率低的货物进货量。

  • 付款转化率=付款总数量/下单总数量

这一指标通常用于反应平台的支付渠道和用户的支付习惯的匹配程度,通常来说我们需要完善快捷银联支付、支付宝、微信支付等渠道,降低因为用户没有某个支付平台而放弃消费的可能性。

某个平台的用户访问阶段转化率数据分析

首先看用户从浏览商品行为到添加购物车行为这一流程的转化情况,通过漏斗图可以快速看出其转化率为50.77%,反映出该平台的商品介绍、图片描述等对用户有较强的吸引力。

接下来继续看添加购物车到下单的转化率,可以看出其转化率高达99.66%,非常不错。之后却看到单至付款的转化率仅50%,这是一个值得反思的转化节点,通过数据分析猜测该平台商铺支付渠道不完善,需要增加例如支付宝、微信等快捷支付渠道,降低平台因为没有提供用户习惯性的支付渠道而导致用户放弃购买行为的几率。


2、事件转化率

事件转化率通常指的是平台或商铺通过一系列的运营推广活动以及由于公共事件影响所带来的额外价值。这一指标对于平台运营评估和指导市场推广运营活动极为重要,例如网络营销总的SEO关键词投放、折扣促销活动、邮件营销等等效果跟踪。关于事件转化率方面的数据分析,通常我们可关注于营销渠道转化率、会员转化率、店铺流量转化率、下单转化率等指标进行活动的推广营销效果评估。

利用BI工具,首先分析出各个营销推广渠道的转化率环形玫瑰分布图。可以看出目前平台的转化率最高的渠道主要是基础上线工作、SEO关键词推广、微信推广、品牌推广几个渠道。同时我们想联动查看每个渠道对应的转化率数据时,通过BI工具提供的数据自动联动过滤功能让用户无需任何设置即可进行所有相关联的数据联动。

各渠道转化率分布

除了以上渠道营销策略之外,对于平台商铺而言,合适的关联性商品推荐也能够提高用户对关联商品的购买率,比如用户在购买完服装之后可以再给他推送鞋子一类商品。另外关于事件转化率方面,由于季节性以及公共事件也会影响商品的下单转化率,针对不同时期较流行的商品进行进货营销往往才能够达到最大的盈利目的。


3、服务转化率

服务转化率方面,通常用户在网上购买商品时,对于商品的一些细节品质以及发货渠道和速度等会需要做一些了解。那么良好的服务自然能够提高顾客的购买率,对于平台的客户人员,我们可以统计处其咨询到下单的节点转化率,并且以咨询到下单的转换率指标作为KPI指标之一来评价客服人员的工作绩效。

如下图所示,通过BI工具进行客服咨询下单转化率条形图的数据分析统计可以发现,该平台的Blanche、Henry、Christian、汉克、贝蒂这五名客服的转化率比较优秀,并且都在10%以上,其他的客服员工的转化率则相对较低,故而这方面可以让转化率最为优秀的Blanche客服给其他客服做一次服务培训,整体上提升平台的服务水平,进而提升用户的下单转化率。

客服咨询下单转化率排名


4、退货率

退货率方面,对于用户而言退货的原因通常可分为两大类,一类是由于买到的商品质量有问题而申请退货,另外一类可能是由于用户自身原因想申请退货。平台方往往更为需要关注第一类因为商品质量问题而申请退货的商品,通过历史商品的质量原因退货数据统计分析,对于确确实实是存在质量问题的商品需要及时反馈给供应商,质量过于严重的话可以考虑该类商品和供应商的协商库存退货。

商品退货品牌分布统计


三、留存

特别是对于TO-C模型下的互联网企业而言,做好平台的用户留存是互联网企业可持续发展的根本保障。如果我们费尽人力物力方才完成拉新和成功转化的用户,在一段时间内就快速地流失掉了(可能其流失之前付费阶段对企业带来的收入还不及前期推广投入的成本之多),那么这绝对是一个非常失败的运营条链。

用户留存

我们可以从宏观上来定义平台的留存用户:在互联网行业中,用户在某段时间内开始使用应用,经过一段时间后,仍然继续使用该应用的用户,被认作是留存用户。我们往往希望留存用户越多越好(新增留存用户数=平台新增用户数*新增用户留存率)

新增用户留存数逻辑图


1、提升产品价值

对于用户而言,使用你们企业的产品只有一种可能,那么就是你们的产品能够对其工作或者生活产生一定价值。对于企业而言,必须做好产品的版本更新迭代工作,不断丰富产品的应用功能、深化产品的可应用空间、简化产品的交互操作,让用户能够通过更少的时间成本快速上手我们的平台应用,同时通过平台为用户创造其所需要的价值。

某平台用户改进建议

如果是在产品设计研发前期,就需要充分调研和考虑用户的需求,以用户为核心,做出真正对用户有价值的产品。对于正处于稳定发展的产品或者平台而言,也需要多多收集平台的用户改进建议,多听听用户是怎么想的,设计出超出用户预期的优秀产品。另外还需要时刻关注竞品动态,观察同类平台或者产品的最近更新状况,打造一款比市场同类产品更加有特色和区分性的产品。


2、让用户感受产品价值

我们需要不断丰富和完善平台或者产品的文档和教程视频,丰富产品或者平台的成功应用案例,优化产品的使用流程向导。对于用户而言,即使你的产品或者平台本身功能再强大,但是用户下载之后感觉无从下手或者无法深入应用的话,那么其产品本身所提供的应用价值也就无从发挥,所以为用户做好产品流程使用方面的帮助事宜对于用户留存来说是非常重要的。


3、活跃用户/提高用户黏性

通常来说到这一步,我们经过前期的引流和转化工作之后已经拥有了一批用户了。对于平台已经拥有的这批用户,我们就需要开始数据精细化运营管理了。很多情况下往往前期运营引流和转化投入带来的高速用户增长,如果不做好用户留存方面的工作,那么最后结局必然是前期的重金得不到对应的利润回报,最终却是竹篮打水一场空。

下面是几个常用的用户生命周期指标:

  • 新增用户数=在某个时间段新登录应用的用户数
  • 登录用户数=登录应用后至当前时间,至少登录过一次的用户数
  • 留存率=新增用户中登录用户数/新增用户数*100%
  • 次日留存率=(当天新增的用户中,在注册的第2天还登录的用户数)/第一天新增总用户数
  • 第3日留存率=(第一天新增用户中,在注册的第3天还有登录的用户数)/第一天新增总用户数
  • 第7日留存率=(第一天新增的用户中,在注册的第7天还有登录的用户数)/第一天新增总用户数
  • 第30日留存率=(第一天新增的用户中,在注册的第30天还有登录的用户数)/第一天新增总用户数
平台用户总量走势

从2017年1月开始,平台的IOS用户数量增长较快,到2017年8月份达到了将近4500的IOS总用户数量。表面上看起来平台的IOS用户数量增长情况是要大于安卓用户增长的,到2017年8月时的总用户数量也要大于安卓用户数量。但是我们仔细观察这两组数据增长情况会发现,IOS用户虽然增长快,但是在2017年5月之后总用户数量趋于平缓,而安卓用户数量虽然增长慢,但是确是一直保持着稳健增长的趋势。

平台用户月留存率分析

这个时候我们就需要关注除用户增长之外的平台用户留存率指标计算统计情况了,下面我们再来继续看看IOS用户和安卓用户的留存率变化对比如何。我们观察上图中,月度用户留存率数据统计情况可以看到,一开始IOS和安卓的用户留存率都是100%,到了第七日IOS的用户留存率下降至44%,安卓用户七日留存率是58%,最后到第30日IOS的用户留存率仅剩15%,而安卓的用户留存率却还有35%。这也就不难解释为什么平台高增长下的IOS用户为何最后留存下来的用户最后却不多了,其背后严重的用户流失率是一个不容忽视的问题。

而关于如何提高平台的用户留存率方法方面,我们有许多事情可以做。比如给平台的用户特别是刚注册的新用户推送相关优惠促销活动,让他们能够快速地融入到平台中产生消费;对于平台积累下的老用户,我们需要注重平台的社区生态运营,以增强用户和平台之间的黏性,提高用户留存率。同时平台需要打造一批平台核心粉丝用户,通过一定物质上的激励形式鼓励用户以老带新,实现平台&用户共创。


4、流失用户回流

一方面,我们需要考虑是否是由于平台或者产品本身的原因导致用户流失,所以通常来说如果是软件类的产品我们一般可以在用户需要卸载产品之前,做一个用户卸载原因选项调研,有针对性地对应反馈意见较多的点进行产品体验改进,如果是网页平台端的产品,我们可以通过定期邮件内容(促销活动、产品使用教程、产品价值文案等)进行用户推送唤醒,值得注意的是我们在做用户回流操作尝试的同时,需要即时关注用户回流指标的数据走势,这样方可找到平台或者产品当面最需要改进的方面。

另外一方面我们还需要考虑到用户本身的质量,当然这是在做完第一方面前提下之后的进阶工作。通常来说我们可以统计各个推广渠道所带来的用户特征分析,因为不同的推广渠道最后引流所带来的用户质量可能跟推广渠道本身具有一定相关性。关于如何分析不同渠道的用户群体特征方面,这里我跟大家推荐非常实用的RMF用户画像模型。RFM模型是衡量客户价值和客户创利能力的重要工具和手段,在众多的客户关系管理(CRM)的分析模式中,RFM模型被广泛应用。

  • 最近一次消费 (Recency)
  • 消费频率 (Frequency)
  • 消费金额 (Monetary)

当然除了以上的分析指标之外,我们还可以根据自己产品或者平台的特点再添加新的分析指标。例如下图所示,我们除了分析平台用户最近一次消费时间、消费频率、消费金额之外,我们还增加了特价商品消费占比(价格容忍度)、最大单笔消费金额(购买力)、最高商品消费占比(价格容忍度)这三个指标进行联立分析,得到各个渠道更加精确的用户画像分析数据。

用户画像

例如上图中,SEO推广渠道所带来的用户,会员对产品和平台忠诚度比较高,但是购买力很低。这种客户虽然消费金额不高,但是即使不做营销策略,他们也会产生持续消费,这部分客户是企业持续利润的来源基础保证,通常我们可以通过在一些网站流量稍小的时段做促销行为,让其产生持续的集中消费。通过分析各渠道用户画像特征之后,我们可以进行有针对性的用户留存运营,以达到最好的留存效果。


不知不觉洋洋洒洒写了好多,希望对大家有所帮助吧!


最后分享一些相关资料:

编辑于 2022-09-28 09:30

与很多小伙伴一样,做数据分析时,拿着手里的数据不知道怎么分析、从什么维度分析。今天DataHunter数猎哥就来给大家分享7种最常用的数据分析方法,让你轻松运用数据分析解决实际工作问题,提升核心竞争力。

一、漏斗分析法

漏斗分析法能够科学反映用户行为状态,以及从起点到终点各阶段用户转化率情况,是一种重要的分析模型。漏斗分析模型已经广泛应用于网站和APP的用户行为分析中,例如流量监控、CRM系统、SEO优化、产品营销和销售等日常数据运营与数据分析工作中。

例如:Data Analytics为网站制作的“促销活动分析”

比如,对一些电商产品来说,最终目的是让用户下单并支付,但转化率取决于整个流程。这时,我们就可以通过漏斗模型一步一步地进行监测。如下图所示,我们可以监控用户在流程中各个层级上的行为路径,寻找每个层级的可优化点。对没有按照流程操作的用户绘制他们的转化路径,找到可提升用户体验,缩短路径的空间,最终提升整体转化率。

漏斗模型除了在电商中应用的比较多以外,在落地页、H5等也应用的比较多。我们可以反复优化落地页当中的图片、文案、布局,进一步的提高整体转化率。

二、留存分析法

留存分析法是一种用来分析用户参与情况和活跃程度的分析模型,考察进行初始行为的用户中,有多少人会进行后续行为。从用户的角度来说,留存率越高就说明这个产品对用户的核心需求也把握的越好,转化成产品的活跃用户也会更多,最终能帮助公司更好的盈利。
这里需要注意的是,在做留存分析之前,我们首先需要了解用户留存的特点:

比如,我们可以通过观察不同时间段用户留存的情况,通过对比各个渠道、活动、关键行为的用户后续留存变化,发现提升用户留存率的影响因素,例如观察领取过优惠券的用户留存率是否比没有领取优惠券的用户留存率更高。
除此以外,还可以针对流失高/留存高的用户群组进行一对一的用户行为分析,统计留存/流失用户的行为特征,特别是针对流失用户,通过流失用户的行为分析总结流失原因,从而提升留存率。具体步骤如下图所示:


三、分组分析法

分组分析法是根据数据分析对象的特征,按照一定的标志(指标),把数据分析对象划分为不同的部分和类型来进行研究,以揭示其内在的联系和规律性。
分组的目的就是为了便于对比,把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起,保持各组内对象属性的一致性、组与组之间属性的差异性,以便进一步运用各种数据分析方法来揭示内在的数量关系,因此分组法必须与对比法结合运用。

如图所示,分组分析在日常工作中应用的比较多的是用户分层与分群,比如在发优惠券的时候,可以通过红包,满减,限时券还有积分券等方式。我们可以针对不同的用户发送不同的优惠券以达到精细化运营的效果。那么当我们在做数据分析时,也可以从结果将用户进行分层来进行判断,这时同样也可以得到优化和改进业务的建议。

说了完用户分层,接下来我们说说用户分群。用户分群和用户分层其实是相关联的,用户分群是对用户分层的补充,当用户差异性较大,层级上不能再做用户细分时,可以考虑将同一个分层内的群体继续切分,满足更高的精细化运营需要。

例如:Data Analytics制作的“客户RFM群体分析”

RFM模型是客户管理中的一个经典方法,它用以衡量消费用户的价值和创利能力,是一个典型的用户分群。它依托收费的三个核心指标:最近一次消费时间(Recency)、消费频率(Frequency)和消费金额(Monetary)。

消费金额Monetary:衡量用户对企业利润的贡献,消费金额越高的用户,价值也就越高。
消费频率Frequency:衡量用户的忠诚度,是用户在限定的期间内购买的次数,最常购买的用户,忠诚度也越高。
最近一次消费时间Recency:衡量用户的流失,消费时间越接近当前的用户,越容易维系与其的关系。1年前消费的用户价值肯定不如一个月才消费的用户。

四、矩阵分析法

矩阵分析法是指根据事物(如产品、服务等)的两个重要属性(指标)作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法,也称为矩阵关联分析法,简称矩阵分析法。

矩阵关联分析法在解决问题和资源分配时,可以为决策者提供重要参考依据——先解决主要矛盾,再解决次要矛盾,这样有利于提高工作效率,并将资源分配到最能产生绩效的部门、工作中,最终有利于决策者进行资源优化配置。

比如在电商行业,我们可以使用浏览量和加购数这两个维度来进行矩阵分析,如图所示,左上角的是浏览量低的,然后加购次数多的,这说明产品其实是有很大潜力的,这时需要将这部分产品放在更好的位置让给用户进行浏览;右下角的浏览量高,但加购数低的,说明这个时候他的资源位置是好的,但是用户对这部分的产品并不感兴趣的,我们就需要对其进行相应的位置调整。

五、关联分析法

关联分析法是一种简单、实用的分析技术,是指从大量数据集中发现项集之间的关联性或相关性。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联等。

关联分析的一个典型例子是购物篮分析。该过程通过发现顾客放入其购物篮中的不同商品之间的联系,分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买,帮助零售商制定营销策略。其他的应用还包括价目表设计、商品促销、商品的排放和基于购买模式的顾客划分。
可从数据库中关联分析出形如"由于某些事件的发生而引起另外一些事件的发生"之类的规则。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的“啤酒和尿布”的货架摆放或捆绑销售可提高超市的服务质量和效益。

六、指标分析法

在实际工作中,当拿到一些可视化数据图表或者是Excel表格时,我们可以直接运用统计学中的一些基础指标来做数据分析,比如平均数、众数、中位数、最大值、最小值等,下面我们分别来介绍:

1.平均数
平均数、也叫平均分析法,是指运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平的分析方法。平均分析法常用指标有算术平均数、调和平均数、几何平均数、众数和中位数等,其中最为常见的是算术平均数,也就是日常所说的平均数或平均值。

平均数指标可用于对比同类现象在不同地区、不同行业、不同单位等之间的差异程度,比用总量指标对比更具说服力。除此以外,利用平均指标对比某些现象在不同历史时期的变化,也更能说明其发现趋势和规律。
比如,汽车行业的自媒体如果想要分析数据,可从两个方面来分析:①外部:行业内整体公众号的平均打开率是多少,我们距离行业平均水平相差多少,该如何去做一些优化;②内部:针对每个月都在尝试的各种选题和内容运营策略,可以分析本月比上月平均打开率又增加了多少,这个月的选题是否有一些爆款,爆款文章平均打开率是多少,标题有什么特点等等。

2.众数、中位数
众数也就是数据中的一种代表数,它反应的是数据的一种集中程度。比如说最佳,最受欢迎,最满意都与众数有关。众数本质上来说,反映的是数据中发生频率最高的一些数据指标,在做数据分析时,我们可以对这些数据指标提取一些共性的特点,然后进行提炼和总结,然后得出一些改进的意见。
中位数主要是反映的是一组数据的集中趋势,像我们比较常见的正态分布,比如说我们想去统计某市的人均收入,其实,大部分的人均收入都是在一定范围之内的,只有少部分是处于最低的和最高的,其实这是中位数带来的意义。

在做数据分析时,如果各个数据之间的差异程度较小,用平均值就有较好的代表性;而如果数据之间的差异程度较大,特别是有个别的极端值的情况,用中位数或众数有较好的代表性。

3.最大(小)值
最大(小)值在平时做数据分析工作时比较常见,只是我们没有特别去注意。最值是作为典型代表和异常值进行分析的,比如说销售团队里的销售冠军,电商爆款商品等,如图所示,我们可以将销售额最大的几款商品提出来,然后我们去总结共性,找到原因,然后复制到其他的商品,最终提高平均转化率。


七、对比分析法

对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。它可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少?对比分析法可分为静态比较和动态比较两类。

静态比较:在同一时间条件下对不同总体指标的比较,如不同部门、不同地区、不同国家的比较、也叫横向比较,简称横比;
动态比较:在同一总体条件下对不同时期指标数值的比较,也叫纵向比较,简称纵比。
这两种方法既可单独使用,也可结合使用。
进行对比分析时,可以单独使用总量指标、相对指标或平均指标,也可将它们结合起来进行对比。比较的结果可用相对数表示,如百分数、倍数等指标。
在使用对比分析法时,需要先注意以下几个方面:①指标的口径范围、计算方法、计量单位必须一致,即要用同一种单位或标准去衡量;②对比的对象要有可比性;③对比的指标类型必须一致。无论绝对数指标、相对数指标、平均数指标,还是其他不同类型的指标,在进行对比时,双方必须统一。

1.时间维度对比
同一指标在不同时间维度下的对比,如同比、环比、定基比等。同比就是与去年的同一个时间段进行对比分析,可以是季、月、周、天;环比就是和上一个时间段来对比(也有和下一个时间段对比的,也叫后比),例如本月和上月,本周和上周对比;定基比是和某个指定的时期进行对比分析,比如2013年每个月都和2013年1月的销售额进行对比取值。
如图为各月销售额对比,时间范围一致(均为月汇总)、指标一致、指标含义一致、其表现的为整个企业信息,总体性质可比。


2.空间对比
就是不同空间数据的对比,比如华北区和华南区对比,北京和上海,上海古北店和成都春熙路店进行对比。相似空间的对比对象必须是形态上比较接近,先进空间则是和同一种形态中的优秀空间进行对比,与扩大空间的对比,比如北京和全国的数据对比,北京王府井店和全北京的数据对比,和竞争对手的对比也在此列。
如图为2018年全年各销售小组销售额对比,其对比的时间范围一致、指标一致、指标含义一致、维度为各个销售小组,具有相同性质。


3.计划对比
和计划标准的对比是销售追踪中非常重要的一环,所有的绩效考核都是计划标准,例如销售实际达成金额与销售计划达成金额对比,看销售是否完成当初指定的计划,如果没有完成,原因在哪里。


4.与经验值或理论值对比
其中的经验标准是在大量的实践过程中总结出来的值,而理论标准则是根据理论推断出来的值,平均值则是某一空间或时间的平均值。如,一单一品率:所有销售小票中只有一个商品的小票数量占比。参考值为小于40%,如果数据超过了40%,则需要考虑如何调整策略,帮助客户做关联购买。而参考值小于40%,就是一个理论值。

以上就是7种常见的数据分析方法,在不同领域的工作中,它们通常都是以不同的形式展现出来的,我们需要在拥有数据面前,清晰知道应用哪一个或几个方法来分析实际问题最为有效,结合场景灵活运用,没有最好的分析方法只有最适合的。

关于 DataHunter
DataHunter 是一家专业的数据分析和商业智能服务提供商,注册于2014年。团队核心成员来自 IBM、Oracle、SAP 等知名公司,深耕大数据分析领域,具有十余年丰富的企业服务经验。

DataHunter 旗下核心产品智能数据分析平台 Data Analytics、数据大屏设计配置工具 Data MAX已在业内形成自己的独特优势,并在各行业积累了众多标杆客户和成功案例。


成立以来,DataHunter就致力于为客户提供实时、高效、智能的数据分析展示解决方案,帮助企业查看分析数据并改进业务,成为最值得信赖的数据业务公司。

欢迎关注公众号:DataHunter
-数据分析展示就用 DataHunter-

编辑于 2019-09-03 15:18

互联网运营分很多类,流量运营、用户运营、内容运营…每一个环节都有特别关注的数据和指标。

回答中很多都从PV\UV\用户数这些数据来切入分析,但是分析之后呢,做什么措施?以什么样的目标来驱动?我也分析做过这样的分析,这些常规的数据大多只是绑定着个人的KPI,反应这个人工作成绩的好坏,并不是一场完整的数据分析。

这里我想从更全面的角度来总结互联网企业的运营体系:精益数据分析。

数据分析的目的应该是为了公司的发展,粗暴一点讲,是为了公司的盈利和持续的盈利。

而互联网的盈利模式不同,数据指标也不同,大抵可分为3种:

  • 向用户出售商品或服务,以电商、社交和o2o平台为代表
  • 靠广告来进行盈利,典型的例如google、百度、字节的抖音以及其他平台类互联网公司
  • 是直接向用户收取费用,各大游戏公司

我们以分析体系最为复杂的互联网电商公司为例,来逐一分解,哪些数据需要分析,怎样分析,分析的价值是什么?

电商类公司的收入是由一个个订单堆出来,由用户购买相关的商品或服务产生,可以说用户和商品或服务为订单的两大基本元素,公司收入下降、增长、异常最终都可以追踪到用户与商品这两大元素上。

这样我们将收入相关的数据拆解为三大类:用户、商品和订单。

一、运营模块

从用户的消费流程来看,可以划分为引流-转化-消费-存留。我们一般将用户分为新老用户,无论新老用户,都会关注两块内容,一个是引流(拉新),一个是转化,最终以数据的形式体现出来,就是流量与转化率。

引流

通过分析PV、UV、访问次数、平均访问深度、跳出率等数据来衡量流量质量优劣。目的是保证流量的稳定性,并通过调整,尝试提高流量。

进一步,按照流量结构还可分为渠道结构、业务结构、地区结构。

在渠道中,流量可来自于自主访问、搜索引擎、淘宝付费、京东付费等等。按设备可分为PC渠道和APP渠道;按照付费与否可分为免费流量和付费流量。有人会通过渠道流量占比来分析各渠道的质量。下面的折线图可以对各渠道的流量情况进行追踪,分析占比不合理是短期内出现的,还是长期存在的,辅助问题的分析。仅仅根据流量情况来衡量质量是不全面的,需要配合转化率和roi。

上述图表是FineReport所做

按地区划分,这个很好理解。

按照业务结构,最典型的比如举办一场活动,例如双十一,可定要对活动的流量追踪。观察活动前、活动中、活动后的变化情况,评估活动效果。

转化

完成引流工作后,下一步需要考虑转化,这中间需要经历浏览页面->注册成为用户->登陆->添加购物车->下单->付款->完成交易。每一个环节中都会有用户流失,提高各个环节的转化率,是这一块工作的最核心,转化率的提升,意味着更低的成本,更高的利润。

转化的分析:

1.观察各环节转化率,分析其合理性,针对转化率异常环节进行调整

2.追踪转化率变化,用于异常定位和策略调整效果验证

3.观察各渠道转化情况,定义渠道价值,并依此适当调整运营策略

4.分析各环节转化周期,分析用户习惯,为制定运营策略提供依据

最直接的分析成果就是转化漏斗。

留存

通过各个渠道或者活动把用户吸引过来,但是过一段时间就会有用户流失走掉,当然也会有一部分用户留下来,留下来这部分用户就叫做留存用户。关于留存,这里要关注的就是日活和留存率。

关于留存,无非就是:

1.日活监控,观察用户活跃数据,分析日活健康度

2.观察存留规律,定位存留阶段,辅助市场活动、市场策略定位等

3.对比不同用户、产品功能的存留情况,分析产品价值、辅助产品调整

复购

有调查数据显示,一个满意的用户会带来8笔潜在生意,不满意的用户可能会影响25个人的购买意愿,可见回头客多么重要。

复购率可以分为“用户复购率”和“订单复购率”,此外,“用户回购率”意义与复购率相似,也在此范围内。

用户复购率=单位时间内:购买两次及以上的用户数/有购买行为的总用户数

订单复购率=单位时间内:第二次及以上购买的订单个数/总订单数

用户回购率=单位时间内:有购买行为的老用户数/有购买行为的总用户数

分析复购率的目的:

1.综合指标展示,分析用户黏性,辅助发现复购率问题,制定运营策略。

2.横向维度(商品、用户、渠道)对比分析,细化复购率,辅助问题定位。

流失

流失是无法避免的,但也有可以挽留的。

流失可以分为

  • 刚性流失:可以进一步分为新用户水土不服型和老用户兴趣转移型,这部分流失用户是无法挽留的,缘尽于此,花再多的钱也没什么用。
  • 体验流失:可能是应用体验、服务体验、交易体验、商品体验等等,总之就是在使用产品\服务的过程中,感到了一丝不爽,正所谓一言不合就流失。
  • 竞争流失:也就是用户已经转粉了。可能是竞争对手的体验更好,可能竞争对手推出了什么优惠的政策。我们也需要抓住行业的动态,针对竞争对手的抢粉行为做出相应的行动。

关于流失的定义,各公司定义不同,可能是7天内没有登陆行为,也可以是几个月之内没有交易行为。(回流率=时间周期内流失的再回访的人数/时间周期内流失的人数)

关于流失的常规数据监控,一般都是和存留一起的,本身两者也是分不开的。单独针对流失的,最多看到如下图样式的监控:

再者,流失率结合存留率也可以评估渠道的价值。

二、销售模块

1、指标跟踪:销售模块中有大量的指标,包括同环比、完成率、销售排行、重点商品占比、平台占比等等,可以从人、货、场三个视角进行分析跟踪。

2、店铺分析:具有小b级用户,或者入驻平台式,需要针对各店铺经营指标进行分析,包括各店铺效率指标、完成率指标、业绩指标、客单价等,实现店铺价值评定分析。

3、销售活动管理:线上销售中,活动是非常重要的一块,从事前、事中、事后三个层面实现销售活动的闭环分析,其中包括事前投入分析、目标预测;事中用户参与度、客流分析、销售单分析;事后目标完成情况、活动对比、费销比、活动衰减度、活动爆发度等。

可参考: 如何针对业务场景做数据分析?

三、商品模块

1、采购管理:包括供应商数据分析、采购匹配度分析等。

2、供应链环节管理:供应链服务情况分析(响应周期、交货及时率、订单执行率)、管理指标分析(物资成本占比、客户投诉率等)。

3、库存管理:商品库存天数、存销比、有效库存比、库存周转率等数据分析。

4、重要指标分析:分析包括货龄、动销率、缺货率、结构指标、价格体系、关联分析、、畅滞销等分析指标,评判商品价值,辅助调整商品策略。

5、异常商品分析:包括对退货率、残损率、异常商品等数据进行分析,发现异常商品,及时处理。

四、用户模块

1、重点指标分析:包括新增用户数、增长率、流失率、有效会员占比、存留率情况等。

2、用户价值分析:根据rfm模型,再融入其他个性化参数,对用户进行价值的划分,并针对各等级用户进一步的分析。

3、用户画像:根据固有属性、行为属性、交易属性、兴趣爱好等维度,来为用户添加标签与权重,设计用户画像,提供精准营销参考依据

最后分享一下我整理的一份数据分析流程知识图谱,需要可自取。内含数据分析12个常见分析模型、18个理论分支、136个详细知识要点和60多个实际分析场景案例,不懂或不记得的知识点拿出地图就能查,数据人必备!高清电子版获取方式↓↓

码了一天,求赞!

编辑于 2022-10-10 11:00

零,简述

民间有一句俗语叫做:“看花容易绣花难”,画龙点睛的添花之笔就更难了,同数据分析是一个道理,数据分析大致可以范围三个层次:绣花(数据处理)、看花(数据转化)、添花(信息输出)


绣花:需要我们掌握数据收集、数据处理、数据呈现等基本数据加工流程,也是我们数据开发常说的ETL流程,将数据集成,能够全面完整准确的构成分析对象的数据集。


看花:需要看花人有清晰的结构思维,以业务大局为视角,基于量化数学表达,从百花丛中:知道怎么了?为什么?怎么解?


添花:基于看花的信息收集,够用为疑难杂症配置药方,用数据驱动业务及大战略的制定。


绣花是手段,看花是过程,目的是为了锦上添花。


一,数据绣花是一门手艺



1.数据收集
巧妇难为无米之炊,数据分析大师也不能脱离数据主观臆断,想要分析好数据必不能少,前期的数据收集非常重要,数据收集也是有章有法的,
我们可以尝试经典的“5W1H”法则也可以结合ECRS策略。

who:分析什么对象: 它是有哪些属性定义的对象。
what:收集什么数据:对象类型限定我们搜集的数据域,对象的属性决定可以收集的数据指标集。
why:为什么要收集数据:数据是论据,论据要围绕论点,收集数据是为了验证假设,找到答案。
when:你要收集什么时间段的数据:数据收集的时间段大致分为当期,往期;当期是为了描述问题,往期是为了对比发现问题。
where:这些数据存在哪些系统里:业务系统,日志系统,外部抓取
how:如何才能获得这些数据:找数据源,用工具SQL,python抽取转换载入或者简单直接找人要,比如分析师会找数据开发要数据。


2,数据处理
附和人的习惯:行转列的数据变换,符合左右阅读及水平对比的思维习惯。
多视角的探查:维度组合的聚合,提供看数据的不同视角,力求全面的发现信息点。
微处理的质变:数据的过滤排序同样也能使量的数据呈现出质的变化。


3.数据分析
基础的数据分析可粗略分为三大类:趋势、构成、对比。统称为:描述统计:
趋势:指标随时间的变动,表现为增幅(同比、环比等)。
构成:指标在不同层次上的表现,包括区域分布、客群等级分布等。
对比:常见的分析方法是AB测试等。

,数据呈现
数据呈现形式大致三种:文字描述、规则公式表达、图表可视化。其中图片可视化让提升看数效率,更具有说服力。数据展现的基本常见要求如下:

工具:excel、D3、echartjs、R、Seaborn 这样的工具很多;
形式:图文并茂的基本原则通俗易懂,活灵活现、有趣味有升华;
原则:领导层要读图表、看规律、要结果,执行层要看数据、读文字、看过程。



二,看花也不容易


工具固然重要,工具能让数据分析的过程更加高效,但使用工具的底层逻辑更重要。如果没有相应的思维方法,即使你的工具掌握得很专业,也解决不了工作当中的问题,就更别提创造价值了

数据分析思维共包含三种底层的思维模式:分别是结构思维、业务思维和数学思维。

1. 结构思维
需要运用《金字塔原理》一书中思维结构化思维,演绎归纳,层层递进的表达:
我们呈现的东西一定要遵循MECE原则:不重、不剩、不漏
纵向关系:上一层的思想必须是下一层思想的概括总结或者是下一层思想的结论。自上而下,结论先行。横向关系:演绎关系和归纳关系。叙述方式:包括背景、冲突、疑问、回答四个要素。

2.业务思维
数据为王,业务是核心,做好数据分析,业务思维很重要,要做到:
了解整个业务链的结构,清晰业务的发展规划,抓住业务的核心指标,数据分析一定要有的放矢服务业务,对业务有助益。


3.公式思维
在结构化的基础上,业务系统链条之上的数据往往会存在一些数学关系及逻辑关系,使其能进行+、-、×、÷的计算,将这些论点进行量化分析,从而验证论点。所谓指标体系,就是这么梳理得来的,数学表达式串联其中,形成一个有机体。

比如:

经济学公式:需求弹性公式、边际效用公式、总效应=替代效应+收入效应、AD-AS模型、短期及长期生产函数、IS- LM模型、乘数效应等等。



物理学公式:抛砖一下


三、添花难能可贵


当你能够以业务发展为核心,结构化的拆解业务关键指标的时候,你就达到了认知层,接下来就到了最重要的添花层,这个层次需要多学多练,日子久了就自然而然了,强求不来,诸君好运,早日破功。

编辑于 2022-04-14 22:11

大家应该都和我一样,经常看到类似于《XXX入职大厂数据分析师,年薪50W+》之类的标题。

数据分析师的薪资真的有这么夸张吗?我特意去查了下数据:

数据来源:职友集

最近的数据显示,全国数据分析师的月平均工资过超过15K。

其中,20-30K的人最多,占24.7%,主要的薪酬区间集中在10-30K之间

如果你在一线或者准一线城市的话,显然还会更高,比如这个岗位杭州的平均月薪是16.9K,北京更是高达22.6K

从以上数据来看,如果你拿的是大厂offer,或者是中小公司的中高级岗位,基本薪资20K以上是没什么压力的。

而且还有67%的受访者认为这个数据偏低,数据分析岗的实际收入有可能比上述的统计数据更高。

所以数据分析岗,年薪不说随随便便50W+,但是30W+还是不难实现的,这个薪资横向对比其他岗位来看,确实是非常高了。

那么一个新人如果想要入行数据分析师的话,需要做些什么呢?

之前和行业大佬讨教的时候,他们都非常认可这一点:一个优秀的数据分析师,应该是技能、统计学、业务sense的综合反映。不管你将来是从事数分行业,还是跳槽或自学数据分析,这三个部分缺一不可。

而入门学习数据分析,对于数据分析技能的学习是首要的,拿数据分析师这个岗位来说,对于数据分析师的要求也相对较为“刁钻”。要求熟练掌握Excel、SQL、Hive、Python、R等等,还需要有出色的数据建模能力


不得不说,这对于初学者是一个很大考验,以上技能的学习都需要一定的代码能力,常常让初学者望而生畏,然而作者根据过往的工作经验,给大家隆重推荐一款数据分析工具,无需代码能力,也可以出色的完成数据分析工作。

这款数据分析工具就是Yonghong数据分析工具

Yonghong Desktop是一款免费智能数据分析工具,基于本机安装,省去繁琐的部署环节,即装即用。提供一站式、敏捷、高效的数据治理及可视化分析、AI深度分析能力,可以帮助每一位用户轻松实现数据分析数据可视化工作。

下面给大家介绍Yonghong Desktop如何使用?举个简单的例子,对比俄罗斯与乌克兰历年的GDP变化,从时间趋势上对比两国之间的经济走势,下面根据案例逐一讲解。

  • 数据获取

首先是数据获取,软件自带的可以整合多种数据源,比如数据库、本地文件等,这里打开软件后点击添加数据源,选择Excel&Text,支持本地文件导入。

导入俄罗斯与乌克兰历年的GDP数据,数据预览结果如下,软件默认是显示前两百行数据。

  • 数据清洗

数据导入后,是不能直接进行分析的,需要将脏数据进行加工,清洗为标准数据,如下介绍几种在数据清洗过程中 使用比较多的步骤。

第一步、数据分列,将文本括号中的数据提取出来,点击三个点的符号,选择拆分列。

自定义分隔符为括号。

第二步、数据类型转换,将数据拆分后的数据转换数据类型,这里将GDP数据转化为整数类型。

第三步、缺失值数据处理,对于缺失的数据我们通常是将其填充为0。

右键选择缺失值填充,自定义缺失值填充为0。

第四步、数据字段起别名,当数据字段比较多的时候,可以对于字段重命名。

  • 数据可视化

数据清洗完成后,接着用清洗后的干净数据进行可视化分析,点击新建报告,进入数据可视化界面。

在数据可视化界面有大量的可供选择的组件间,比如我们要看两个国家历年的GDP变化情况,首先在组件中选择折线图。

接着导入数据,将年份拖入到列,各个国家的GDP数据拖入到行。

同理,我们要看各个国家的GDP在世界的占比情况,在组件中选择堆积柱形图,导入对应的字段。

数据可视化的结果如下所示,从图中可以直观的看出,额落实与乌克兰历年GDP的变化情况以及在世界的的占比分布情况。

  • 报表发布

报表创建以后,可以将报表进行分布,调整图表的布局,并且可以设置邮件进行定时发送,极大方便了我们日常的数据报表任务。


“在未来,一切业务数据化,一切数据业务化,企业才更有出路。”

几年后的今天,数据已覆盖我们工作中的每一个场景。熟练运用工具是数据人的基本功。

不论你是数据分析岗,还是数据运营,数据产品,数据开发,数据挖掘,商业分析等等数据岗位,想要斩获高薪Offer、早日升职加薪,掌握一个好的数据分析工具,才能使自己在职场竞争中更胜一筹!

数字化时代一定需要更多的复合型人才,尤其在互联网行业。如果你能熟练掌握数据分析技能,这一定是你职业发展的核心利器,让你拥有更多上升机会,在这个数字化时代,懂数据的人将先人一步收获高薪、话语权、不可替代性和成就感。

我们不能在舒适区域中止步不前,要趁着如今这个风口,提前抢占赛道!学习数据分析迫在眉睫!

编辑于 2022-03-01 10:08

刷到这里的同学,别走!按照下面的方法做数据分析,真的超级无敌爽!!!听我的,做到下面几个步骤,绝对让你工作更上一层楼,工作效率杠杠的。

建议先点赞收藏防丢失,真的很有用,绝对值得上手,看到就是赚到,你绝对会回来谢我的。

看到其他答主都是从如何找到正确的数据分析思路这个角度来讨论,但是忽略了最重要的一点:对于刚踏入职场的小白,特别是刚转行到新媒体运营行业的小白来说,找到数据分析的正确姿势,才是最重要的

所以我这一篇文章,想给新媒体运营小白,做一份数据分析的正确系统指南,分享给你,一文搞定数据分析的所有问题!

按照分享惯例,先上目录:

一、数据分析有多重要?

二、数据分析的正确姿势

1.确定分析业务目标

2.梳理路径拆解指标

3.制造数据埋点

4.收集运营数据

5.发现问题分析原因

三、总结

干货整理不易,喜欢的小伙伴们麻烦动动手指点个赞,收藏起来呀!


一、数据分析有多重要?

关于数据分析,你往往会联想到一些密密麻麻的数字表格,或是高级的 数据建模手法,再或是华丽的数据报表。

其实互联网行业里,有一个大家默认的共识——“数据分析是发现问题的神器”,得数据者得天下。

如果大家去看一下大运营岗 招聘信息,就会发现应聘者的数据分析能力越来越重视。不论是做产品运营、内容运营、用户运营,还是做活动策划、做电商直播,数据分析能力已经成为一名新媒体运营的标配:

仔细看看这些招聘信息里的要求,哪个不是要有数据分析能力?基本上大厂里10K+的运营岗,都是要求用数据分析来优化运营策略,提升转化,对结果负责。

发现了吗?在互联网行业中,数据分析是我们发现问题的钥匙。懂数据思维的人,才是这个时代的香饽饽。

不管我们是做产品、运营还是做市场,都避免不了与各种各样的数据打交道,并且需要从这些数据中得出能够帮助业务改善成长的信息。

与其说产品、运营需要懂数据,不如说我们需要学会「用」数据。也难怪懂数据的新媒体运营薪资高。

尽管数据分析如此重要,但很多新媒体运营小白实在是不懂数据分析,在和数据打交道的过程中,往往面临以下几种情况:

1、数据分析只用在复盘环节,且只是展示数据

每次做总结时,只能简单地罗列、记录一下数据,看似分析了一大串,实际上对业务已经没啥帮助。

2、 数据解读只停留在表面

数据到手后,简单地观察一下异常数据,在建立数据分析体系的时候,不知道如何选取指标维度,然后开始拍拍脑袋,想当然地分析原因可能是什么。很有可能由于对异常数据的敏感性不足,导致数据分析得出的结论与真实情况大相径庭。

3、 分析”完数据之后,没有用上数据思维来解决问题

“分析”出异常数据背后的原因后,不会从中分析出具有意义的结论,来指导接下来的工作。最后只能“拍脑袋”做决策。

长期以往,我们每次在做运营工作的时候,都是一做三不知:

不知道分析什么数据
不知道怎么分析数据
不知道怎么用数据分析结果解决问题

我发现,很多转行学习新媒体运营的小白,并没有掌握数据分析的能力,无法匹配招聘的要求,很难找到心仪的工作。

首先要解决第一个问题:价值月薪 20k+ 的数据分析能力,究竟是怎么样的呢?

一句话概括就是——是能够通过数据定位问题,推导问题背后的原因,并高效解决问题


二、数据分析的正确姿势

新媒体运营在做数据分析的时候,往往需要以目标为导向,学会找到核心目标,并将它拆分,用来做运营数据全面的,系统性的分析。

新媒体运营在数据分析中的正确姿势是怎样的呢?

1.确定分析业务目标

在运营工作中,每项业务都会有一个具体的关键指标。对于新媒体运营来说,工作的指标通常围绕着订阅号的阅读量、粉丝量。

每一次运营行为,都会伴随着具体的运营目的。这个业务目标,就是数据分析的起源。在确定这个目标前,就必须从收集现有的运营数据开始。

比如,我想要从这个月开始减肥,因此在正式开始 减肥计划前,我需要知道历史数据,包括但不限于自己的身高、体重、三围、BMI( 身体质量指数)、体脂率、基础代谢率等。

我又将BMI和体脂率率公式拆解:

BMI=体重(kg)除以身高(m)的平方

体脂率 = (脂肪重量 ÷ 体重) × 100%

了解了这些数据后,我才能找出减肥目标:减10斤的体重,让自己的BMI和体脂率处于正常范围内。

再比如,作为新媒体运营,我背上的业务目标就是“提高读者点击文末的 注册量”,首先就要收集过去近三个月(甚至半年)内订阅号的运营数据。通过过往的运营数据进行分析后,可得出初步的业务目标:在这个月内,将读者点击文末的注册量从3%提升至4%。

发现了吗?

数据分析是帮助我们实现运营目标的工具,我们在不断监控运营的过程中,优化运营的环节,才能帮助我们实现运营目标。

2.梳理路径拆解指标

数据分析后的业务目标,只是一个结果。

但是想要达成业务目标,并不是简简单单一步就完成的,而是需要运营者策划一系列的运营事件,即完成了一个又一个的步骤,才能让这个结果达成。

因此在我们明确了一个目标后,就需要思考:我们需要监测哪些指标才能完成目标?

举个例子:

众所周知,减肥的本质就是消耗热量>摄入热量。也就是说,我想要达成减肥10斤的本月目标,就需要自然热量消耗+运动热量消耗>热量的摄入量

所以,除了体重数字之外,我还需要监测自然热量消耗、 运动热量消耗、热量摄入量这三个重要数据。

核心目标的拆解,就需要以 业务流程为思路进行构建。

我们回到新媒体运营的工作场景里,看看怎么理解梳理业务路径,拆解核心目标。

我确定了的业务目标是:在这个月内,将读者点击文末的注册量从3%提升至4%,我们先尽可能地列举出和这个业务目标直接相关的所有指标:本月订阅号的发文数量、阅读量、打开率、完读率等等。

想要提升订阅号读者点击文末的注册率,那需要完成哪些步骤?这时候就要从业务流程开始着手思考:如何从零开始完成一篇文章的推送。

再根据“提高读者点击文末注册量”这一目标,因为读者需要看完文章才能看到文末的“阅读原文”,所以我决定把“完读率”作为关键指标。

在实际的运营工作中,有哪些是完读率的影响因素呢?一起试想一下:

假如订阅号的推文推送后,在公众号粉丝人数基本不变的情况下,会产生怎样的结果?

如果文章点击率基本不变,文章质量高,完全阅读人数就会增多;如果文章点击率提高,完全阅读人数却不变,完读率反而会下降!

点击率又和推文的标题有关。如果标题取得吸引人,阅读总人数也会随着变多,打开率就会变高。

提高阅读总人数,就得从文章选题、标题撰写、推文封面、文章发布时间这4个主要因素开始分析:

热点选题比常规选题更吸引人眼球,选题可以考虑热点事件。
标题越吸引读者,阅读人数自然而然变多。
封面会影响从订阅号打开推文的读者。
文章发布时间影响阅读人数,最好选在阅读人数最高的时段发。

所以为了完成任务,我需要把“完读率”和“阅读总人数”同时列为关键的核心指标,优化文章标题来提高“点击率”,优化文章选题和质量来提高“完读率”,最终达到“提高读者点击文末注册量”的目标。

拆解到这一步,就知道要从哪些方面去改善了。

3.制造数据埋点

很多小白可能不懂什么叫埋点。先和大家举一个简单的例子:

埋点就像是城市里,某条大马路上的摄像头,这个摄像头就是一条马路上的埋点,监控着马路上发生的一切,并且记录下来。

数据埋点对运营者来说有什么用处呢?

最重要的就是分析用户的动作行为,挖掘运营数据的流失点

运营者制造的埋点,相当于马路上的摄像头,可以记录用户经历过的行为和路径,通过埋点可以得知:用户的行为路径是怎样的?用户在哪个关键的运营环节流失了?

看到这里,你可能还不太能直观理解,那举个例子吧:

我要在这个月内减肥10斤,并且已经找到体重、运动热量消耗、热量摄入量这3个维度,需要每日、每周定时监测并记录。

问题来了,这四个维度的数据该怎么监测?

体重秤直接监测每日体重数字;

健康类APP记录一日三餐的食物热量摄入量;

运动APP、 运动手环(手表)记录运动热量消耗。

发现了吗?体重秤、 运动健康类APP和运动手环(手表)都可以算是我在减肥道路上的“摄像头”,也就是我重点监测减肥数据的埋点

我再举个新媒体运营工作场景中的例子:

假如当领导问起,为什么最近文末注册转化量这么少?

作为新媒体运营老司机的我,在定好“提高读者点击文末的注册量”的运营目标,找到了“完读率”和“阅读总人数”的核心目标后,就提前埋入了阅读量、打开率、完读率及文末跳转注册转化数的监测点。

监测阅读量、打开率、完读率的数据并不难,直接在公众号后台就能找到。

而文末跳转注册转化数,在系统中不能直接提供,该怎么制造监测点呢?这就需要制造专属的渠道二维码、UTM链接,在 百度推广后台跟踪数据来源

这样就能记录到阅读量、完读率等每个运营流程的转化率,埋点背后的数据,就可以让我用来分析用户漏斗的哪一个阶段出现了问题,再结合实际的运营情况,就能输出解决方案给领导看。

如果你学习更多关于制造数据埋点的内容,那你可以点击:新媒体运营自习室选择课时11,获取数据监测推广自学指南,特别适用于对数据埋点学习求学无门的小伙伴。



4.收集运营数据

对新媒体运营来说,收集数据是最简单的一步。

比如说:

我正在努力减肥的路上,必须要收集每日体重打卡、每天一日三餐的热量摄入量和运动热量消耗的数据,从而汇总成完整的数据表格。

再比如:

在完成“提高读者点击文末注册量”这个目标的过程中,会将单篇阅读数、注册转化总数、文章转化数等数据汇总至表格里。

我提供一些数据收集和分析工作的网站或工具给大家,方便大家能够更好地收集数据:

(1)新媒体平台自身后台数据分析

微信公众号、微博、头条、知乎等等,都有自己的数据分析后台,可以查看阅读量、分享量、打开率等基本数据,然后再根据数据优化新媒体运营工作。




(2)百度指数

百度指数几乎是每个行业必用的查询工具,在行业市场分析、推广策略制定以及用户需求变化等有一定的参考价值。

简单的讲,我们可以上百度指数,去查查:什么话题是网民最关心的,什么关键词搜索的最多等等。


(3)新榜

可以在新榜查找到微提供各类新媒体账号详实数据、内容榜单、爆文分析等,为写热文提供素材。

(4)壹伴

作为微信公众号后台的插件,可以用来多公众号数据采集,数据分析、公众号运营工具增强等。

5.发现问题分析原因

通过已经统计好的数据,就能分析观察运营中每个行为的效果,通过实际的反馈找到最优解。留意异常数据,哪个环节用户流失多,该如何召回以及如何优化现有的问题。

比如,注册转化数比较少,是因为推文打开率低。打开率低是通过阅读量这个数据体现的,也就是说阅读量也偏低。

导致阅读量偏低的原因是什么呢?

是选题没有戳中读者用户?

是标题、封面吸引读者用户打开等等……


三、总结

最后,我们总结一下。在运营工作开展的过程中,新媒体运营在数据分析中的正确姿势是:

1.确定分析业务目标

2.梳理路径拆解指标

3.制造数据埋点

4.收集运营数据

5.发现问题分析原因

除此之外,一个真正懂数据分析的新媒体运营,在工作执行阶段,对业务数据进行监控和分析。能够对数据加工处理,方便发现其中的规律或者数据背后的蹊跷。

当拿到预设的活动目标数据和实际的数据做对比,就能非常快速地知道业务的问题所在。对于异常的 数据指标,挖掘背后的原因,给到针对性的解决方案。

当然,以上这些关于「 数据分析能力」的解读都是在我的工作经验中总结出来的,如果你有其他想法,欢迎评论告知。


——————————————

福利时间:最近不少小伙伴找我要一些新媒体人和活动策划的学习资料,于是我根据自己的经验,利用业余时间熬夜肝了一个月,整理一份「10G 新媒体人学习资料大全」,还有《 新媒体完全入门指南书籍》免费共享给大家!

资料有点多,如果大家想要上面「10G 新媒体人学习资料大全」,点赞-喜欢-收藏,一键三连,在评论区回复「111」我就会把资料免费私发给你。

如果你也是新媒体er或者准新媒体er,下面的内容一定会帮助到你!

1、加入 半撇私塾公开课,年度5星课程,目前全网已有超60000+人学习。

2、关注【半撇私塾】公众号,定期更新爆款运营案例、运营小技巧、营销 黑科技,还有 求职面试的干货。

3、点赞+关注我 @半撇私塾,你的每一个三连对于作为创作者的我,都是莫大的鼓励。

发布于 2023-01-31 11:19

分享一个互联网产品经常遇到的 比如分析 什么跟产品活跃有关, 什么跟留存有关, 什么跟付费有关等相关性的问题, 以下内容来自个人公众号【渔好学】

在数据分析的问题中, 经常会遇见的一种问题就是相关的问题, 比如抖音短视频的产品经理经常要来问留存(是否留下来)和观看时长, 收藏的次数, 转发的次数, 关注的抖音博主数等等是否有相关性, 相关性有多大。

因为只有知道了哪些因素和留存比较相关, 才知道怎么去优化从产品的方向去提升留存率, 比如 如果留存和收藏的相关性比较大 那么我们就要引导用户去收藏视频, 从而提升相关的指标,

除了留存的相关性计算的问题, 还有类似的需要去计算相关性的问题, 比如淘宝的用户 他们的付费行为和哪些行为相关, 相关性有多大, 这样我们就可以挖掘出用户付费的关键行为

这种问题就是相关性量化, 我们要找到一种科学的方法去计算这些因素和留存的相关性的大小,

这种方法就是相关性分析


02 什么是相关性分析

相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析(官方定义)

简单来说, 相关性的方法主要用来分析两个东西他们之间的相关性大小

相关性大小用相关系数r来描述,关于r的解读:(从知乎摘录的)

(1)正相关:如果x,y变化的方向一致,如身高与体重的关系,r>0;一般地,

·|r|>0.95 存在显著性相关;

·|r|≥0.8 高度相关;

·0.5≤|r|<0.8 中度相关;

·0.3≤|r|<0.5 低度相关;

·|r|<0.3 关系极弱,认为不相关

(2)负相关:如果x,y变化的方向相反,如吸烟与肺功能的关系,r<0;

(3)无线性相关:r=0, 这里注意, r=0 不代表他们之间没有关系, 可能只是不存在线性关系。

下面用几个图来描述一下 不同的相关性的情况

第一张图r=-0.92 <0 是说明横轴和纵轴的数据呈现负相关, 意思就是随着横轴的数据值越来越大纵轴的数据的值呈现下降的趋势, 从r的绝对值为0.92>0.8 来看, 说明两组数据的相关性高度相关

同样的, 第二张图 r=0.88 >0 说明纵轴和横轴的数据呈现正向的关系, 随着横轴数据的值越来越大, 纵轴的值也随之变大, 并且两组数据也是呈现高度相关


03 如何实现相关性分析

前面已经讲了什么是相关性分析方法, 那么我们怎么去实现这种分析方法呢, 以下先用python 实现

1. 首先是导入数据集, 这里以tips 为例

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
## 定义主题风格
sns.set(style="darkgrid")

## 加载tips
tips = sns.load_dataset("tips")

2. 查看导入的数据集情况,

字段分别代表

total_bill: 总账单数

tip: 消费数目
sex: 性别

smoker: 是否是吸烟的群众

day: 天气

time: 晚餐 dinner, 午餐lunch

size: 顾客数

tips.head() # 查看数据的前几行

3. 最简单的相关性计算

tips.corr()

4. 任意看两个数据之间相关性可视化,比如看 total_bill 和 tip 之间的相关性,就可以如下操作进行可视化

## 绘制图形,根据不同种类的三点设定图注
sns.relplot(x="total_bill", y="tip",  data=tips);
plt.show()

从散点图可以看出账单的数目和消费的数目基本是呈正相关, 账单的总的数目越高, 给得消费也会越多

5. 如果要看全部任意两两数据的相关性的可视化

sns.pairplot(tips)

6. 如果要分不同的人群, 吸烟和非吸烟看总的账单数目total_bill和小费tip 的关系。

sns.relplot(x="total_bill", y="tip", hue="smoker",  data=tips)# 利用hue 进行区分
plt.show()

7. 同样的 区分抽烟和非抽烟群体看所有数据之间的相关性,我们可以看到

对于男性和女性群体, 在小费和总账单金额的关系上, 可以同样都是账单金额越高的时候, 小费越高的例子上, 男性要比女性给得小费更大方

在顾客数量和小费的数目关系上, 我们可以发现, 同样的顾客数量, 男性要比女性给得小费更多

在顾客数量和总账单数目关系上, 也是同样的顾客数量, 男性要比女性消费更多

sns.pairplot(tips ,hue ='sex')

04 实战案例

问题:

影响B 站留存的相关的关键行为有哪些?

这些行为和留存哪一个相关性是最大的?

分析思路:

  1. 找全与留存相关的行为
  2. 计算这些行为和留存的相关性大小

首先规划好完整的思路, 哪些行为和留存相关, 然后利用这些行为+时间维度 组成指标, 因为不同的时间跨度组合出来的指标, 意义是不一样的, 比如登录行为就有 7天登录天数, 30天登录天数

第二步计算这些行为和留存的相关性, 我们用1 表示会留存 0 表示不会留存

那么就得到 用户id + 行为数据+ 是否留存 这几个指标组成的数据

然后就是相关性大小的计算

import matplotlib.pyplot as plt
import seaborn as sns
retain2 = pd.read_csv("d:/My Documents/Desktop/train2.csv") # 读取数据
retain2 = retain2.drop(columns=['click_share_ayyuid_ucnt_days7']) # 去掉不参与计算相关性的列
plt.figure(figsize=(16,10), dpi= 80)
# 相关性大小计算
sns.heatmap(retain2.corr(), xticklabels=retain2.corr().columns, yticklabels=retain2.corr().columns, cmap='RdYlGn', center=0, annot=True)

# 可视化
plt.title('Correlogram of retain', fontsize=22)
plt.xticks(fontsize=12)
plt.yticks(fontsize=12)
plt.show()

图中的数字值就是代表相关性大小 r 值 所以从图中我们可以发现

留存相关最大的四大因素:

•30天或者7天登录天数(cor: 0.66)

•30天观看品类个数(cor: 0.44)

•30天观看主播数 (cor: 0.37)

•30天日均观看时长(cor: 0.26)

码字不易,求个赞哈,数据集可以关注公众号【渔好学】

发布于 2021-04-22 15:40

如何做数据分析?

大数据分析是一个非常好的行业,尤其是在人才匮乏的一二线城市,毕竟,今天是互联网扩张的时代,一切都开始依赖数据,来讲述事情或提供决策,大数据行业的工资都普遍高于同级别的其他岗位的薪资;想要转行做大数据分析师的人越来越多,确实,从发展看来,大数据分析师还是非常有前景的;

本公司目前在招聘一些大数据分析师,我们欢迎所有对数据分析感兴趣的人来试试,符合条件的可以投递简历(可培养!!!)投递方式见下方,更多岗位信息关注本公司公众号,欢迎主动与我们联系。(1、签订正式合同、五险一金;2、须大专及以上学历;3、无经验者由项目经理带;4、在京工作一年后要求回当地的工作的,可申请调回当地省会城市的分公司或合作企业工作;5、每日简历投递量非常大,欢迎主动与我们联系!!!)

数据分析的流程,一般可以按“业务理解——指标设计——数据建模——分析报告”这样的步骤来实施一个数据分析项目;

业务理解

(1)树立正确的思维观,包括数学、逻辑、统计;

(2)对数据要足够敏感,如发现异常等;

(3)积累经验,包括行业,业务客户需求;

指标设计

(1)根据业务和目标对原始数据探索、变换、真个好生成专家数据;

(2)对指标进行描述性分析;

(3)数据分析关键的一步,一般称为特征工程,决定着数据的价值;

数据建模

(1)根据指标和目标提出分析所需的模型;

(2)选用合适的工具实现模型;

分析报告

(1)根据模型分析的结果,得出一些当前问题产生的结论;

(2)用数据讲故事,学会包装数据;

(3)结论,要有对决策有用的建议;

编辑于 2023-04-10 17:30

说到数据分析师,那么就很难不让人想到现在如火如荼的数据分析行业,薪资高,发展前景好,让人很向往。那么这些高薪的数据分析师到底是如何去做数据分析工作的呢?接下来就简单了解一下。

本公司目前在招聘一些大数据分析师,我们欢迎所有对数据分析感兴趣的人来试试,符合条件的可以投递简历(可培养!!!)投递方式见下方,更多岗位信息关注本公司公众号,欢迎主动与我们联系。(1、签订正式合同、五险一金;2、须大专及以上学历;3、无经验者由项目经理带;4、每日简历投递量非常大,欢迎主动与我们联系!!)

数据分析指的就是通过用适当的统计分析方法对收集而来的大量数据进行一系列的分析,将它们加以汇总与理解并进行消化,以求可以最大化地开发数据的功能,从而去发挥数据的一些作用。数据分析主要是为了提取到有用信息与形成结论从而对数据加以详细研究还有概括总结的一个过程。

从事数据分析工作,这些技能都是必须要去掌握的。

1、数学知识

对于初级数据分析师而言,需要了解统计相关的一些基础性内容,公式计算,统计模型等。当获得一份数据集时,需要先去了解数据集的质量,然后进行描述统计。

而对于高级数据分析师来说,统计模型的能力是必须具备的,线性代数也要有一定程度的了解。

2、分析工具

对于分析工具,SQL 是必须要会的,然后就是要熟悉Excel数据透视表与公式的使用,另外,还要学会使用一个统计分析工具,SAS作为入门工具是比较好的,VBA是基本必备,SPSS/SAS/R 至少要熟练使用其中任意一个,其他分析工具则可视情况而定。

3、编程语言

目前数据分析领域最热门的两大语言就是 R 和 Python。涉及各类统计函数主要还有工具上的调用,那么R无疑是有优势。但是大数据量的处理力比较不足,学习曲线相对也比较陡峭。Python的适用性相对较强,可以将分析的过程进行脚本化。所以,如果想在这一领域有所发展的话,那么学习 Python 也是很有必要的。其他编程语言也是需要掌握的。要有独立把数据化为己用的这项能力。当然,编程技术并不需要达到软件工程师的水平。

4、业务理解

对于业务的理解主要还是数据分析师工作的一些相关基础,而有关数据的获取方案、指标的选取以及最终结论的一些洞察,而这都是依赖于数据分析师对业务本身的一些理解。

对于初级数据分析师来说,他们的主要工作是提取数据还有做一些简单的图表,以及少量的洞察结论,拥有对业务的基本了解基本来说就可以了。而对于高级数据分析师,则是更需要对业务要有较为深入的一些了解,可以基于数据,提炼出一些有效的观点,对于实际业务可以有所帮助。对于一些数据挖掘工程师来说,对业务有基本的了解就可以了,而重点还是得需要放在发挥自己的技术的能力上。

5、逻辑思维

对于初级数据分析师,逻辑思维主要体现在数据分析过程中的每个步骤都是有目的性的,知道自己需要用怎样的手段,从而达到怎样的目标。对于高级数据分析师来说,逻辑思维主要体现在搭建完整、有效的分析框架,了解分析对象间的关联关系,清楚每个指标变化的前因后果,可以给业务带来怎样的影响。对于数据挖掘工程师,逻辑思维除了能体现在与业务相关的分析工作中,还包括算法逻辑,程序逻辑等,所以对逻辑思维的要求上同样也是最高的。

6、数据可视化

数据可视化主要借助于图形化手段,可以清晰有效地传达与沟通信息。虽然听起来很高大上,其实包括的范围很广,做个 PPT 里边放上数据图表也算是数据可视化。

对于初级数据分析师,能用 Excel 与 PPT 做出基本的图表还有报告,可以清楚地展示数据,那么就达到目标了。对于稍高级的数据分析师来说,需要使用更加有效的数据分析工具,可以根据实际需求做出或简单或复杂,但适合受众观看的数据可视化内容。

7、协调沟通

数据分析师不仅需要具备破译数据这方面的能力,也经常被要求向项目经理还有部门主管提供有关某些数据点的一些建议,所以,你要有较强的交流能力。

而高级数据分析师,则会需要开始独立带项目,或者是和产品做一些合作,因此,除了要具备沟通能力以外,还需要有一些项目协调的能力。

编辑于 2023-02-22 17:47

分享一些常用的「数据分析方法论」,相信会对你有所帮助

发布于 2022-05-14 10:17

1、明确分析目的和思路:

这一定很重要,你想通过数据分析得到什么,你想通过数据分析告诉别人什么,这是你做数据分析的首要问题,分析不能是漫无目的的,一定要明确思路,有目的性、有计划性的去做数据分析。找好角度、指标、以及分析逻辑尤为重要。


2、数据收集,这里不做过多的说明,一般情况下,数据来源都会可靠有效。我们要做的只是把我们需求的数据get即可。


3、数据处理:

主要包括数据清洗、数据转化、数据提取、数据计算等方法,数据分析的前提是要保证数据质量,如果数据质量无法保证,分析出来的结果也没法得到有效的利用,甚至会对决策者造成误导的行为。


4、数据分析:

首先要明确数据处理和数据分析的区别:数据处理只是数据分析的基础,我们做数据处理就是为了保证数据形式合适,保证数据的一致性和有效性。


5、数据展现:

数据展现就是把数据分析的结果,用可视化的图标形式展现出来,用一种简单易懂的方式表达出你分析的观点


6、撰写报告:

数据分析报告其实就是对整个数据分析过程的一个总结与呈现,通过报告把数据分析的起因、过程、结果及建议完整的呈现出来,供决策者参考。


想要获取更多数据分析相关资讯,欢迎关注我们的公众号:聚数云海。免费获取数据分析大厂真题和免费成长训练营课程。

发布于 2021-06-28 09:46

本公司目前在招聘一些大数据分析师,我们欢迎所有对数据分析感兴趣的人来试试,符合条件的可以投递简历(可培养!!!)投递方式见下方,更多岗位信息关注本公司公众号,欢迎主动与我们联系。(1、签订正式合同、五险一金;2、须大专及以上学历;3、无经验者由项目经理带;4、在京工作一年后要求回当地的工作的,可申请调回当地省会城市的分公司或合作企业工作;5、每日简历投递量非常大,欢迎主动与我们联系!!)

近几年,大数据分析岗的领域范围越来越高,涉及到了很多的行业,但是数据分析学起来还是有一定的难度的,但只有我们掌握相关的基础技能才能学好数据分析。而且数据分析有好多种,具体的还是要看自己所从事的岗位和公司的情况而定。

一般的行业都使用四种类型的大数据分析。我们可以将这些类别分为几类

数据分析的四种类型是:

1、诊断分析

2、描述性分析

3、预测分析

4、规范分析

数据分析怎么做?

1.运用数据分析工具,比如最常用的是excel表,以及里面的各类函数公式和功能;

2. 学习和掌握数据分析工具的用法和各项功能。比如如何建立一个数据表,如何采用筛选透视等功能。

3.通过调查问卷或者前端销售反馈,收集足够多的的数据录入表格,形成初步的数据表。

4.采用数据分析工具的各项功能对数据进行目标分析,比如你需要看见的是哪些指标和影响因素。

5.分析评定存在影响业务的因素,以及哪些数据因素偏低或过高,影响着业务目标的达成。

从事数据分析还需要具备一下的特点:

1、业务问题的转化能力,能够将业务问题转化为数据问题,如“评估产品健康”或者“说产品要不要做哪些推广”等,这些都是需要进行将其转化为数据问题才能分析,而且有好的业务问题是数据分析的关键,需要通过深入了解业务在加上自己的思考才能有这样的思维。

2、数据敏感程度:看数据不仅看他的本身,而是要看对应产品经营状况度,数据敏感不是短期内能够提升的,需要经验长期的业务逻辑思考和长期接触业务,才能逐步提升对数据的敏感度。

3、逻辑推理能力 :做数据分析需要有一定的逻辑推理能力,就像是做数学题一样,这方面可以通过阅读别人的分析报告,学好已有的推理方式来获取相关的技能。

4、落实相关策略:这也是做数据分析一个至关重要的环节,没有落地的数据分析都是白费功夫,在大部分企业的情况是跟产品和团队相互协作完成的,

就先介绍到这里,有更多想要了解的问题可以私信我,我看到了就会回复的。

发布于 2021-05-26 18:18

做数据分析,我觉得先搭建思维框架,再做,会比较好

一、我们想了解下有哪些数据分析方法:

1、5W2H分析方法——适合简单问题

5W是对所以想象都追问5个问题:what(是什么)、where(何地)、when (何时)、 who(是谁) why (为什么)

2H 是追再追问两个问题:how (怎么做)、 how much(多少钱)

2、逻辑树分析法——把复杂的问题拆解成若干子问题

例子费米问题

3、行业分析方法——PEST(政策、经济、社会和技术)分析方法

4、多维度拆解分析法——维度、拆解

从哪些维度去拆解呢?一般会从指标构成或者业务流程的维度来拆分。

指标构成拆解:销售额=访客量*点击率*转化率*客单价*(1+复购率)我们分析一个店铺的销售额,就可以从这几个维度去分析,如销量额下降了,经过分析原来是客单价变小了,那么想保持原来的销量额,提高客单价就可以做到了。如何做呢?捆绑、满减都是提高客单价不错的办法。

业务流程拆解:投放了广告,想知道推广效果如何,我们怎么分析呢?

我们通过考察哪个渠道来的用户转化率更高,在下一波推广的时候,可以把推广预算侧重哪个渠道。店铺做推广,最终目的就是为店铺带来销量。

5、对比分析法——和谁比(和行业比,和自己比)

对比分析法,这个很好理解,正所谓没有对比就没有伤害,也要通过对比才能真正知道,自己做得怎么样。

怎么做对比呢?一般从三个维度比较:

数据整体的大小:平均值、中位数

数据整体的波动:变异系数=标准差/平均值

趋势变化:时间折线图、环比和同比

注意的是,比较规模要一致。

6、假设检验分析方法

逻辑推理:提出假设——收集证据——得出结论。

如何客观提成假设?是重点。这也涉及到了相关业务指标,你也要知道你要分析的数据涉及到那些业务指标,你才能更客观地提成假设。

要分析前,可以先画出业务流程。如下面的例子

某线上店铺最近给新会员的折扣券的领取率降低,原因是什么呢?可以先画出业务流程,根据业务流程,提出以下假设:

7、相关分析方法

当我们研究两种或者两种以上的数据之间有什么关系的时候,我们就用到向关分析。

如:身高与体重的关系。一般用散点图表示,散点图是比较直观地显示两种数据之间的相关关系。

8、群组分析方法

简单理解就是,把数据分组然后进行对比。如男生组,女生组。群组分析方法,经常用来分析留存率(或者流失率)随时间发生了什么,然后找出用户留下或者离开的原因。

9、RFM分析方法

如小红12月在A点买了3次东西,一共花了3000元。这个例子怎么理解RFM呢?我们看看

R(Recency)最近1次消费时间间隔。如12月22日小红在A店买东西,而上次是12月11日买的。那这个R就是11,就是最近1次消费时间间隔为11天。——R越小,用户价值越高。

F(Frequency)消费频次。是指用户一段时间消费了多少次。如一段时间为30天,那小红F为3次——F的值越大,用户价值越高。

M(Monetar)消费金额。指用户一段时间内的消费金额,那小红12月的M为3000元。——M的值越大,用户价值越高。

用户分类:首先看消费金额,都是高的,都要想办法保住。

10、AARRR模型分析方法

AARRR模型对应的是5个重要环节:

获取用户(Acquisition):用户如何找到我们?

激活用户(Activation):用户的首次体验如何?

提高留存(Retention):用户会回来吗?

增加收入(Revenue):如何赚更多的钱?

推荐(Referral):用户会告诉其他人吗?

11、漏斗分析方法

从业务流程起点开始到最后目标完成的每个环节都会有用户流失。因此需要一种分析方法来衡量业务流程每一步的转化效率,漏洞方法就是这样的方法。如下图:

还有很多其他的数据分析方法,欢迎在留言区补充,一起交流。

二、数据分析解决问题的过程是怎么样的呢?

1、如何明确问题?

数据分析的第一步是,定义问题。因为在定义问题的时候就已经包含了“原因”了,不是有句话是这样说的吗?有很多好答案就苦等一个好问题。说明明确问题,其实答案也就出来了。

明确问题决定了分析范围,而错位定义问题会缩小分析范围。所以在定义问题,明确问题的时候,一定不能拍脑袋,这样也许会导致事情越做越糟糕。浪费资源与时间。

2、如何分析原因?

影响问题的原因肯定不止一个,如果把所有相关的原因都分析一遍,那么这个工作量是非常大的。所以要优先分析那些关键因素,也就非常重要了。哪些是关键因素呢?如果找到这些关键因素呢?这才是难点。可以参考下面的流程图的方式分析找关键原因,分析原因。

举个栗子:

要解决的问题:为什么11月淘宝店铺的实际销售额比10月有所提升?公司如何在12月继续保持11月的销售额?

那我们就要开始思考了。影响销售额的因素有哪些?

销售额=访客量*点击率*转换率*客单价*(1+复购率)

我们会发现,业务指标会拆分很多更细的指标。那我们可以假设11月销售的提升,原因是访客量多了。

那我们继续深入分析,是不是访客增加,销售额就增加,结果发现,在7月与9月访客量比11月还多,但是销售额并没有增加。那为什么11月访客增加就销售额增加了呢?

那我们就可以进一步分析,发现,11月成交的顾客并不是来自新增加了的两个推广渠道。说明新推广渠道来的访客,对11月销售额的贡献不大。经过继续分析,原来是双11活动,平台有补贴,加上店铺有优惠,老顾客购买为主,复购率比较高。那说明影响11月的主要是老顾客回购为主。

那12月应该怎么做呢?可以参考11月的办法,积极参加双12活动。再做一个老客户回访或者专题,让一部分在11月没能享受到的实惠的用户享受到实惠,11月已经购买的,我们可以再折上折赠送优惠价,让他们再购买,就是让他们觉得自己11月光顾了,12月店家惦记着,12月特意再给优惠。

所以有些看起来好像真原因,也许不是真原因,是假的。所以一定要深入分析。

3、如何提出建议?

根据结论提出建议。但是只是知道原因,但是还不知道要改善到什么程度才能实现目标。这时候我们就需要“回归分析”来计算某个原因能够对目标造成“多大程度”的影响。

回归方程y=a回归系数)x+b(截距)

如:利润=ax(销售收入)+b(截距)

编辑于 2021-12-22 14:59

从事大数据产品工作多年,数据分析作为一项基本的能力,分享几点经验。

1、首先,应该会使用常用的数据分析工具,最简单好用的工具推荐excel,可以满足绝大部分的数据分析需求。

2、其次,会用常用的三种数据分析方法,分别为对比、细分和溯源,对比可是分为纵向对比和横向对比,所谓纵向一般按时间维度,观察当前周期与历史周期的变化,一般分为同比或环比,通过对比,发现变化,没有对比,就不能说变化的程度是大或小。所谓横向对比,是指同一类事物的变化对比,从而找出差异。对于细分,是相对于宏观的观察一般不能够发现问题的本质,而通过从不同维度进行细分,从而找到哪些维度发生了变化。溯源,也叫归因分析,通过不同维度和角度,打到问题的根本原因,网上有相关的方法介绍。

3、再次,数据分析重要的不是数据分析工具的使用及分析方法,而是要在分析前搞清楚数据分析的目的和意义,先建立假设,然后分析验证。如果没有目的性、没有分析的思路、没有带着假设去分析,很容易陷入数据分析的泥潭,分析效率低下,最后也得不到想要的结果。

4、最后,数据分析是为业务服务的,分析不是目的,而在数据分析之后如何行动才会是数据分析的价值所在,数据分析通常是找到问题所在,并给出解决问题的思路和方法,指导实践,如果分析完之后,没有行动,价值将大打折,切记、切记,数据分析师在产出分析报告时,一定要有行动的建议,并且可以落地实施。

数据分析除掌握基本的技能外,重要的是分析的思路和方法以及分析之后的行动,形成数据分析的闭环。

发布于 2022-04-04 21:58