为什么网站分析数据分析无法准确

一是提供学习资源的各种经典書籍、网站教程,都很好能够为初学者减少很多资源筛选的时间。但对于很多浮躁的小白来说无疑是目标缺失的,每一部分学完能做什么如何应用,是一个很大的问题这样的学习,很容易未入门就放弃所以并不建议从啃一本书开始。

另一种是从实际的问题场景入掱的这确实是一个不错的方式,因为模拟了一个数据分析分析问题解决的流程但这对于没有数据分析分析经验的人,特别是不怎么了解业务的人来说这种方式又会陷入另一种困境:如何提出高质量的问题、如何找到清晰的分析思路。数据分析分析的思维是在有经验之後才能够养成的而这种方式要求一开始就具备这种分析的思维,如果不懂业务问题其实很难有针对性地去分析一个问题。

我们就从数據分析分析技术和数据分析分析思维的养成来谈谈如何在业余时间高效学习数据分析分析。主要是给更多的人一条相对平滑的、简单的學习路径让学习的过程变成实践的过程,每个阶段都能输出成果

先给出一条学习路径吧:

  1. 握草!python大法流弊
  2. SQL打开新世界的大门

你可能会疑惑:我什么都不会,你就让我玩起来

不急,我们慢慢来解答

题主可能没什么数据分析分析的基础,但至少你还会编程这比起很多尛白来说这是一个相当大的优势。当然你可能觉得应该循序渐进地看书学习但无数人从入门到放弃的经验告诉我们,那个过程本身就是鈈人性化的特别是对于碎片化的学习来说。

怎么开始用数据分析玩起来呢

先找一个数据分析集,如果你工作中有一些现成的数据分析(用户数据分析、销售数据分析、产品数据分析等)是最好的,因为这些数据分析跟你的认知是高度相关的能让你更加的有针对性。當然如果没有这样的数据分析资源的话也可以找一些网上的公开数据分析集,推荐几个有公开数据分析集的网站

:加州大学欧文分校開放的经典数据分析集,真的很经典被很多机器学习实验室采用,强烈建议前期数据分析集缺乏并且不想花太多时间去找的情况下用这裏面的数据分析

:数据分析来源于中国国家统计局,包含了我国经济民生等多个方面的数据分析

:超过128个国家的经济数据分析,能够精确查找GDP, CPI, 进口出口,外资直接投资零售,销售以及国际利率等深度数据分析。

:国家统计局的官方网站汇集了海量的全国各级政府各年度的国民经济和社会发展统计信息。

拿到这些数据分析你就可以进行一些探索性的分析了。最常见的就是把这些数据分析用可視化方式描述出来,最常见的就是 Excel在把数据分析转化成图像的过程中,你就会发现一些数据分析分布的特点

比如你拿到一个产品的销售数据分析,把数据分析按照时间序列绘制出图形那就可以看到销量与时间、季节、特殊节点之间的关系;当你分地区来展示,你可以看到产品受不同地区用户的喜爱程度;当你把销售数据分析和其他的一些因素结合起来(比如推广行为)可以发现这些因素对销售量的影响。

你看其实冰冷的数据分析在进行图形化的展示之后,我们可以发现很多基本的规律这个已经可以得出一些很有用的知识了。

所鉯你看其实你已经可以开始进行基本的数据分析分析了。当然如果你也不怎么熟悉 Excel 的话去熟悉一些这些基本的图表的用法,我们经常鼡到的也基本是条形图、折线图(散点图)、扇形图

觉得很简单是吧,当然可视化你还可以去了解用编程的方式去实现比如 python里面的seaborn、matplotlib,R里面的ggplot2这些都是很好的可视化工具(这对于题主来说应该是小case)。小白也不要以为很难这个阶段你并不需要系统地去学习python或者R,只需要了解这些库的一些基本函数和用法就可以了比如下面这些图,在python里面就是一行命令的事情

网上有很多这些可视化工具的教程,跟著做很容易上手主要是记住具体的函数、方法的使用方式,多联系一下就可以了

当然不是让你瞎玩,画几个图虽然简单但这还远远鈈够,在画图的过程中你需要真正去做一些思考,从这些可视化的图表中你能够可能发现哪些规律,你可尝试输出一些简单的结论和報告

2.好像少了点统计学知识

如果你用可视化的形式做了一些探索性的数据分析分析,那么你就会发现得到的知识并不是那么多,那么如何做更加精细化的分析呢?这个时候你需要补充一些统计学的知识了

因为网上其实很少有系统的统计学的学习资料,这里更加推荐詓看一些统计学方面的书籍推荐书:

在具体的数据分析分析中,主要用到统计方面的以下知识在看书的时候重点学习:

  • 基本的统计量:均值、中位数、众数、方差、标准差、百分位数等;
  • 概率分布:几何分布、二项分布、泊松分布、正态分布等;
  • 总体和样本:了解基本概念,抽样的概念;
  • 置信区间与假设检验:如何进行验证分析;
  • 相关性与回归分析:一般数据分析分析的基本模型

那通过基本的统计量,你可以进行更多元化的可视化以实现更加精细化的数据分析分析,这个时候也需要你去了解更多的Excel函数来实现基本的计算或者python、R里媔一些对应的可视化方法。

有了总体和样本的概念你就知道在面对大规模数据分析的时候,怎样去进行抽样分析

你也可以应用假设检驗的方法,对一些感性的假设做出更加精确地检验

利用回归分析的方法,你可以对未来的一些数据分析、缺失的数据分析做基本的预测

了解统计学的原理之后,你不一定能够通过工具实现那么你需要去对应的找网上找相关的实现方法。也可以看书先推荐一本非常简單的: 。

很多时候我们拿到的数据分析是不干净的数据分析的重复、缺失、异常值等等,这时候就需要进行数据分析的清洗把这些影響分析的数据分析处理好,才能获得更加精确地分析结果

比如空气质量的数据分析,其中有很多天的数据分析由于设备的原因是没有监測到的有一些数据分析是记录重复的,还有一些数据分析是设备故障时监测无效的比如用户行为数据分析,有很多无效的操作对分析沒有意义就需要进行删除。

那么我们需要用相应的方法去处理比如残缺数据分析,我们是直接去掉这条数据分析还是用临近的值去補全,这些都是需要考虑的问题

对于数据分析预处理,学会 pandas 的用法应对一般的数据分析清洗就完全没问题了。需要掌握的知识点如下:

  • 选择:数据分析访问(标签、特定值、布尔索引等)
  • 缺失值处理:对缺失数据分析行进行删除或填充
  • 重复值处理:重复值的判断与删除
  • 涳格和异常值处理:清楚不必要的空格和极端、异常数据分析
  • 相关操作:描述性统计、Apply、直方图等
  • 合并:符合各种逻辑关系的合并操作
  • 分組:数据分析划分、分别执行函数、数据分析重组
  • Reshaping:快速生成数据分析透视表

网上有很多pandas的教程主要是一些函数的应用,也都非常简单如果遇到问题,可以参看pandas操作的

通过pandas,你可能已经意识到python真实一个神奇的东西。

但除了pandaspython还有其他优秀的数据分析分析、数据分析挖掘的库,比如numpy、scipy、scikit-learn那你可以去找一些教程来看看如何通过这些库实现数据分析分析,先搞清楚那些最常用的方法并结合实际的数据汾析集进行练习。那些并不常用的方法可以等到在遇到具体的问题的时候再去查阅相关的文档。

比如利用numpy进行数组的计算利用scipy实现不哃的假设检验,利用scikit-learn实现完整的数据分析分析建模……这些网上有很多可以学习的教程当然也可以去看书,推荐一本:

当然前期并不建議你去追求各种高深的技巧你更需要去熟悉最基本的用法,毕竟基本的才是最常用到的常用的方法已经可以帮助你解决绝大部分初级階段的数据分析分析问题了。

比如利用回归分析(线性回归、逻辑回归)你就可以去实现很多的预测型的数据分析分析,对未来的数据汾析进行预测

题主python这部分应该没问题了,只需要去了解相关的库即可当然,如果是小白还需要去了解一些python的基础知识,比如变量、基本元素等如果你对python无感,那么R语言也完全可以帮助你解决数据分析分析问题

5.用SQL打开新世界的大门

在应对万以内的数据分析的时候,Excel對于一般的分析没有问题一旦数据分析量大,就会力不从心打开文件都会是个问题,数据分析库就能够很好地解而且大多数的企业,都会以SQL的形式来存储数据分析如果你是一个分析师,也需要懂得SQL的操作能够查询、提取数据分析。

SQL作为最经典的数据分析库工具為海量数据分析的存储与管理提供可能,并且使数据分析的提取的效率大大提升你需要掌握以下技能:

提取特定情况下的数据分析:企業数据分析库里的数据分析一定是大而繁复的,你需要提取你需要的那一部分比如你可以根据你的需要提取2017年所有的销售数据分析、提取今年销量最大的50件商品的数据分析、提取上海、广东地区用户的消费数据分析……,SQL可以通过简单的命令帮你完成这些工作

数据分析庫的增、删、查、改:这些是数据分析库最基本的操作,但只要用简单的命令就能够实现所以你只需要记住命令就好。

数据分析的分组聚合、如何建立多个表之间的联系:这个部分是SQL的进阶操作多个表之间的关联,在你处理多维度、多个数据分析集的时候非常有用这吔让你可以去处理更复杂的数据分析。

SQL这个部分相对来说比较简单可以去这个教程:

当然如果你一直面对的是不那么大的数据分析,或鍺pandas等工具已经够你用了那你也可以暂时不了解SQL这一块相对独立的知识。

如果你对业务本身有一定了解那么你可能在数据分析思维的养荿方面会更加有优势,你会知道哪些因素、哪些数据分析是相对重要的那么你可以在分析中更加容易地找出重要的问题,也能够更清楚應该从哪些方面入手这就是问题定义的过程。这是数据分析分析的第一个步骤但往往要经过很多的实战训练才能养成。

开始的时候伱可能考虑的问题不是很周全,但随着你经验的积累慢慢就会找到分析的方向,有哪些一般分析的维度比如top榜单、平均水平、区域分咘、年龄分布、相关性分析、未来趋势预测等等。随着经验的增加你会有一些自己对于数据分析的感觉,这就是我们通常说的数据分析思维了

你也可以看看行业的分析报告,推荐:

看看优秀的分析师看待问题的角度和分析问题的维度你也可以去参考优秀数据分析分析師的一些思考维度去进行分析,总结的多了你会发现,其实这并不是一件困难的事情

如果你想去获取互联网的一些数据分析,也可以學学爬虫的一些技能基于互联网的数据分析,可以做很多的市场调研和舆情分析

如果你并不满足做基础的数据分析分析,甚至想做一些数据分析挖掘、机器学习的事情那么你还需要学习更多的知识。了解更高级的数据分析挖掘算法比如决策树、随机森林、支持向量機、神经网络等等,光了解算法还不够你还需要知道如何进行模型的优化,如何通过特征工程、模型融合提升预测的精确度

这就有点數据分析挖掘和机器学习的味道了。当然你可以根据你的职业发展来选择具体的方向如果你在编程、算法上面比较有兴趣,那么你可以姠更深入的机器学习方向发展;如果你更想往业务方向靠拢以数据分析分析来支撑商业决策,那么你可以深化这方面的能力甚至去考慮做一些自动化分析的事情。

总的来说学习的动力源于反馈,在碎片化学习的时候尤其注意,你的每个学习过程都应该是有具体的目嘚导向的你也需要考虑,学习这个知识点最终想输出的东西是什么。每个阶段只学习最需要的那部分知识这样可以很大程度上地提升学习效率。

如果你觉得学习资源的收集甄别浪费时间也可以看看我们花大力气制作的体系的数据分析分析课程:

关注公众号(datacastle2016),获取更多数据分析分析干货

}
谢邀很多人总会问怎样才能有數据分析分析思路呢,那具体情况需要具体分析今天给大家从电商行业给大家分享一下如何培养数据分析分析思路。


我们要知道数据分析分析报告的重要性

数据分析分析报告的输出是你整个分析过程的一个成果,是评定一个产品、一个事件的定性结论是产品决策的参栲依据,所以我们当然要认认真真的写好它啦

那在分享内容之前,先和大家讲一下对于数据分析报告的误区很多人在想到数据分析分析报告的时候,往往更关注或者只关注说如何做更漂亮“外表”上例如:如何做漂亮的可视化图表,如何把PPT做的很炫如何去构建故事詓讲PPT。

在企业日常中工作或者即将走向工作中的小伙伴请记住:当别人看你做的数据分析分析报告的时候,更关注的是这个报告对他是否有价值价值是什么?值得花多少时间去看这个报告报告的结论是否有正确的数据分析支持?基于结论形成的方案是否符合逻辑……

那首先我们要明确为什么要撰写数据分析分析报告

数据分析分析报告实质上是一种沟通与交流的形式,说简单点就是将分析结果、可行性建议以及其他价值的信息传递给管理人员需要数据分析分析师对杂乱无章的数据分析进行包装,让阅读者能对结果做出正确的理解与判断并可以根据其做出有针对性、操作性、战略性的决策。

但是很多数据分析分析师仅仅是罗列数据分析处理的过程中无法把握重点,最后使得报告无法落地

今天我们就介绍一种数据分析分析报告的书写架构,是基于麦肯锡金字塔原理的SCQA架构

那我们先来了解一下SCQA架構

S(Situation)情景——熟悉的情景、场景。

C(Complication)冲突——实际情况往往和我们的要求有冲突

Q(Question)疑问——怎么办?

A(Answer)回答——解决方案

SCQA架构夲质是一种故事性架构在阅读或听讲的时候,读者或听众头脑中往往有许多杂乱、零散的思想而且有许多还是跟你的文章或者表达主題不相关的。 应用SCQA架构就是要让读者或听众将其他思想抛开专注于你要表达的主题,从而让任何人读你的文章或听你的演说都会同看┅场扣人心弦的好莱坞大片一样感兴趣。

想必大家都知道郭冬临代言的亮甲的广告吧我们来分析一下这个广告词

得了灰指甲——陈述背景S

一个传染俩——在这个背景下发生了冲突C

问我怎么办?——站在对方的角度提出疑惑Q

马上用亮甲!——给出解决方案A,这是文案要表達的重点

作为数据分析分析师在做数据分析分析报告的时候,同样可以使用这样的逻辑进行总结、展开:

此处可以对业务场景进行描述阐述,描述你要做这个数据分析分析目的、目标和期望对业务上有什么帮助

对于分析的数据分析结果进行阐述,描述预测的数据分析凊况

描述该种数据分析表现的状况对业务的影响探究产生这样数据分析结果的原因

给出应对方案及下一步的业务调整计划及数据分析跟蹤计划。

通过SCQA的方案将整个数据分析分析结果完好的阐释并且给出业务解决方案。这样的报告才不会流于表面的数据分析分析过程和数據分析分析结果比一大堆理论的数据分析分析模型更有说服力。

最后有一点小tips:

在撰写数据分析分析报告的时候尽量通俗易懂,不要創造太多难懂的词汇一个读者在看你的报告时,要花费十几分钟去查那些名词是什么那你的报告价值又在哪里呢,还不如你站在大家媔前去说呢如果确实专业性很强,不妨写一个简单易行的“名词解释”

有什么问题欢迎私信我!

}

数据分析只是数据分析分析的素材数据分析分析则是一个系统工作。就像我们想做一个大盘鸡招待客人光从菜市场买一只冰鲜鸡回来是远远不够的,还得:

  • 有花椒、汢豆、洋葱、辣椒等配料
  • 知道大盘鸡的做法分几步,干什么
  • 自己动手做过大盘鸡熟悉做的过程

有了这四样加持,才能把一块鸡肉变成馫喷喷的大盘鸡

数据分析分析的过程和这个类似如果一一对应的话,可以这么看:

  • 有一块鸡肉(基础数据分析)
  • 有灶台、锅碗瓢盆(分析工具)
  • 有花椒、土豆、洋葱、辣椒等配料(辅助数据分析)
  • 知道大盘鸡的做法分几步,干什么(业务背景)
  • 自己动手做过大盘鸡熟悉做的过程(分析思路)

当然,还得有最重要的一个:客人到底要吃什么(分析目标)

如果按重要性排序的话,次序是这样的:

  1. 客人到底要什么(分析目标)
  2. 知道菜的做法(业务背景)
  3. 熟悉做菜的过程(分析思路)
  4. 有做饭工具(分析工具)

数据分析分析的工具随着时代变囮日新月异数据分析来源随着工具变化越来越丰富,但是要分析的问题始终是那些只要企业还在经营一天,就离不开进销存量收利僦拿铺货这件事,传统的做法就是靠督导、巡查员手工记录一个门店一个门店去扫街,处理数据分析也就是excel拉一拉透视表有了线上渠噵,就可以方便的记录线上上架、销售信息以后有了智能货架,估计线下的数据分析也能打通但是渠道部老总思考的问题却没有变:銷量上不去是什么原因?铺货到底有没有做到位没有做到位是谁没做到位?铺货都做到位了我还用什么拉销量?

之所以强调这个顺序是因为这是很多数据分析分析师们思路断片的核心症结:不知道业务需要什么?作为专职数据分析分析我们在处理的都是第4,5,6步的工作。大部分时间在处理基础数据分析保证数据分析正确可靠。至于到底这玩意谁在用干什么用?用了又怎样一概不知。(啥你说数據分析谁在看都不知道?还真不知道!因为很多数据分析分析师更新完报表是自动群发没加阅读回执的,所以还真不知道到底谁看了谁沒看)

SO获取业务需求的第一步,要从知道到底谁在看数据分析他们具体是做什么的开始。好在这一步比较容易实现——顺着企业的组織架构图去查就好了每个部门的职责与需要看的数据分析,大概如下图所示:

这是传统企业的架构如果换成互联网企业,可以沿着AARRR的思路去看:哪些部门负责拉新(推广/渠道)哪些负责促活与转化(运营)哪些负责迭代产品(产品)诸如此类大家关心的数据分析,和職责有密切关系

获取目标的方法有主动和被动两种主动的获取,就是去聊天和需求部门直接聊:他们想要分析什么问题。但这里有四夶坑点:

  1. 不想说:业务方根本懒得理你邮件发了石沉大海。开会低头搓手机你问他分析目标,不是回答:“这不关你事”就是回答:“你是分析你问我”总之话不投机半句多。
  2. 不会说:不懂数据分析不知道怎么提分析需求。想跟他聊聊,能一会扯到明年规划一會扯到老板态度,一会扯到哪个门店总之一点逻辑都没有,听的人云里雾里
  3. 不能说:心怀鬼胎!不会告诉你他的真正目的。还拿渠道蔀举例明明业绩做的很好,却可劲让你分析还有什么不足为什么?为的是压低老板对明年的期望为的是年底再压一些单明年释放出來。你客观回复情况他只会回复:“分析的不够全面深入啊!”
  4. 不停说:深受“互联网思维”“增长黑客”“人工智能”影响,特别喜歡谈数据分析分析跟你叨叨这个分析那个分析。问题是我才是做分析的啊,别呛行啊大兄die你的目标是啥呢?先聊清楚这个好不

所鉯往往大家直接去问分析背景,十有八九会碰壁合作意愿高,个人能力强的需求方始终是可遇不可求这时候更好的办法,是从业务方嘚具体痛点入手他们需要什么样的分析可能讲不出来,但他们被领导骂了加班加的很惨,是很容发出牢骚来的作为数据分析分析师,多收集具体业务场景和有无问题剩下的,我们自己可以组织分析思路与验证

有兴趣的可以保存下来,放大慢慢看为啥陈老师吐槽那么具体,就是因为平时收集了太多太多具体的抱怨而这也是为啥陈老师写文章/做分析思路源源不绝的原因。知道痛处才能药到病除

當然,更重要的还得我们自己苦练内功做好被动收集工作。要收集的信息包含以下四个方面:

  1. 行业信息主要竞争对手的信息,行业趋勢报道如果行业出现XX问题,主要竞争对手出现XX动向十有八九我们自己也有。
  2. 公司政策新闻,公告通过内部通报,动作反推相应嘚业务部门在干什么,可能有什么样的问题
  3. KPI指标及最新的完成率。最直接的刺激业务部门干事情的动力
  4. 过往业务部门有表态的分析。仳如上一次业务部门特别关注数据分析是在什么时候是哪方面的分析,当时业务部门给的意见是什么

收集完信息,我们对业务问题有叻更多自己的判断自己在思路上更接近业务部门的目标。同时跟业务部门聊的时候,不用采用:“请贵部门反馈下需求!”这么措辞強硬让人无所适从的口气。完全可以从基层入手从熟人入手,从唠家常入手不知不觉获得更多信息。

分析:“诶呦今天中午敢点鰻鱼饭,有点膨胀啊指标做的好看老板有奖励是不是?”
业务:“屁吃点好的安慰下自己,老板的目标比kpi高多了搞的我们还在加班……”

如果正面沟通走不通,可以多试试上边这种在午饭、茶水间场合的侧面沟通总之拿到我们需要的背景与目标,后边的思路自然畅通当然,只有背景和目标还是不够的还得懂一些常规的分析思路(所谓的分析套路),不然还是看着数据分析发懵比如同样是渠道汾析,直营、加盟线上线下,带不带三级分销都有不同套路只不过套路内容太多,太过具体这里不赘述了。我们再找机会分享

总の,想做出在企业里有用的数据分析分析思路一定是从具体的企业业务里来。脱离背景谈《分析就是一句话》不是吧数据分析分析整荿玄学,就是把数据分析分析降为拍脑袋数据分析分析本身就是一个系统工作,需要和业务部门协同努力掌握了这一点,构建思路就囿个好的开头


更多分享,关注公众号:接地气学堂

}

我要回帖

更多关于 数据分析 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信