快好知 kuaihz

数据分析六步曲

数据分析过程

数据分析,不是一个简单的操作,而是一个完整的过程。

一般地,一个完整的数据分析包括了六个步骤,后一个步骤依赖前一个步骤,也是前一个过程的深入。

数据分析过程

第一步:明确目的。

首先,任何数据分析都是为了解决业务问题。因此,明确目的是数据分析有效进行的先决条件,也为后续提供清晰的指引方向。明确目的要做的工作如下:

1、 确定分析目的。即为什么要做数据分析分析的背景以及目的是什么,要解决什么业务问题,并进一步对业务分析进行分解。

2、 确定分析思路。围绕业务目的,梳理分析思路,搭建分析框架。比如,要从哪几个角度进行分析,采用哪些分析指标,等等。

分析思路

第二步:收集数据

当确定分析目的之后,接下来就需要围绕业务问题来收集相关的数据数据收集为分析数据提供素材与依据。需要明确下面工作:

1、 明确收集范围。即需要收集哪些数据数据的名称、类型、时间范围等等。

2、 确定收集来源。数据的来源可以是多样性的,可以是互联网、公开出版物,以及一些专门的咨询机构,当然更多的数据来源是本企业的IT系统及数据库(比如CRM、BOSS、营销系统等)。

3、 确定收集方法。采用哪些方法可以快速获得想要的数据呢?是抽样,还是需要普查?是只需要样本还是数据全集?调查的渠道有哪些?对于一些特定的分析任务,还需要进行市场调查,通过专门的市场调查机构来获取数据

第三步:整理数据

数据预处理是对收集到的数据进行加工、整理,形成适合分析的格式,是分析前不可缺少的阶段。一般情况下,数据预处理所花费的时间占整个数据分析的60~80%的工作。预处理经常要做的工作包括:

1、 数据预处理

a) 数据清洗。去掉或合并重复的数据,删除无效数据,补齐缺失数据

b) 数据转化。将原始的数据转化为新的数据格式,比如,将性别(男,女)转换为数值(1,0)等等。

c) 数据提取。将几个字段进行抽取、合并等形成新的字段,比如,从身份证中提取出性别,以及出生年月。

d) 数据计算。对数据进行基本的汇总、统计,比如,根据单价和数量,计算出总的消费金额。

2、 数据质量评估

a) 有效性评估。数据的取值、单位是否有效。

b) 可靠性评估。来源是否专业,可信度如何。

3、 合并多个表格

大多数分析方法都是基于一个数据集进行的,所以需要将众多的数据表格进行合并,形成一个数据集。

第四步:分析数据

分析数据,就是用适当的分析方法和工具,对数据进行分析,提取有价值的信息。这一步包含如下内容:

1、 选择分析方法。基于业务问题,需要选择合适的分析方法,比如:分组分析、结构分析、趋势分析,不同的分析目的要采用不同的分析方法。

2、 选择分析模型。对于复杂的业务问题,有可能还需要重新构建分析模型,或者选择已有的数据分析模型,比如回归模型、聚类、决策树分类,等等。

3、 选择合适工具。常用的分析工具有通用的Excel数据分析,也有较专业的数据分析工具SPSS和SAS,各种不同的工具,其适用范围及能够解决的问题也不同。选择合适的工具能够让你的分析工作更加有效。

4、选择合适的分析语言。如果前面的分析工具都无法满足业务的需求,那么就需要学习一些分析语言了,比如Python/R语言,来编写业务数据的处理分析流程,以实现业务数据的自动化分析,满足定制的业务流程需求。

第五步:呈现数据

数据呈现,或者叫做数据可视化。数据可视化,能够将数据很直观地表达出来,让阅读者能够一眼看出数据所要表达的业务逻辑,所谓一图胜千言。分析师需要掌握最基本的可视化技术:

1、 常用图形。包括柱状图、条件图、饼图、折线图、散点图、雷达图,等等。

2、 图表工具。最常用的图形工具,有Excel、水晶易表、SwiffChart等等。

掌握常用的图形工具,能够让你的分析结果更直观有效,更易理解,更容易找出数据中蕴含的业务规律和业务问题,从而能够辅助决策。

第六步:撰写报告

分析报告,是整个数据分析过程的一个总结。一个好的分析报告,需要图文并茂,层次清晰,要有明确的分析结论,以及可行的建议和业务解决方案。

撰写报告的过程,其实就是思考业务策略的过程,这是从数据分析转换成业务策略最重要的一步。

所以,数据分析是一个完整的业务解决过程,发源于业务(业务问题),也回归于业务(业务策略)。

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:数据分析六步曲  数据分析  数据分析词条  数据分析六步曲词条  
经济

 专家:十年后中国人均住房望达34...

“中国房地产总体上没泡沫。”北京大学经济学院博士生导师萧国亮教授于近日在南京举办的中国普惠金融南京论坛上提出这一观点。论坛上,中国普惠金融发展研究中心成立。萧国...(展开)