写给喜欢数据分析的初学者

十年生死两茫茫

数据人,忙忙忙

良辰美景,平添我凄凉

一天早晚闲不住

调研急

报告狂

夜来思路忽闪现

寻笔记

怕遗忘

需求多变

改改又何妨

料得午夜加班时

听家人

鼾声响

以上是一位资深的数据分析师写的自嘲的段子,却是很多分析师的真实写照。在耀眼的职业光环下,数据分析师自身的成长,几乎是与孤寂相伴,在高级打杂中,锻造而成。

最近接到一个职业访谈的邀请,要给对数据分析感兴趣的新人Y(目前在知名电商从事系统开发和维护)一些建议,才突然发现自己在这个领域打滚了一段时间,一阵感叹后,写下自己的一些体会,尽管不全面,但或许能够给新人一些借鉴。如有不妥地方,请各位数据大牛轻拍。

一、数据分析师有哪些要求?

1、理论要求及对数字的敏感性,包括统计知识、市场研究、模型原理等。

2、工具使用,包括挖掘工具、数据库、常用办公软件(excel、PPT、word、脑图)等。

3、业务理解能力和对商业的敏感性。对商业及产品要有深刻的理解,因为数据分析的出发点就是要解决商业的问题,只有理解了商业问题,才能转换成数据分析的问题,从而满足部门的要求。

4、汇报和图表展现能力。这是临门一脚,做得再好的分析模型,如果不能很好地展示给领导和客户,成效就大打折扣,也会影响到数据分析师的职业晋升。

二、请把数据分析作为一种能力来培养

从广义来说,现在大多数的工作都需要用到分析能力,特别是数据化运营理念深入的今天,像BAT这样的公司强调全员参与数据化运营,所以,把它作为一种能力培训,将会让你终生受益。

三、从数据分析的四个步骤来看清数据分析师需具备的能力和知识:

数据分析的四个步骤(这有别于数据挖掘流程:商业理解、数据理解、数据准备、模型搭建、模型评估、模型部署),是从更宏观地展示数据分析的过程:获取数据、处理数据、分析数据、呈现数据。

(一)获取数据

获取数据的前提是对商业问题的理解,把商业问题转化成数据问题,要通过现象发现本质,确定从哪些纬度来分析问题,界定问题后,进行数据的采集。此环节,需要数据分析师具备结构化的思维和对商业问题的理解能力。

推荐书籍:《金字塔原理》、麦肯锡三部曲:《麦肯锡意识》、《麦肯锡工具》、《麦肯锡方法》

工具:思维导图、mindmanager软件

(二)处理数据

一个数据分析项目,通常数据处理时间占70%以上,使用先进的工具有利于提升效率,所以尽量学习最新最有效的处理工具,以下介绍的是最传统的,但却很有效率的工具:

Excel:日常在做通报、报告和抽样分析中经常用到,其图表功能很强大,处理10万级别的数据很轻松。

UltraEdit:文本工具,比TXT工具好用,打开和运行速度都比较快。

ACCESS:桌面数据库,主要是用于日常的抽样分析(做全量统计分析,消耗资源和时间较多,通常分析师会随机抽取部分数据进行分析),使用SQL语言,处理万级别的数据还是很快捷。

Orcle、SQLsever:处理千万级别的数据需要用到这两类数据库。

当然,在自己能力和时间允许的情况下,学习新流行的分布式数据库及提升自身的编程能力,对未来的职业发展也有很大帮助。

分析软件主要推荐:

SPSS系列:老牌的统计分析软件,SPSSStatistics(偏统计功能、市场研究)、SPSSModeler(偏数据挖掘),不用编程,易学。

SAS:老牌经典挖掘软件,需要编程。

R:开源软件,新流行,对非结构化数据处理效率上更高,需编程。

随着文本挖掘技术进一步发展,对非结构化数据的分析需求也越来越大,需要进一步







































2018治疗白癜风最好的药哪里能买到
湖北治疗白癜风的医院



转载请注明:http://www.nylrzx365.com/whgj/whgj/7958.html