如果莫问有工具优势,你不会失望的。
最近老李看到很多想进入数据分析领域的朋友偷偷相信我,让我帮忙解答一些专业问题。在和他们的交流中,我发现他们中有70%的人对数据一无所知或者刚刚入门,但是他们很积极,很想学习数据分析。
他们大多不是为了转行而想学,而是认为多学点数据分析技能对自己的生意有帮助。
有很多人问,我也没时间一一回答。我只想盘点一下今天数据分析应该使用的工具。
从基础到高级,跟着老李循序渐进,哪个阶段学哪个工具,怎么学,需要学到什么程度,让你一目了然。
Excel不用多说,是数据分析领域的入门级工具,也是日常工作中最常用的工具。
精通:
和公式:常用函数(逻辑、统计、搜索、引用、文本、日期、数学函数等。)
透视表:分类汇总、平均值、最大值、自动过滤、分析比例、同比、环比、固定比例。
*VBA程序开发:加分,有能力的可以先学,时间精力不够的可以到高级阶段再学。
学习书籍/网站:
你应该这样玩Excel,Excelhome论坛
Excelhome论坛
建议:
先跟教程过一遍基础,知道每个函数怎么用,明白数据透视表怎么做,然后去网上找几个案例跟着做,在实践中边学边练,这样效率最高。
做数据分析,SQL也是必要的工具,因为我们需要使用SQL语句来检索和清理数据。
精通:
了解常用的数据库类型,学习添加、删除、检查基础(使用select语句添加字段、查找数据;Alter语句减去字段;更新数据等。);熟悉主键的用法;理解SQL中各种连接的异同
学习书籍/网站:
《SQL必知》/自学SQL网(强烈推荐,不喜欢看书的同学可以直接上网站学习练习)
建议:
两点建议。
1.选好1-2本书和网站教程后,停止在网上找学习资料。这些课本足够你用了。不要在他们身上浪费时间。
2.学了一遍之后,学会自己总结,自己做思维导图(如上图),加深记忆,不要用别人的总结来复习,这样学习效果不好。
一般来说,数据分析的编程语言有Python和R语言,其中R语言倾向于统计分析和绘图,而Python倾向于数据处理,实用性更强,所以对于初学者来说学习Python是更好的选择。
精通:
学习基本的Python概念
熟练掌握和使用Numpy、Pandas、Matplotlib三个库。
学习书籍/网站:
Python编程浅显易懂,哔哩哔哩教程视频(全部免费)
建议:
Python这几年太火了,整个网络都是卖类的广告。但其实网络上有很多Python资源可以借鉴,不用花那些浪费的钱。按照我给你推荐的学习书籍/网站学习Python就够了。
最终数据会呈现给业务/管理层查看,所以BI工具也是高级阶段必须掌握的技能。
精通:知道如何使用商务智能工具连接数据库;了解Dashboard的概念,知道大部分图表适用的场景;了解维度和指标的区别以及一些数据的清理。
学习工具/网站:FineBI:FineBI帮助文档,Fanruan社区
Power BI: Power BI权威指南
Tableau:“人人都是数据分析师:Tableau实际应用”
目前市面上的BI工具很多,国内企业普遍使用FineBI,国外企业大多使用PowerBI和Tableau。但是,因为它们是外国产品,所以对中国人来说有两个不便:1。帮助文档是英文的,不准备中文翻译后的意思,理解和学习成本高;2.无法满足国内企业复杂报表的需求,本地化服务差。但是不可否认Tableau的可视化和power bi的数据处理和建模还是很牛逼的。
如前所述,R语言倾向于统计分析和绘图。高级阶段,需要掌握R语言。近年来,R语言已经成为求职公司的一项基本功,需要数据分析师熟练掌握。
了解R的基本用法,掌握基本的数据结构,数据导入导出,简单的数据可视化。
学习书籍/网站:学习R:牢牢掌握第1章到第5章的数据基础介绍,这是R最基础的东西,不能一遍一遍的看。不要以为你能看懂,只有你自己打出来,而且工作正常。至于第六章环境与功能,建议直接跳过,比较抽象。了解r之后再回头看看学习效果更好。
R Python和R Python都很好学,但是很多地方很像。如果两个都同时学,就容易混淆,建议不要同时学。最好等其中一个掌握到一定程度再开始学习另一个。
欲善其事,必先利其器。工具的确是数据分析师的利器。然而,刚刚入门的小白很容易陷入一个误区,那就是如果我学会了这些工具,我就可以成为一名数据分析师。这显然是一个误解。在实际工作中,要成为一名优秀的数据分析师,仅仅知道这些工具是远远不够的。
在数据分析落地后做出结论,并切实推动业务增长,是成为一名优秀数据分析师的关键。
福利以上推荐的书籍,大家都有电子版。