神译局是36Kr的编译团队,聚焦科技、商业、职场、生活等领域,专注于引进国外新技术、新理念、新趋势。
编者按:数据科学家是21世纪的热门工作。欲善其事,必先利其器。数据分析工具这么多,哪种合适?Lewis Chou分析了介质上3类6种工具的特点和适用场景。看完这篇文章,相信你能知道。原标题:2019年6大数据分析工具
说到数据分析工具,我们总是有疑问。这么多数据分析工具,它们之间有什么区别?哪个更好?我应该学习哪一个?
虽然这是一个老生常谈的话题,但是真的很重要,我也一直在努力寻找这个终极问题的答案。如果你在网上搜索这方面的相关信息,很难找到公正的观点。因为某个具体数据分析工具的评价者可能会从不同的角度去看,会有一些个人感受。
今天,我们先抛开这些个人感受。我尽量客观的和大家谈谈我个人对市场上数据分析工具的看法,以供参考。
我选择了三类六个工具。接下来我就一一介绍。
1.Excel工具
Excel有很多强大的功能,如创建表单、透视表、VBA等。Excel的系统庞大到任何分析工具都无法超越,保证了每个人都可以根据自己的需求来分析数据。
但是,有些人可能会认为自己非常精通计算机编程语言,然后因为Excel无法处理大数据而不屑于使用Excel作为工具。但是请考虑一下,我们日常生活中使用的数据是否超出了大数据的界限?在我看来,Excel是一个多面手。最适合小数据,通过插件可以处理几百万的数据。
综上所述,基于Excel强大的功能及其用户规模,我认为它是一个不可或缺的工具。如果想学习数据分析,Excel绝对是首选。
2.商务智能工具
商业智能是为数据分析而生的,起点很高。其目的是缩短从业务数据到业务决策的时间,用数据影响决策。
这不是Excel的产品目标。Excel可以做很多事情。你可以用Excel画一个课程表,做一个调查问卷或者当计算器用,甚至可以画图。如果你知道VBA,你也可以制作小游戏。但这些都不是真正的数据分析功能。
但是BI工具是专门用于数据分析的。
以常见的BI工具(如Power BI、FineReport、Tableau)为例。你会发现都是按照数据分析流程设计的。首先是数据处理,数据清洗,然后是数据建模,最后是数据可视化,用图表来发现问题,影响决策。
数据分析的方法只有这些,这个过程中也有一些员工的痛点。
比如BI工具,可以用来简化低附加值的重复数据清理。
如果有大量数据,传统工具Excel无法完成数据透视表。
如果我们使用Excel进行图形显示,编辑图表会花费很多时间,包括颜色、字体设置等琐碎的事情。
这些痛点正是BI工具可以为我们带来改变和价值的地方。
现在,我们来对比一下市面上比较流行的三款BI工具:Power BI、FineReport和Tableau。
1 )Tableau
Tableau的核心本质其实就是Excel的数据透视表和数据透视图。可以说,Tableau敏锐地意识到了Excel的这个功能。它较早进入BI市场,并延续了这一核心价值。
从发展历史和目前市场反馈来看,Tableau的可视化效果更好。我不认为这是因为它的图表很酷,而是它的设计、颜色和用户界面给我们一种简单清新的感觉。
的确,就像Tableau自己的宣传一样,他们把大量的学术精力放在研究什么样的图表大家都喜欢,如何在操作和视觉上给用户提供极致的体验。
此外,Tableau还增加了数据清洗功能和更智能的分析功能。这也是Tableau可以期待的产品开发优势。
2)电源BI
Power BI的优势在于商业模式和数据分析功能。
Power BI曾经是Excel的一个插件,但是发展并不理想。所以它摆脱了Excel,发展成了BI工具。Power BI作为后来者,每个月都有一次迭代更新,而且跟得很快。
目前有三种Power BI许可方法:Power BI免费、Power BI专业版和Power BI高级版。和Tableau一样,免费版功能不全。不过基本够个人用了。而Power BI拥有强大的数据分析功能。它的PowerPivot和DAX语言使我能够以类似于在Excel中编写公式的方式进行复杂的高级分析。
3)FineReport应用程序
FineReport的独特之处在于,它的自助式数据分析非常适合企业用户。通过简单的拖放操作,您可以使用FineReport设计各种风格的报表,轻松构建数据决策分析系统。
FineReport可以直接连接各种数据库,方便快捷地定制各种样式,从而做出周报、月报、季报、年报。其格式类似于Excel的界面。包括功能报表创建、报表权限分配、报表管理、数据录入等。
此外,FineReport的可视化功能也非常突出,它提供了多种仪表盘模板和许多自主开发的可视化插件库。
价格方面,FineReport个人版完全免费,所有功能开放。
3.R&Python语言
和r Python是我想讨论的第三种工具。Excel、BI工具等软件虽然尽力考虑了数据分析的大部分应用场景,但实际上基本都是定制化的。如果软件没有设计某个功能,或者没有为某个功能开发按钮,那么很有可能你无法用它们来完成工作。
在这一点上,编程语言是不同的。它非常强大和灵活。你可以写代码做任何你想做的事情。比如R和Python是数据科学家不可或缺的工具。从专业的角度来说,它们肯定比Excel和BI工具更强大。
那么,R和Python能实现哪些Excel和BI工具难以实现的应用场景呢?
1)专业统计分析
就R语言而言,最擅长的是统计分析,如正态分布、聚类分类和利用算法进行回归分析等。这种分析就像用数据做实验。它可以帮助我们回答以下问题。
比如数据的分布是正态分布、三角分布还是其他类型的分布?分散程度如何?是否在我们想要达到的统计可控范围内?不同的参数对结果有什么影响?和假设模拟分析。如果一个参数发生变化,会有多大的影响?
2)独立预测分析
例如,我们打算预测消费者的行为。他会在我们店里呆多久?他会花多少钱?我们可以根据他的网上消费记录,了解他的个人信用状况,确定贷款金额。或者,我们可以根据他在网页上的浏览历史推送不同的项目。这也涉及到目前流行的机器学习和人工智能的概念。
结论
以上对比说明了几款软件的区别。我想总结的是,存在就是合理的。Excel、BI工具或编程语言有一些重叠的功能,但它们也是互补的工具。每个应用程序的价值取决于要开发的应用程序的类型和当时的情况。
在选择数据分析工具之前,你首先要了解你的工作:你会使用我刚才提到的应用场景吗?或者考虑你的职业方向:你是面向数据科学还是商业分析?
译者:博西。