您当前所在位置: > 爆料站 > 有深度

干货丨18个免费的探索性数据分析工具,值得收藏

时间:2019-10-14 14:03:17  来源:  作者:网络

原标题:干货丨18个免费的探索性数据分析工具,值得收藏

每个人都有各自的天赋,发现它们并开始相信我们自己只是时间的问题。我们都有局限,但是我们应该止步不前吗?答案是不。

当我开始用R编程的时候,我很纠结。有时候不止一个人曾经这么想过。因为我在这一生中从未编码过。我的情况就像是一个从来没学过游泳的人在被强行踹进深海后用尽力气让自己不沉下去但是却喝了好多口咸咸的海水。

现在,当我回过头看,我笑了。你知道为什么吗?因为,我本可以选择不需要会编程就可以使用的数据分析工具并避免那些痛苦。

数据挖掘是预测建模不可缺少的一部分。除非你知道过去发生了什么否则你无法做出预测。掌握数据挖掘最重要的技能就是好奇心,它是免费的却不是每个人都拥有的东西。

我写这篇文章是为了帮助你们了解可用于探索性数据分析的各种免费工具。时下,在市场中可以找到非常多的免费且有趣的工具来帮助我们工作。这些工具不需要你较精确仔细地编写代码,只需要你点点鼠标就能完成工作。

无需编程即可用来数据分析的工具/软件

1.Excel / Spreadsheet

http://www.openoffice.org/download/

无论你正准备步入数据科学领域还是已经在这个领域小有建树,你会知道过去这么多年以来,excel 一直以来都是数据分析领域不可缺少的一部分(最常用的工具之一)。哪怕是在今天,有很大一部分需要数据分析的项目都依赖excel去完成。由于来自于社区,辅导教程,免费资源的帮助越来越多,学习excel已经变得越来越简单。

excel 基本上支持了最常用的数据分析功能:用来概述(总结)数据特征,数据可视化,对数据转型(去除噪音数据)从而得到新的数据集用来分析等。这些工具足够强大到让我们可以重新从多个方面审视数据。无论你知道有多少其它的数据分析工具,你一定要学会用excel。尽管Microsoft excel这个软件是付费的,但你可以用其替代品,例如open office, google docs!

2.Trifacta

https://www.trifacta.com/start-wrangling/

Trifacta的Wrangler工具正在挑战传统的数据清理和操作方法。因为excel在数据大小上有限制,但这个工具没有这样的局限,您可以安全地用它处理大数据集。这个工具有令人难以置信的特性,如图表推荐、内置算法、分析洞察力,您可以使用这些特性在任何时间内生成报告。这是一种智能工具,专注于更快地解决业务问题,从而使我们在与数据相关的练习中更有效率。

这些开源工具的提供让我们感到更加自信和支持,世界各地也有优秀的人在为使我们的生活更好而努力工作。

3.Rapid Miner

https://rapidminer.com/

这一工具作为高级分析的领导者出现在2016Gartner Magic Quadrant。是的,它不仅仅是一个数据清理工具。它在建立机器学习模型方面的具有专业性。是的,它包含了我们经常使用的所有ML算法。不仅仅是GUI,它还对使用Python&R构建模型的人提供了支持。

它以其非凡的能力继续吸引着全世界的人们。最重要的是,它能闪电般的快速水平上提供分析经验。他们的生产线上有几个为大数据、可视化、模型部署而构建的产品,其中一些产品(企业)包括订阅费。简而言之,我们可以说,它对于任何从数据加载到模型部署的需要执行AI操作的业务,都是一个完备的工具。

4.Rattle GUI

https://cran.r-project.org/bin/windows/base/

如果你试着使用R语言,但却找不到诀窍的情况下,Rattle应该是你的第一选择。这个GUI基于R语言构建,通过在R语言中键入安装包("rattle") ,然后输入库(rattle),然后键入RTACK,即可启动。因此,要使用Rattle,您必须安装R语言。它也不仅仅是数据挖掘工具。Rattle支持各种ML算法,如树算法、支持向量机算法、Booting算法、神经网络算法、生存算法线性模型算法等。

现在它已经被广泛使用。据克拉恩,rattle每月被安装10000次。它提供了足够的选项来探索、转换和建模数据,只是很少有人点击。然而,它在统计分析方面的选择比SPSS少。但是,SPSS是一个付费工具。

5.Qlikview

http://global.qlik.com/us/landing/go-sm/qlikview/download-qlikview

QlikView是全球商业情报行业更受欢迎的工具之一。这个工具所做的就是获得商业洞察力并以一种极具吸引力的方式将其呈现出来。有了它较先进的可视化功能,你会惊讶于你在处理数据时所得到的控制量。它有一个内置的推荐引擎,可以不时地更新有关可视化的信息。

然而,这不是一个统计软件。QlikView在探索数据、趋势、洞察力方面是不可思议的,但它无法从统计学上证明任何事情。在这种情况下,您可能需要查看其他软件。

6.Weka

https://www.analyticsvidhya.com/learning-paths-data-science-business-analytics-business-intelligence-big-data/weka-gui-learn-machine-learning/

使用Weka的一个优点是它很容易学习。作为一个机器学习工具,它的界面是足够直观的,你可以迅速完成工作。它为数据预处理、分类、回归、聚类、关联规则和可视化提供了选择。您所想到的建模过程中的大部分步骤都可以使用Weka来完成。它建立在Java之上。

它最初是为瓦卡托大学的研究目的而设计的,但后来被世界各地越来越多的人所接受。然而,这么久了我还没看到一个能像R和Python一样热情的weka交流社区。下面列出的教程将帮助您更多。

7.KNIME

https://www.knime.org/knime-analytics-platform

与RapidMiner类似,KNIME提供了一个开放源码的分析数据的平台,以后可以使用其他支持KNIME的产品进行部署。该工具在数据融合、可视化和先进的机器学习算法等方面具有丰富的特点。是的,你也可以使用这个工具建立模型。虽然,关于这个工具的讨论还不够多,但是考虑到它的设计技术,我认为它很快就会很快就会引起人们的注意。

此外,在他们的网站上有快速培训课程,可以让你现在就开始使用这个工具。

8.Orange

http://orange.biolab.si/

这个工具正如它听起来很酷那样,它的目的是产生交互式数据可视化和数据挖掘任务。YouTube上有足够的教程来学习这个工具。它有一个广泛的数据挖掘任务库,包括所有的分类、回归、聚类方法。同时,在数据分析过程中形成的多功能可视化使我们能够更紧密地理解这些数据。

要构建任何模型,您将需要创建流程图。这很有趣,因为它将帮助我们进一步了解数据挖掘任务的确切过程。

9.Tableau Public

https://public.tableau.com/s/

Tableau是一个数据可视化软件。我们可以说,Tableau和QlikView是商业智能海洋中最强大的鲨鱼。优势的比较是永无止境的。这是一个让我们快速探索数据的可视化软件,每一次观察都可使用各种可能的图表。它是一种由自己计算出数据类型、可用的较佳方法等的智能算法。

如果您想实时理解数据,tableau可以完成这个工作。从某种意义上说,tableau赋予了丰富多彩的数据生活,让我们与他人分享我们的工作。

10.Data Wrapper

这是一个闪电般的快速可视化软件。下一次,当您的团队中有人被分配到BI工作时,他/她对该做什么毫无头绪的话,可以考虑选择这个软件。可视化桶由线条图、条形图、列图、饼图、叠加条形图和地图组成。因此,这是一个基本的软件,无法与像Tableau和QlikView这样的巨人相提并论。此工具启用浏览器,不需要任何软件安装。

11.Data Science Studio (DSS)

http://www.dataiku.com/dss/trynow/

它是一个旨在连接技术,业务和数据的强大工具。它可分为两部分:编码和非编码。它对任何旨在发展,建立,在网络上部署和扩展模型的组织来说都是一个完整的软件包。DSS也足够强大去创建智能数据应用程序来解决现实世界的问题。它包含了一些特性,这些特性促进了项目上的团队集成。在所有特性中,最有趣的部分是,您可以在DSS中再现您的工作,因为系统中的每个操作都是通过集成的GIT存储库进行版本化的。

12.OpenRefine

http://openrefine.org/download.html

它开始于谷歌的精益求精,但似乎谷歌因为不清楚的原因而大幅缩减了这个项目。但是,这个工具仍然可用,改名为Open Refine。在众多开放源码的工具中,Open Refine专门研究混乱的数据;为预测建模目的而清理、转换和塑造数据。有趣的是,在在建模过程中,分析师80%的时间都用于数据清理。不是那么愉快,但这是事实。使用Open Refine进行改进,分析人员不仅可以节省时间,还可以将其用于生产工作。

13.Talend

http://openrefine.org/download.html

如今,决策主要是由数据驱动的。管理者和专业人士不再做基于直觉的决定。他们需要一种能迅速帮助他们的工具。Talend可以帮助他们探索数据并支持他们做出决策。确切地说,它是一种数据协作工具,能够清理、转换和可视化数据。

此外,它还提供了一个有趣的自动化特性,您可以在新的数据集上保存和重做以前的任务。这个特性是独特的,在许多工具中还没有找到。而且,它能自动发现,为用户提供增强数据分析的智能建议。

14.Data Preparator

http://www.datapreparator.com/downloads.html

这个工具建立在Java上,能够帮助我们进行数据的开发、清理和分析。它包括用于离散化、数字、缩放、属性选择、缺失值、离群值、统计、可视化、平衡、抽样、行选择的各种内置包,以及几个其他任务。它的GUI能够直观简单地理解。一旦你开始使用这个,我相信你不会花很多时间来弄清楚该如何使用。

这个工具的一个独特的优点是,用于分析的数据集不会存储在计算机内存中。这意味着您可以在大型数据集上工作,而不会出现任何速度或内存问题。

15.DataCracker

https://www.datacracker.com/Plans

这是一个专门研究调查数据的数据分析软件。许多公司确实进行了调查,但他们很难对其进行统计分析。调查数据从不清楚。它包含了大量的缺失和不恰当的内容。这个工具减少了我们的痛苦,增强了我们处理凌乱数据的经验。该工具的设计使得它可以从所有主要的互联网调查程序(如surveymonkey, survey gizmo等)中加载数据。有几个有助于更好地理解数据的交互功能。

16.Data Applied

http://www.data-applied.com/Web/TryNow/Overview.aspx

这个强大的交互工具被设计用来构建、共享、设计数据分析报告。在大型数据集上创建可视化有时会很麻烦。但是这个工具在使用树状地图可视化大量数据方面是很强大的。与上面所有其他工具一样,它具有数据转换、统计分析、异常检测等功能。总之,它是一个多用途的数据挖掘工具,能够自动从原始数据中提取有价值的知识(信号)。您会惊讶地发现,这种非编程工具在数据分析方面不差于R或Python。

17.Tanagra Project

http://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html

因为老式的UI,你可能不喜欢它,但这个免费的数据挖掘软件是设计出来建立机器学习模型的。Tanagra项目是作为学术研究的免费软件启动的。作为一个开源项目,它为您提供了足够的空间来设计自己的算法和贡献。

除了有监督的学习算法外,它还具有聚类、阶乘分析、参数和非参数统计、关联规则、特征选择和构造等范例。它的一些局限性包括:无法获得广泛的数据源、直接访问数据仓库和数据库、数据清理、交互利用等。

18.H2o

http://www.h2o.ai/download/h2o/choose

H2O是当今分析行业最流行的软件之一。在短短的几年里,该组织成功地在世界各地分析界传播开来。这个开源软件带来了照明快速分析的经验,这是API编程语言的进一步扩展使用。不仅是数据分析,而且您可以在任何时候建立先进的机器学习模型。基于强劲的社区支持,学习这个工具是不担心的。

额外奖励

除了上面那些很棒的工具之外,我还发现了一些我认为您可能感兴趣的工具。然而,这些工具并不是免费的,但您仍然可以试用它们:

Data Kleenr http://chi2innovations.com/datakleenr/

Data Ladder http://dataladder.com/

Data Cleaner https://datacleaner.org/

WinPure http://www.winpure.com/cleanmatch.html

最后说明

一旦您开始使用这些工具(你选择的),你就会明白,了解预测建模的编程并不是什么好事。您可以使用这些开源工具完成相同的任务。因此,如果你直到现在还对自己缺乏非编码感到失望的话,现在是你将你的热情注入到这些工具上的时候了。

我观察到这些工具(其中一些)的限制是缺乏社区支持。除了很少的工具,他们中的几个没有一个社区来寻求帮助和建议。不过,值得一试!

英文原文:https://www.analyticsvidhya.com/blog/2016/09/18-free-exploratory-data-analysis-tools-for-people-who-dont-code-so-well/

原文作者:ANALYTICS VIDHYA CONTENT TEAM

本文转载自:大数据地盘

版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。

Github中文项目排行榜,你永远想不到开发者都用它干了什么游戏网

责任编辑:

相关下载

玩家评论

【干货】由财富平台推荐榜重视返还率,谈野鸡砖家常用套路

大家都知道,我们的足球财富平台,每周都有个推荐榜单,奖金非常可观。可能朋友们也有自己关注的选手,大家平常会发现,有些选手红单率很不错,但却无法上榜详情>>

阅读: 0
日期: 2020-03-27
干货|宝丽星为你解读品牌海外运营成功的三大关键要素

原标题:干货| 宝丽星为你解读品牌海外运营成功的三大关键要素 如果你的品牌想要进入海外市场,最担心什么?最希望得到什么样的帮助和服务支持?如何确保详情>>

阅读: 4
日期: 2020-03-27
干货满满《梦塔防手游》新版本英雄与卡牌属性调整

《梦塔防手游》在3月5日发布新版本,带来了更加优质的塔防游戏体验。在本次新版本中调整了英雄和卡牌在冒险模式中的属性能力,维持属性平衡,增加游戏趣味,希望大详情>>

阅读: 4
日期: 2020-03-24
干货回顾|乐客5周年年庆活动,助力vr体验店“破蛹而出”_疫情

原标题:干货回顾 | 乐客5周年年庆活动,助力vr体验店“破蛹而出” 2020年的春节,大家都寄于很大的希望,在节前做了很多的准备,希望能在春节大干一场,使店详情>>

阅读: 2
日期: 2020-03-14
写给女孩子的8条干货清单_生活

原标题:写给女孩子的8条干货清单 7 愿每天都是你的女生节。节日快乐。 作者 | 李尚龙 写在女生节的几条干货清单,希望对你有用: 01 女孩子可以外详情>>

阅读: 6
日期: 2020-03-07
CSGO攻略教学:炙热沙城2进攻细节汇总,四条干货助你上分

在之前呢小miu给大家带来了一些DUST2进攻时能够用到的技巧,但是在实际的操作过程中还是会有非常多的细节遗漏。虽然进攻的过程中总体思路不会有大的详情>>

阅读: 8
日期: 2020-03-07
干货回顾丨销售组织如何长期、稳健、规模化增长?

原标题:干货回顾丨销售组织如何长期、稳健、规模化增长? 嘉宾:硅谷销售研究院创始人Patrick 1. 疫情之下谈增长:长期稳健的规模化增长 有人说增长靠详情>>

阅读: 4
日期: 2020-03-01
4000字干货|如何搭建游戏数据分析平台_统计

原标题:4000字干货 | 如何搭建游戏数据分析平台 本文作者为数数科技某游戏客户的运营总监,在使用数数科技的产品之前,他们在内部尝试自建数据分析平详情>>

阅读: 6
日期: 2020-02-26
干货|七项模特健身法则科学的训练才是王道_运动

原标题:干货 | 七项模特健身法则 科学的训练才是王道 无论是想让身体更健康还是再度挑战减肥,把运动列入目标吧。为了不让自己半途而废,同时又能达到详情>>

阅读: 15
日期: 2020-02-15
男士搭配干货,直接上图_男生

原标题:男士搭配干货,直接上图 男生只要你注重穿着,干净利索自然有气质。不要总拿丑、胖、矮来说事,为什么那么多单眼皮的男生也很受欢迎~下面推荐些详情>>

阅读: 3
日期: 2020-01-21
[实战干货]《DFQ》开发随录全集(1-9)_lorien

原标题:[实战干货]《DFQ》开发随录全集(1-9) 干货又来了,本课程共9节,大家可以收藏慢慢看~ 01.《DFQ》开发随录——图集 02.《DFQ》开发随录——资源详情>>

阅读: 7
日期: 2020-01-15
腾讯优量汇游戏助推计划干货来袭!_流量

原标题:腾讯优量汇游戏助推计划干货来袭! 2019年12月27日,“向心力”——腾讯优量汇2020年度发布会在北京顺利举行。腾讯优量汇团队与在场近500位详情>>

阅读: 7
日期: 2019-12-28
比化妆重要一百倍的卸妆干货分享,详细又全面你都做对了吗?_肌肤

原标题:比化妆重要一百倍的卸妆干货分享,详细又全面你都做对了吗? 慧boss干货小课堂开课啦!今天的主题是 卸妆,仙女们拿小板凳坐好记笔记啦! 卸妆是详情>>

阅读: 10
日期: 2019-12-28
干货还是噱头?众多国产游戏引入光追技术,玩家:本质还是垃圾

关于国产游戏,国内玩家一直都抱有谨慎而又期待的态度。在不太乐观的市场环境下一直没有让人满意的作品出现。不过最近国产厂商有了一些动作,在腾讯与详情>>

阅读: 5
日期: 2019-12-21
干货还是噱头?众多国产游戏引入光追技术,玩家:本质还是垃圾_画质

原标题:干货还是噱头?众多国产游戏引入光追技术,玩家:本质还是垃圾 关于国产游戏,国内玩家一直都抱有谨慎而又期待的态度。在不太乐观的市场环境下一直详情>>

阅读: 2
日期: 2019-12-21
FBEC2019Unity制作人专场顺利落幕 Unity叠纸巨人技术大牛分享干货满满

2019年12月5日,由中国通信工业协会区块链专业委员会、中国通信工业协会虚拟现实专业委员会、广东省游戏产业协会、深圳市互联网文化市场协会指导,行业头部媒体详情>>

阅读: 8
日期: 2019-12-09
退而求其次!云顶9.23版本稳分干货阵容推荐_装备

原标题:退而求其次!云顶9.23版本稳分干货阵容推荐 大家好,我是掌游宝作者:失眠! 9.23登录国服已经有了一周,大家是不是已经玩腻了海洋法、掠食者刺和云详情>>

阅读: 6
日期: 2019-12-04
新赛季白起正在悄然崛起,学会精髓轻松上分,大神干货分享

Hello,大家好。这里是王者驿站 今天,小编给大家带来的是白起的玩法攻略,那么小编到底有没有能力写这一篇攻略呢?我介绍一下自己吧,S16赛季用白起最高上详情>>

阅读: 11
日期: 2019-11-26
《洛奇》14周年见面会完美收官!超多干货首爆!

  一年一度的《洛奇》玩家见面会终于揭开了它神秘的面纱,在众多米莱西安翘首以盼的目光下,穿越时空遇见你《洛奇》14周年玩家见面会正式开场了! 门口   签到区迎面而详情>>

阅读: 14
日期: 2019-11-25
绝对干货《颤抖吧三国》神器升段所需材料大盘点(一)

绝对干货《颤抖吧三国》神器升段所需材料大盘点(一) 随着版本的更替,神器系统所带来收益是日益增加。绝大数玩家都已经拥有了属于自己的一详情>>

阅读: 12
日期: 2019-11-25
贪婪洞窟实用干货分享实用小技巧及游戏机制详解

贪婪洞窟手游中很多小伙伴不知道怎样能把游戏玩好,也不知道实用小技巧及游戏机制是什么,今天小编就带着大家了解一下贪婪洞窟实用干货分享;这里想写一些关于游戏机制的解析,因详情>>

阅读: 19
日期: 2019-11-21
干货教学:超强对抗路渔夫孙策教程,战斗局势全在一船中_技能

原标题:干货教学:超强对抗路渔夫孙策教程,战斗局势全在一船中 Hello,各位观众老爷们大家好鸭,我是电竞撸时代。 本期撸时代给大家推荐一位巅峰赛特别强详情>>

阅读: 10
日期: 2019-11-20
干货!球鞋的几大属性,哪个才是你最看重的关键点?

原标题:干货!球鞋的几大属性,哪个才是你最看重的关键点? 很多小伙伴在选择实战篮球鞋时,不明白篮球鞋的意义出发点在哪里:为什么会不支持穿fake球鞋进详情>>

阅读: 15
日期: 2019-11-19
百家号引流之被动吸粉大法,干货大放送

原标题:百家号引流之被动吸粉大法,干货大放送 在之前,笔者分享过关于百度经验的引流方法,一条经验可以做到长期截流,只要百度搜索引擎存在,就能源源不断详情>>

阅读: 9
日期: 2019-11-19
YSLNIKI的一些真假鉴别点第一集,干货(个人感受,不说味道包型这些)_字体

原标题:YSLNIKI的一些真假鉴别点第一集,干货(个人感受,不说味道包型这些) YSL NIKI一直很in的一款百搭包,这几年的当红IT BAG的背后,都一定有一位女明星详情>>

阅读: 16
日期: 2019-11-16
曝微软X019发售日期干货满满黑曜石将公布全新IP

微软一年一度的X019活动即将在15日凌晨4点开启,Xbox官方称这次是“规模最大”的一次。而业界知名分析师Daniel Ahmad(ZhugeEX)也爆料说:如果你是Xbox G详情>>

阅读: 13
日期: 2019-11-14
曝微软X019干货满满将公布很多发售日黑曜石还有全新IP!

【导读】微软X019活动即将于今夜开启,业界分析师ZhugeEX爆料称这次活动将有很多干货,新收购的黑曜石还将有全新的IP!   微软一年一详情>>

阅读: 10
日期: 2019-11-14
《亲爱的客栈》解锁职场干货教你如何让工作事半功倍

相信很多人都在职场中遇见过这样的情况:在老板和员工的相处之中,由于大家对工作内容、职责、理念等方面的不同理解,会产生一些分歧和矛盾,从而引出老板“生气咆哮”模详情>>

阅读: 10
日期: 2019-11-12
高手干货丨创业企业想要有所突破,创始人需要想清楚哪些问题?

原标题:高手干货丨创业企业想要有所突破,创始人需要想清楚哪些问题? 创始人的初心是企业的DNA,如果没有这个DNA,就不会有这个公司的存在;这个DNA是决定详情>>

阅读: 8
日期: 2019-11-11
“26条措施”干货满满

原标题:“26条措施”干货满满 “广泛、精准,而且务实。”对于刚刚发布的《关于进一步促进两岸经济文化交流合作的若干措施》(以下简称“26条措施”)详情>>

阅读: 13
日期: 2019-11-06
干货来袭 手把手教你计算《问道》人物属性

在《问道》中,常常看到道友们在在游戏中苦苦烦恼该如何提高自己的战力。明明非常努力的做任务却总打不过去。想要挑选适合的装备也不知道该如何选择。那么在这里就给各位道详情>>

阅读: 9
日期: 2019-11-04
干货!10个免费的PDF文献资源网站推荐

原标题:干货!10个免费的PDF文献资源网站推荐 各位读者,这次推荐的10个学术资源搜索引擎,小编均已经亲自测试过,都能正常打开链接,而且绝大部分网站的文详情>>

阅读: 9
日期: 2019-11-04
第二届进博会新闻通气会讲了这些干货

原标题:第二届进博会新闻通气会讲了这些干货 11月2日上午10时,第二届中国国际进口博览会新闻通气会在上海国家会展中心召开。 中国国际进口博览会详情>>

阅读: 11
日期: 2019-11-02
纯干货|2019Q3网络安全态势报告

原标题:纯干货 | 2019 Q3网络安全态势报告 网络安全状况概述 根据深信服安全云脑及深信服安全监测平台统计数据显示,2019年第三季度,网站攻击数量总详情>>

阅读: 9
日期: 2019-11-02
5G商用正式启动,你想知道的干货都在这儿

原标题:5G商用正式启动,你想知道的干货都在这儿 10月31日上午,在2019年中国国际信息通信展览会开幕式上,工信部与三大运营商、中国铁塔联合举行了5G详情>>

阅读: 9
日期: 2019-10-31
干货:职业模特的重要面试技巧!_工作

原标题:干货:职业模特的重要面试技巧! 模特工作的各个阶段都要进行面试,这也是获得工作的主要途径。不要认为自己已经有了一定的知名度,就忽视面试的重详情>>

阅读: 8
日期: 2019-10-30
精彩推荐