你好,游客 登录 注册 搜索
背景:
阅读新闻

常用的数据挖掘工具

[日期:2015-07-23] 来源: 王路情博客  作者:王路情 [字体: ]

  俗话说,“工欲善其事必先利其器”,要做数据挖掘,熟悉一个或者多个数据挖掘工具是很有必要的。

  让我们先来看一下,公司里面对于数据挖掘这个岗位的职责描述和具体要求,如下图所示。

数据挖掘

  

数据挖掘

  通过上面的数据挖掘岗位要求,我们能够发现数据挖掘的常用工具包括这些:

  1SPSS Modeler

  它属于IBM公司,封装了先进的统计学和数据挖掘技术,来获得预测知识并把相应的决策方案部署到现有的业务过程和系统中,从而提高企业的效益。小编现在使用SPSS Modeler14,这个工具的使用关键是数据流的设计和实现以及CRISP-DM模型的应用。

  2 SASEM

  它是SAS公司推出的一个集成的数据挖掘系统,小编对这个不是很熟悉,但是小编发现这个工具很多银行喜欢使用它,给人的感觉,这样的工具是属于有钱人玩的家伙,小编就暂时不罗嗦了。

  3 R

  R语言和环境现在是由R核心小组和R活跃社区在推进着。小编很喜欢R,一直分享给身边的人,用R语言做数据挖掘和分析,有诸多优点,比方说,R语言是开源的,可以免费获取,R语言在数据挖掘领域里有着很多扩展包,针对数据挖掘的各种方法都可以找到相应的R包来进行学习和应用,还有就是R的社区很活跃,作为新手,很多问题都可以通过R社区来进行解答。关于如何深入学习和使用R,朋友们可以加小编微信:luqin360,我们可以深入交流。

  4Python

  Python语言也能做数据挖掘,尤其数据挖掘环节中那60%的数据准备阶段,使用Python这个语言能够简单高效地进行处理和完成。据我说知,很多公司使用Python语言来做“爬虫”程序,获取与商业目的相吻合的数据,尤其对于那些不是数据拥有着而需要数据的挖掘工师或是分析师,使用Python获取数据,可以大大地提高效率。

  5Mahout

  数据挖掘为什么最近这两年很是活跃,需求大增。重要原始是趋势所为,即大数据时代。在这样的一个时代里面,意味着需要从海量数据中发现知识、模式和规则,这就需要大数据挖掘思维和技术。而Mahout是Hadoop生态系统里面一个机器学习项目,能够实现机器学习或者数据挖掘里面几类典型任务,即分类与预测、聚类分析、推荐系统、关联规则等,因而,在企业中构造大数据挖掘系统,基于Hadoop的架构,利用Mahout项目是一种可行的方法。

  除了上面这些以外,还有WEKA、RapidMiner等开源的数据挖掘工具。我的建议,精通一款数据挖掘工具,充分地应用其优点,并且结合其他数据挖掘工具的优势,形成一种互补和聚合。而不要在就是是学R还是学Python中纠结,若是你不知道应该要学那个,你就先深入地去学好一个,赶快行动吧。





收藏 推荐 打印 | 录入:Cstor | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款