你好,游客 登录
rss订阅 手机访问 
开源技术
漫谈Hadoop的思想之源:Google
  谷歌公司(Google Inc.)成立于1998年9月4日,由拉里·佩奇和谢尔盖·布林共同创建,被公认为全球最大的搜索引擎。
日期:今 10:07 作者:
Spark DataFrame便捷整合HBase
  HBase的介绍及使用场景;Spark on HBase介绍;以及如何通过Spark的DataFrame访问HBase表。
日期:昨 16:26 作者:
Hadoop 面试,有它就够了
  Apache Hadoop 是一个开源软件框架,可安装在一个商用机器集群中,使机器可彼此通信并协同工作,以高度分布式的方式共同存储和处理大量数据。最初,Hadoop 包含以下两个主要组件:Hadoop Distributed File System (HDFS) 和一个分布式计算引擎,该引擎支持以 MapReduce 作业的形式实现和运行程序。
日期:昨 16:17 作者:
hadoop2.5.0完全分布式环境搭建
hadoop2.5.0完全分布式环境搭建
日期:昨 14:11 作者:
2017年最棒的七个Python图形应用GUI开发框架
  作为Pyhon开发者,你迟早都会碰到图形用户界面(GUI)应用开发任务,目前市场上有大量Pyhon GUI开发框架可供选择,Python wiki GUI programming给出了超过30个跨平台框架方案,包括Pyjamas这样的跨浏览器web开发框架。
日期:昨 14:10 作者:李辉
初识Hadoop之Hadoop单机版搭建
  最近闲来无事,和朋友志声大神一起想学习Hadoop,最晚弄机器的弄到两点多,今天动手和志声一起安装Hadoop的环境,刚开始也是一头雾水啊,Hadoop官网 的教程我也是醉了,说的牛头不对马嘴,最后只能通过各种百度解决了问题,最后把安装的一些操作都记录下来,希望可以帮助到后来人
日期:11月20日 作者:
HBase集群搭建笔记
  最近突发奇想,想自己搭建一个 HBase 集群玩玩,一来复习一下 HBase 的架构,二来试试搭建一个分布式系统需要注意哪些问题,三来可以练练动手能力。
日期:11月17日 作者:
hadoop生态圈背后隐藏的“凶险”
  伴随互联网的高速发展,大数据成为炙手可热的时髦产物。随之而来的是关于大数据的存储与计算问题。作为能够对大量数据进行分布式处理的软件框架——Hadoop目前已经发展成为分析大数据的领先平台,它能够以一种可靠、高效、可伸缩的方式进行数据处理。
日期:11月17日 作者:
Apache Spark 黑名单(Blacklist)机制介绍
  在使用 Apache Spark 的时候,作业会以分布式的方式在不同的节点上运行;特别是当集群的规模很大时,集群的节点出现各种问题是很常见的,比如某个磁盘出现问题等。我们都知道 Apache Spark 是一个高性能、容错的分布式计算框架
日期:11月16日 作者:
你需要了解关于Hadoop与大数据的12个事实
  人们在谈论Hadoop的时候,常常把它当做单一产品来看待,但事实上它由多个不同的产品共同组成。
日期:11月14日 作者:
搭建Spark所遇过的坑
搭建Spark所遇过的坑
日期:11月10日 作者:
如何为Hadoop集群选择正确的硬件
  当我们想搭建一个Hadoop大数据平台时,碰到的第一个问题就是我们到底该如何选择硬件。
日期:11月09日 作者:Fayson
谷歌开源Tangent:一个用于自动微分的源到源Python库
  近日,谷歌在其官方博客上开源了「Tangent」,一个用于自动微分的源到源 Python 库;它通过 Python 函数 f 生成新函数,来计算 f 的梯度,从而实现更好的梯度计算可视化,帮助用户更容易地编辑和调试梯度;本文还扼要概述了 Tangent API,包括如何使用 Tangent 在 Python 中生成易于理解、调试和修改的梯度代码。
日期:11月08日 作者:
Quora十大机器学习作者与Facebook十大机器学习、数据科学群组
  使用相同的学习方法和数据集的不同的10倍交叉验证实验经常产生不同的结果,源于随机变化对选择折叠本身的影响。分层减少变化,但不能完全消除它。
日期:11月08日 作者:
HBase 在Linux&Mac 下的安装和配置
HBase 在Linux&Mac 下的安装和配置
日期:11月07日 作者:
  • 1/309
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • ...
  • 309
  • »