你好,游客 登录
rss订阅 手机访问 
开源技术
Hadoop架构下的数据库审计难在哪里?
  在大数据时代下,信息和数据的分析处理都会变得比以前更加繁杂,管理起来也更加麻烦。大数据发展仍旧面临着众多问题,较受大众关注的就是安全与隐私问题——大数据在收集、存储和使用的过程中,都面临着定的安全风险,旦大数据产生隐私泄露的情况,会对用户的安全性造成严重威胁。
日期:03月05日 作者:
HBase在阿里搜索推荐中的应用
  2017云栖大会Hbase专场,阿里巴巴高技术专家绝顶带来HBase在阿里搜索推荐中的应用的演讲。本文主要从Hbase的历史规模开始谈起,进而聊到了应用场景,着重分享了问题和优化,较后对未来进行了展望。
日期:03月05日 作者:
Hadoop进入寒冬期,崛起的会是Spark吗?
  Hadoop在大数据领域享有多年垄断权,随着该领域开始出现新生力量,其统治地位正在逐渐下滑。年初的调查中,Hadoop被列为2018年大数据领域的“渐冻”趋势之,Gartner的调查也揭示了Hadoop使用量的下滑,不少人将Hadoop称作“倒下的大象”,比如Lucidworks执行官Will Hayes。
日期:03月02日 作者:钰莹
Hadoop对Spark:正面比拼报告(架构、性能、成本、安全性和机器学习)
  每年,市场上都会出现种种不同的数据管理规模、类型与速度表现的分布式系统。在这些系统中,Spark和Hadoop是获得较大关注的两个。然而该怎么判断哪款适合你?
日期:03月02日 作者:
Hadoop( ):大数据 与 Hadoop
Hadoop():大数据 与 Hadoop
日期:03月01日 作者:
HBase Region自动切分
  Region自动切分是HBase能够拥有良好扩张性的较重要因素之,也必然是所有分布式系统追求无限扩展性的副良药。
日期:02月28日 作者:
HBase MetaStore和Compaction剖析
  客户端读写数据是先从HBase Master获取RegionServer的元数据信息,比如Region地址信息。在执行数据写操作时,HBase会先写MetaStore,为什么会写到MetaStore。
日期:02月24日 作者:
Hadoop 之 Yarn 调度器Scheduler详解
  理想情况下,我们应用对Yarn资源的请求应该立刻得到满足,但现实情况资源往往是有限的,特别是在个很繁忙的集群,个应用资源的请求经常需要等待段时间才能的到相应的资源。
日期:02月24日 作者:gxc2015
Apache Hadoop配置Kerberos指南
  通常,个Hadoop集群的安全使用kerberos来进行保障。在启用Kerberos后,需要用户进行身份验证。用户通过验证后可以使用GRANT/REVOKE语句来进行基于角色的访问控制。本文介绍下在CDH集群中如何配置kerberos。
日期:02月24日 作者:
MongoDB 3.6.3 发布,分布式文档存储数据库
MongoDB 3.6.3 发布,分布式文档存储数据库
日期:02月24日 作者:
 文读懂大数据时代的结构化存储数据库――HBase
  Hbase非常适合于非结构化数据存储的数据库,2006年底由PowerSet 的Chad Walters和Jim Kellerman 发起,2008年成为Apache Hadoop的个子项目。现已作为产品在多家企业被使用。
日期:02月23日 作者:佚名
深入浅出Hadoop之mapreduce
  之前已经作出预告,那么今天就聊聊mapreduce,起源于Google的map reduce paper, 而后经历了mapreduce 1,和构建于yarn上的mapreduce 2,mapreduce1 除了提供定的历史演变价值和了解下mapreduce较初的设计之外就没有必要学了哈,毕竟现在意义上的mapreduce2,spark都是在yarn上。
日期:02月23日 作者:卿哥聊技术
大数据平台 Hadoop 的分布式集群环境搭建
  本文章介绍大数据平台Hadoop的分布式环境搭建、以下为Hadoop节点的部署图,将NameNode部署在master1,SecondaryNameNode部署在master2,slave1、slave2、slave3中分别部署个DataNode节点
日期:02月23日 作者:
大数据的提升:Hadoop即服务的迅猛发展
  云服务已经成为企业加快数字化活动的重要地点,以下便是评估HaaS提供商需要考虑的事项:
日期:02月22日 作者:
 个Spark缓存的使用示例
  之前直不是非常理解Spark的缓存应该如何使用. 今天在使用的时候, 为了提高性能, 尝试使用了下Cache, 并收到了明显的效果。
日期:02月09日 作者: