你好,游客 登录 注册 搜索
rss订阅 手机访问 
资料下载
  由候选项集C2生成频繁2-项集L2是关联规则Apriori算法的一个瓶颈。直接哈希修剪(DHP)算法利用一个生成的Hash表H2删减C2中无用的候选项集,以此提高L2的生成效率。但传统DHP算法是一个串行算法,不能有效处理较大规模数据。
日期:今 11:38 作者:杨燕霞 冯林
  在分布式系统中,云计算作为一种新的服务提供模式出现,其执行科学应用数据流时的优势和缺点得到越来越多的关注,其主要特点为拥有大量同质和并发的任务包,并构成了性能瓶颈的主要因素.在云数据流中调度大规模任务是已被证实的NP难问题.
日期:12月09日 作者:沈尧 秦小麟 鲍芝峰
  Hadoop作为当今云计算与大数据时代背景下最热门的技术之一,其相关生态圈与Spark技术的结合一同影响着学术发展和商业模式。
日期:11月30日 作者:夏靖波 韦泽鲲 付凯 陈珍
  针对高分辨率图像像素分割时间复杂度高的问题,提出了超像素分割算法。采用超像素代替原始的像素作为分割的处理基元,将Hadoop分布式的特点与超像素的分块相结合。在分片过程中提出了基于多任务的静态与动态结合的适应性算法
日期:11月25日 作者:王春波 董红斌 印桂生 刘文杰
  过去十年,Apache Hadoop从无到有,从理论概念演变到如今支撑起若干全球最大的生产集群。接下来的十年,Hadoop将继续壮大,并发展支撑新一轮的更大规模、高效和稳定的集群。
日期:08月12日 作者:
  为充分利用I/O资源并提高数据分析效率,针对高能物理数据分析过程及数据存储特点,利用Java本地接口技术,提出基于HBase C++访问接口的数据完全本地化分析平台,并设计MapReduce模型的相关算法及组件,根据Mapper任务的优化分配及组合提高CPU资源的利用率。
日期:07月12日 作者:雷晓凤 李强 孙震宇 孙功星
  云计算环境中大数据应用在数据迁移方面遇到各种问题,主要表现为如何在迁移过程中减少网络访问次数,减少全局时间消耗,以及在提高效率的同时兼顾全局的负载均衡等。
日期:06月13日 作者:张晋芳 王清心 丁家满 刘彦君 黄心
  《数据挖掘概念与技术(原书第2版)》全面地讲述数据挖掘领域的重要知识和技术创新。在第1版内容相当全面的基础上,第2版展示了该领域的最新研究成果,例如挖掘流、时序和序列数据以及挖掘时间空间、多媒体、文本和Web数据。
日期:06月07日 作者:
  手机已经成为了人们休闲娱乐的工具,男孩子们喜欢在手机上下载几个游戏,几部电影,以供闲暇之时打发时间。女孩子们手机你最多的莫过于照片了,喜欢摆个好看的角度自拍,喜欢记录生活中的点点滴滴。各种美图照片,手机的操作灵敏性。有的是一个不小心把喜欢的照片给删除了该怎么恢复回来呢!
日期:06月01日 作者:
  云计算环境下用户数据的集中存储为数据挖掘提供了便利条件,同时也为用户的隐私保护带来了挑战。为了解决云数据在数据挖掘条件下的隐私保护问题,提出了云计算环境下的隐私保护模型。
日期:05月27日 作者:陶林波 沈建京 游庆祥 郭佳
【PDF】面向DaaS应用的数据集成隐私保护机制研究
日期:05月23日 作者:周志刚 张宏莉 余翔湛 李攀攀
  为解决现有的HBase数据压缩策略选择方法未考虑数据的冷热性,以及在选择过程中存在片面性和不可靠性的缺陷,提出了基于HBase数据分类的压缩策略选择方法。依据数据文件的访问频度将HBase数据划分为冷热数据
日期:05月23日 作者:王海艳 伏彩航
  本文主要研究了云计算开源平台Hadoop及其Hadoop平台下开源生物信息存储和处理工具的基础上做了如下工作:1. Hadoop基础平台的构建与研究研究了Hadoop Common、Hadoop分布式文件系统和MapReduce分布式计算框架。
日期:05月10日 作者:包永红
  本文从Hadoop2.0版本中的核心子项目HDFS和YARN入手,分析其在服务过程中的认证和授权机制,对当前所采用的基于Kerberos和基于非对称加密的Token认证机制、传输加密机制、基于Linux/Unix系统自带的访问控制机制进行了详细的分析,归纳这些安全措施在安全性及效率性两方面存在的缺陷
日期:05月09日 作者:李延改
  • 1/17
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • ...
  • 17
  • »