你好,游客 登录
rss订阅 手机访问 
技术方案
Python数据预处理:使用Dask和Numba并行化加速
  如果你善于使用Pandas变换数据、创建特征以及清洗数据等,那么你就能够轻松地使用Dask和Numba并行加速你的工作。单纯从速度上比较,Dask完胜Python,而Numba打败Dask,那么Numba+Dask基本上算是无敌的存在。
日期:03月14日 作者:
现代数据架构的7个关键技术
  企业IT基础设施平台的重新构建是项复杂的任务。重新构建平台通常由系列变化的关键业务驱动因素引发,现在情况正是如此。简而言之,主导企业IT技术的近30年的平台无法再满足推动业务发展所需的工作负载的需求。
日期:03月12日 作者:
企业在数据泄露后应及时更改安全策略
  与许多企业在网络安全政策不充分的情况样,新的研究表明,半以上的澳大利亚企业在其网络遭到破坏后甚至没有改变其网络安全策略。
日期:03月09日 作者:Harris编译
用于大数据处理高性能计算的4个实现步骤
  如果企业需要采用处理其大数据的高性能计算,则在内部部署运营可能效果较佳。以下是企业需要了解的内容,其中包括高性能计算和Hadoop的不同之处。
日期:03月09日 作者:
大数据:企业的潜在机遇和风险
  企业需要实时收集和分析大数据。同样的数据有助于防止对有价值的数据基础设施的攻击。
日期:03月08日 作者:Harris编译
人工智能的算法黑箱与数据正义
  个月前,《算法》作者、人工智能学者、华盛顿大学教授 Pedro Domingos 在社交网络中写道:“自 5 月 25 日起,欧盟将会要求所有算法解释其输出原理,这意味着深度学习成为非法的方式。”
日期:03月08日 作者:
数据挖掘实战:带你做客户价值分析(附代码)
数据挖掘实战:带你做客户价值分析(附代码)
日期:03月07日 作者:
数据科学研究的现状与趋势全解
  大数据时代的到来催生了门新的学科——数据科学。首先,本文探讨了数据科学的内涵、发展简史、学科地位及知识体系等基本问题,并提出了专业数据科学与专业中的数据科学之间的区别与联系
日期:03月06日 作者:佚名
数据能耗问题待解 边缘计算或开启新蓝海
  近两年,物联网、人工智能、5G等新技术的不断涌现和发展,直推动着数据的新轮变革。而关于数据的能耗问题,是当前业内亟待解决的难题。不过随着技术的成熟发展,2018年我们或将成为边缘数据的发展年。
日期:03月06日 作者:佚名
大数据行业洞察:未来2-3年或迎数据时代的真正高潮
  从2012年的“用户标签”到2014年的“用户画像”,从2015年的“大数据”到2017年的“人工智能”,大数据正在从神坛走向现实。
日期:03月06日 作者:
5种快速易用的Python Matplotlib数据可视化方法
  数据可视化是数据科学家工作的重要部分。在项目的早期阶段,我们通常需要进行探索性数据分析来获得对数据的洞察。
日期:03月05日 作者:
热门缓存数据架构设计
  热门数据、通用数据在个性化推荐系统中有这广泛的应用,为什么这么说呢?因为在大部分频道下,当天来的除了20%用户是老用户,还有80%用户是新用户,是在频道内没有历史行为的,这就需要通过热门数据、地域数据、通用数据来补充用户feed信息,好的热门数据能够带来更多的用户转化,好的热门数据架构决定这热门数据带来的价值。
日期:03月05日 作者:
你应该使用NoSQL数据库、SQL数据库还是两者都用?
  SQL和NoSQL之争只不过是关系数据库和非关系数据库的比较。区别在于它们是如何构建的、存储信息的种类以及如何存储信息。关系数据库是结构化的,非关系数据库是面向文档、分布式的。四十多年来,结构化查询语言(SQL)数据库直是主要的数据存储机制。
日期:03月02日 作者:布加迪编译
2018中国国际大数据博览会5月在贵州举行
  2月28日,2018中国国际大数据产业博览会(以下简称数博会)新闻发布会在北京召开。记者从会上获悉,以“数化万物 智在融合”为主题的2018数博会将于5月26-29日在贵阳举行。
日期:03月02日 作者:
如何进行 App 数据分析?攻略 :屏幕与事件
  App数据分析比Web流量分析更困难,因为对于Web,只要每页都部署了GA基础代码,就能够收集分析很多有价值的数据了。但App分析则不同,如果只是加入基础的统计SDK,则只能收集到日活跃用户、留存率等些基本的数据而已,完全无法进行深入分析。所以如何从“平地”建立起数据分析的高楼大厦,其中的方法就变得尤其重要。
日期:03月01日 作者:孙维