你好,游客 登录
背景:
阅读新闻

基于Hadoop的社交网络的分析,Hadoop社交分析

[日期:2015-01-29] 来源:帮客之家  作者:帮客之家 [字体: ]

      昨天终于hadoop的项目验收完成了,终于可以松一口气了,总体还是比较满意的。

      首先说一下项目流程,用mapreduce对数据进行预处理,然后用mahout中的聚类算法(kmeans)对数据进行处理,最后用peoplerank对数据进行处理。

      根据老师交给我们的数据,包括Google+和Twitter的部分社交网络数据。以下是两个数据下载的链接

http://snap.stanford.edu/data/egonets-Gplus.html(Google+)

http://snap.stanford.edu/data/egonets-Twitter.html(Twitter)

      这里面的Google的人数是大概是100000多,相互之间的映射关系(A->B,就是A关注B,或者A是B的好友)有20W+,Twitter的人数大概是80000多,相互之间的映射关系也有20W+。

      对下面的图片做一些解释,横坐标代表拥有好友的数量,纵坐标为拥有该好友数的用户数。这样的分布是符合网络的无标度性。

      我是在本地上实现分布式的,在我的机子上开启了两个虚拟机,和使用了其他两个同学的电脑。

      然后我们的性能是用ganglia进行检测的,ganglia的安装以及使用我已在之前的一篇博文中已经说过。

      只是其中一张性能分析的图片,估计本地上配置除了问题,所以才导致,master做了所有的工作。

      如果有想要程序的朋友,可以在下面留言,我会写出全部的过程,和代码。





收藏 推荐 打印 | 录入: | 阅读:
本文评论   查看全部评论 (4)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
第 4 楼
* 匿名 发表于 2015/2/14 15:59:59
您好!您能发我一份吗?谢谢!jhan2811@163.com
第 3 楼
* 匿名 发表于 2015/2/2 10:39:04
你好,我现在也在研究这方面, 能发一份给我吗? 谢谢! 1291676247@qq.com
第 2 楼
* 匿名 发表于 2015/1/30 11:37:39
你好,能给我发一份吗?谢谢你了!610293776@qq.com
第 1 楼
* 吕贵冬 发表于 2015/1/29 11:44:17
您好,我现在也在研究这个,想要些程序,能发到我邮箱吗?谢谢!lvguidong_1@163.com