产品邦

 找回密码
 立即注册

QQ登录

只需一步,快速开始

社交网站的数据挖掘与分析(第21届Jolt生产效率大奖获奖图书)

[复制链接]
图书管理员 发表于 2012-4-24 18:37:00 | 显示全部楼层 |阅读模式

 

masterchat.cn推荐
网站策划必备手册,网站策划深度解析
新手建站入门书籍,建站流程详细指导
成功网站深度揭秘,实用技巧全面分享


 

 

内容简介


   Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?本书简洁而且具有可操作性,它将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。
  本书每章都介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。
  通过本书,你将
   . 获得对社交网络世界的直观认识
   . 使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn等社交网络API中的数据
   . 学习如何应用便捷的Python工具来交叉分析你所收集的数据
   . 通过XFN探讨基于微格式的社交联系

目录


  前言
  第1章 绪论:Twitter 数据的处理
  Python 开发工具的安装
  Twitter 数据的收集和处理
  小结

 

  第2章 微格式:语义标记和常识碰撞
  XFN 和朋友
  使用XFN 来探讨社交关系
  地理坐标:兴趣爱好的共同主线
  (以健康的名义)对菜谱进行交叉分析
  对餐厅评论的搜集
  小结

 

  第3章 邮箱:虽然老套却很好用
  mbox:Unix 的入门级邮箱
  mbox+CouchDB= 随意的Email 分析
  将对话线程化到一起
  使用SIMILE Timeline 将邮件“事件”可视化
  分析你自己的邮件数据

  小结

  第4章 Twitter :朋友、关注者和Setwise 操作
  REST 风格的和OAuth-Cladded API
  干练而中肯的数据采集器
  友谊图的构建
  小结

 

  第5章 Twitter:tweet ,所有的tweet ,只有tweet
  笔PK 剑:和tweet PK 机枪(?!?)
  对tweet 的分析(每次一个实体)
  并置潜在的社交网站(或#JustinBieber VS #TeaParty)
  对大量tweet 的可视化
  小结

 

  第6章 LinkedIn :为了乐趣(和利润?)将职业网络聚类
  聚类的动机
  按职位将联系人聚类
  获取补充个人信息
  从地理上聚类网络
  小结

 

  第7章 Google Buzz:TF-IDF 、余弦相似性和搭配
  Buzz=Twitter+ 博客(???)
  使用NLTK 处理数据
  文本挖掘的基本原则
  查找相似文档
  在二元语法中发Buzz
  利用Gmail
  在中断之前试着创建一个搜索引擎……
  小结

 

  第8章 博客及其他:自然语言处理(等)
  NLP :帕累托式介绍
  使用NLTK 的典型NLP 管线
  使用NLTK 检测博客中的句子
  对文件的总结
  以实体为中心的分析:对数据的深层了解
  小结

 

  第9章 Facebook :一体化的奇迹
  利用社交网络数据
  对Facebook 数据的可视化
  小结

 

  第10 章 语义网:简短的讨论
  发展中的变革
  人不可能只靠事实生活
  期望

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|产品经理之家 ( 粤ICP备12078725号 )

GMT+8, 2024-12-22 10:13

Powered by Discuz!

© 2012-2024 masterchat.cn.

快速回复 返回顶部 返回列表