社交网站的数据挖掘与分析(第21届Jolt生产效率大奖获奖图书)
<script type="text/javascript" ><!--
dd_ad_output="html";
dd_ad_width=302;
dd_ad_height=167;
dd_ad_client="P-304431";
dd_ad_format=20;
dd_ad_id=0;
dd_product_id=22606834;
dd_img_size=150;
dd_display_style=1;
dd_text_url="";
dd_color_text="";
dd_color_bg="FFFFCC";
dd_open_target="_blank";
dd_border=1;
dd_color_link="";
dd_ad_text="";
//--></script>
<script type="text/javascript" src="http://union.dangdang.com/union/script/dd_ads.js" ></script>
<P> </P>
<P>masterchat.cn推荐<BR>网站策划必备手册,网站策划深度解析<BR>新手建站入门书籍,建站流程详细指导<BR>成功网站深度揭秘,实用技巧全面分享<BR><BR></P>
<P> </P>
<P> </P>
<P><STRONG>内容简介</STRONG></P><STRONG></STRONG>
<P><BR> Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?本书简洁而且具有可操作性,它将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。<BR> 本书每章都介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。<BR> 通过本书,你将<BR> . 获得对社交网络世界的直观认识<BR> . 使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn等社交网络API中的数据<BR> . 学习如何应用便捷的Python工具来交叉分析你所收集的数据<BR> . 通过XFN探讨基于微格式的社交联系<BR><BR></P>
<P><STRONG>目录</STRONG></P><STRONG></STRONG>
<P><BR> 前言<BR> 第1章 绪论:Twitter 数据的处理<BR> Python 开发工具的安装<BR> Twitter 数据的收集和处理<BR> 小结</P>
<P> </P>
<P> 第2章 微格式:语义标记和常识碰撞<BR> XFN 和朋友<BR> 使用XFN 来探讨社交关系<BR> 地理坐标:兴趣爱好的共同主线<BR> (以健康的名义)对菜谱进行交叉分析<BR> 对餐厅评论的搜集<BR> 小结</P>
<P> </P>
<P> 第3章 邮箱:虽然老套却很好用<BR> mbox:Unix 的入门级邮箱<BR> mbox+CouchDB= 随意的Email 分析<BR> 将对话线程化到一起<BR> 使用SIMILE Timeline 将邮件“事件”可视化<BR> 分析你自己的邮件数据</P>
<P> 小结<BR></P>
<P> 第4章 Twitter :朋友、关注者和Setwise 操作<BR> REST 风格的和OAuth-Cladded API<BR> 干练而中肯的数据采集器<BR> 友谊图的构建<BR> 小结</P>
<P> </P>
<P> 第5章 Twitter:tweet ,所有的tweet ,只有tweet<BR> 笔PK 剑:和tweet PK 机枪(?!?)<BR> 对tweet 的分析(每次一个实体)<BR> 并置潜在的社交网站(或#JustinBieber VS #TeaParty)<BR> 对大量tweet 的可视化<BR> 小结</P>
<P> </P>
<P> 第6章 LinkedIn :为了乐趣(和利润?)将职业网络聚类<BR> 聚类的动机<BR> 按职位将联系人聚类<BR> 获取补充个人信息<BR> 从地理上聚类网络<BR> 小结</P>
<P> </P>
<P> 第7章 Google Buzz:TF-IDF 、余弦相似性和搭配<BR> Buzz=Twitter+ 博客(???)<BR> 使用NLTK 处理数据<BR> 文本挖掘的基本原则<BR> 查找相似文档<BR> 在二元语法中发Buzz<BR> 利用Gmail<BR> 在中断之前试着创建一个搜索引擎……<BR> 小结</P>
<P> </P>
<P> 第8章 博客及其他:自然语言处理(等)<BR> NLP :帕累托式介绍<BR> 使用NLTK 的典型NLP 管线<BR> 使用NLTK 检测博客中的句子<BR> 对文件的总结<BR> 以实体为中心的分析:对数据的深层了解<BR> 小结</P>
<P> </P>
<P> 第9章 Facebook :一体化的奇迹<BR> 利用社交网络数据<BR> 对Facebook 数据的可视化<BR> 小结</P>
<P> </P>
<P> 第10 章 语义网:简短的讨论<BR> 发展中的变革<BR> 人不可能只靠事实生活<BR> 期望</P>
页:
[1]