Twitter数据挖掘：如何使用Python分析大数据

我们可以创建变量来存放待拉取的微博数量（即count），以及待拉取的用户（即name）。然后用这两个参数调用user_timeline()函数。下面是更新后的代码（注意，在代码的顶部应该保持认证和API对象的创建）。

# 传入认证信息，并创建API对象 api = tweepy.API(auth) # 待拉取微博的用户 name = "nytimes" # 待拉取的微博数量 tweetCount = 20 # 使用上面的参数，调用user_timeline函数 results = api.user_timeline(id=name, count=tweetCount) # 遍历所拉取的全部微博 for tweet in results: # 打印存在微博对象中的text字段 print tweet.text

输出的结果看起来像这样：http://www.wmyl15.com/

这种类型数据的流行应用包括有：

对指定的用户进行分析，分析他们是如何与世界进行互动的

寻找Twitter的影响者并分析他们的粉丝的趋势和互动情况

监控某个用户的粉丝的变化情况

示例3：使用关键字查找微博

这是最后一个示例：获取包含某个关键字的最新的微博。如果想在Twitter世界中监控某个话题，或者甚至想看下你的商业被提到的情况，这都是相当有用的。假设现在想看下Twitter谈论Toptal的情况怎样。

翻阅完Tweept文档，search()函数似乎是完成我们目标的最佳工具。

这里最重要的参数是q——查询参数，即要查找的关键字。

还可以设置lang参数，这样就只会取到想要的语言的微博。这里只返回英文（“en”）的微博。

现在可以修改代码，以体现要做的改变。首先创建存放参数（query和language）的变量，然后通过API对象调用相应的函数。最后在循环中也打印了发布微博的用户的终端名称。

# 传入认证信息，并创建API对象 api = tweepy.API(auth) # 你想查找的关键字 query = "Toptal" # 语言代码（遵循ISO 639-1标准） language = "en" # 使用上面的参数，调用user_timeline函数 results = api.search(q=query, lang=language) # 遍历所拉取的全部微博 for tweet in results: # 打印存在微博对象中的text字段 print tweet.user.screen_name,"Tweeted:",tweet.text

最后结果看起来像是这样：

以下是使用这些信息的一些实用途径：

创建空间图表，查看你们公司在世界哪些地方被提到最多

对微博进行情感分析，看下关于你们公司的整体意见是正面还是负面

创建关于发布你们公司或者产品相关微博中最热门的用户的社交图表

在后续的文章中，会覆盖到部分这些主题。

结论

Twitter的API接口在数据挖掘应用中非常有用，并且关于公众的意见能提供大量的见解。如果Twitter API接口和大数据分析是你未来会感兴趣的东西，建议查看Twitter API接口，Tweepy和Twitter的频率限制指南以获取更多信息。

在本教程，我们只是简单地讲了基本的访问和拉取。然而，Twitter的API接口还可用来服务于错综复杂的大数据问题，涉及人，趋势，和非常复杂以致单凭人类心智无法掌控的社交图

Twitter数据挖掘：如何使用Python分析大数据的更多相关文章

Twitter数据挖掘：如何使用Python分析大数据 (3)
让我们来拉取Twitter账号@NyTimes的最近20条微博. 我们可以创建变量来存放待拉取的微博数量(即count),以及待拉取的用户(即name).然后用这两个参数调用user_timeline ...
Python/Numpy大数据编程经验
Python/Numpy大数据编程经验 1.边处理边保存数据,不要处理完了一次性保存.不然程序跑了几小时甚至几天后挂了,就啥也没有了.即使部分结果不能实用,也可以分析程序流程的问题或者数据的特点. ...
【Python开发】Python 适合大数据量的处理吗？
Python 适合大数据量的处理吗? python 能处理数据库中百万行级的数据吗? 处理大规模数据时有那些常用的python库,他们有什么优缺点?适用范围如何? 需要澄清两点之后才可以比较全面的看这 ...
Spark大型项目实战：电商用户行为分析大数据平台
本项目主要讲解了一套应用于互联网电商企业中,使用Java.Spark等技术开发的大数据统计分析平台,对电商网站的各种用户行为(访问行为.页面跳转行为.购物行为.广告点击行为等)进行复杂的分析.用统计分 ...
菜鸟学python之大数据的初认识
这次作业的要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639 1.这些分析所采用数据来源是什么? 国家数据库:中国铁路 ...
黑马基础阶段测试题：创建一个存储字符串的集合list，向list中添加以下字符串：”C++”、”Java”、” Python”、”大数据与云计算”。遍历集合，将长度小于5的字符串从集合中删除，删除成功后，打印集合中的所有元素
package com.swift; import java.util.ArrayList; import java.util.List; import java.util.ListIterator; ...
为什么说Python 是大数据全栈式开发语言
欢迎大家访问我的个人网站<刘江的博客和教程>:www.liujiangblog.com 主要分享Python 及Django教程以及相关的博客交流QQ群:453131687 原文链接 h ...
python学习--大数据与科学计算第三方库简介
大数据与科学计算库名称简介 pycuda/opencl GPU高性能并发计算 Pandas python实现的类似R语言的数据统计.分析平台.基于NumPy和Matplotlib开发的,主要用于 ...
Spark项目之电商用户行为分析大数据平台之（七）数据调研--基本数据结构介绍
一.user_visit_action(Hive表) 1.1 表的结构 date:日期,代表这个用户点击行为是在哪一天发生的user_id:代表这个点击行为是哪一个用户执行的session_id :唯 ...

随机推荐

Luogu2839 Middle 主席树、二分答案
题目传送门:https://www.luogu.org/problemnew/show/P2839 题目大意:给出一个长度为$N$的序列与$Q$次询问,每次询问左端点在$[a,b]$,右端点在$[c, ...
校内模拟赛 SovietPower Play With Amstar
SovietPower Play With Amstar 题意: 一棵二叉树,每次询问一条路径上的路径和,初始每个点有一个权值1,询问后权值变为0.$n \leq 10^7,m\leq10^6$ 分析 ...
C# 时间戳与DateTime互转
#region 转换时间为unix时间戳 /// <summary> /// 转换时间为unix时间戳 /// </summary> /// <param name=&q ...
ABP module-zero +AdminLTE+Bootstrap Table+jQuery权限管理系统第十四节--后台工作者HangFire与ABP框架Abp.Hangfire及扩展
返回总目录:ABP+AdminLTE+Bootstrap Table权限管理系统一期 HangFire与Quartz.NET相比主要是HangFire的内置提供集成化的控制台,方便后台查看及监控,对于 ...
2018年高教社杯全国大学生数学建模竞赛C题解题思路
题目 C题大型百货商场会员画像描绘在零售行业中,会员价值体现在持续不断地为零售运营商带来稳定的销售额和利润,同时也为零售运营商策略的制定提供数据支持.零售行业会采取各种不同方法来吸引更多的人成 ...
Pair_Work Project
结对项目小记 ——by 12061227 康 12061179 宇帆结对编程就是一种敏捷软件开发的方法,两个人在一个计算机上共同工作.一个人输入,而另一个人检查他输入的每一行代码.输入代 ...
SCRUM 12.21
从爬虫遇到的问题中我们学会了: 1.有的网站是有反爬虫机制的,外卖网站(我们猜测基本所有盈利性质的网站可能都是)全部都有. 2.我们对于反爬虫机制有了一定的了解. 本次爬虫测试中,我们最后连美团网 ...
BUAAMOOC项目M2 postmortem
设想和目标 1.我们的软件要解决什么问题?是否定义的很清楚?是否对典型用户和典型场景有清晰的描述? 我们的软件是基于北航MOOC网站做的Android手机客户端,用于便捷的在学校里通过手机做到随时随地 ...
week3-构造一个简单的linux系统
潘恒原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 一.gdb跟踪调试内核 ...
Java awt项目开发
通过Java awt 界面上的知识编写的扫雷游戏代码中有详细的注解 package com.langsin.saolei; import java.awt.Color;import java.awt ...

Twitter数据挖掘：如何使用Python分析大数据

Twitter数据挖掘：如何使用Python分析大数据的更多相关文章

随机推荐

热门专题