——Rothschild预测2014奥斯卡花落谁家" title="提前窥测奥斯卡颁奖信封中的谜底  ——Rothschild预测2014奥斯卡花落谁家">

编者按:第86届奥斯卡金像奖颁奖典礼将于美国时间3月2日(北京时间3月3日)在洛杉矶拉开帷幕。去年,微软纽约研究院的经济学家David
Rothschild
成功预测24个奥斯卡奖项中的19个奖项。今年Rothschild也有了基于大数据分析的新预测,并使用百分比表示该预测结果获奖的可能性。他通过收集赌博市场、好莱坞证券交易所、用户自动生成信息等大量公开数据建立预测模型,其预测结果会随着时间和数据变化而更新。想看看他的预测结果吗?

文章编译自An
Early Peek into the Oscars’ Envelopes

随着2月的离去,全球影迷们翘首期盼的2014年奥斯卡颁奖典礼就真正进入了倒计时。今年的提名名单公布了已经有一个多月了,其中的各项提名一直为大家所津津乐道。相信每个人都已在心中谱好获奖名单,来自微软纽约研究院的David
Rothschild亦如是。

看到这里,你或许已经回忆起Rothschild是何许人。去年他曾成功预测了24个奥斯卡奖项中的19个奖项。而今年,随着第86届奥斯卡金像奖颁奖典礼将于美国时间3月2日在洛杉矶拉开帷幕,Rothschild也有了新的预测。与大众基于个人喜好而进行的主观推断方式不同,Rothschild的预测不是基于观看电影后的感性评价,而是来自大数据的收集和分析。

Rothschild表示:“这是我第二次预测奥斯卡奖,相比去年,可能今年的预测难度增加了。因为去年预测奥斯卡时主要电影颁奖典礼已经结束,我们的预测结果可以基于各大电影颁奖典礼的数据进行判断。”

Rothschild采用了来自BetfairIntrade等赌博市场数据、好莱坞证券交易所的数据以及相关用户自动生成数据。他的目标是做有成本效益的预测,不仅仅希望此次预测能涉及奥斯卡的所有24项奖项,还希望能对他在其他领域的预测工作有所帮助。直到奥斯卡奖获奖名单揭晓的最后一刻,该预测都会随着时间和数据变化而持续更新。

对于今年的预测,他补充道:“我从2013年的预测中学到了不少经验,这将让我在2014年预测更准确。去年我和我的同事利用数据模型、独特的投票数据和多种形式的预测市场数据,这其中有利有弊。而在2014年的奥斯卡奖预测中,我们引入了新的技术方法。”

“与去年相比,我们今年收集了更多的数据,不断完善今年的奥斯卡奖预测。”

所以,他的数据告诉了我们什么呢?你可以PredictWise(Rothschild用以公布预测结果的官方网站)中看到最新的预测结果——虽然他没有直接指出每个奖项的得主,而是用百分比来表示不同电影获得该奖项的可能性,但是这也足以勾起你的兴趣,下面是其中一些预测结果(数据结果截至美国时间3月2日6:13
am):

最佳影片:为奴十二年,88.7%

最佳导演:阿方索·卡隆地心引力), 
97.6%

最佳男主角:马修·麦康纳达拉斯买家俱乐部), 
90.9%

最佳女主角:凯特·布兰切特
蓝色茉莉),
99.2%

最佳男配角:杰瑞德·莱托
达拉斯买家俱乐部),97.9%

最佳女配角:露皮塔·尼永奥
为奴十二年),60.1%

如果你想知道Rothschid关于最佳服装设计或最佳音乐的预测结果,你可以登陆PredicWise网站以了解更多信息(我预测你们中83%的人都会这么做)。Rothschild提到主要奖项中唯一一个竞争相当激烈的是最佳原创剧本奖,根据他的分析,电影获奖的可能性最大为56.3%,紧随其后的是获奖可能性为41.8%的美国骗局

这就是科学,在研究着人们社交聚会讨论的话题,这其中乐趣无穷。

“我很高兴我的工作能够成为人们聚会时候的焦点话题!”Rothschid笑道,“但是我更关心的是数据可得的且人们愿意配合提供数据的领域。”

“此外,我也希望把我们的研究延伸到经济和商业问题中。我期待向大家展示预测工作的价值,在一些有意义的问题上,预测工作能帮助人们有效分配资源。”

这,也就意味着,数字可能帮助实现准确的预测。






相关阅读

数据模型下的神奇预言家




欢迎关注


微软亚洲研究院人人网主页:
http://page.renren.com/600674137


微软亚洲研究院微博:
http://t.sina.com.cn/msra

提前窥测奥斯卡颁奖信封中的谜底  ——Rothschild预测2014奥斯卡花落谁家的更多相关文章

  1. 扑克牌中的顺子(网易2014.3.16笔试offerP226)

    题目:从扑克牌中随机抽5张牌,判断是不是一个顺子,即这5张牌是不是连续的.2~10为数字本身,A为1,J~K为11,12,13,而大小王可以看成任意数字.(网易要求必须用C完成,可以用C库函数) ja ...

  2. sklearn中模型评估和预测

    一.模型验证方法如下: 通过交叉验证得分:model_sleection.cross_val_score(estimator,X) 对每个输入数据点产生交叉验证估计:model_selection.c ...

  3. tensorflow在文本处理中的使用——Word2Vec预测

    代码来源于:tensorflow机器学习实战指南(曾益强 译,2017年9月)——第七章:自然语言处理 代码地址:https://github.com/nfmcclure/tensorflow-coo ...

  4. CentOS中Mysql常用操作

    安装mysqlyum -y install mysql-server 修改mysql配置vi /etc/my.cnf 这里会有很多需要注意的配置项,后面会有专门的笔记暂时修改一下编码(添加在密码下方) ...

  5. BizTalk开发系列(十七) 信封架构(Envelop)

    在BizTalk开过中使用信封架构可以提高BizTalk处理性能.比如在使用SQL Adapter时使用信封选取多条记录在通过管道的XML拆装器时将信封里的XML消息部分拆分为单独的消息,发布到Mes ...

  6. 在多线程环境中使用CoreData

    在多线程环境中使用CoreData BY 子非鱼 · 2014 年 10 月 13 日   上回书说道,其实CoreData学起来也没有很复杂,我们其实增删改查都和别的ORM大同小异.但是世界总是很复 ...

  7. 信与信封问题(codevs 1222)

    题目描述 Description John先生晚上写了n封信,并相应地写了n个信封将信装好,准备寄出.但是,第二天John的儿子Small John将这n封信都拿出了信封.不幸的是,Small Joh ...

  8. 【wikioi】1222 信与信封问题(二分图+特殊的技巧)

    http://wikioi.com/problem/1222/ 一开始我就想到这样构图的,即可能的连边.但是似乎无法判断. 然后想来想去想不出来.. 题解: 同样是二分图,将可能的连边,然后跑一次最大 ...

  9. 从一次异常中浅谈Hibernate的flush机制

    摘自http://www.niwozhi.net/demo_c70_i1482.html http://blog.itpub.net/1586/viewspace-829613/ 这是在一次事务提交时 ...

随机推荐

  1. Python-django入门

    上网流程: Django的安装

  2. dfs--汉诺塔

    在研究汉诺塔问题时,我们可以先分析俩个盘子的方法: 1.把第一个盘子放到辅助柱子上 2.把第二个盘子放大目标柱子上 3.把第一个盘子从辅助柱子移到目标柱子上 由此我们可以通过整体思想推导出一共有n个盘 ...

  3. 结点选择(树形DP)

    Description 有一棵 n 个节点的树,树上每个节点都有一个正整数权值.如果一个点被选择了,那么在树上和它相邻的点都不能被选择.求选出的点的权值和最大是多少? Input 接下来的一行包含 n ...

  4. 翻译——2_Linear Regression and Support Vector Regression

    续上篇 1_Project Overview, Data Wrangling and Exploratory Analysis 使用不同的机器学习方法进行预测 线性回归 在这本笔记本中,将训练一个线性 ...

  5. MyBatis学习——动态SQL

    开发人员在使用JDBC框架或者其他类似的框架进行数据库开发时,通常都要根据需求去手动拼接SQL,这样非常麻烦,而myBatis提供了对SQL语句动态组装的功能,恰好解决了这一问题. 一,动态SQL中的 ...

  6. 使用hexo+GitHub搭建个人博客的心得(含教程)

    Author Email Yaoyao Liu yaoyaoliu@msn.com 前言 对于广大CS专业的学生和码农,找一个地方写博客,记录一些编程.配置环境.阅读论文的心得体会是一个很常见的习惯. ...

  7. 学会用Python操作Mongodb

    在linux下,用pip导包. pip install pymongo python操作基本步骤: 导包 建立连接,建立客户端. 获取数据库 获取集合 对数据操作 import pymongo #建立 ...

  8. python——logging模块

    简介: 日志是一种可以追踪某些软件运行时所发生事件的方法.软件开发人员可以向他们的代码中调用日志记录相关的方法来表明发生了某些事情.不同的事件,被区分在不同的等级中,故通过log分析,可以很轻易地分析 ...

  9. [HAOI2018]苹果树(组合数学)

    首先有个很奇妙而且很有用的性质:每个二叉树对应唯一的中序遍历,然后每个二叉树出现概率相同.所以n个节点的二叉树形态是n!种(题目中说了*n!已经是提示了),对每种方案求和即可得到期望.令f[i]表示i ...

  10. Python笔记_第三篇_面向对象_2.第一个Python类

    1. 设计一个类: 设计一个类主要从三个方面进行考虑: 第一:类名:类名要见名知意.首字母大写. 第二:属性. 第三:方法. 备注:在Python中有些东西并不是绝对化的事情,有些根据Python社区 ...