聊一聊google的Knowledge Graph
什么是Knowledge Graph?
它是google用于增强它的搜索引擎的功能和提高搜索结果质量的一种技术。在2012年5月16日提出,除了提供基本的与主题相关的链接服务之外,它还能结构化与主题相关的信息。这样做的目的就是让用户无需通过点击多个相关链接自己手动去搜索相关信息,而是google直接把整合好的结果展示在搜索页面,真是太贴心啦!
for example: 我在google中搜索:andrew ng

可以看到,右侧会直接把andrew ng的相关基本资料给你整合好。比如出生,教育背景,所获奖项,你搜有些名人,甚至连他爹是谁都给你显示出来。而这些绝逼不是系统手动输入的(so stupid!),而是Knowledge Graph帮你完成。
Knowledge Graph的历史?
这些内容是怎么来的呢?当然,不可能完全靠google自己搜索数据得到,因为,这个数据实在是太庞大了。
比如说,其中有部分数据来源于The World Factbook(世界概况) - CIA(中央情报局):《世界概况》是由美国中央情报局出版的调查报告,发布世界各国及地区的概况,例如人口、地理、政治及经济等各方面的统计数据。因中央情报局属美国政府部门,所以其资料格式、体例、内容皆需符合美国政府的官方需要及立场资料则是由美国国务院、美国人口调查局、国防部等部门及其辖下的相关单位提供。(google)
还有数据来自freebase:Freebase是一个由元数据组成的大型合作知识库,内容主要来自其社区成员的贡献。它整合了许多网上的资源,包括部分私人wiki站点中的内容。Freebase致力于打造一个允许全球所有人(和机器)快捷访问的资源库。它由美国软件公司Metaweb开发并于2007年3月公开运营。2010年7月16日被谷歌收购。 2014年12月16日,Google宣布将在六个月后关闭Freebase,并将全部数据迁移至维基数据。
当然,还有大名鼎鼎的wikipedia。
在2012年的时候,google的语义网络就已经包含了超过5亿7千万个对象实体,而且对象实体之间超过了180亿的史实和关系。这些数据用于理解我们输入到搜索栏中的关键字。
在2012年12月4日,Knowledge Graph被翻译成了其中语言,其中包括了:西班牙语,法语,德语,葡萄牙语,日语,俄语和意大利语。没有中文也是情理之中。
在2013年5月的google io大会上, Amit Singhal(google search的头头,Google's Mr Search
提出了未来的搜索将主要在3个方面进行提升和改进:1)为搜索者答问;2)与搜索者交流;3)在搜索者开始搜索之前,就能给出他们想要的答案。他和knowledge graph的关系极为密切
2014年8月,google提出了一个新的东东叫Knowledge Vault,这个Knowledge Vault,包含了大量的源自Knowledge Graph的数据,同时,利用机器学习的方法,它自身也搜集了16亿的史实。
2014年12月16日,Freebase and Knowledge Graph team(都是google的)宣称将在六个月后关闭Freebase,并将全部数据迁移至维基数据。
Knowledge Graph的故事
Amit Singhal长期致力于如何为小伙伴们提供更佳优质的服务,他认为评判搜索结果好不好,可以通过记录用户点击搜索结果的链接之后,跳转停留的时间来判断( "long clicks" and "short clicks")。如果你搜索“世界上最帅的人是不是程序员”,然后google之后的结果,你点击了相关的链接停留了很长时间,说明他们提供的搜索结果质量较高。反之亦然。
因此,在2002年,基于Ludwig Wittgenstein关于一个单词的含义和上下文有紧密的联系,Singhal开始对一些模棱两可的单词进行考察,从与这些单词相关的单词入手。比如,你搜索“hot dog”,google会告诉你,这是一种可以吃的食物,香肠,还有可能是一种棒球的比赛,而不是告诉你这是一只很热的
聊一聊google的Knowledge Graph的更多相关文章
- 收藏:左路Deep Learning+右路Knowledge Graph,谷歌引爆大数据
发表于2013-01-18 11:35| 8827次阅读| 来源sina微博 条评论| 作者邓侃 数据分析智能算法机器学习大数据Google 摘要:文章来自邓侃的博客.数据革命迫在眉睫. 各大公司重兵 ...
- 1. 通俗易懂解释知识图谱(Knowledge Graph)
1. 通俗易懂解释知识图谱(Knowledge Graph) 2. 知识图谱-命名实体识别(NER)详解 3. 哈工大LTP解析 1. 前言 从一开始的Google搜索,到现在的聊天机器人.大数据风控 ...
- 学习笔记之知识图谱 (Knowledge Graph)
Knowledge Graph - Wikipedia https://en.wikipedia.org/wiki/Knowledge_Graph The Knowledge Graph is a k ...
- RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems
一.摘要 为了解决协同过滤的稀疏性和冷启动问题,社交网络或项目属性等辅助信息被用来提高推荐性能. 考虑到知识图谱是边信息的来源,为了解决现有的基于嵌入和基于路径的知识图谱感知重构方法的局限性,本文提出 ...
- [Paper Reading]--Exploiting Relevance Feedback in Knowledge Graph
<Exploiting Relevance Feedback in Knowledge Graph> Publication: KDD 2015 Authors: Yu Su, Sheng ...
- Deep Learning 和 Knowledge Graph howto
领军大家: Geoffrey E. Hinton http://www.cs.toronto.edu/~hinton/ 阅读列表: reading lists and survey papers fo ...
- Multi-Task Feature Learning for Knowledge Graph Enhanced Recommendation(知识图谱)
知识图谱(Knowledge Graph,KG)可以理解成一个知识库,用来存储实体与实体之间的关系.知识图谱可以为机器学习算法提供更多的信息,帮助模型更好地完成任务. 在推荐算法中融入电影的知识图谱, ...
- Efficient Knowledge Graph Accuracy Evaluation 论文笔记
前言 这篇论文主要讲的是知识图谱正确率的评估,将知识图谱的正确率定义为知识图谱中三元组表述正确的比例.如果要计算知识图谱的正确率,可以用人力一一标注是否正确,计算比例.但是实际上,知识图谱往往很大,不 ...
- 哈工大知识图谱(Knowledge Graph)课程概述
一.什么是知识图谱 知识(Knowledge)可以理解为 精炼的数据,知识图谱(Knowledge Graph)即是对知识的图形化表示,本质上是一种大规模语义网络 (semantic network) ...
随机推荐
- Leetcode 219 Contains Duplicate II STL
找出是否存在nums[i]==nums[j],使得 j - i <=k 这是map的一个应用 class Solution { public: bool containsNearbyDuplic ...
- [原创]Java静态代码检查工具介绍
[原创]Java静态代码检查工具介绍 一 什么是静态代码检查? 静态代码分析是指无需运行被测代码,仅通过分析或检查源程序的语法.结构.过程.接口等来检查程序的正确性,找出代码隐藏的错误和缺陷,如参数 ...
- GO語言視頻教程下載
需要的朋友可以加QQ群195112,在群共享內可以下載到.
- ZookeeperNet太难用,写了个RetryHelper来进行配套使用
普通的zk用法,如下写法: zk.Exists("/aaa", true); zk.Create(...); 但是由于这些API会抛Zookeeper的Exception,比如Co ...
- 解决Electron加载带jquery的项目报错问题
<!-- Insert this line above script imports --> <script>if (typeof module === 'object') { ...
- 关于 c# 操作 world
把数据存放在datatable 中并循环取出来数据然后再保存在world中 protected void ExportToWord(DataSet Ads) { try { Object Nothin ...
- wordpress自动截取文章摘要代码
想要实现 wordpress 首页显示摘要有几种方法: 第一种,可以在写文章的时侯在需要分割的地方加入<!–more–>标签,但在输出首页摘要的同时,也会使feed只显示摘要,不方便读者阅 ...
- 64位Linux下编译搭建Nginx1.5与PHP5.5(CentOS6.4)
(1)安装Nginx1.5.2更新Nginx和PHP的依赖包yum -y install gcc gcc-c++ autoconf libjpeg libjpeg-devel libpng \libp ...
- 日暮·第一章·决斗
日暮 第一章 决斗 泉州府,位于帝国的东南沿海,在数百年前,这里已是帝国最大的通商口岸之一,其一城之繁荣喧哗足以与异邦小国的都城相媲美,无数的人曾经来到这里,追逐财富,梦想,女人以及所有他们认为可 ...
- Spring4 MVC Hibernate4集成 Annotation
Spring4 MVC Hibernate4集成 Annotation 一.本文所用环境 二.工程目录 三.Maven添加依赖 四.新建数据库表 五.配置文件 六.Model层 七.DAO层 八.Se ...