【K哥爬虫普法】大众点评VS百度地图,论“数据权属”对爬虫开发的罪与罚!
我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。
案情介绍
被告人:北京百度网讯科技有限公司(以下简称百度公司),百度
上诉人:上海汉涛信息咨询有限公司(以下简称汉涛公司),大众点评
汉涛公司诉称,“百度地图”与“百度知道”未经授权,大量复制“大众点评网”的用户点评等信息,与“百度地图”具有合作关系的上海杰图软件技术公司运营的“城市吧”网站因使用了“百度地图”又扩大了侵权影响范围、造成公司重大损失。因此,“大众点评网”的运营方上海汉涛信息咨询有限公司将北京百度网讯有限公司及上海杰图软件技术公司以不正当竞争为由,诉至法院,要求被告停止侵权、刊登公告消除不良影响,并赔偿经济损失 9000 万元和为制止侵权行为支出的 45 万余元。
该案中,北京百度网讯科技有限公司(“百度公司”)使用技术手段在大众点评等 APP 上抓取了商户的基本信息及点评信息,用户使用其运营的百度地图 APP 查询位置时,无需跳转至大众点评界面,就可直接在百度地图界面获取商户的基本信息和点评信息。汉涛公司以百度公司等相关主体构成不正当竞争向法院起诉。
法院观点
双方是否存在竞争关系?
法院认为,虽然汉涛公司与百度公司所运营的APP属于不同行业、不同领域且有着不同的经营模式,但是双方的行为在争夺相同的网络用户群体,两者在为用户提供商户信息和点评信息的服务模式上近乎一致,存在竞争关系。 从法院观点来看,在竞争关系的认定上,将不限于对同行业相关主体竞争关系的认定,还将争夺相同网络用户群体的相关主体认定为具有竞争关系。这对许多以“流量为王”的企业非常具有警示意义。
汉涛公司是否有可诉诸法律保护的合法权益?
法院认为,汉涛公司为了积累点评信息付出了巨额成本。点评信息是汉涛公司的核心竞争资源之一,为汉涛公司带来竞争优势。 在法院考量汉涛公司是否具备可诉诸法律保护的合法权益上,关注了汉涛公司获取涉案数据信息的成本,以及涉案数据信息为汉涛公司带来的效益。
百度公司是否存在不正当的行为?
法院认为,在百度公司靠自身用户无法获取足够点评信息的情况下,通过技术手段,从大众点评等网站获取点评信息,用于充实百度地图,百度公司的这种行为违反了公认的商业道德和诚实信用原则,具有不正当性。 在对百度公司行为不正当性进行认定上,法院认为百度公司这种类似于“搭便车”、“不劳而获”的行为违反了商业道德和诚实信用原则。
汉涛公司是否因百度公司的行为遭受实际损害?
法院认为,用户在使用百度地图查阅到商户信息和点评信息后已无需跳转至大众点评查看更多信息,百度地图已经对大众点评形成实质性替代,对汉涛公司造成了实质性损害。 对于互联网企业而言,用户流量的多少,在某种程度上决定了企业在市场上的竞争力和企业价值。与认定是否具有竞争关系类似,法院在认定汉涛公司是否遭受实际损害时,关注到百度公司“截取”了汉涛公司应有的网络用户浏览量,对大众点评形成实质性替代。
判决情况
法院一审判决结果:
- 百度公司于判决生效之日起立即停止以不正当的方式使用汉涛公司运营的大众点评网的点评信息;
- 百度公司于判决生效之日起十日内赔偿汉涛公司经济损失 300 万元及为制止不正当竞争行为所支付的合理费用 23 万元;
- 驳回汉涛公司的其余诉讼请求,一审案件受理费 494,067 元,由汉涛公司负担 238,207 元,由百度公司负担 255,860 元。
法院二审判决结果:
- 维持原判,案件受理费人民币 32,640 元,由上诉人北京百度网讯科技有限公司负担。
判决文书
案例分析
本案中汉涛公司认为百度的行为是零成本获取己方拥有“著作权的内容”,且因百度的行为造成了实际损失,构成不正当竞争。而百度方代理律师认为,百度是一家搜索功能公司,与大众点评网之间没有形成竞争关系,所做的只是搜索相关信息,筛选后进行呈现,在这个过程中采集到了大众点评网中的部分信息,不存在不正当行为,而且大众点评网的Robots协议是面向百度开放的,百度采集的信息是Robots协议允许的。
在二审中上诉人汉涛公司的辩称中有一条需要我们注意:百度公司通过搜索引擎抓取涉案信息并不违反Robots协议,但并不意味着百度公司可以任意使用该些信息,若不对使用他人网站信息的方式进行合理控制,将导致百度公司以极低的成本攫取汉涛公司的经营成果。
我们知道Robots协议是一种约定俗成的君子协议,并不具备法律效应。即使大众点评网中Robots协议是面向百度的,但百度也不可以用采集到的信息对大众点评网造成影响,百度的行为依旧属于不正当竞争行为。这种情况也存在于很多企业之中,很多企业都会采集一些信息聚合平台上的公开或者半公开的信息,然后将信息应用于自己的业务场景中,企业认为自己采集的是公开信息,并不违反法律。但是却没有考虑业务是否与信息聚合平台间存在竞争关系,没有考量对爬虫信息的使用范围和方式以及对信息聚合平台造成的影响,这也是很多个人爬虫开发者在爬虫开发时没有去考虑的点。
目前数据抓取行为所涉的竞争关系认定标准比较模糊,目前对于此类案件的判决主要有三要件:
第一,行为确属法律未特别明确;
第二,其他经营者的合法权益确因该竞争行为而受到了实际损害;
第三,该种竞争行为确因违反诚实信用原则和公认的商业道德而具有不正当性或可责性。
该案中百度的行为也确实符合这三要件,同样作为内容提供商,将大众点评网中的信息展示在自己的产品中,会导致大众点评的流量流失,是不正当的行为。
随着数据在现代社会中的重要性日益增加,数据权属问题也越来越重要,企业乃至国家对于数据的重视程度不断加深。《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》中明确将数据作为一种生产要素,与传统的生产要素如土地、劳动力、资本、技术等并列。因此,爬虫开发中,我们不仅需要关注数据的来源是否合法,也要思考数据的使用是否得当。
【K哥爬虫普法】大众点评VS百度地图,论“数据权属”对爬虫开发的罪与罚!的更多相关文章
- Python爬虫丨大众点评数据爬虫教程(1)
大众点评数据获取 --- 基础版本 大众点评是一款非常受普罗大众喜爱的一个第三方的美食相关的点评网站. 因此,该网站的数据也就非常有价值.优惠,评价数量,好评度等数据也就非常受数据公司的欢迎. 今天就 ...
- 【百度地图API】建立全国银行位置查询系统(四)——如何利用百度地图的数据生成自己的标注
原文:[百度地图API]建立全国银行位置查询系统(四)--如何利用百度地图的数据生成自己的标注 摘要: 上一章留个悬念,"如果自己没有地理坐标的数据库,应该怎样制作银行的分布地图呢?&quo ...
- 获取百度地图POI数据三(模拟关键词搜索)
上一篇博文中讲到如何获取用于搜索的关键词,并且已经准备好了一百五十万的关键词 这其中有门牌号码,餐馆酒店名称,公司名称,道路名称等.有了这些数据,我们就可以通过代码,模拟我们在百度地图的搜索框中搜 ...
- 获取百度地图POI数据二(准备搜索关键词)
上篇讲到 想要获取尽可能多的POI数据 需要准备尽可能多的搜索关键字 那么这些关键字如何得来呢? 本人使用的方法是通过一些网站来获取这些关键词 http://poi.mapbar.com ...
- 基于 Golang 完整获取百度地图POI数据的方案
百度地图为web开发者提供了基于HTTP/HTTPS协议的丰富接口,其中包括地点检索服务,web开发者通过此接口可以检索区域内的POI数据.百度地图处于数据保护对接口做了限制,每次访问服务,最多只能检 ...
- 【Python3爬虫】大众点评爬虫(破解CSS反爬)
本次爬虫的爬取目标是大众点评上的一些店铺的店铺名称.推荐菜和评分信息. 一.页面分析 进入大众点评,然后选择美食(http://www.dianping.com/wuhan/ch10),可以看到一页有 ...
- Python爬虫丨大众点评数据爬虫教程(2)
大众点评数据爬虫获取教程 --- [SVG映射版本] 前言: 大众点评是一款非常受大众喜爱的一个第三方的美食相关的点评网站.从网站内可以推荐吃喝玩乐优惠信息,提供美食餐厅.酒店旅游.电影票.家居装修. ...
- scrapy爬虫框架调用百度地图api数据存入数据库
scrapy安装配置不在本文 提及, 1.在开始爬取之前,必须创建一个新的Scrapy项目.进入自定义的项目目录中,运行下列命令 scrapy startproject mySpider 其中, my ...
- iOS开发之引用百度地图SDK(一)-----------SDK开发指南
(void)viewWillAppear:(BOOL)animated { [_mapView viewWillAppear]; _mapView.delegate = self; // 此处记得不用 ...
- 百度地图JavaScript API V1.5初级开发工具类
/** * 百度地图使用工具类-v1.5 * @author boonya * @date 2013-7-7 * @address Chengdu,Sichuan,China * @email boo ...
随机推荐
- 干货来了!阿里发布近300页Flink实战电子书
近300页实用干货总结,帮你解决 Flink 实战应用难题!<Apache Flink电子书合辑>收录来自bilibili.美团点评.小米.OPPO.快手.Lyft.Netflix等一线大 ...
- Flutter加固原理及加密处理
引言 为了保护Flutter应用免受潜在的漏洞和攻击威胁,加固是必不可少的措施之一.Flutter加固原理主要包括代码混淆.数据加密.安全存储.反调试与反分析.动态加载和安全通信等多个方面.通过综 ...
- 信创就用国产的生态,Solon v2.6.4 发布
Solon 是什么框架? Java 新的"生态级"应用开发框架.从零开始构建,有自己的标准规范与开放生态(历时六年,具备全球第二级别的生态规模). 相对于 Spring,有什么特点 ...
- Axure 元件--基本元件
图片:导入图看,根据图片实际大小显示,双击方框,再导入,根据控件的大小来显示图片 热区:1:增加锚点,制作点击事件:2:放在页面下方,控制滚动位置,比如其它控件在交互事件中找到它的坐标. 动态面版:交 ...
- 🤗Hugging Face 87个 AI 游戏可以在线玩啦
7月9日结束的开源游戏挑战赛有超过来自全球 1000 多名开发者参加 一共收录了 87 个游戏 目前已经进入投票期 视频中的:猜名画 ️ 用了之前推荐的 LEDITS 目前得分很高呢 来试试看你能猜对 ...
- 神秘又强大的@SpringBootApplication注解
一.前言 大部分的配置都可以用Java类+注解来代替,而在SpringBoot项目中见的最多的莫过于@SpringBootApplication注解了,它在每个SpringBoot的启动类上都有标注. ...
- PVE API创建虚拟机
度娘,谷歌都搜了一圈没有找到通过PVE API创建虚拟机的方式, 于是查官网自己试了试,部分代码抄的Sam Liu大佬的作业,感谢大佬. python代码如下: import requests # s ...
- 移动端h5中rem适配
1 (function (win, lib) { 2 var doc = win.document; 3 var docEl = doc.documentElement; 4 var metaEl = ...
- java实现微信扫码登录功能 精讲
java实现微信扫码登录功能 精讲 https://www.bilibili.com/video/BV1RJ411N7ne?from=search&seid=18091761082032798 ...
- Visual Studio2019 使用WCF服务
什么是WCF Windows Communication Foundation (WCF) 是一个框架,用于生成面向服务的应用程序.它取代了较旧的进程间通信技术,例如 ASMX Web 服务..NET ...