我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。

案情介绍

被告人:北京百度网讯科技有限公司(以下简称百度公司),百度

上诉人:上海汉涛信息咨询有限公司(以下简称汉涛公司),大众点评

汉涛公司诉称,“百度地图”与“百度知道”未经授权,大量复制“大众点评网”的用户点评等信息,与“百度地图”具有合作关系的上海杰图软件技术公司运营的“城市吧”网站因使用了“百度地图”又扩大了侵权影响范围、造成公司重大损失。因此,“大众点评网”的运营方上海汉涛信息咨询有限公司将北京百度网讯有限公司及上海杰图软件技术公司以不正当竞争为由,诉至法院,要求被告停止侵权、刊登公告消除不良影响,并赔偿经济损失 9000 万元和为制止侵权行为支出的 45 万余元。

该案中,北京百度网讯科技有限公司(“百度公司”)使用技术手段在大众点评等 APP 上抓取了商户的基本信息及点评信息,用户使用其运营的百度地图 APP 查询位置时,无需跳转至大众点评界面,就可直接在百度地图界面获取商户的基本信息和点评信息。汉涛公司以百度公司等相关主体构成不正当竞争向法院起诉。

法院观点

双方是否存在竞争关系?

法院认为,虽然汉涛公司与百度公司所运营的APP属于不同行业、不同领域且有着不同的经营模式,但是双方的行为在争夺相同的网络用户群体,两者在为用户提供商户信息和点评信息的服务模式上近乎一致,存在竞争关系。 从法院观点来看,在竞争关系的认定上,将不限于对同行业相关主体竞争关系的认定,还将争夺相同网络用户群体的相关主体认定为具有竞争关系。这对许多以“流量为王”的企业非常具有警示意义。

汉涛公司是否有可诉诸法律保护的合法权益?

法院认为,汉涛公司为了积累点评信息付出了巨额成本。点评信息是汉涛公司的核心竞争资源之一,为汉涛公司带来竞争优势。 在法院考量汉涛公司是否具备可诉诸法律保护的合法权益上,关注了汉涛公司获取涉案数据信息的成本,以及涉案数据信息为汉涛公司带来的效益。

百度公司是否存在不正当的行为?

法院认为,在百度公司靠自身用户无法获取足够点评信息的情况下,通过技术手段,从大众点评等网站获取点评信息,用于充实百度地图,百度公司的这种行为违反了公认的商业道德和诚实信用原则,具有不正当性。 在对百度公司行为不正当性进行认定上,法院认为百度公司这种类似于“搭便车”、“不劳而获”的行为违反了商业道德和诚实信用原则。

汉涛公司是否因百度公司的行为遭受实际损害?

法院认为,用户在使用百度地图查阅到商户信息和点评信息后已无需跳转至大众点评查看更多信息,百度地图已经对大众点评形成实质性替代,对汉涛公司造成了实质性损害。 对于互联网企业而言,用户流量的多少,在某种程度上决定了企业在市场上的竞争力和企业价值。与认定是否具有竞争关系类似,法院在认定汉涛公司是否遭受实际损害时,关注到百度公司“截取”了汉涛公司应有的网络用户浏览量,对大众点评形成实质性替代。

判决情况

法院一审判决结果:

  • 百度公司于判决生效之日起立即停止以不正当的方式使用汉涛公司运营的大众点评网的点评信息;
  • 百度公司于判决生效之日起十日内赔偿汉涛公司经济损失 300 万元及为制止不正当竞争行为所支付的合理费用 23 万元;
  • 驳回汉涛公司的其余诉讼请求,一审案件受理费 494,067 元,由汉涛公司负担 238,207 元,由百度公司负担 255,860 元。

法院二审判决结果:

  • 维持原判,案件受理费人民币 32,640 元,由上诉人北京百度网讯科技有限公司负担。

判决文书

https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=gL4HukrAw8LpLHLUssM8+hIipYEt3LDCHI+9DfkEyiKKUftVDKO13J/dgBYosE2gc2cTGVpSTHa7o9mKVrJbEzLGWx4roqJIeJOqeLvkNBEr8EKw/3hD72ZK/jdrffX2

案例分析

本案中汉涛公司认为百度的行为是零成本获取己方拥有“著作权的内容”,且因百度的行为造成了实际损失,构成不正当竞争。而百度方代理律师认为,百度是一家搜索功能公司,与大众点评网之间没有形成竞争关系,所做的只是搜索相关信息,筛选后进行呈现,在这个过程中采集到了大众点评网中的部分信息,不存在不正当行为,而且大众点评网的Robots协议是面向百度开放的,百度采集的信息是Robots协议允许的。

在二审中上诉人汉涛公司的辩称中有一条需要我们注意:百度公司通过搜索引擎抓取涉案信息并不违反Robots协议,但并不意味着百度公司可以任意使用该些信息,若不对使用他人网站信息的方式进行合理控制,将导致百度公司以极低的成本攫取汉涛公司的经营成果。

我们知道Robots协议是一种约定俗成的君子协议,并不具备法律效应。即使大众点评网中Robots协议是面向百度的,但百度也不可以用采集到的信息对大众点评网造成影响,百度的行为依旧属于不正当竞争行为。这种情况也存在于很多企业之中,很多企业都会采集一些信息聚合平台上的公开或者半公开的信息,然后将信息应用于自己的业务场景中,企业认为自己采集的是公开信息,并不违反法律。但是却没有考虑业务是否与信息聚合平台间存在竞争关系,没有考量对爬虫信息的使用范围和方式以及对信息聚合平台造成的影响,这也是很多个人爬虫开发者在爬虫开发时没有去考虑的点。

目前数据抓取行为所涉的竞争关系认定标准比较模糊,目前对于此类案件的判决主要有三要件:

第一,行为确属法律未特别明确;

第二,其他经营者的合法权益确因该竞争行为而受到了实际损害;

第三,该种竞争行为确因违反诚实信用原则和公认的商业道德而具有不正当性或可责性。

该案中百度的行为也确实符合这三要件,同样作为内容提供商,将大众点评网中的信息展示在自己的产品中,会导致大众点评的流量流失,是不正当的行为。

随着数据在现代社会中的重要性日益增加,数据权属问题也越来越重要,企业乃至国家对于数据的重视程度不断加深。《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》中明确将数据作为一种生产要素,与传统的生产要素如土地、劳动力、资本、技术等并列。因此,爬虫开发中,我们不仅需要关注数据的来源是否合法,也要思考数据的使用是否得当。

【K哥爬虫普法】大众点评VS百度地图,论“数据权属”对爬虫开发的罪与罚!的更多相关文章

  1. Python爬虫丨大众点评数据爬虫教程(1)

    大众点评数据获取 --- 基础版本 大众点评是一款非常受普罗大众喜爱的一个第三方的美食相关的点评网站. 因此,该网站的数据也就非常有价值.优惠,评价数量,好评度等数据也就非常受数据公司的欢迎. 今天就 ...

  2. 【百度地图API】建立全国银行位置查询系统(四)——如何利用百度地图的数据生成自己的标注

    原文:[百度地图API]建立全国银行位置查询系统(四)--如何利用百度地图的数据生成自己的标注 摘要: 上一章留个悬念,"如果自己没有地理坐标的数据库,应该怎样制作银行的分布地图呢?&quo ...

  3. 获取百度地图POI数据三(模拟关键词搜索)

    上一篇博文中讲到如何获取用于搜索的关键词,并且已经准备好了一百五十万的关键词   这其中有门牌号码,餐馆酒店名称,公司名称,道路名称等.有了这些数据,我们就可以通过代码,模拟我们在百度地图的搜索框中搜 ...

  4. 获取百度地图POI数据二(准备搜索关键词)

    上篇讲到  想要获取尽可能多的POI数据 需要准备尽可能多的搜索关键字   那么这些关键字如何得来呢?   本人使用的方法是通过一些网站来获取这些关键词   http://poi.mapbar.com ...

  5. 基于 Golang 完整获取百度地图POI数据的方案

    百度地图为web开发者提供了基于HTTP/HTTPS协议的丰富接口,其中包括地点检索服务,web开发者通过此接口可以检索区域内的POI数据.百度地图处于数据保护对接口做了限制,每次访问服务,最多只能检 ...

  6. 【Python3爬虫】大众点评爬虫(破解CSS反爬)

    本次爬虫的爬取目标是大众点评上的一些店铺的店铺名称.推荐菜和评分信息. 一.页面分析 进入大众点评,然后选择美食(http://www.dianping.com/wuhan/ch10),可以看到一页有 ...

  7. Python爬虫丨大众点评数据爬虫教程(2)

    大众点评数据爬虫获取教程 --- [SVG映射版本] 前言: 大众点评是一款非常受大众喜爱的一个第三方的美食相关的点评网站.从网站内可以推荐吃喝玩乐优惠信息,提供美食餐厅.酒店旅游.电影票.家居装修. ...

  8. scrapy爬虫框架调用百度地图api数据存入数据库

    scrapy安装配置不在本文 提及, 1.在开始爬取之前,必须创建一个新的Scrapy项目.进入自定义的项目目录中,运行下列命令 scrapy startproject mySpider 其中, my ...

  9. iOS开发之引用百度地图SDK(一)-----------SDK开发指南

    (void)viewWillAppear:(BOOL)animated { [_mapView viewWillAppear]; _mapView.delegate = self; // 此处记得不用 ...

  10. 百度地图JavaScript API V1.5初级开发工具类

    /** * 百度地图使用工具类-v1.5 * @author boonya * @date 2013-7-7 * @address Chengdu,Sichuan,China * @email boo ...

随机推荐

  1. 这8个JS 新功能,你应该去尝试一下

    摘要:本文主要介绍几个已经进入stage4的提案,这几个提案有望在2022年逐步纳入标准. 本文分享自华为云社区<2022 年你应该尝试的 8个 JavaScript 新功能>,作者:前端 ...

  2. 火山引擎DataTester:企业如何使用A/B实验优化商业化能力

      商业化是企业将研发成果,如新产品.新技术.新服务等,转变成可盈利的商业化产品:整个流程中包含了研发.推广.服务,全程通过精细化管理运营.商业化的本质是流量的变现,而对企业而言,商业化链路的打磨至关 ...

  3. 火山引擎 DataLeap 通过中国信通院测评,数据管理能力获官方认可!

      近日,火山引擎大数据研发治理套件 DataLeap 通过中国信通院第十五批"可信大数据"测评,在数据管理平台基础能力上获得认证.   "可信大数据"产品能力 ...

  4. PPT 常规设置

    高级设置 可以将撤销次数调大,最多 150次 默认拉到PPT中的图片是被压缩的,可以设置成不压缩(解压 PPT 可查看里面的图片大小) 字体嵌入 可将自动保存时间调短,默认保存目录我习惯先保存到桌面( ...

  5. SQL Server 附加数据库,报只读文件,无权修改其中某些文件

    MSSQL 默认安装在 C盘下,由于C盘没空间了,迁到D盘,这时候在附件数据库是报了错误:附加数据库  因为它是只读的,它具有只读文件,无权修改其中某些文件 如果是可以附加,显示(只读)这时候不能删除 ...

  6. DevEco中被忽略的实用功能

    近期,我一直在业余时间研究纯血鸿蒙(HarmonyOS)App的开发,所使用的IDE是华为官方的DevEco Studio 3.1.1. 随着使用时间的增长,我发现了几个特别容易被忽略,但又特别实用的 ...

  7. 【转】OS | 从一道面试题谈 Linux 下 fork 的运行机制

    今天一位朋友去一个不错的外企面试 Linux 开发职位,面试官出了一个如下的题目: 给出如下C程序,在 Linux 下使用 gcc 编译: #include "stdio.h" # ...

  8. 汇编 | 数据段寄存器DS和[address]

    Description CPU要读写一个内存单元的时候,必须先给出这个内存单元的地址,在8086PC中,内存地址由段地址和偏移地址组成.8086CPU中有一个DS寄存器,通常用来存放要访问 数据的段地 ...

  9. POJ 1236 Network of Schools (连通图 - Garbow 算法)

    POJ 1236 Network of Schools ​ 校园网:给定N所学校和网络,目标是分发软件其他学校都可收到,求①所需最少分发学校数:②若任选学校都能收到,最低新增边数. 思路:同一个强连通 ...

  10. mybatis-plus数据批量插入

    为了提高数据处理效率,大量数据需要插入数据时可以采用批量数据插入的策略提高数据插入的效率. 如下是实现方法 1.代码结构 2.实体类 package little.tiger.one.applicat ...