我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。

案情介绍

被告人:北京百度网讯科技有限公司(以下简称百度公司),百度

上诉人:上海汉涛信息咨询有限公司(以下简称汉涛公司),大众点评

汉涛公司诉称,“百度地图”与“百度知道”未经授权,大量复制“大众点评网”的用户点评等信息,与“百度地图”具有合作关系的上海杰图软件技术公司运营的“城市吧”网站因使用了“百度地图”又扩大了侵权影响范围、造成公司重大损失。因此,“大众点评网”的运营方上海汉涛信息咨询有限公司将北京百度网讯有限公司及上海杰图软件技术公司以不正当竞争为由,诉至法院,要求被告停止侵权、刊登公告消除不良影响,并赔偿经济损失 9000 万元和为制止侵权行为支出的 45 万余元。

该案中,北京百度网讯科技有限公司(“百度公司”)使用技术手段在大众点评等 APP 上抓取了商户的基本信息及点评信息,用户使用其运营的百度地图 APP 查询位置时,无需跳转至大众点评界面,就可直接在百度地图界面获取商户的基本信息和点评信息。汉涛公司以百度公司等相关主体构成不正当竞争向法院起诉。

法院观点

双方是否存在竞争关系?

法院认为,虽然汉涛公司与百度公司所运营的APP属于不同行业、不同领域且有着不同的经营模式,但是双方的行为在争夺相同的网络用户群体,两者在为用户提供商户信息和点评信息的服务模式上近乎一致,存在竞争关系。 从法院观点来看,在竞争关系的认定上,将不限于对同行业相关主体竞争关系的认定,还将争夺相同网络用户群体的相关主体认定为具有竞争关系。这对许多以“流量为王”的企业非常具有警示意义。

汉涛公司是否有可诉诸法律保护的合法权益?

法院认为,汉涛公司为了积累点评信息付出了巨额成本。点评信息是汉涛公司的核心竞争资源之一,为汉涛公司带来竞争优势。 在法院考量汉涛公司是否具备可诉诸法律保护的合法权益上,关注了汉涛公司获取涉案数据信息的成本,以及涉案数据信息为汉涛公司带来的效益。

百度公司是否存在不正当的行为?

法院认为,在百度公司靠自身用户无法获取足够点评信息的情况下,通过技术手段,从大众点评等网站获取点评信息,用于充实百度地图,百度公司的这种行为违反了公认的商业道德和诚实信用原则,具有不正当性。 在对百度公司行为不正当性进行认定上,法院认为百度公司这种类似于“搭便车”、“不劳而获”的行为违反了商业道德和诚实信用原则。

汉涛公司是否因百度公司的行为遭受实际损害?

法院认为,用户在使用百度地图查阅到商户信息和点评信息后已无需跳转至大众点评查看更多信息,百度地图已经对大众点评形成实质性替代,对汉涛公司造成了实质性损害。 对于互联网企业而言,用户流量的多少,在某种程度上决定了企业在市场上的竞争力和企业价值。与认定是否具有竞争关系类似,法院在认定汉涛公司是否遭受实际损害时,关注到百度公司“截取”了汉涛公司应有的网络用户浏览量,对大众点评形成实质性替代。

判决情况

法院一审判决结果:

  • 百度公司于判决生效之日起立即停止以不正当的方式使用汉涛公司运营的大众点评网的点评信息;
  • 百度公司于判决生效之日起十日内赔偿汉涛公司经济损失 300 万元及为制止不正当竞争行为所支付的合理费用 23 万元;
  • 驳回汉涛公司的其余诉讼请求,一审案件受理费 494,067 元,由汉涛公司负担 238,207 元,由百度公司负担 255,860 元。

法院二审判决结果:

  • 维持原判,案件受理费人民币 32,640 元,由上诉人北京百度网讯科技有限公司负担。

判决文书

https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=gL4HukrAw8LpLHLUssM8+hIipYEt3LDCHI+9DfkEyiKKUftVDKO13J/dgBYosE2gc2cTGVpSTHa7o9mKVrJbEzLGWx4roqJIeJOqeLvkNBEr8EKw/3hD72ZK/jdrffX2

案例分析

本案中汉涛公司认为百度的行为是零成本获取己方拥有“著作权的内容”,且因百度的行为造成了实际损失,构成不正当竞争。而百度方代理律师认为,百度是一家搜索功能公司,与大众点评网之间没有形成竞争关系,所做的只是搜索相关信息,筛选后进行呈现,在这个过程中采集到了大众点评网中的部分信息,不存在不正当行为,而且大众点评网的Robots协议是面向百度开放的,百度采集的信息是Robots协议允许的。

在二审中上诉人汉涛公司的辩称中有一条需要我们注意:百度公司通过搜索引擎抓取涉案信息并不违反Robots协议,但并不意味着百度公司可以任意使用该些信息,若不对使用他人网站信息的方式进行合理控制,将导致百度公司以极低的成本攫取汉涛公司的经营成果。

我们知道Robots协议是一种约定俗成的君子协议,并不具备法律效应。即使大众点评网中Robots协议是面向百度的,但百度也不可以用采集到的信息对大众点评网造成影响,百度的行为依旧属于不正当竞争行为。这种情况也存在于很多企业之中,很多企业都会采集一些信息聚合平台上的公开或者半公开的信息,然后将信息应用于自己的业务场景中,企业认为自己采集的是公开信息,并不违反法律。但是却没有考虑业务是否与信息聚合平台间存在竞争关系,没有考量对爬虫信息的使用范围和方式以及对信息聚合平台造成的影响,这也是很多个人爬虫开发者在爬虫开发时没有去考虑的点。

目前数据抓取行为所涉的竞争关系认定标准比较模糊,目前对于此类案件的判决主要有三要件:

第一,行为确属法律未特别明确;

第二,其他经营者的合法权益确因该竞争行为而受到了实际损害;

第三,该种竞争行为确因违反诚实信用原则和公认的商业道德而具有不正当性或可责性。

该案中百度的行为也确实符合这三要件,同样作为内容提供商,将大众点评网中的信息展示在自己的产品中,会导致大众点评的流量流失,是不正当的行为。

随着数据在现代社会中的重要性日益增加,数据权属问题也越来越重要,企业乃至国家对于数据的重视程度不断加深。《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》中明确将数据作为一种生产要素,与传统的生产要素如土地、劳动力、资本、技术等并列。因此,爬虫开发中,我们不仅需要关注数据的来源是否合法,也要思考数据的使用是否得当。

【K哥爬虫普法】大众点评VS百度地图,论“数据权属”对爬虫开发的罪与罚!的更多相关文章

  1. Python爬虫丨大众点评数据爬虫教程(1)

    大众点评数据获取 --- 基础版本 大众点评是一款非常受普罗大众喜爱的一个第三方的美食相关的点评网站. 因此,该网站的数据也就非常有价值.优惠,评价数量,好评度等数据也就非常受数据公司的欢迎. 今天就 ...

  2. 【百度地图API】建立全国银行位置查询系统(四)——如何利用百度地图的数据生成自己的标注

    原文:[百度地图API]建立全国银行位置查询系统(四)--如何利用百度地图的数据生成自己的标注 摘要: 上一章留个悬念,"如果自己没有地理坐标的数据库,应该怎样制作银行的分布地图呢?&quo ...

  3. 获取百度地图POI数据三(模拟关键词搜索)

    上一篇博文中讲到如何获取用于搜索的关键词,并且已经准备好了一百五十万的关键词   这其中有门牌号码,餐馆酒店名称,公司名称,道路名称等.有了这些数据,我们就可以通过代码,模拟我们在百度地图的搜索框中搜 ...

  4. 获取百度地图POI数据二(准备搜索关键词)

    上篇讲到  想要获取尽可能多的POI数据 需要准备尽可能多的搜索关键字   那么这些关键字如何得来呢?   本人使用的方法是通过一些网站来获取这些关键词   http://poi.mapbar.com ...

  5. 基于 Golang 完整获取百度地图POI数据的方案

    百度地图为web开发者提供了基于HTTP/HTTPS协议的丰富接口,其中包括地点检索服务,web开发者通过此接口可以检索区域内的POI数据.百度地图处于数据保护对接口做了限制,每次访问服务,最多只能检 ...

  6. 【Python3爬虫】大众点评爬虫(破解CSS反爬)

    本次爬虫的爬取目标是大众点评上的一些店铺的店铺名称.推荐菜和评分信息. 一.页面分析 进入大众点评,然后选择美食(http://www.dianping.com/wuhan/ch10),可以看到一页有 ...

  7. Python爬虫丨大众点评数据爬虫教程(2)

    大众点评数据爬虫获取教程 --- [SVG映射版本] 前言: 大众点评是一款非常受大众喜爱的一个第三方的美食相关的点评网站.从网站内可以推荐吃喝玩乐优惠信息,提供美食餐厅.酒店旅游.电影票.家居装修. ...

  8. scrapy爬虫框架调用百度地图api数据存入数据库

    scrapy安装配置不在本文 提及, 1.在开始爬取之前,必须创建一个新的Scrapy项目.进入自定义的项目目录中,运行下列命令 scrapy startproject mySpider 其中, my ...

  9. iOS开发之引用百度地图SDK(一)-----------SDK开发指南

    (void)viewWillAppear:(BOOL)animated { [_mapView viewWillAppear]; _mapView.delegate = self; // 此处记得不用 ...

  10. 百度地图JavaScript API V1.5初级开发工具类

    /** * 百度地图使用工具类-v1.5 * @author boonya * @date 2013-7-7 * @address Chengdu,Sichuan,China * @email boo ...

随机推荐

  1. centos 8 yum 默认安装nginx php 重启nginx服务,报错 403 404

    centos yum nginx 默认安装nginx 服务,重启nginx服务,报错. nginx: [error] open() "/run/nginx.pid" failed ...

  2. Axure 进度条制作

    拖两个矩形,一个用来做边框,另一个用来做进度 下图进度条的宽要设为2,如果是1的话,看不到背景色动 百分比 进度条 百分比 [[Math.floor(jdt.width/bk.width100)]] ...

  3. Windows 安装 MySQL 5.7 x64 位

    设置MySQL 创建数据库,默认为UTF-8 下载地址:https://downloads.mysql.com/archives/installer/ 安装 网站上只有 x86 没有 x64 位,之前 ...

  4. 手把手教你在 Windows 环境中搭建 MQTT 服务器

    前言 前些天要对接一家硬件商的设备数据,对方使用的 MQTT 协议点对点透传,所以又赶紧搭建 MQTT 服务器,写 .NET 程序接收数据等等,今天分享一下如何搭建 MQTT 服务器. MQTT 协议 ...

  5. CentOS7系统上安装升级Vim8

    基本步骤 1.卸载旧版vim yum remove vim* -y 2. 到Vim官方Github仓库下载目前最新的Vim Release版本 git clone https://github.com ...

  6. CJ88 DUMP The ASSERT condition was violated

    一.CJ88运行某个项目时DUMP,其他项目正常 The ASSERT condition was violated. 源代码位置为交易货币为空导致DUMP 经过长时间的源码调试,也只定位在查询语句这 ...

  7. The 18th Zhejiang Provincial Collegiate Programming Contest 补题记录(ACFGJLM)

    补题链接:Here A. League of Legends 签到题,求和判断即可 ll suma, sumb; void solve() { ll x; for (int i = 1; i < ...

  8. distributor和gateway联合实现出中继的负载均衡+故障转移

    概述 freeswitch是一款简单好用的VOIP开源软交换平台. 在之前的文章,我们介绍过distributor模块实现多线路分发的配置方法,但是当线路发生故障时,distributor并不会自动跳 ...

  9. Liunx常用操作(八)-sed命令详细说明

    一.sed简介 sed是一种流编编器,它是文本处理中非常中的工具,能够完美的配合正则表达式便用,功物能不同凡响. 处理时,把当前处理的行存储在临时缓冲区中,称为"模式空间"( oa ...

  10. LLM面面观之LLM上下文扩展方案

    1. 背景 本qiang~这段时间调研了LLM上下文扩展的问题,并且实打实的运行了几个开源的项目,所谓实践与理论相结合嘛! 此文是本qiang~针对上下文扩展问题的总结,包括解决方案的整理概括,文中参 ...