我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。

案情简介

2017 年 7 月份,金熊信息科技有限公司产品经理被告人马某雇佣被告人莫某一同开发“探索云盘搜索”网站,并于2017 年 10 月份将“探索云盘搜索”网站开发完毕,2018 年 3 月份将浏览器插件开发完毕。下载并使用“探索云盘搜索”插件的用户只要登录百度云盘,其中的隐私资源信息就会在用户不知情的情况下被自动抓取并收录,且无需授权同意。

2018 年 2 月份,被告人马某要求被告人莫某开发出了充值会员的功能,至 2019 年 7 月,被告人马某以充值会员的形式,以每人每月人民币 7 元、6 个月人民币 42 元、一年人民币 84 元(就真没优惠)、永久使用人民币 360 元的价格在网络上销售该款软件,违法所得人民币 80000 余元,该插件被下载安装数总计 13464 人次

2019 年 5 月 20 日,被害人薛某在使用“探索云盘搜索”时,其存放于百度网盘内的私人照片在其不知情的情况下被该款软件抓取并收录,泄露于网络

经北京网络行业协会电子数据司法鉴定中心对网站上被下载的“探索云盘插件”功能的鉴定,认定在安装有上述插件的浏览器中登入百度网盘账户,进入“我的分享”时,插件程序会将已登录账户的所有分享链接的地址和提取码上传到服务器。该插件具有避开百度网盘安全保护措施,未经授权获取计算机信息系统数据的功能

供述情况

  • 胡某(百度公司刑事法务部员工)

“探索云盘搜索”能搜索到其他用户曾经分享给他人的资料,用户点击搜索出的链接,网站自动填写分享密码,就可以打开用户曾经分享过的个人资料;同时安装过这个插件的用户,自己曾经分享过的个人资料也能在这个网站上被搜索出来。这个插件能绕过百度网盘的安全防护,直接获取到用户链接的明文和密码

  • 马某(金熊信息科技有限公司产品经理,“探索云盘搜索”开发者)

2017 年初,马某在“特斯拉汽车交流群”表示要开发一个软件,需要投资。2017 年 5 月,熊某让马某到金熊信息科技有限公司上班,赞助开发。2018 年 1 月份马某和莫某、田某和陈某四人共同开发了“探索云盘搜索”,有三个功能:一、实时过滤网页上无效的链接;二、自动填充资源链接的提取码;三、自动在“探索云盘搜索”的数据里面检索用户搜索网页上的主关键词。其实背地里还有一个功能,就是用户如果下载了该浏览器插件,就能在用户不知情的情况下自动抓取用户百度网盘里面的资源放到我们自己的数据库里面成为其的资源,只要这些资源形成链接就能被抓取到并且无需授权。插件是马某让莫某开发的。2018 年 2 月份左右,马某让开发了会员功能,用来盈利。熊某知道这是一款搜索软件,也知道是在网络上抓取资源。

  • 田某(金熊信息科技有限公司实习生)

公司刚开发“探索云盘搜索”这个软件时,只有搜索查看的功能,可以在网络上搜索到资源的链接,用户保存到自己的百度网盘里面就可以查看并下载。后来马某让田某搭建了一个数据库,并做了一个“爬虫”软件,可以将网络上各种资源的链接抓取到这个数据库里面,客户通过搜索关键词找到自己想要的资源链接后,可以保存在自己的百度云账户里进行查看和下载。田某于 2018 年年前辞职。

  • 熊某(金熊信息科技有限公司法人)

2017 年 5 月份熊某让马某到金熊信息科技有限公司来专门负责组织开发软件。2017 年 5 月份左右,马某招聘了莫某等几个程序员负责开发该软件及一些外包项目。他们做的是一款搜索下载器,叫“探索云盘搜索”,主要功能是在网上搜索资源然后抓取过来作为自己的资源,供客户下载,这些功能都是马某告诉其的,也给其展示过。软件的开发工作主要都是由马某和莫某开发实施的。

熊某称其不懂网络技术,没问过他们。大概 2018 年 5 月马某说这款软件开发了充值会员的功能,开始盈利了。盈利统一都收入到马某自己的支付宝账户里,以供他运营这个软件。熊其主要提供场所和需要的工具,给程序员发工资,给马某发生活费,平时马某吃住也在公司里。

案件简要梳理:马某规划,熊某赞助,莫某实现

法院观点

被告人马某、莫某违反《网络安全法》第二十七条:“任何个人和组织不得从事非法侵入他人网络、干扰他人网络正常功能、窃取网络数据等危害网络安全的活动”的规定,在用户不知情,且未经百度网站授权的情况下,利用“探索云盘搜索”的插件自动抓取用户存储于百度网盘的分享链接的地址和提取码,并且将该信息收录于自己研发的网站上用于牟利,其犯罪数额已达情节特别严重(违法所得 5000 元以上或者造成经济损失 1 万元以上),被告人马某、莫某的行为均已构成非法获取计算机信息系统数据罪。被告人马某、莫某共同故意犯罪,系共同犯罪,二被告人在共同犯罪中均起主要作用,均系主犯,应当按照其所参与的全部犯罪处罚。

判决情况

一、被告人马某犯非法获取计算机信息系统数据罪,判处有期徒刑三年,缓刑四年,并处罚金人民币一万元;

二、被告人莫某犯非法获取计算机信息系统数据罪,判处有期徒刑三年,缓刑三年六个月,并处罚金人民币一万元;

三、被告人马某、莫某退出的违法所得人民币 70115 元依法予以没收,上缴国库;公安机关扣押的中国工商银行卡 1 张、中国邮政储蓄银行卡 1 张、硬盘 10 个、U 盘 1 个予以没收;扣押的手机 2 部分别发还给各被告人。

裁判文书

(2019)苏1091刑初157号

案例分析

马某、莫某等开发的插件“探索云盘搜索”,在用户不知情的情况下,抓取并收录用户存放在百度云盘内的隐私资源信息,包括分享链接和提取码,这意味着用户的个人隐私数据在未经授权的情况下,被非法获取和使用,甚至牟利,这是明显侵犯公民个人隐私的行为。同时该插件绕过了百度网盘设置的,对分享链接的防抓取措施,非法获取计算机信息系统数据。行为违法是毋庸置疑的。

本案中获取分享链接和提取码的技术是否属于爬虫,难下定论,但是本案同样提醒了爬虫工程师们,个人隐私数据是绝对的“红线”,任何相关需求,都不要抱有侥幸的心理去触碰,当时无事,不代表久安,法律的业火燃起时,终将烧尽蛛网的每一寸角落。

案例中提到的被害人薛某,她的私人照片都在不知情的情况下被该插件抓取并泄露到了网络上。这也警醒了我们,网络上有很多好用的免费插件或者软件,诚然,大多数开发者有着令人敬佩的开源精神,但不排除有少数别有用心之徒,在软件上留有后门。因此可能涉及到个人隐私相关的行为,都是需要仔细斟酌的,切莫因小失大。

熊某在本案中将自己撇的很清,不了解、不参与、不获利,各位认为他是否也应当属于共犯呢?

有用过“探索云盘搜索”的吗?有何见解呢?

【K哥爬虫普法】网盘用的好,“艳照门”跑不了的更多相关文章

  1. C# 学习之路--百度网盘爬虫设计与实现(一)

    百度网盘爬虫 现在市面上出现了很多网盘搜索引擎,写这系列博文及爬虫程序的初衷: 更方面的查找资源 学习C# 学习爬虫的设计与实现 记录学习历程 自我监督 能力有限,如有不妥之处,还请各位看官点评.同在 ...

  2. 利用Python爬虫实现百度网盘自动化添加资源

    事情的起因是这样的,由于我想找几部经典电影欣赏欣赏,于是便向某老司机寻求资源(我备注了需要正规视频,绝对不是他想的那种资源),然后他丢给了我一个视频资源网站,说是比较有名的视频资源网站.我信以为真,便 ...

  3. 从零开始学Python网络爬虫PDF高清完整版免费下载|百度网盘

    百度网盘:从零开始学Python网络爬虫PDF高清完整版免费下载 提取码:wy36 目录 前言第1章 Python零基础语法入门 11.1 Python与PyCharm安装 11.1.1 Python ...

  4. 《精通Python网络爬虫》|百度网盘免费下载|Python爬虫实战

    <精通Python网络爬虫>|百度网盘免费下载|Python爬虫实战 提取码:7wr5 内容简介 为什么写这本书 网络爬虫其实很早就出现了,最开始网络爬虫主要应用在各种搜索引擎中.在搜索引 ...

  5. C#制作网盘搜索工具(简单的爬虫)

    最近学习C#编程,在网上发现一篇winform下制作百度网盘搜索器的文章,故而下载源码学习一二.无奈原博所用的网址失效,故而自己改写了网址和相关源代码,也进行了实现.因为初学,接触的知识较多,为免忘记 ...

  6. Linux VPS使用百度网盘API上传备份文件

    最近百度网盘将空间升级到了永久1TB,鉴于百度的实力用做数据备份空间不错,不过百度网盘没有Linux下的客户端,上传管理文件需通过百度开放云平台访问PCS资源的系列接口. 1.首先加入百度开发者:ht ...

  7. 百度网盘自动上传脚本-bpcs_uploader

    安装jsonpear install pecl/json 一.bpcs_uploader下载和使用: 1.下载地址:http://oott123.github.com/bpcs_uploader/ 2 ...

  8. 利用jsoup爬取百度网盘资源分享连接(多线程)

    突然有一天就想说能不能用某种方法把百度网盘上分享的资源连接抓取下来,于是就动手了.知乎上有人说过最好的方法就是http://pan.baidu.com/wap抓取,一看果然链接后面的uk值是一串数字, ...

  9. 私人网盘系统2.0—全部升级为layUI+PHP(持续更新中)shang

    网盘系统2.0   上周,我做了第一版的“私人网盘系统”,http://www.cnblogs.com/sunlizheng/p/7822036.html 没看过的朋友可以去看一下,这周在家升级做了第 ...

  10. CentOS 7 使用OwnCloud建立私有云储存网盘

    使用OwnCloud建立属于自己私有的云存储网盘 OwnCloud概述: OwnCloud 一款文件主机服务软件,就是我们平时使用的云存储,不过这是在自己主机的服务器上建立属于自己的私有云,OwnCl ...

随机推荐

  1. 5步带你掌握工作流Activiti框架的使用

    摘要:本文通过一个工作流Activiti框架的具体使用示例,具体详尽的介绍了工作流Activiti框架的使用方式. 本文分享自华为云社区<一个使用示例,五个操作步骤!从此轻松掌握项目中工作流的开 ...

  2. Linux CentOS 8 安装DHCP服务

    DHCP 如果虚拟机没有 /etc/dhcp/dhcpd.conf 文件,这可能是因为 DHCP 服务器软件包尚未安装,或者安装后配置文件未创建. 要创建 DHCP 服务器配置文件 dhcpd.con ...

  3. GPT应用开发:运行你的第一个聊天程序

    本系列文章介绍基于OpenAI GPT API开发大模型应用的方法,适合从零开始,也适合查缺补漏. 本文首先介绍基于聊天API编程的方法. 环境搭建 很多机器学习框架和类库都是使用Python编写的, ...

  4. Codeforces Round #707 (Div. 2, based on Moscow Open Olympiad in Informatics Editorial

    Codeforces Round #707 (Div. 2, based on Moscow Open Olympiad in Informatics) Problem 1501A. Alexey a ...

  5. ==和equals的区别和联系,StringBuffer和StringBuilder,clone方法

    ==和equals的区别和联系? ( 1)对于==,比较的是值是否相等 如果作用于基本数据类型的变量,则直接比较其存储的 "值"是否相等: 如果作用于引用类型的变量,则比较的是所指 ...

  6. 如何将接口的返回值中所需信息提取出来作为其他接口的入参使用(postman与jmeter的使用)

    一.背景: 偶尔会用到一个场景,两个接口之前的调用有依赖关系,将其中一个的返回参数中的部分信息取出来作为入参在第二个接口中使用,代码内是比较好实现,只要定义一个变量,用于参数传递. 如果是测试过程中使 ...

  7. 解决Xshell/Xftp提示“要继续使用此程序必须应用到最新的更新或者新版本”(临时规避和彻底解决方案)

    一.xshell与xftp登录时提示,但是更新却又每次都失败,无法登录 二. 临时规避方案:手动修改日期为1年前,问题解决软件可以打开,但是每次启动都要手动修改,甚是麻烦  三.彻底解决方案,修改xs ...

  8. docker容器中执行GPU环境中的tensorflow和pytorch任务

    1. 背景 (1) 业务方提供了一台有GPU的服务器,且已经安装了显卡等组件,cuda版本10.2,具体信息如下 (2) 在裸机上部署anaconda.pytorch.tensorflow较为麻烦,因 ...

  9. SV Interface and Program 2

    Clocking:激励的时序 memory检测start信号,当start上升沿的时候,如果write信号拉高之后,将data存储到mem中 start\write\addr\data - 四个信号是 ...

  10. phpcms - 在删除文章后实现自动删除tag标签

    在使用phpcms程序制作网站的时候,我们会发现文章模型新建一篇文章后会自动向数据库中插入关键词,但如果删除文章后,数据库中的关键词表中字段中还存在之前文章的关键词,那么怎样才能在phpcms后台中删 ...