【K哥爬虫普法】孤注一掷的爬虫er,究竟还要误入歧途多远?
我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。
案情简介
2018 年 8、9 月间,被告人谢财安、林建华预谋窃取公民个人信息售卖获取利益。后二人通过网络联系被告人杨杭,被告人杨杭明知二被告人从事非法活动仍向被告人林建华、谢财安提供 “smarttool”(用于爬取京东商户订单信息)等软件并收取费用。被告人林建华、谢财安利用该软件通过技术手段非法侵入京东商城 “WIS 旗舰店” 等商户的账户维护后台,窃取公民交易类个人信息予以售卖并获利。经鉴定,本案涉及公民个人信息共计 297313 条,内容信息包含有 “店铺名称”、“购买产品”、“金额”、“ID”、“姓名”、“电话”、“地址” 等,经对该文件中每条个人信息的电话号码为标准进行统计剔除重复数据后,获取到信息共 240372 条。
供述情况
- 被告人林建华的供述(爬虫软件买家):
2018 年 9 月份左右,谢财安说京东网上有一些购物的数据有人要,让我和他一起去网上窃取数据。我们两个人就在新罗区适中镇中心村山脚下的一个老房子里面架设了设备开始窃取京东的数据,然后卖给龙岩当地从事网络诈骗的人,一条 3 到 4 元的价格,这些从事网络诈骗的人就是通过我卖给他们的这些数据给购物的人打电话实施诈骗。
谢财安首先联系做钓鱼链接的人,然后把钓鱼链接发给我,我自己注册一个京东账号,把钓鱼链接发给卖家说让对方看一下这款商品,对方点开链接之后是一个假的京东账号,对方就以为是自己掉线了,然后对方会在假的京东页面上重新登录自己的账号、密码和验证码,这些账号、密码就会通过钓鱼网站的链接发送到我们钓鱼链接的管理后台,我们登录钓鱼网站的管理后台就可以拿到商家的用户名和密码,在京东商城的网站登录商家后台,然后我们再用爬虫软件将商家的购买人订单信息采集下来,我们只需要设定好时间,软件就会自动批量的将这个时间段商家的买家数据采集下来,然后由谢财安负责在 QQ 上联系购买数据的人,如果有人购买的话,我们就从 QQ 上以 TXT 的格式发给对方,对方收到数据之后就会告诉我到什么地方取现金,我们就到对方放钱的地方把钱取走。我们从京东公司窃取的数据总共卖了大约十五、六万元,五五分成,我个人获利大概在七、八万元左右。
- 被告人谢财安的供述(爬虫软件买家):
2018 年听老家人说窃取买家数据可以赚钱,大约 8 月份左右,我在 “猪八戒” 网站上看到有人发布信息说可以写爬虫程序,于是我就加入一个 QQ 群,群里面有个叫 “宝爸” 的,我就问他可不可以做京东商城的爬虫程序,他说能做。没过几天他就做了一个钓鱼网站和一套爬虫软件。我和林建华一起出资购买设备用于取京东商家后台数据了。这样由 “宝爸” 提供技术支撑、我和林建华购买设备实施窃取商家数据。
登录商家后台信息查看实际购买商品的用户信息,用户信息包括姓名、手机号、邮寄地址等内容。之后再使用爬虫软件自动爬取这些买家信息,保存到我们的笔记本电脑里,去重之后售卖给那些做电信诈骗的骗子。爬虫软件爬取的数据我们会打包发给宝爸,他有工具可以查询这些买家信息中手机号的停机、空号情况,之后他再打包发给我们,我们将这些停机、空号的买家信息去掉后再进行去重,剩下的数据就可以卖给适中镇和龙岩市区的骗子了,我们卖数据收取的都是现金,一般都是让买数据的人将钱放在指定地点,然后我们去取。卖数据的钱我和林建华一人分了大概七、八万左右。“宝爸” 负责给我们提供技术支撑,维护钓鱼网站、爬取数据软件的工作。购买信息的骗子是我通过 QQ 联系的。
- 被告人杨杭的供述(钓鱼网站及爬虫软件制作者):
2018 年 8 月份左右,我 QQ 所在的 “深度软件订购群” 里有一个昵称叫 “小师弟” 的人跟我说他想让我做一个程序来获得京东商家的订单信息,我同意了,刚开始我在我自己的电脑上调试这个程序的时候发现这个程序用不了,大概 3 天的时间调试成功了,我就发给他用了,成功之后我跟他商量好通过这个程序获取的商家信息,一个商家 380 元,后来有一段时间用不了了,我就帮他重新调试了一遍,调试完之后我们商量好每个商家 400 元,我通过这个程序大概一共获利 1 万元左右。
他们大概获取了 30 个左右的商家信息。我设计的这个程序没有对应的商户,可以获取无限个商户的信息,他获取几个商户的信息我这边都有显示,如果他不给我钱我可以远程关停这个程序。对方还给过我两次包含手机号的文档,我通过创蓝 235 网站查询这些手机号是否为空号,每次付费 2 分钱一个手机号,我收下家是 5 分钱一个手机号,总共查询过 3 万多个手机号。对方使用我的软件共爬取了约 20 多万个订单信息,我把对方爬取的信息同步一份在我自己架设的网站上,是腾讯云服务器,对方每次启动软件都需要调用我的这个服务器,所以我能做到实时同步数据,同时记录了软件的登录日志、流量日志。
- 证人周某的证言(被骗的买家):
证实案发前几天我在京东商城上买了两瓶化妆品,花费 108 元。2018 年 10 月 1 日 14 时 15 分许,有一个陌生号码给我打电话说我在京东上买的化妆品质量有问题,要给我退钱。然后该男子在电话里告诉了我另一个手机号码,我按照对方要求将这个陌生号码加了微信好友。这个微信号给我发过来一个二维码说是退款的流程,我就用自己的手机扫了这个二维码进到一个很像京东平台的页面,然后按照网页上的提示操作,期间需要手机的验证码,我输入好几次都是超时不能继续操作,对方男子就告诉我是因为我的信用度不够,需要通过走流水的方式提高信用度,然后对方在微信里给我发来一张支付宝的二维码,对方在支付宝里下单,然后需要我操作付款以流水的方式提高信用度,这样我先后五次在支付宝里转款,分别为 18000 元、6000 元、9000 元、4000 元、6800 元,然后对方又让我打开我的京东账号,我看到账号里有四笔待付款,一共是 7680 元,我又把这四笔待付款订单、付款了。然后我电话问对方男子什么时候能把钱退给我,对方男子说不用管了已经还完了。对方男子也没有和我提我买化妆品花费的 108 元什么时候退给我,我觉得不对劲了,于是我就报警了。我一共被骗了 51480 元。
案件实施流程:
- 给卖家发送钓鱼链接;
- 拿到卖家在假的京东登录界面输入账户名、密码;
- 通过账户名、密码,登录商家后台;
- 使用爬虫软件,获取该商家所有买家的订单信息;
- 根据订单信息(姓名、手机号、邮寄地址等),实施电话诈骗行为。
法院观点
被告人林建华、谢财安非法窃取公民个人信息,被告人杨杭明知被告林建华、谢财安从事非法活动仍为其提供作案工具,情节特别严重,三被告人的行为均已构成侵犯公民个人信息罪,依法应予惩处。
被告人林建华、谢财安的辩护人所提涉案公民个人信息具有不确定性、鉴定结论不具有客观公正性的辩护意见,根据相关法律规定,对批量公民个人信息条数以查获的数量直接认定并无不当,虽获取的信息中部分信息无公民的真实姓名,但其电话号码 + 住址 + 订单信息等内容已然能够反映自然人的活动情况,属公民个人信息的范畴。
被告人杨杭明知其他二被告人从事非法窃取公民个人信息的活动,仍为其提供作案工具并获取利益,且该作案工具系被告人林建华、谢财安获取公民个人信息的关键性工具,其行为已构成侵犯公民个人信息罪的共同犯罪。
判决情况
一、被告人林建华犯侵犯公民个人信息罪,判处有期徒刑三年六个月,并处罚金人民币七万元。
二、被告人谢财安犯侵犯公民个人信息罪,判处有期徒刑三年六个月,并处罚金人民币七万元。
三、被告人杨杭犯侵犯公民个人信息罪,判处有期徒刑三年二个月,并处罚金人民币三万元。
四、扣押在公安机关的被告人林建华持有的黑色苹果 6 手机一部、U 盘一个、华硕笔记本电脑一台,被告人谢财安持有的银色苹果 6 手机二部、U 盘一个、华硕笔记本电脑三台、华为无线上网终端一个,被告人杨杭持有的戴尔牌笔记本电脑一台、华为荣耀手机一部、中国银行银行卡一张,依法予以没收;扣押在公安机关的被告人谢财安持有的交通银行卡一张、中国农业银行一张、中国工商银行一张、中国光大银行一张,由扣押机关依法予以处理。
五、扣押在公安机关的被告人谢财安持有的黑色苹果 X 手机一部、黑色小米手机一部、黑色苹果 7 手机一部,变价后折抵罚金;不足部分,继续追缴。
裁判文书
(2019)京 0115 刑初 570 号
案例分析
本案中,两被告人通过钓鱼网站,获取到了登录商家后台的账号和密码,再使用爬虫软件采集后台所有买家信息,最终被不法分子用于电话诈骗。这些数据的获取未经授权,侵犯了公民的个人隐私权,并且最终可能造成未知数额的经济损失,严重损害了公民的利益。
电话诈骗深恶痛绝,这也是近年来国家严厉打击的违法犯罪行为,不只是本案中涉及到的京东商家后台,拼多多、抖音、淘宝等电商平台也是不法分子的首选目标之一,作为爬虫工程师一定要仔细权衡自己的行为可能造成的影响,技术是无罪的,但是技术的滥用可能造成极大的社会危害,本案中的爬虫工程师在明知买家目的的情况下,还售卖爬虫软件等,成为了不法分子的帮凶,这是我们需要引以为戒且严厉禁止的行为,电话诈骗伤害的可能不只是一个人、更可能是一个圆满的家庭。电影《孤注一掷》向我们展现了诈骗团伙的可怕,为了利益丧失人性,身为爬虫工程师不应成为违法犯罪分子的助力。
由本案可知,违法犯罪行为人的技术提供者,也是逃脱不了法律的制裁的,且判罚同样严重。因此在技术获益之前,一定要问清楚买家的需求,不然一旦成为了帮凶,法律的重锤一样会砸到自己身上,切记不要越过法律的红线!
趣味验证码
为了应对爬虫, 12306 当年上线了王珞丹和白百何的 "史上最坑图片验证码",你能找的出来吗,欢迎评论区发表见解~
【K哥爬虫普法】孤注一掷的爬虫er,究竟还要误入歧途多远?的更多相关文章
- python3编写网络爬虫23-分布式爬虫
一.分布式爬虫 前面我们了解Scrapy爬虫框架的基本用法 这些框架都是在同一台主机运行的 爬取效率有限 如果多台主机协同爬取 爬取效率必然成倍增长这就是分布式爬虫的优势 1. 分布式爬虫基本原理 1 ...
- 【收藏】收集的各种Python爬虫、暗网爬虫、豆瓣爬虫、抖音爬虫 Github1万+星
收集的各种Python爬虫.暗网爬虫.豆瓣爬虫 Github 1万+星 磁力搜索网站2020/01/07更新 https://www.cnblogs.com/cilisousuo/p/1209954 ...
- Python 爬虫3——第一个爬虫脚本的创建
在进行真正的爬虫工程创建之前,我们先要明确我们所要操作的对象是什么?完成所有操作之后要获取到的数据或信息是什么? 首先是第一个问题:操作对象,爬虫全称是网络爬虫,顾名思义,它所操作的对象当然就是网页, ...
- 放养的小爬虫--豆瓣电影入门级爬虫(mongodb使用教程~)
放养的小爬虫--豆瓣电影入门级爬虫(mongodb使用教程~) 笔者声明:只用于学习交流,不用于其他途径.源代码已上传github.githu地址:https://github.com/Erma-Wa ...
- 爬虫(Spider),反爬虫(Anti-Spider),反反爬虫(Anti-Anti-Spider)
爬虫(Spider),反爬虫(Anti-Spider),反反爬虫(Anti-Anti-Spider),这之间的斗争恢宏壮阔... Day 1小莫想要某站上所有的电影,写了标准的爬虫(基于HttpCli ...
- Python爬虫与数据分析之爬虫技能:urlib库、xpath选择器、正则表达式
专栏目录: Python爬虫与数据分析之python教学视频.python源码分享,python Python爬虫与数据分析之基础教程:Python的语法.字典.元组.列表 Python爬虫与数据分析 ...
- python爬虫随笔(2)—启动爬虫与xpath
启动爬虫 在上一节中,我们已经创建好了我们的scrapy项目,看着这一大堆文件,想必很多人都会一脸懵逼,我们应该怎么启动这个爬虫呢? 既然我们采用cmd命令创建了scrapy爬虫,那就得有始有终有逼格 ...
- 【网络爬虫入门03】爬虫解析利器beautifulSoup模块的基本应用
[网络爬虫入门03]爬虫解析利器beautifulSoup模块的基本应用 1.引言 网络爬虫最终的目的就是过滤选取网络信息,因此最重要的就是解析器了,其性能的优劣直接决定这网络爬虫的速度和效率.B ...
- python爬虫-基础入门-python爬虫突破封锁
python爬虫-基础入门-python爬虫突破封锁 >> 相关概念 >> request概念:是从客户端向服务器发出请求,包括用户提交的信息及客户端的一些信息.客户端可通过H ...
- 2.Python爬虫入门二之爬虫基础了解
1.什么是爬虫 爬虫,即网络爬虫,大家可以理解为在网络上爬行的一直蜘蛛,互联网就比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛咯,如果它遇到资源,那么它就会抓取下来.想抓取什么?这个由你来控制它咯. ...
随机推荐
- 你知道,什么时候用Vue计算属性吗?
摘要:当我们处理复杂逻辑时,都应该使用计算属性. 本文分享自华为云社区<深入理解计算属性,知道什么时候该用Vue计算属性吗?>,作者: 前端老实人 . 计算属性 有些时候,我们在模板中放入 ...
- 协同编辑:Google Wave架构分析
Google Wave的设计初衷是让人们互相发送信息,一起编辑文档,但用户对此感到困惑,很快就以失败告终.Google Wave持续了大约一年时间,于2010年8月被关闭. Wave"领先于 ...
- PNG文件解读(1):PNG/APNG格式的前世今生
PNG格式的前世今生 png是一种无损压缩的位图片形格式,其设计目的是试图替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性.PNG使用从LZ77派生的无损数据压缩算法--LZW专 ...
- 火山引擎A/B测试私有化实践
更多技术交流.求职机会.试用福利,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 作为一款面向 ToB 市场的产品--火山引擎 A/B 测试(DataTester)为了满足客户对数据安全 ...
- Linux 检查应用不在现就重启
每5分钟检查一次,如果不在线就重启 #!/bin/bash count=`ps axu | grep kafka_2.11-1.0.0|grep -v grep|wc -l` echo "p ...
- Cypress系列(1)-Window下安装Cypress并打开
Cypress系列(1)-Window下安装Cypress并打开 系统要求 Cypress是一个被安装在你电脑上的桌面应用,你的操作系统需要满足如下条件才能正常安装 Mac OS 10.9+(仅提供6 ...
- 【主流技术】MongoTemplate 与 Spring Boot 项目集成分享(附CURD技巧)
目录 前言 一.表结构特点 1.1Json格式 1.2实体映射 二.条件构造 2.1Criteria与Query的区别 2.2简单条件 2.3复杂条件 三.如何选用接口 3.1MongoReposit ...
- javascript yield
代码: function delay(time) { return new Promise(function (resolve, reject) { setTimeout(() => { res ...
- Windows | 安装 Docker 遇到的 WSL 2 installation is incomplete 报错的解决方案
控制面板中打开 Windows功能,在其中勾选 适用于 Linux 的 Windows 子系统 下载 WSL 更新包(非最新版本的也会报错) 更新包下载链接:https://wslstorestora ...
- AtCoder Beginner Contest 211 (C ~ E) 个人题解
比赛链接:Here A.B题跳过 C - chokudai 题意: 给出一个字符串,问有多少个字串能构成 chokudai 这道题算是一个简单DP,只要计算某个位置对构成 chokudai 的贡献值即 ...