我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。

案情介绍

2017年至2019年间,被告人陈辉为牟取非法利益,在本区编写“爬虫”软件用于在浙江淘宝网络有限公司旗下的“大麦网”平台上抢票,并以人民币1888元到6888元不等的价格向他人出售该软件,非法获利人民币12万余元。

经鉴定,上述“爬虫”软件具有以非常规的方式构造和发送网络请求,模拟用户在大麦网平台手动下单和购买商品的功能;具有以非常规手段模拟用户识别和输入图形验证码的功能,该功能可绕过大麦网平台的人机识别验证机制,以非常规方式访问大麦网平台的资源。

法院观点

被告人陈辉提供专门用于侵入、非法控制计算机信息系统程序、工具,情节特别严重,依法应予惩处。被告人陈辉认罪认罚且在庭前签署《认罪认罚具结协议》,依法可以从宽处理。辩护人所提意见于法有据部分,予以采纳。公诉机关量刑建议适当,予以采纳。

被告人触犯的法律主要为:《中华人民共和国刑法》第二百八十五条第三款:【提供侵入、非法控制计算机信息系统程序、工具罪】提供专门用于侵入、非法控制计算机信息系统的程序、工具,或者明知他人实施侵入、非法控制计算机信息系统的违法犯罪行为而为其提供程序、工具,情节严重的,依照前款的规定处罚;

判决情况

  • 被告人陈辉犯提供侵入、非法控制计算机信息系统程序、工具罪,判处有期徒刑三年,缓刑四年,并处罚金人民币二万元

  • 继续追缴被告人陈辉的违法所得人民币12万元,上缴国库。

  • 扣押在案的 U 盘1个、手机1台、电脑主机1台、移动硬盘1个等作案工具予以没收、上缴国库。

判决文书

广州市南沙区人民法院(2021)粤0115刑初5号

案例分析

根据案情介绍,被告人陈辉通过爬虫技术绕过了验证码人机识别等反爬虫策略,实现了抢购,并且将该爬虫脚本封装成软件,进行售卖,以此盈利,这明显是违背了大麦网意愿的行为。使用程序进行抢购肯定会比人工手动操作快很多,必然会影响到在大麦网进行正常购票的用户,造成不公平的竞争,并存在资源垄断的可能。

使用爬虫脚本进行抢购的场景很多,例如抢票、抢各种热门产品等等,通过赚取差价或者售卖抢购软件的方式获利,殊不知这种行为不仅破坏了公平购买的秩序,还可能导致真正有需要的人买不到,并且会使得产品溢价很多,严重的扰乱了市场。更重要的是通过软件或脚本进行抢购的行为,是肯定违反相关平台规定以及法律法规的,使用爬虫技术抢票可能涉及以下法律问题:

  1. 违反服务协议:许多网站在其服务协议中明确禁止使用自动化工具或爬虫技术进行访问,网站经营者可能采取法律行动追究责任;
  2. 不正当竞争:如果您使用爬虫技术扰乱市场秩序,例如通过抢票来获取一定数量的票务资源,从而排挤其他竞争者或商家,然后以高价售卖,可能会被认定为不正当竞争行为;
  3. 违反反垄断法:如果滥用爬虫技术来获取大量票务资源,从而垄断市场、排挤竞争对手,可能触犯反垄断法律;
  4. 网络入侵:如果使用爬虫技术侵入他人的计算机系统或网络,未经授权地访问和操作,可能触犯计算机犯罪法律;
  5. 网络攻击和滥用:使用爬虫技术进行网络攻击、滥用资源或干扰正常运营,可能触犯计算机犯罪相关法律;
  6. 经济犯罪:如果使用爬虫技术进行票务抢购,然后以欺诈、洗钱、非法交易等方式牟利,可能触犯经济犯罪相关法律;
  7. 违反国际法:在跨国爬取网站信息或进行抢购活动时,可能触犯跨境数据流动、贸易限制等国际法律法规;
  8. 违反电子商务法规:在一些国家或地区,使用爬虫技术抢购商品可能违反电子商务法规,如未经授权的电子商务活动、虚假交易等。

技术本身是无罪的,但谨记不要利用技术来实施可能违法犯罪的行为。不要心怀侥幸,若一直游走于刀尖,出事是迟早的事情,一定不要为一时的利益蒙蔽了双眼。在此劝谏各位爬虫工程师们,切莫触碰灰黑地带,越过了法律的红线!

【K哥爬虫普法】你很会写爬虫吗?10秒抢票、10秒入狱,了解一下?的更多相关文章

  1. php实现求最小的k个数(日常出错很容易是分号或者$符号忘记写了)

    php实现求最小的k个数(日常出错很容易是分号或者$符号忘记写了) 一.总结 日常出错很容易是分号或者$符号忘记写了 二.php实现求最小的k个数 题目描述 输入n个整数,找出其中最小的K个数.例如输 ...

  2. [python]新手写爬虫v2.5(使用代理的异步爬虫)

    开始 开篇:爬代理ip v2.0(未完待续),实现了获取代理ips,并把这些代理持久化(存在本地).同时使用的是tornado的HTTPClient的库爬取内容. 中篇:开篇主要是获取代理ip:中篇打 ...

  3. (转)新手写爬虫v2.5(使用代理的异步爬虫)

    开始 开篇:爬代理ip v2.0(未完待续),实现了获取代理ips,并把这些代理持久化(存在本地).同时使用的是tornado的HTTPClient的库爬取内容. 中篇:开篇主要是获取代理ip:中篇打 ...

  4. 让你从零开始学会写爬虫的5个教程(Python)

    写爬虫总是非常吸引IT学习者,毕竟光听起来就很酷炫极客,我也知道很多人学完基础知识之后,第一个项目开发就是自己写一个爬虫玩玩. 其实懂了之后,写个爬虫脚本是很简单的,但是对于新手来说却并不是那么容易. ...

  5. [Python]新手写爬虫全过程(已完成)

    今天早上起来,第一件事情就是理一理今天该做的事情,瞬间get到任务,写一个只用python字符串内建函数的爬虫,定义为v1.0,开发中的版本号定义为v0.x.数据存放?这个是一个练手的玩具,就写在tx ...

  6. 开发记录_自学Python写爬虫程序爬取csdn个人博客信息

    每天刷开csdn的博客,看到一整个页面,其实对我而言,我只想看看访问量有没有上涨而已... 于是萌生了一个想法: 想写一个爬虫程序把csdn博客上边的访问量和评论数都爬下来. 打算通过网络各种搜集资料 ...

  7. PHP, Python, Node.js 哪个比较适合写爬虫?

    PHP, Python, Node.js 哪个比较适合写爬虫? 1.对页面的解析能力2.对数据库的操作能力(mysql)3.爬取效率4.代码量推荐语言时说明所需类库或者框架,谢谢.比如:python+ ...

  8. [Python]新手写爬虫全过程(转)

    今天早上起来,第一件事情就是理一理今天该做的事情,瞬间get到任务,写一个只用python字符串内建函数的爬虫,定义为v1.0,开发中的版本号定义为v0.x.数据存放?这个是一个练手的玩具,就写在tx ...

  9. 为什么python适合写爬虫?(python到底有啥好的?!)

    我用c#,java都写过爬虫.区别不大,原理就是利用好正则表达式.只不过是平台问题.后来了解到很多爬虫都是用python写的.因为目前对python并不熟,所以也不知道这是为什么.百度了下结果: 1) ...

  10. 基于C#.NET的高端智能化网络爬虫(一)(反爬虫哥必看)

    前两天朋友发给我了一篇文章,是携程网反爬虫组的技术经理写的,大概讲的是如何用他的超高智商通过(挑衅.怜悯.嘲讽.猥琐)的方式来完美碾压爬虫开发者.今天我就先带大家开发一个最简单低端的爬虫,突破携程网超 ...

随机推荐

  1. Excel 2016 VBA 提取单元格的中文字符

    启用开发工具 方式一:[右键Sheet1 ]->[查看代码] 方式二:[开发者工具]->[Visual Basic] Function chinese(rng As String) Dim ...

  2. CentOS7 Docker 安装,配置国内镜像

    删除已有Docker sudo yum remove docker \ docker-ce \ docker-client \ docker-client-latest \ docker-common ...

  3. Java的非法反射警告illegal reflective access operation

    反射是一项相当强大的特性,不仅在各类框架中被广泛应用,即使是在日常开发中我们也隔三差五得要和它打交道.然而在JDK9中JDK对反射加上了一些限制,需要注意. 考虑有如下的代码: import java ...

  4. CSS3 ------- object-fit属性

    做项目经常会遇到图片列表展示,图片一般是用户从后台上传的,上传的图片尺寸千差万别.如果前端不控制图片大小,整个排版就会很乱,如果给定长宽,图片又会变形,用背景图片来处理有特别麻烦.这个问题一直苦恼了我 ...

  5. freeswitch的distributor模块

    概述 freeswitch 是一款简单好用的VOIP开源软交换平台. 当呼叫是同一个入中继,但是有多条出中继时,需要对出中继做负载均衡,mod_distributor模块可以完成对应的配置和路由. m ...

  6. freeswitch查看所有通道变量

    概述 freeswitch 是一款好用的开源软交换平台. 实际应用中,我们经常需要对fs中的通道变量操作,包括设置和获取,set & get. 但是,fs中有众多的内部定义通道变量,也有外部传 ...

  7. CF1656F Parametric MST 题解

    为了便于解题,先对 \(a\) 数组从小到大进行排序. 首先,根据定义可以得出总价值的表达式: \[\begin{aligned} W&=\sum\limits_{(u,v)\in E}[a_ ...

  8. kafka 集群环境搭建

    本文为博主原创,未经允许不得转载: 如果搭建单机节点 kafka 可看我的这篇博客: 搭建 kafka 集群环境,只需要在搭建单机 kafka 环境的基础上,多增加几个kafka 服务实例即可. 多增 ...

  9. mybatis 源码学习

    本文为博主原创,未经允许不得转载:

  10. P5707 【深基2.例12】上学迟到

    1.题目介绍 2.题解 这里只有两个稍微注意的点 2.1 s % v != 0(向上取整) 这里的话,若是结果不为整数,我们必须向上取整,必须保证空余时间永远大于所需时间! 2.2 ceil向上取整函 ...