【K哥爬虫普法】你很会写爬虫吗?10秒抢票、10秒入狱,了解一下?

我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。
案情介绍
2017年至2019年间,被告人陈辉为牟取非法利益,在本区编写“爬虫”软件用于在浙江淘宝网络有限公司旗下的“大麦网”平台上抢票,并以人民币1888元到6888元不等的价格向他人出售该软件,非法获利人民币12万余元。
经鉴定,上述“爬虫”软件具有以非常规的方式构造和发送网络请求,模拟用户在大麦网平台手动下单和购买商品的功能;具有以非常规手段模拟用户识别和输入图形验证码的功能,该功能可绕过大麦网平台的人机识别验证机制,以非常规方式访问大麦网平台的资源。
法院观点
被告人陈辉提供专门用于侵入、非法控制计算机信息系统程序、工具,情节特别严重,依法应予惩处。被告人陈辉认罪认罚且在庭前签署《认罪认罚具结协议》,依法可以从宽处理。辩护人所提意见于法有据部分,予以采纳。公诉机关量刑建议适当,予以采纳。
被告人触犯的法律主要为:《中华人民共和国刑法》第二百八十五条第三款:【提供侵入、非法控制计算机信息系统程序、工具罪】提供专门用于侵入、非法控制计算机信息系统的程序、工具,或者明知他人实施侵入、非法控制计算机信息系统的违法犯罪行为而为其提供程序、工具,情节严重的,依照前款的规定处罚;
判决情况
被告人陈辉犯提供侵入、非法控制计算机信息系统程序、工具罪,判处有期徒刑三年,缓刑四年,并处罚金人民币二万元。
继续追缴被告人陈辉的违法所得人民币12万元,上缴国库。
扣押在案的 U 盘1个、手机1台、电脑主机1台、移动硬盘1个等作案工具予以没收、上缴国库。
判决文书
广州市南沙区人民法院(2021)粤0115刑初5号
案例分析
根据案情介绍,被告人陈辉通过爬虫技术绕过了验证码人机识别等反爬虫策略,实现了抢购,并且将该爬虫脚本封装成软件,进行售卖,以此盈利,这明显是违背了大麦网意愿的行为。使用程序进行抢购肯定会比人工手动操作快很多,必然会影响到在大麦网进行正常购票的用户,造成不公平的竞争,并存在资源垄断的可能。
使用爬虫脚本进行抢购的场景很多,例如抢票、抢各种热门产品等等,通过赚取差价或者售卖抢购软件的方式获利,殊不知这种行为不仅破坏了公平购买的秩序,还可能导致真正有需要的人买不到,并且会使得产品溢价很多,严重的扰乱了市场。更重要的是通过软件或脚本进行抢购的行为,是肯定违反相关平台规定以及法律法规的,使用爬虫技术抢票可能涉及以下法律问题:
- 违反服务协议:许多网站在其服务协议中明确禁止使用自动化工具或爬虫技术进行访问,网站经营者可能采取法律行动追究责任;
- 不正当竞争:如果您使用爬虫技术扰乱市场秩序,例如通过抢票来获取一定数量的票务资源,从而排挤其他竞争者或商家,然后以高价售卖,可能会被认定为不正当竞争行为;
- 违反反垄断法:如果滥用爬虫技术来获取大量票务资源,从而垄断市场、排挤竞争对手,可能触犯反垄断法律;
- 网络入侵:如果使用爬虫技术侵入他人的计算机系统或网络,未经授权地访问和操作,可能触犯计算机犯罪法律;
- 网络攻击和滥用:使用爬虫技术进行网络攻击、滥用资源或干扰正常运营,可能触犯计算机犯罪相关法律;
- 经济犯罪:如果使用爬虫技术进行票务抢购,然后以欺诈、洗钱、非法交易等方式牟利,可能触犯经济犯罪相关法律;
- 违反国际法:在跨国爬取网站信息或进行抢购活动时,可能触犯跨境数据流动、贸易限制等国际法律法规;
- 违反电子商务法规:在一些国家或地区,使用爬虫技术抢购商品可能违反电子商务法规,如未经授权的电子商务活动、虚假交易等。
技术本身是无罪的,但谨记不要利用技术来实施可能违法犯罪的行为。不要心怀侥幸,若一直游走于刀尖,出事是迟早的事情,一定不要为一时的利益蒙蔽了双眼。在此劝谏各位爬虫工程师们,切莫触碰灰黑地带,越过了法律的红线!

【K哥爬虫普法】你很会写爬虫吗?10秒抢票、10秒入狱,了解一下?的更多相关文章
- php实现求最小的k个数(日常出错很容易是分号或者$符号忘记写了)
php实现求最小的k个数(日常出错很容易是分号或者$符号忘记写了) 一.总结 日常出错很容易是分号或者$符号忘记写了 二.php实现求最小的k个数 题目描述 输入n个整数,找出其中最小的K个数.例如输 ...
- [python]新手写爬虫v2.5(使用代理的异步爬虫)
开始 开篇:爬代理ip v2.0(未完待续),实现了获取代理ips,并把这些代理持久化(存在本地).同时使用的是tornado的HTTPClient的库爬取内容. 中篇:开篇主要是获取代理ip:中篇打 ...
- (转)新手写爬虫v2.5(使用代理的异步爬虫)
开始 开篇:爬代理ip v2.0(未完待续),实现了获取代理ips,并把这些代理持久化(存在本地).同时使用的是tornado的HTTPClient的库爬取内容. 中篇:开篇主要是获取代理ip:中篇打 ...
- 让你从零开始学会写爬虫的5个教程(Python)
写爬虫总是非常吸引IT学习者,毕竟光听起来就很酷炫极客,我也知道很多人学完基础知识之后,第一个项目开发就是自己写一个爬虫玩玩. 其实懂了之后,写个爬虫脚本是很简单的,但是对于新手来说却并不是那么容易. ...
- [Python]新手写爬虫全过程(已完成)
今天早上起来,第一件事情就是理一理今天该做的事情,瞬间get到任务,写一个只用python字符串内建函数的爬虫,定义为v1.0,开发中的版本号定义为v0.x.数据存放?这个是一个练手的玩具,就写在tx ...
- 开发记录_自学Python写爬虫程序爬取csdn个人博客信息
每天刷开csdn的博客,看到一整个页面,其实对我而言,我只想看看访问量有没有上涨而已... 于是萌生了一个想法: 想写一个爬虫程序把csdn博客上边的访问量和评论数都爬下来. 打算通过网络各种搜集资料 ...
- PHP, Python, Node.js 哪个比较适合写爬虫?
PHP, Python, Node.js 哪个比较适合写爬虫? 1.对页面的解析能力2.对数据库的操作能力(mysql)3.爬取效率4.代码量推荐语言时说明所需类库或者框架,谢谢.比如:python+ ...
- [Python]新手写爬虫全过程(转)
今天早上起来,第一件事情就是理一理今天该做的事情,瞬间get到任务,写一个只用python字符串内建函数的爬虫,定义为v1.0,开发中的版本号定义为v0.x.数据存放?这个是一个练手的玩具,就写在tx ...
- 为什么python适合写爬虫?(python到底有啥好的?!)
我用c#,java都写过爬虫.区别不大,原理就是利用好正则表达式.只不过是平台问题.后来了解到很多爬虫都是用python写的.因为目前对python并不熟,所以也不知道这是为什么.百度了下结果: 1) ...
- 基于C#.NET的高端智能化网络爬虫(一)(反爬虫哥必看)
前两天朋友发给我了一篇文章,是携程网反爬虫组的技术经理写的,大概讲的是如何用他的超高智商通过(挑衅.怜悯.嘲讽.猥琐)的方式来完美碾压爬虫开发者.今天我就先带大家开发一个最简单低端的爬虫,突破携程网超 ...
随机推荐
- 鸿蒙轻内核源码分析:MMU协处理器
摘要:本系列首先了解下ARM CP15协处理器的知识,接着介绍下协处理器相关的汇编指令,最后分析下MMU相关汇编代码. 本文分享自华为云社区<鸿蒙轻内核A核源码分析系列六 MMU协处理器> ...
- 悲报, GIF 之父因新冠去世
今天下午二狗子照常上班摸鱼的时候,突然看到了一则消息,消息说 GIF 的发明人因新冠去世了.作为一个自诩理性的互联网人,二狗子第一反应是看到了一个离谱谣言,可是查看了多方消息后,二狗子难过地发现这是真 ...
- Docker--镜像&&容器基本操作
1 基础镜像 BusyBox 一个极简版的Linux系统 集成了100多种常用Linux命令 大小不到2MB 适用于简单测试场景 Alpine 一个面向安全的轻型Linux发行版系统 比BusyBox ...
- 百年奥运的凌空之美,AI 云智剪背后的新算法
奥运赛事每天都在上演冰雪奇迹,而捕捉发生瞬间,凝结最精彩.最动人的体育人文画面,让"冰之舞"."雪之舞"."速度之美"."凌空之美 ...
- 未来,让我们一起想象 — “Imagine” 阿里云视频云全景创新峰会
视频云赛道是一条极具想象力的赛道,可以变革商业与社会,成为大视频时代底座. 视频云技术是一项极具创新力的技术,可以突破时间与空间,创造一个全新的世界. 7 月 10 日,"Imagine&q ...
- 2D 可视赋能智慧水务绿色集约化发展
前言 随着国家对环境保护治理程度的日益重视,各地政府积极响应国家政策,在共同聚焦生态文明建设下,急速催生了水务行业数字化转型.如今 "供排污"一体化管理系统成为行业发展的重要趋势, ...
- mysql备份恢复总结
mysqldump备份注:例子中的语句都是在mysql5.6下执行------------------基础------------------------一.修改my.cnf文件 vi /etc/my ...
- babel7 的配置加载逻辑
babel.config.js 是对整个项目(父子package) 都生效的配置,但要注意babel的执行工作目录. .babelrc 是对 待编译文件 生效的配置,子package若想加载.babe ...
- es6-10
- Prime Time-02
Timing Constrain clk3和clk4 - 异步 clk2和clk1 - 同步 有四个clk,所以要设置四个clk的周期 latency - Net delay,走线的延时 uncert ...