【K哥爬虫普法】你很会写爬虫吗?10秒抢票、10秒入狱,了解一下?

我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。
案情介绍
2017年至2019年间,被告人陈辉为牟取非法利益,在本区编写“爬虫”软件用于在浙江淘宝网络有限公司旗下的“大麦网”平台上抢票,并以人民币1888元到6888元不等的价格向他人出售该软件,非法获利人民币12万余元。
经鉴定,上述“爬虫”软件具有以非常规的方式构造和发送网络请求,模拟用户在大麦网平台手动下单和购买商品的功能;具有以非常规手段模拟用户识别和输入图形验证码的功能,该功能可绕过大麦网平台的人机识别验证机制,以非常规方式访问大麦网平台的资源。
法院观点
被告人陈辉提供专门用于侵入、非法控制计算机信息系统程序、工具,情节特别严重,依法应予惩处。被告人陈辉认罪认罚且在庭前签署《认罪认罚具结协议》,依法可以从宽处理。辩护人所提意见于法有据部分,予以采纳。公诉机关量刑建议适当,予以采纳。
被告人触犯的法律主要为:《中华人民共和国刑法》第二百八十五条第三款:【提供侵入、非法控制计算机信息系统程序、工具罪】提供专门用于侵入、非法控制计算机信息系统的程序、工具,或者明知他人实施侵入、非法控制计算机信息系统的违法犯罪行为而为其提供程序、工具,情节严重的,依照前款的规定处罚;
判决情况
被告人陈辉犯提供侵入、非法控制计算机信息系统程序、工具罪,判处有期徒刑三年,缓刑四年,并处罚金人民币二万元。
继续追缴被告人陈辉的违法所得人民币12万元,上缴国库。
扣押在案的 U 盘1个、手机1台、电脑主机1台、移动硬盘1个等作案工具予以没收、上缴国库。
判决文书
广州市南沙区人民法院(2021)粤0115刑初5号
案例分析
根据案情介绍,被告人陈辉通过爬虫技术绕过了验证码人机识别等反爬虫策略,实现了抢购,并且将该爬虫脚本封装成软件,进行售卖,以此盈利,这明显是违背了大麦网意愿的行为。使用程序进行抢购肯定会比人工手动操作快很多,必然会影响到在大麦网进行正常购票的用户,造成不公平的竞争,并存在资源垄断的可能。
使用爬虫脚本进行抢购的场景很多,例如抢票、抢各种热门产品等等,通过赚取差价或者售卖抢购软件的方式获利,殊不知这种行为不仅破坏了公平购买的秩序,还可能导致真正有需要的人买不到,并且会使得产品溢价很多,严重的扰乱了市场。更重要的是通过软件或脚本进行抢购的行为,是肯定违反相关平台规定以及法律法规的,使用爬虫技术抢票可能涉及以下法律问题:
- 违反服务协议:许多网站在其服务协议中明确禁止使用自动化工具或爬虫技术进行访问,网站经营者可能采取法律行动追究责任;
- 不正当竞争:如果您使用爬虫技术扰乱市场秩序,例如通过抢票来获取一定数量的票务资源,从而排挤其他竞争者或商家,然后以高价售卖,可能会被认定为不正当竞争行为;
- 违反反垄断法:如果滥用爬虫技术来获取大量票务资源,从而垄断市场、排挤竞争对手,可能触犯反垄断法律;
- 网络入侵:如果使用爬虫技术侵入他人的计算机系统或网络,未经授权地访问和操作,可能触犯计算机犯罪法律;
- 网络攻击和滥用:使用爬虫技术进行网络攻击、滥用资源或干扰正常运营,可能触犯计算机犯罪相关法律;
- 经济犯罪:如果使用爬虫技术进行票务抢购,然后以欺诈、洗钱、非法交易等方式牟利,可能触犯经济犯罪相关法律;
- 违反国际法:在跨国爬取网站信息或进行抢购活动时,可能触犯跨境数据流动、贸易限制等国际法律法规;
- 违反电子商务法规:在一些国家或地区,使用爬虫技术抢购商品可能违反电子商务法规,如未经授权的电子商务活动、虚假交易等。
技术本身是无罪的,但谨记不要利用技术来实施可能违法犯罪的行为。不要心怀侥幸,若一直游走于刀尖,出事是迟早的事情,一定不要为一时的利益蒙蔽了双眼。在此劝谏各位爬虫工程师们,切莫触碰灰黑地带,越过了法律的红线!

【K哥爬虫普法】你很会写爬虫吗?10秒抢票、10秒入狱,了解一下?的更多相关文章
- php实现求最小的k个数(日常出错很容易是分号或者$符号忘记写了)
php实现求最小的k个数(日常出错很容易是分号或者$符号忘记写了) 一.总结 日常出错很容易是分号或者$符号忘记写了 二.php实现求最小的k个数 题目描述 输入n个整数,找出其中最小的K个数.例如输 ...
- [python]新手写爬虫v2.5(使用代理的异步爬虫)
开始 开篇:爬代理ip v2.0(未完待续),实现了获取代理ips,并把这些代理持久化(存在本地).同时使用的是tornado的HTTPClient的库爬取内容. 中篇:开篇主要是获取代理ip:中篇打 ...
- (转)新手写爬虫v2.5(使用代理的异步爬虫)
开始 开篇:爬代理ip v2.0(未完待续),实现了获取代理ips,并把这些代理持久化(存在本地).同时使用的是tornado的HTTPClient的库爬取内容. 中篇:开篇主要是获取代理ip:中篇打 ...
- 让你从零开始学会写爬虫的5个教程(Python)
写爬虫总是非常吸引IT学习者,毕竟光听起来就很酷炫极客,我也知道很多人学完基础知识之后,第一个项目开发就是自己写一个爬虫玩玩. 其实懂了之后,写个爬虫脚本是很简单的,但是对于新手来说却并不是那么容易. ...
- [Python]新手写爬虫全过程(已完成)
今天早上起来,第一件事情就是理一理今天该做的事情,瞬间get到任务,写一个只用python字符串内建函数的爬虫,定义为v1.0,开发中的版本号定义为v0.x.数据存放?这个是一个练手的玩具,就写在tx ...
- 开发记录_自学Python写爬虫程序爬取csdn个人博客信息
每天刷开csdn的博客,看到一整个页面,其实对我而言,我只想看看访问量有没有上涨而已... 于是萌生了一个想法: 想写一个爬虫程序把csdn博客上边的访问量和评论数都爬下来. 打算通过网络各种搜集资料 ...
- PHP, Python, Node.js 哪个比较适合写爬虫?
PHP, Python, Node.js 哪个比较适合写爬虫? 1.对页面的解析能力2.对数据库的操作能力(mysql)3.爬取效率4.代码量推荐语言时说明所需类库或者框架,谢谢.比如:python+ ...
- [Python]新手写爬虫全过程(转)
今天早上起来,第一件事情就是理一理今天该做的事情,瞬间get到任务,写一个只用python字符串内建函数的爬虫,定义为v1.0,开发中的版本号定义为v0.x.数据存放?这个是一个练手的玩具,就写在tx ...
- 为什么python适合写爬虫?(python到底有啥好的?!)
我用c#,java都写过爬虫.区别不大,原理就是利用好正则表达式.只不过是平台问题.后来了解到很多爬虫都是用python写的.因为目前对python并不熟,所以也不知道这是为什么.百度了下结果: 1) ...
- 基于C#.NET的高端智能化网络爬虫(一)(反爬虫哥必看)
前两天朋友发给我了一篇文章,是携程网反爬虫组的技术经理写的,大概讲的是如何用他的超高智商通过(挑衅.怜悯.嘲讽.猥琐)的方式来完美碾压爬虫开发者.今天我就先带大家开发一个最简单低端的爬虫,突破携程网超 ...
随机推荐
- 以平安银行“智能化银行3.0”实践,看火山引擎DataTester如何助推金融行业数智化进程
作者:DataTester 银行业正在进入一场围绕客户为中心的新革命时期.流量红利逐渐消失,银行零售进入存量客户精细化经营时代:"互联网+"给金融带来更多的场景,智能化成为零售 ...
- 一文了解 DataLeap 中的 Notebook
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 概述 Notebook 是一种支持 REPL 模式的开发环境.所谓「REPL」,即「读取-求值-输出」循环:输入一 ...
- PPT 用图片轻松做出高大上的精修
PPT 用图片轻松做出高大上的精修 图片留白充分 图片很花 文字和图片中间,插入一个透明背景 单图片型 放大+色块 左右分割 上下分割 用一个容器 图形结合 多图型 图片并列
- 盛科交换机和ovs交换机建立VxLAN隧道
环境信息 盛科交换机信息: R3# show version CentecOS Software, E580, Version 5.3.6 Copyright (C) 2004-2017 Centec ...
- 【3rd_Party】format() 处理一些常见的格式化解决方案
fmt的痛与对format设计的思考 fmt:轻量高性能的C++格式化库 C++20 引入了新的 format() 函数,该函数以字符串形式返回参数的格式化表示.format() 使用 python ...
- AtCoder ABC 165 D - Floor Function (Good, 手动模拟推出公式)
题目链接:Here 题意: 给出正整数 \(A,B,N (1\le A\le 1e6,1\le B,N\le1e12)\) ,对于 \(x\in [0,N]\) 求出 \(\left\lfloor\f ...
- Function--jdk8用法
Lambda表达式.首先是参数部分,接着是->,可以视为产出,->之后的内容都是方法体. 当只有一个参数时,可以不需要括号(): 正常情况使用()包裹参数,为了保持一致性,也可以使用括号( ...
- <vue 路由 8、keep-alive的使用>
一. 知识点 1.什么是keep-alive? keep-alive是Vue.js的一个内置组件. 包裹动态组件时,会缓存不活动的组件实例,而不是销毁它们.它自身不会渲染一个 DOM 元素,也 ...
- 假如有一个需求,我们要在一个页面中 ul 标签里渲染 **十万** 个 li 标签
1 // 插入十万条数据 2 const total = 100000; 3 let ul = document.querySelector('ul'); // 拿到 ul 4 5 // 懒加载的思路 ...
- zzuli 1023
java 读入单个字符 import java.util.Scanner; public class Main{ public static void main(String args[]){ Sca ...