我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。

案情介绍

2015年,被告人肖某开发了一款免费看小说 APP,为了牟利,肖某从腾讯广告联盟下载广告包并插入该 APP 应用程序,用户在通过该 APP 阅读小说时点击其中的广告,广告联盟会自动以点击量计算广告推广费。之后肖某注册成立“某网络技术工作室”公司,并以公司名义将 APP 陆续上架到应用商城。为通过著作权资质的审查,肖某伪造相应作品转让授权证明上传至各应用商城。

2019年,肖某成立公司开发“悦读免费小说”手机 APP 软件并上架,提供网络小说在线阅读服务。后为获取更多利益,肖某将网络爬虫程序植入 APP 应用中,自动爬取互联网上各小说网站的网页链接、小说名称、小说作者、小说简介、小说图片等信息,并分类存放于腾讯云服务器当中,且不间断更新爬取内容。用户在 APP 中搜索或点击相关信息后,APP 将自动爬取到的小说信息提取出来,发送并缓存在上述服务器中,再通过第三方网页重新排版,并插入广告公司提供的广告供用户阅读。

腾讯公司每月根据该程序中的点击量按每次单价 0.2 元至 1 元不等的价格结算广告推广费,费用转到长沙畅想网络技术工作室的银行账户。为了规避风险,肖某分别于2020年5月26日、7月17日以其父亲肖某、母亲王某的身份注册上海昶悠网络技术工作室和上海毓璃网络技术工作室,并用该两个公司的对公银行账户接收腾讯公司结算的广告推广费用。

2021年6月,北京腾飞克科技有限公司发现“悦读免费小说” APP 在未经其许可的情况下,大量非法复制了该公司享有著作权的作品。经广东甄明司法鉴定所鉴定:固定至“悦读免费小说” APP 中 576 部小说作品与永丰舸渡网络科技有限公司提供的拥有著作权的小说作品具有相同名称,其中 551 部小说作品相似度大于70%。

公诉机关变更起诉为:经广东甄明司法鉴定所于2022年2月25日鉴定,固定到“悦读免费小说” APK 文件并通过程序获得“悦读免费小说侵权书单.xlsx”同名小说 4547 本,经检验,与版权方提供的版权小说相似度大于70%的共计 3968 本。上述相似度大于70%的小说合计 4519 本。

2020年1月至2021年8月期间,长沙畅想网络技术工作室广告收益 9167638.55 元,上海毓璃网络技术工作室广告收益 10863914.2 元,上海昶悠网络技术工作室广告收益 286828.46 元。肖某共获取广告推广费 2000 余万元。

法院观点

《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》第三条规定“网络用户、网络服务提供者未经许可,通过信息网络提供权利人享有信息网络传播权的作品、表演、录音录像制品,除法律、行政法规另有规定外,人民法院应当认定其构成侵害信息网络传播权行为。通过上传到网络服务器、设置共享文件或者利用文件分享软件等方式,将作品、表演、录音录像制品置于信息网络中,使公众能够在个人选定的时间和地点以下载、浏览或者其他方式获得的,人民法院应当认定其实施了前款规定的提供行为”。

本案中被告人肖某开发的“悦读免费小说” APP 中设置了爬虫程序从其他网站扒取小说书名、封面、网站链接等,并把小说链接、小说简介、小说名字等信息存储到其服务器里,并且进行了增减、排版和过滤,插入广告,读者可以六种方式通过“阅读免费小说” APP 进行阅读,其中“立即阅读”模式读者可以在该 APP 页面直接阅读小说,“全书缓存”模式可以下载小说供读者在选定的时间和地点阅读,“悦读免费小说”中扒取的小说均未经过著作权或其授权人的许可,侵害了著作权权利人的信息网络传播权。

被告人肖某辩护其服务器中并未存储小说,但存储了小说链接、小说简介、小说名字,虽然“悦读免费小说” APP 中确实有链接服务,但是其提供的不是普通链接服务,用户点击后并不直接跳转到第三方网页首页,而是直接在该 APP 中显示相关页面,被告人亦供述“悦读免费小说” APP 默认是全屏阅读,读者都是在 APP 的界面中进行阅读,在全屏阅读时分辨不出在哪个网站进行观看小说的,因为软件自动进行了转码阅读,只有读者自己退出全屏阅读点击菜单才能看到是在哪个网站看到的,也就是说读者完全感觉是在“悦读免费小说” APP 中进行阅读,而不是在其他网站进行阅读,故应当认定属于复制发行和传播行为。“悦读免费小说” APP 中扒取的小说经司法鉴定与被害人北京腾飞克科技有限公司享有著作权包括信息网络传播权的小说相似度大于70%的有 4519 部,因此被告人的行为构成侵犯著作权权利人信息网络传播权的行为

法院认为,被告人肖俊以营利为目的,未经著作权权利人许可,擅自在其开发的“悦读免费小说” APP 中复制发行他人享有著作权权利的文字作品,其行为构成侵犯著作权罪。被告人肖俊非-法-经营数额达 2000 余万元,非法复制发行他人作品的数量众多,属于情节特别严重,依法应在三年以上十年以下有期徒刑幅度内量刑,并处罚金。

2021年12月24日,永丰县人民检察院以肖某犯侵犯著作权罪提起公诉。2022年8月15日,法院作出一审判决,以犯侵犯著作权罪,判处肖某有期徒刑五年,并处相应罚金。肖某不服判决,提出上诉。2022年10月25日,中级人民法院裁定驳回上诉,维持原判。

判决情况

  • 被告人肖某犯侵犯著作权罪,判处有期徒刑五年,并处罚金人民币 100 万元;

  • 追缴被告人肖某违法所得 20318381.21 元及其产生的收益,上缴国库;。

  • 没收扣押在案的作案工具苹果 macbookpro 电脑一台。

判决文书

(2022)赣0825刑初2号

案例分析

根据案情介绍,肖某通过网络爬虫技术爬取电子小说信息,为用户提供直接阅读、下载功能,使公众可以在选定的时间和地点阅读,符合信息网络传播行为的实质性要件,侵犯了权利人的信息网络传播权,并依此获取了巨额的利益,这种行为明显是触犯了法律法规的。这种小说侵犯著作权案屡见不鲜,早在2011年,盛大文学就告了“小说5200”网站的侵权行为,后者的相关负责人最终也都被判刑了。在网络上爬取喜欢的小说,供自己或朋友阅读,见仁见智,但是切莫大量的爬取小说、文章等,然后借此获利,这是缺乏道德,且违反法律的行为。

通过爬虫侵犯著作权来获取作品并以盈利的方式使用,将著作权人的劳动成果无偿占为己有,对著作权人造成经济损失。同时,这种行为也扭曲了正常的市场竞争,给那些合法获得授权并按照规定使用作品的人带来不公平的竞争环境。一旦大众缺乏版权意识,都抱着白嫖的心理,使得盗版抄袭行为猖獗,形成一种恶性的市场环境,必然会打击原创者的积极性,好的作品将会越来越少。

随着网络技术的发展,通过信息网络向公众提供作品的获利方式不再局限于收取会员注册费或者作品下载费、阅读费等直接、传统的收益方式,而是逐渐转向收取第三方高额广告费等间接方式,利用海量用户在使用软件时的巨大广告点击量牟取暴利。这不失为一种好的策略,但切记提供的产品一定不能是侵权所得,不然获利再多,也迟早有吐出来的那一天,谁都想赚钱,不过一定要通过合法合规的渠道

还是老话长谈,技术本身是无罪的,但谨记不要利用技术来实施可能违法犯罪的行为。不要心怀侥幸,若一直游走于刀尖,出事是迟早的事情,一定不要为一时的利益蒙蔽了双眼。在此劝谏各位爬虫工程师们,切莫触碰灰黑地带,越过了法律的红线!

【K哥爬虫普法】一个人、一年半、挣了2000万!的更多相关文章

  1. (转)Python网络爬虫实战:世纪佳缘爬取近6万条数据

    又是一年双十一了,不知道从什么时候开始,双十一从“光棍节”变成了“双十一购物狂欢节”,最后一个属于单身狗的节日也成功被攻陷,成为了情侣们送礼物秀恩爱的节日. 翻着安静到死寂的聊天列表,我忽然惊醒,不行 ...

  2. 爬虫逆向基础,理解 JavaScript 模块化编程 webpack

    关注微信公众号:K哥爬虫,QQ交流群:808574309,持续分享爬虫进阶.JS/安卓逆向等技术干货! 简介 在分析一些站点的 JavaScript 代码时,比较简单的代码,函数通常都是一个一个的,例 ...

  3. RPC 技术及其框架 Sekiro 在爬虫逆向中的应用,加密数据一把梭!

    什么是 RPC RPC,英文 RangPaCong,中文让爬虫,旨在为爬虫开路,秒杀一切,让爬虫畅通无阻! 开个玩笑,实际上 RPC 为远程过程调用,全称 Remote Procedure Call, ...

  4. Python 3.10 正式发布,新增模式匹配,同事用了直呼真香!

    关注微信公众号:K哥爬虫,QQ交流群:808574309,持续分享爬虫进阶.JS/安卓逆向等技术干货! 前几天,也就是 10 月 4 日,Python 发布了 3.10.0 版本,什么?3.9 之后居 ...

  5. 逆向进阶,利用 AST 技术还原 JavaScript 混淆代码

    什么是 AST AST(Abstract Syntax Tree),中文抽象语法树,简称语法树(Syntax Tree),是源代码的抽象语法结构的树状表现形式,树上的每个节点都表示源代码中的一种结构. ...

  6. 关于 K米 —— 的案例分析

    第一部分 调研,评测 评测 下载并使用,描述最简单直观的个人第一次上手体验. 我觉得ktv遥控软件设计的很好,给我带来了很多方便,点歌也不用那么麻烦了跑到台子那里点,调各种音量灯光也是,所以第一次上手 ...

  7. 终于等到你: 图形化开源爬虫Hawk 3发布!

    超级图形化爬虫Hawk已经发布两年半时间了,2015年升级到第二版,收到上千条用户反馈(tucao),100多个红包,总共666块五毛~一直想攒着这笔钱,去北境之王天通苑的龙德商场买最心爱的阿迪王! ...

  8. 剑指Offer面试题15(Java版):链表中倒数第K个结点

    题目: 输入一个链表.输出该链表中倒数第k哥结点.  为了符合大多数人的习惯,本题从1開始计数.即链表的尾结点是倒数第1个结点. 比如一个链表有6个结点.从头结点開始它们的值依次是1.2.3,4,5, ...

  9. Java [leetcode 23]Merge k Sorted Lists

    题目描述: Merge k sorted linked lists and return it as one sorted list. Analyze and describe its complex ...

  10. 《机器学习实战》读书笔记—k近邻算法c语言实现(win下)

    #include <stdio.h> #include <io.h> #include <math.h> #include <stdlib.h> #de ...

随机推荐

  1. CentOS7与centOS8的抉择

    目前国内各大云服务器的默认centos 系统版本还是7,vultr,centos只有8了 官网,下载,默认也是8,作为本地主机玩的服务器,还是试一下centos8 国外下载之前版本,下载链接: 官网默 ...

  2. 火山引擎 DataLeap 构建Data Catalog系统的实践(三):关键技术与总结

    更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 关键技术 构建一个好的Data Catalog系统,需要考虑的核心产品设计和技术设计有很多.篇幅所限,本文只概要介 ...

  3. linux tar解压命令总结

    把常用的tar解压命令总结下,当作备忘: -c:建立压缩档案 -x:解压 -t:查看内容 -r:向压缩归档文件末尾追加文件 -u:更新原压缩包中的文件 这五个是独立的命令,压缩解压都要用到其中一个,可 ...

  4. ZOJ 3537 Cake (凸包 + 区间DP && 最优三角形剖分)

    题目链接:Here 题意: 给定 \(n\)​​ 个点的坐标,先问这些点能否组成一个凸包,如是凸包,问用不相交的线来切这个凸包使得凸包只由三角形组成,根据 \(cost_{i, j} = |x_i + ...

  5. 【每日一题】21.边的染色 (DFS连通图 + 思维)

    补题链接:Here 思维不够,看到这种陌生的题目无从下手. 这题应该做过一次的人会觉得它其实并不难. 主要思想:把边权->点权. 这样做的好处是,无论你怎么分配点权,在环内的异或值一定为 \(0 ...

  6. 1、springboot工程新建(单模块)

    系列导航 springBoot项目打jar包 1.springboot工程新建(单模块) 2.springboot创建多模块工程 3.springboot连接数据库 4.SpringBoot连接数据库 ...

  7. 简易机器学习笔记(八)关于经典的图像分类问题-常见经典神经网络LeNet

    前言 图像分类是根据图像的语义信息对不同类别图像进行区分,是计算机视觉的核心,是物体检测.图像分割.物体跟踪.行为分析.人脸识别等其他高层次视觉任务的基础.图像分类在许多领域都有着广泛的应用,如:安防 ...

  8. linux 对子用户配置java 环境变量

    转载请注明出处: 若服务器安装 jdk 时用的是root 用户,则root 用户登录服务器可以直接获取Java环境. 当切换到其他子用户时,则会发现环境不存在,命令不存在等. 解决方案: 1. 先切换 ...

  9. spring启动流程 (4) FactoryBean详解

    FactoryBean接口 实现类对象将被用作创建Bean实例的工厂,即调用getObject()方法返回的对象才是真正要使用的Bean实例,而不是直接将FactoryBean对象作为暴露的Bean实 ...

  10. AMBA Bus介绍_01

    AMBA总线概述 系统总线简介 AMBA 2.0 AHB - 高性能Bus APB - 外设Bus AHB ASB APB AHB 组成部分 APB组成部分 AMBA协议其他有关问题 DMA DMA ...