當前位置 博文首頁 > 信息技術智庫:《爬蟲寫得好,鐵窗關到老》教你把握爬蟲的法律邊

    信息技術智庫:《爬蟲寫得好,鐵窗關到老》教你把握爬蟲的法律邊

    作者:[db:作者] 時間:2021-09-13 19:06

    作者簡介

    藍橋簽約作者、大數據&Python領域優質創作者。維護多個大數據技術群,幫助大學生就業和初級程序員解決工作難題。

    我的使命與愿景:持續穩定輸出,賦能中國技術社區蓬勃發展!

    最近的IT公司違法案件越來越多,看了很多因為爬蟲,數字貨幣,博彩網站外包等被抓的事情,給大家提個醒,打工注意不能違法,寫代碼背后也有法律風險。

    一、什么是爬蟲?

    通過爬蟲代碼,下載互聯網上的數據到本地,并且提取出我們需要的信息的過程。

    二、典型違法案例

    典型案例(一):構成非法獲取計算機信息系統數據罪

    張某等非法獲取計算機信息系統數據案(上海市楊浦區人民法院(2015)楊刑初字第232號)

    本案中,同享公司人員因通過技術手段非法獲取掌門公司服務器存儲的大量WIFI熱點密碼數據,被判非法獲取計算機信息系統數據罪。

    典型案例(二):構成非法侵入計算機信息系統罪

    魯某、吳某非法侵入計算機信息系統案(眉山市東坡區人民法院(2018)川1402刑初56號)

    魯某和吳某因獲取國家事務網站數據信息,最終被判非法侵入計算機信息系統罪。

    該案中,魯某為獲取投標數據,雇傭、指使吳某利用黑客技術取得眉山市公共資源電子交易網站的最高權限,吳某在該服務器上非法獲取相關投標信息后發送給魯某。

    與本案相關的法律法規為:

    《刑法》

    第二百八十五條第一款主要內容:違反國家規定,侵入國家事務、國防建設、尖端科學技術領域的計算機信息系統的,處三年以下有期徒刑或者拘役。

    典型案例(三):構成提供侵入、非法控制計算機信息系統的程序、工具罪

    王甲、王乙提供侵入、非法控制計算機信息系統程序、工具案(南城縣人民法院(2018)贛1021刑初13號)

    本案中,王甲和王乙制作并銷售用于攻擊58同城網頁漏洞并采集公民個人簡歷信息的軟件,最終被判提供侵入、非法控制計算機信息系統的程序、工具罪。

    該案中,王甲利用計算機編程先后制作了“ANYR”、“藍鯨”、“寶馬”三個軟件,專門用于攻擊58同城網頁漏洞并采集網站上公民個人簡歷信息。王甲和王乙兩人分工合作,由王甲負責軟件的運營和維護,由王乙負責軟件的推廣與銷售,并約定分成。本案中,王甲和王乙通過銷售前述軟件獲利5000元以上。

    與本案相關的法律法規的主要內容為:

    《刑法》

    第二百八十五條第三款主要內容:提供專門用于侵入、非法控制計算機信息系統的程序、工具,或者明知他人實施侵入、非法控制計算機信息系統的違法犯罪行為而為其提供程序、工具,情節嚴重的,處三年以下有期徒刑或者拘役,并處或者單處罰金;情節特別嚴重的,處三年以上七年以下有期徒刑,并處罰金。

    三、什么樣的爬蟲是合法的?

    1、 遵守 Robots 協議

    Robots 協議也叫 robots.txt(統一小寫)是一種存放于網站根目錄下的 ASCII 編碼的文本文件,它通常告訴網絡搜索引擎的漫游器(又稱網絡蜘蛛),此網站中的哪些內容是不應被搜索引擎的漫游器獲取的,哪些是可以被漫游器獲取的。

    Robots 協議就是告訴爬蟲,哪些信息是可以爬取,哪些信息不能被爬取,嚴格按照 Robots 協議 爬取網站相關信息一般不會出現太大問題。

    2、不能造成對方服務器癱瘓

    但不是說只要遵守 Robots 協議的爬蟲就沒有問題,還涉及到兩個因素,第一不能大規模爬蟲導致對方服務器癱瘓,這等于網絡攻擊。

    2019年05月28日國家網信辦發布的《數據安全管理辦法(征求意見稿)》中,擬通過行政法規的形式,對爬蟲的使用進行限制:

    網絡運營者采取自動化手段訪問收集網站數據,不得妨礙網站正常運行;此類行為嚴重影響網站運行,如自動化訪問收集流量超過網站日均流量三分之一,網站要求停止自動化訪問收集時,應當停止。

    3、不能非法獲利

    惡意利用爬蟲技術抓取數據,攫取不正當競爭的優勢,甚至是牟取不法利益的,則可能觸犯法律。實踐中,非法使用爬蟲技術抓取數據而產生的糾紛其實數量并不少,大多是以不正當競爭為由提請訴訟。

    舉個例子,如果你把大眾點評上的所有公開信息都抓取了下來,自己復制了一個一模一樣的網站,并且還通過這個網站獲取了大量的利潤,這樣也是有問題的。

    一般情況下,爬蟲都是為了企業獲利的,因此需要爬蟲開發者的道德自持和企業經營者的良知才是避免觸碰法律底線的根本所在。

    四、我們該怎么做

    對程序員而言,首先要提高職業警惕性。程序員在當今的大數據時代,其殺傷力不亞于手里握著鋼槍的戰士,因此,自然應該對手中的程序的合法合規與否格外警惕:

    (1) 明確自己制作的爬蟲程序是否涉及抓取對象的個人信息,如社交信息、財產信息、聯系信息等;

    (2) 明確是否涉及被抓取對象的商業機密,再次明確被抓取對方是否是自己所任職公司的直接競爭對手;

    (3) 嚴格按照公司制定的軟件開發規范做事。

    如果主管或者老板要求在開發規范之外,給爬蟲程序加裝“外掛”,如偽裝外掛、暴力破解外掛時,硬氣一點的,可以直接遞上一本《中華人民共和國刑法》,而迫于生活壓力不敢正面硬剛的,也要注意留下開發指令的書面郵件記錄。誠然,生活不易,但為了微薄的工資而身陷囹吾,則是得不償失了。

    ?

    【求評論、求點贊、求收藏】?

    cs
程序員cxuan的個人主頁:這篇 Java 基礎,我吹不動了 小小張自由―>張有博:軟件工程――編碼、測試、維護 小小張自由―>張有博:淺談面向對象方法學 小小張自由―>張有博:UML――概述(事物、關系、圖) 小小張自由―>張有博:UML――用例圖 小小張自由―>張有博:UML――活動圖和狀態圖 小小張自由―>張有博:UML――交互圖(順序圖與協作圖) 小小張自由―>張有博:UML――實現圖(構件圖與部署圖) 小小張自由―>張有博:C#編程基礎――C#與.NET的關系 小小張自由―>張有博:C#編程基礎――數據類型 小小張自由―>張有博:C#編程基礎――常量與變量 小小張自由―>張有博:C#編程基礎――運算符與表達式 小小張自由―>張有博:C#編程基礎――循環語句 小小張自由―>張有博:C#編程基礎――跳轉語句 小小張自由―>張有博:C#編程基礎――類 小小張自由―>張有博:C#編程基礎――方法 小小張自由―>張有博:初始三層架構(超超超詳細) 小小張自由―>張有博:C#連接數據庫之Connection、Command、D 小小張自由―>張有博:System.ArgumentOutOfRangeException: 小小張自由―>張有博:機房重構之單例模式的應用 小小張自由―>張有博:機房重構之備忘錄模式的應用 小小張自由―>張有博:機房重構之職責鏈模式的應用 小小張自由―>張有博:HTML基礎――標簽 小小張自由―>張有博:div+css的入門知識 小小張自由―>張有博:CSS核心內容:標準流、盒子模型、浮動 小小張自由―>張有博:asp.net生成驗證碼并提交驗證 小小張自由―>張有博:XML基礎 小小張自由―>張有博:各種計算機語言簡短簡介 小小張自由―>張有博:2020年10月自考總結 小小張自由―>張有博:vs2019利用gitee(碼云)協作開發 小小張自由―>張有博:1024程序員節 小小張自由―>張有博:IDEA2020.3詳細安裝教程 小小張自由―>張有博:JavaWeb之Request與Response詳解 小小張自由―>張有博:JavaWeb之Filter和Listener 小小張自由―>張有博:Vue插件報錯:Vue.js is detected on t 小小張自由―>張有博:在項目中使用Spring Cloud Alibaba Sen 小小張自由―>張有博:在項目中使用OpenFeign 小小張自由―>張有博:解決idea打開Vue項目報紅 小小張自由―>張有博:CentOS7詳細安裝教程--圖文介紹超詳細 zhtbs的博客:Springboot 入門培訓 5 Thymeleaf 與 MVC項目搭建 zhtbs的博客:(Framework7 移動webapp) Springboot 入門培訓 7 zhtbs的博客:HTML+CSS+JavaScript 迷宮生成算法 【建議收藏】 zhtbs的博客:(Framework7 移動webapp) Springboot 入門培訓 8 C zhtbs的博客:Springboot 入門培訓 9 Security(一) 登錄驗證 zhtbs的博客:Springboot 入門培訓 4 WEB+JSP MVC項目搭建 zhtbs的博客:Springboot 入門培訓 10 Security(二) 數據庫DB 貓耳山在天邊:《Linux命令行與shell腳本編程大全》(第三版)讀 英雄哪里出來:??13萬字《C語言動漫對話教程(入門篇)》??(建議收 qq1113673178的博客:[學習][筆記] qt5 從入門到入墳:<12>Grap qq1113673178的博客:[學習][筆記] qt5 從入門到入墳:<13>基于 .net平臺的rabbitmq使用封裝demo詳解 C++類的特種函數生成機制詳解 Python調用百度AI實現圖片上表格識別功能 node自定義安裝更改npm全局模塊默認安裝路徑的步驟 帶你用C語言實現strtok和字符串分割函數 靜態網頁和靜態網頁性能比較 網頁標題優化原則和描述優化原則 php 怎么設置cookie記住密碼 php設置時區無效怎么辦 php __autoload 失效怎么辦 有關PHP調試的小技巧,看看吧! 從0開始:教你微信小店怎么開! 成本5元竟然賣50元 微信朋友圈賣面膜真黑啊 HashMap原理及put方法與get方法的調用過程 基于IDEA 的遠程調試 Weblogic的操作過程 UTC時間、GMT時間、本地時間、Unix時間戳的具體使用 如何利用SwiftUI實現可縮放的圖片預覽器 網站怎么利用內容更新雙重境界快速提高網站權重? php顯示繁體亂碼怎么辦 php不能開啟php_curl怎么辦
A级免费视频