大数据风控行业遭“定点爆破”(如何规避爬虫技术带来的风险?)

qinzhiqiang 07-18 11:27 617次浏览

大数据风控行业遭“定点爆破”(如何规避爬虫技术带来的风险?)

从9月份开始,大数据风控行业迎来前所未有的整顿风暴,多家知名大数据公司或被查封,或配合调查,整个行业一时间风声鹤唳,草木皆兵。不少大数据风控从业者哀鸿遍野,人人自危。

多家大数据风控公司被突击检查

9月6日,摩羯科技突然遭警方上门,核心高管人员被警方带走,当天开始业务全面停止。随后,魔蝎科技的官网也无法打开。

同日,新颜科技CEO黄向前也被警方要求协助调查。内部人士表示,协助调查是因为与其合作的一家持牌网贷平台涉及暴力催收问题。

9月10日,大数据服务公司聚信立发布消息称,为积极迎合国家监管政策,保证所有商户业务运作合法合规,聚信立对其业务板块做出相应调整,于2019年9月6日停止对外提供用户授权的运营商爬虫服务。

9月11日,公信宝运营公司杭州存信数据科技有限公司被杭州公安查封,工作人员被带回警局接受调查。

9月12日,据媒体报道,国内第一家由电信运营商发起成立的征信机构天翼征信多位高管被警方带走。

9月16日,网传同盾科技爬虫部门解散。

一时间大数据风控行业被推上风口浪尖,人人谈之色变,唯恐避之不及。大数据风控公司短时间内遭到集中“定点爆破”,滥用爬虫技术恐成主要原因。

爬虫技术成“原罪”

技术本无罪,但是掌握“爬虫”技术的从业者,往往徘徊在法律红线的边缘。

通常情况下,爬虫技术只是在互联网上采集公开数据信息,很难判定属于违法行为,但是涉及侵入到别人家的系统去获取数据,或者在未经授权的情况下私自爬取公民隐私信息,都可能会给爬虫从业者带来牢狱之灾。

因此,对于爬虫技术应用不当而涉及的犯罪行为主要可以归纳为三类 :

1.爬取的数据信息属于公民个人信息范畴

公民个人信息,是指以电子或者其他方式记录的,能够单独或者与其他信息结合识别特定自然人身份,或者反映特定自然人活动情况的各种信息,包括姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等。

2.利用爬虫技术获取的公民个人信息为非法获取的

利用爬虫技术收集公民个人信息数据,应当获得被收集人的同意,尤其是在数据中包含身份证号、信用信息等敏感数据的情况下,还需要获得明示同意。同时,利用网络漏洞非法下载、非法购买等行为,都属于“非法获取”公民个人信息。

3.非法获取公民个人信息达到“情节严重”以上的标准

非法获取、出售或者提供行踪轨迹信息、通信内容、征信信息、财产信息五十条以上,非法获取、出售或者提供住宿信息、通信记录、健康生理信息、交易信息等其他可能影响人身、财产安全的公民个人信息五百条以上,非法获取、出售或者提供上述规定以外的公民个人信息五千条以上,都属于“情节严重”。

根据相关法律规定,向他人出售或者提供公民个人信息,情节严重的,窃取或者以其他方法非法获取公民个人信息的,均可构成“侵犯公民个人信息罪”,处三年以下尤其徒刑或者拘役,情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。

如何规避爬虫技术带来的法律风险?

关于在公民个人信息已合法公开的情况下,利用爬虫技术对其进行抓取是否构成非法获取这一问题,暂时没有明确答案,但《民法典人格权编》(草案三次审议稿)第816条写到:行为人收集、处理自然人自行公开的或者其他已经合法公开的信息不承担民事责任,但是该自然人明确拒绝或者处理该信息侵害其重大利益的除外。

上海瀛东律师事务所的高级合伙人及管理委员会成员冉晋律师在对大数据风控行业的法律问题进行解读时,提出关于规避爬虫技术风险的若干建议。

1、严格禁止通过技术手段绕过服务器的访问限制,或破解被爬网站为保护数据而采取的加密算法及技术保护措施,从而对被爬网站受保护的计算机信息系统中的数据进行爬取。

2、若被爬网站设定了获取数据信息的措施(包括实名认证、账号密码、内部权限等),爬虫企业应避免通过伪造实名认证或窃取账号密码、内部权限的形式获取数据。

3、避免或谨慎抓取身份认证信息。

4、对大数据公司,特别是大数据风控企业来说,获取“裁判文书网”“执行信息公开网”等网站的数据非常普遍且重要,但爬取这类国家事务网站的信息时应当尤为审慎,特别是在网站已采取相关“反爬措施”的情况下,仍强行恶意突破防护措施爬取数据,对网站运行造成影响的,均可能构成犯罪。

  • 暂无推荐