网络抓取是利用机器人从网站中提取信息的过程。近年来,随着商业智能和数据隐私问题的出现,关于网络抓取的争论越来越复杂。raksmart大宽带服务器商分享抓取网站内容是否违法?

网络抓取的时间几乎和网站一样长。公平地说,有好网络抓取,其实是互联网的基础。以下是一些好网络抓取实践的例子:

好搜索引擎机器人爬网站索引、分析和排名其内容。

价格比较网站部署机器人自动获取相关卖家网站的价格和产品描述,使消费者能够比较商品和服务的价格,做出更明智的购买选择。

市场研究公司利用网络爬虫从论坛和社交媒体中提取数据,帮助衡量公众情绪(即报告趋势)。推荐阅读:《如何保护您的网站内容:在WordPress 中禁用右键单击》

然而,这就是网络抓取故事精彩部分结束的地方。根据Imperva2022年不良机器人报告,不良机器人占Web、移动和API所有流量的27.7%,比去年增加了2.1%。他们从网站获取内容,并计划将其用于网站所有者的控制。除了网络捕获,网络犯罪分子还使用恶意机器人进行各种有害活动,包括拒绝服务攻击、竞争性数据挖掘、在线欺诈、账户劫持、数据盗窃、知识产权盗窃、未经授权的漏洞扫描、垃圾邮件和数字广告欺诈

恶意使用网络捕获的两种主要方法是降低价格,获得不公平的竞争优势,窃取版权保护的内容和知识产权。问题还存在,这是违法的吗?

Linkedin和hiQLabs的案例。

2017年夏天,Linkedin起诉了总部位于旧金山的初创公司hiQLabs。根据他的网站,hiQ正在获取公开的Linkedin个人信息,为客户提供一个水晶球可以帮助您提前几个月确定技能差距或离职风险

你的雇主可能会用你的公共Linkedin个人资料来对付你,这是非常令人不安的。然而,在2017年8月14日,法官认为这没有问题。旧金山美国地方法院法官EdwardChen同意hiQ在诉讼中的主张,即微软的Linkedin在阻止初创公司访问此类数据时违反了反垄断法。他命令Linkedin在24小时内消除障碍。领英上诉。

该裁决与之前建议打击网络抓取的法律决定背道而驰。它引发了无数关于社交媒体用户隐私和企业保护自己免受数据劫持的问题。还有公平的问题。Linkedin花了几年时间创造了一些真正有价值的东西。为什么要把它交给像hiq这样的公司——支付服务器和带宽,把所有的机器人流量托管在自己的人类用户身上,让hiq跟着linkedin?推荐阅读:《网站建设时应该要做到哪些效果?》

在Linkedin和hiQLabs之间的法律战争中,该公司将自己描述为一家基于公共数据源应用于人力资本的数据科学公司。Linkedin正试图阻止hiQ从用户的公共信息中获取个人信息。Linkedin于2020年3月提交请愿书,要求最高法院审查,因为第九巡回上诉法院决定允许机器人掌握公开可用的内容。事实上,最高法院在2021年6月为Linkedin提供了另一个阻止hiQ的机会。然而,最高法院表示不会受理此案。相反,它命令上诉法院根据最近的裁决再次审理此案,发现如果一个人不正当访问他们有权使用的计算机上的数据,就不能违反计算机欺诈和滥用法。这不是唯一的法律战斗。Linkedin目前正在战斗;2022年2月,Linkedin对新加坡一组数据捕获工具Mantheospte提出投诉。Ltd.,Jeremiahtang,Yuxichew,Stankosyakov。投诉称,他们从Linkedin的网站上非法获利,违反了其服务条款,损害了用户的利益。案件还在继续。

网络抓取的判决是什么?

正如我们在这里看到的,网络捕获的合法性尚未确定,因为网站所有者继续寻求法律要求,以防止其网站被捕获。当法院试图进一步确定网络捕获的合法性时,你可能会被盗数据,滥用你网站的业务逻辑。考虑使用先进的机器人保护和反抓取技术,而不是寻求法律补救措施来克服这一技术挑战。推荐相关阅读:《企业建设网站时有哪些需要考虑的因素?》

作者 admin

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注