二维码
萨马伯南

扫一扫关注

当前位置: 首页 » 新闻资讯 » 行业新闻 » 正文

亚马逊正在调查人工智能初创公司Perplexity未经许可抓取网站信息的行为

放大字体  缩小字体 发布日期:2025-01-06 16:21:30    来源:本站    作者:admin    浏览次数:76    评论:0
导读

      周五的一份报告称,亚马逊正在调查热门人工智能初创公司Perplexity,该公司涉嫌违反其云计算部门的规定,未经许可从

  

  

  周五的一份报告称,亚马逊正在调查热门人工智能初创公司Perplexity,该公司涉嫌违反其云计算部门的规定,未经许可从其他网站不当“抓取”内容。

  据科技媒体《Wired》报道,最近估值达到30亿美元的Perplexity据称无视一项名为“机器人排除协议”(Robots Exclusion Protocol)的知名网络标准,该协议通常被称为Robots .txt,新闻出版商和其他网站使用该协议向自动机器人显示哪些页面是不允许抓取的。

  虽然法律并未要求遵守该标准,但大多数互联网公司选择遵循该协议。对于依赖Amazon Web Services(如Perplexity)的网站,合规也是强制性的。

  Perplexity 3

  亚马逊发言人在一份声明中表示:“AWS的服务条款禁止客户使用我们的服务进行任何非法活动,我们的客户有责任遵守我们的条款和所有适用的法律。”

  《福布斯》本月早些时候指责该公司“直接剽窃”其记者以及CNBC和彭博社的其他记者撰写的文章,包括那些在付费墙之后发表的文章,对Perplexity的审查力度随之加大。

  《连线》杂志在自己的调查确定,据称Perplexity使用了一个“未公开的IP地址”来抓取其母公司condnast运营的网站后,联系了亚马逊——尽管它试图阻止访问。

  该媒体表示,包括《福布斯》、《纽约时报》和《卫报》在内的其他媒体的代表都检测到访问他们服务器的IP地址相同。

  《华盛顿邮报》联系了亚马逊请其置评。

  Perplexity发言人Sara Platnick反驳了《连线》的报道,称其“不准确”。

  Platnick在一份声明中说:“我们在AWS上运行的PerplexityBot尊重robots.txt,我们确认perplexity控制的服务不会以任何违反AWS服务条款的方式进行爬行。”

  普拉特尼克补充说:“AWS调查了《连线》的媒体问题,这是调查滥用AWS资源报告的标准协议的一部分。”“在连线记者联系AWS之前,我们没有收到任何消息。如果说AWS正在调查《连线》杂志调查之外的“困惑”,那是不正确的。AWS是Perplexity的重要合作伙伴,我们对他们持续的合作表示感谢。”

  Amazon 3

  普拉特尼克告诉《连线》杂志,在用户在查询中包含特定URL的“非常罕见”的情况下,PerplexityBot会绕过robots.txt协议。

  Perplexity的首席执行官Aravind Srinivas此前曾抨击《连线》杂志的调查结果,声称它们“反映了对Perplexity和互联网如何运作的深刻而根本的误解。”

  《福布斯》对一个名为“困惑页面”(Perplexity Pages)的功能提出了异议,该产品显示的是“精心策划”的文章,这些文章从第三方新闻媒体撰写的文章中提取细节。

  即使在Perplexity帖子的措辞与原文非常吻合的情况下,原始作者也没有署名。

  Perplexity 3

  相反,Perplexity使用了福布斯所描述的“小而容易被忽略的标识”链接到原始来源。

  在一个令人震惊的例子中,Perplexity的聊天机器人炮制了《福布斯》关于谷歌前首席执行官埃里克·施密特军用无人机项目的独家付费报道。

  “我们对埃里克·施密特隐形无人机项目的报道是今天上午由@perplexity_ai发布的,”《福布斯》执行编辑约翰·帕兹科夫斯基当时在X上写道。“它剽窃了我们的大部分报道。它以最容易被忽视的方式引用我们,以及一些转发我们博客的人。”

  斯里尼瓦斯表示,该工具“有缺陷”,但他否认有不当行为。

 
(文/admin)
打赏
免责声明
• 
部分文章来源于网络,我们均标明出处,如果您不希望我们展现您的文章,请与我们联系,我们会尽快处理。
0相关评论
 

(c)2023-2023 www.pec33.com All Rights Reserved

浙ICP备14008059号