AI正在吞食一切!谷歌改变政策 爬取所有公开内容用于训练AI
从今往后,你在网上公开说的每一句话,都可能被谷歌拿去训练AI!
没错,继画画之后,文字作品也要被用来喂大模型了——
无论是技术博客、代码、论文,还是所有你在网上公开的帖子,都可能被扔进“谷歌大模型搅拌机”,即使有版权也是如此。

就在这周,谷歌更新了一版隐私政策,明确表示他们保留有抓取网上所有公开内容,以构建其AI工具的权利。
网友们立刻炸了。有人警告“谷歌正抓取一切”:
一旦谷歌能够读取你写的东西,就意味着这些都是他们的“所有物”了。

还有网友抱持更悲观的想法:
很快啊,所有内容产出者就都会是AI了。

所以,这版隐私政策究竟是怎么回事?
用于训练Bard等AI产品
事情还得从谷歌这几天更新的隐私政策说起。
在最新的隐私权政策中,谷歌增加了一个关于“研究和开发”的AI模型条款:
Google会利用信息来改进我们的服务并开发新的产品、功能和技术,以惠及我们的用户和公众。
例如,我们会利用公开信息来帮助训练Google的AI模型并打造实用产品和功能(比如Google翻译、Bard和Cloud AI功能)。
换言之,就是将所有可能收集到的公开信息,用在谷歌翻译、Bard和Cloud AI等AI相关产品或功能的训练中。

那么,这些公开信息具体包括什么?
例如互联网、网络和其他活动信息,包括搜索字词、应用和浏览器与谷歌服务进行互动的相关信息,以及在第三方网站和应用中使用谷歌服务等。
换而言之,不止是此前已经公开的博客等内容,包括公开到网上的谷歌文档、或是一些包含个人信息的发帖,也可能会被谷歌收集起来,用于大模型训练。
当然,目前这些内容都还限定在“公开信息”。
像谷歌提供的Gmail等电子邮件服务,应该还是不会被爬进数据里的。
而且谷歌也明确在隐私权政策中表示,在其他如防范安全威胁、信息审核、服务维护、个性化广告或法律等原因情况下,同样可以使用这些个人或公开信息。
不过,谷歌为啥在这个节骨眼更新这个政策?
“AI正挑战文字版权”
或许也与Reddit和推特等一众公司搞出的“限流”操作有关。
先是今年4月,Reddit宣布对接入API的公司开始收费。
公司CEO认为,Reddit的数据库很有价值,但是他们不想将这些有价值的内容免费提供给科技大公司。
随后,推特也开始以“不想让AI公司白嫖数据”的理由,来给推特限流,未经验证用户日浏览量只有600,经过验证后增加到6000。
这一系列政策对用户和第三方工具影响很严重,例如Reddit引发了大规模的讨论版块抗议,不少版主直接关闭了自己管理的论坛,以对Reddit这一活动进行抗议,推特上也有不少人在声讨,甚至有网友表示“推特被杀死了”。
但无论如何,让AI白嫖数据这件事,现在都已经是一个无法忽视的矛盾了。
对于谷歌AI爬数据这件事,有网友表示疑惑:
为啥之前互联网如搜索引擎也有爬取数据一类的操作,但人们却偏偏对“AI抓取”感到抗拒。

有网友回应称:
本质上还是版权的问题。如果只是引用受版权保护的材料,那么不一定侵犯版权,但如果用AI对有版权的内容进行“搅拌清洗”,而且这事儿合法化了,那么本质上版权已死。
也正是因此,他对于这件事感到悲观:
如果有人在不标注来源的情况下复制了你的博客,或是将你的开源代码拿去做付费服务,又或是将你在StackOverflow上的答案用作答题方法,你能接受这些情况发生吗?
我之前做的一切都是免费的。但现在如果AI想让我消失,那我就会消失。

当然,也有网友已经接受了这个政策的推出,警惕大家自身防范意识不可或缺:
细读新政策,注意我们泄露了多少信息到网上。

那么,你怎么看待这件事?
责任编辑:宪瑞
地球真正的主人 绝对不可能是人类(地球主人)
地球真正的主人有可能是病毒。如果说现在地球上的主人是谁呢?很多人可能会说是人类,因为人类去世已经称霸了这个世界,不过也并不代表着人类成为了整个地球的主人,毕竟在地球当中还有很多东西是人类无法去左右的,比如说曾经带给我们很多困扰的病毒。人类历史我要新鲜事2023-04-23 22:43:560001秋裤阴谋论是什么?秋裤是苏联人的阴谋吗
导语:很多人怕冷都会早早穿上秋裤,虽然显得有点臃肿,但是相当暖和。但是有人提出秋裤阴谋论,他们表示秋裤实际上是苏联人的阴谋,这个说法是真的吗。为什么说秋裤是苏联人的阴谋据说在1953年的时候,前苏联遗传学家李森科向斯大林提出了一个观点,假如人们长期穿秋裤的话,双腿和关节抗寒性会逐渐丧失,最终在几代人之后更加畏惧寒冷,甚至于没办法脱下秋裤。我要新鲜事2023-05-11 06:33:070002科学界的重大突破 新的粒子加速器(粒子加速)
小型粒子加速器的突破可能会让地球科技产生质的突破。粒子加速器是在多年之前就已经被国外的科研团队给发明了出来,而在前段时间美国有一个科研团队开发了一种新的粒子加速器,这是让之前3km长的直线加速器才能够做到的事情,直接缩短到20m也依然能够做到。缩短到150倍,这对于整个科学界来说,或许这一粒子加速器的研究将会对医疗以及半导体核心能源等各领域的研究带来非常大的进步。粒子加速器我要新鲜事2023-12-21 21:07:250000神秘力量在太阳系内部画下特定区域,旅行者一号竟然用40年才飞出
人类在宇宙中发射探测器,也是为了更好的了解宇宙。旅行者一号发射之后,历经40年的飞行,才最终飞出了太阳系的边缘。宇宙中的太阳系就像被神秘力量画了一个圈,飞行器很难飞出这个划定的区域。我要新鲜事2023-05-14 18:35:500000MySQL 中常见的高可用架构部署方案
这里来聊聊,MySQL中常用的部署方案。MySQLReplication是官方提供的主从同步方案,用于将一个MySQL的实例同步到另一个实例中。Replication为保证数据安全做了重要的保证,是目前运用最广的MySQL容灾方案。Replication用两个或以上的实例搭建了MySQL主从复制集群,提供单点写入,多点读取的服务,实现了读的scaleout。我要新鲜事2023-05-14 01:44:320000