数据收费，对普通用户的实在暴击-远大期货｜远大国际期货【官方网站】

您的位置：主页 > 公告动态 > 远大动态 > 远大动态

数据收费，对普通用户的实在暴击

2023-07-12 10:53 来源：远大期货官网作者：远大期货点击：次

几天前，谷歌忽然更新了隐私方针，清晰表明要用网上一切的揭露数据，来练习自家的 AI 模型。

也便是说，依据新方针，你在网上揭露发布的任何信息都有或许被谷歌抓取，包含但不限于你发的帖子、查找的要害词以及看过的视频。

这不当妥互联网裸奔吗！

OpenAI 前脚刚被申述数据侵权还没多久，谷歌就立刻着急来撞枪口。

在这个节骨眼上整这么一出，大概率跟数据收费脱不了联系，谷歌再不薅这波免费的羊毛，之后很有或许就薅不到咯。

这事儿啊，自打 ChatGPT 爆火后再也没消停过。

世超先给大家伙儿捋捋时刻线。

本年 3 月的时分呢，马斯克带头打响了数据收费*枪，宣称推特的 API 接口不再免费了。

紧接着，美版贴吧 Reddit 也按耐不住了。

上个月 Reddit 闹得沸反盈天的 “ 停电 ” 运动，便是为了反对官方的 API 收费方针。

之宿世超写这事儿的时分还在猜想， Reddit 官方最终会不会作出退让。

从现在的后续看来，大多第三方软件现已承认关停， Reddit 是铁了心要数据收费。

再到这段时刻，推特又整了限流的幺蛾子，没有花钱认证的帐号每天就只能阅览 600 条贴文，意图呢也是为了避免机器人抓取用户数据。

莫非数据就这么值钱吗？

世超觉着啊，仍是AI 的锅。

AI 大模型要想变得更聪明，就需求连绵不断的数据去 “ 喂食 ” 。

现在能做大模型的，要不便是自己家有数据，像百度、阿里和腾讯；要不便是爬人家的数据，这儿点名 OpenAI 。

由于许多网站都敞开有免费的 API 接口，才给了微软、 OpenAI 这些巨子待机而动。

但今时不同往日， AI 在从头赋予数据价值今后，有筹码在手上的渠道当然不乐意被白嫖了。

乃至于 Reddit 的 CEO 霍夫曼都把话搬上明面儿了：便是不想免费供给数据给巨子们。

所以， OpenAI 被申述估量也是渠道们联合起来想要 “ 杀鸡儆猴 ”，治一治 AI 的这股歪风邪气。

不过，法令这次会不会站在 OpenAI 这边，还真不好说。

由于数据版权触及到 3 个要害的问题：

1.数据爬虫的行为自身是否是合法的？

2.数据是否遭到版权的维护？

3.用数据生成的著作是否遭到版权维护？

首要*个问题，要获取数据，无非便是付费购买，或许搜集网上揭露的数据。

但需求留意的是，揭露的数据并不能等同于授权运用，并且还要看网站是不是有相关的条款对数据爬虫行为做出了约束。

要是直接跳过版权方的赞同，或许绕过了网站约束强行获取数据，那便是妥妥的不合法获取计算机信息系统数据罪。

即便 OpenAI 宣称爬的是揭露网站的数据，数据爬虫行为自身是否合法，还要看版权方是不是给了授权。

其次，关于数据自身是否遭到版权维护。

依据美国的版权法，假如 AI 模型练习所用的数据契合 “ 合理运用 ” 的规模，那就不会构成侵权。

但问题就出在这 “ 合理运用 ” 上。

“ 合理运用 ” 的构成要件包含是否触及商用、著作自身是否受版权法维护、所运用部分的数量以及运用之后对著作自身形成的影响这四个规范。

像什么新闻报道、学术研究，恰当引用是彻底 ok 的。

可 AI 模型上亿万等级的数据运用量、现已商业化的 AI 软件，还能算作 “ 合理运用 ” 吗？

最终，便是 AI 生成著作的版权问题。

由于练习数据版权理不清， AI 生成的内容天然也会存在版权争议。前几天， Steam 还下架了一款运用了 AIGC 生成的游戏，理由便是版权有问题。

咱就拿 AI 绘画举比如，图画生成相当于一个拆分又重组的进程，尽管最终的成果是彻底 “ 新 ” 的，但仍然会保存练习图画的某些特征。

但这种状况究竟是不是侵权，各国的说法现在也是议论纷纷。

由于练习数据是人家的，美国版权局确定 AI 生成的著作不受版权法维护，乃至还或许侵略著作权。

而日本政府的情绪则天壤之别，表明日本法令不维护 AI 练习所用数据的版权。

至少在现行的法令框架下，上面这些问题很难得到一个一致的答案。

已然监管不给力，那版权方就只有提刀自己干了，该收费的收费，该追偿的也赶忙追偿。

▼OpenAI 被申述的文件

能够预见，在推特和 Reddit 之后，或许还会有更多的内容版权方竖起高墙。

这事儿呢，关于渠道来说，当然是个赚钱的新路子，科技巨子再不济也便是多砸点儿钱。

但关于整个互联网来说，可算不上一件好事儿。

当年，互联网便是带着敞开同享的基因出世的，像什么维基百科、推特，之前终年免费供给 API 接口，开发者调用数据很便利。

但现在假如让数据收费这么一搞，成果会怎么样还真不好说。

究竟，小开发者没有付出巨额数据费的才干，假如立异只在巨子里产生，这不便是纯纯搞垄断了？

最主要的是，或许许多现在免费能看到的网站之后就要花钱才干看了，这才是对咱们这种普通用户的实在暴击。

其实吧，数据收费这事儿也不能全怪渠道，实在是让 AI 巨子给 “ 抢 ” 怕了，算是一种自保的无法之举。

尽管这次谷歌有“隐私方针”护体，但成果怎么还真不好说。

所以，要害还要是看监管的大锤什么时分能落下。

厘清数据版权，是 AI 要开展一直绕不过去的一道坎儿，而现在，好像也相同关乎着互联网的未来走向。

不知道 AI 这艘船，会将咱们面向一个更敞开，仍是更关闭的年代？

上一篇：通过价格战淬炼的中国汽车已成为拉动内需和外

下一篇：OpenAI现已悄悄发布了GPT 4.5？