游客发表

AI,正在纵容传染中文互联网

发帖时间:2024-11-08 05:50:38

滥用AI ,AI也毁了AI

编者案:本文来自微信公共号 量子位 (ID:QbitAI),正纵作者 :金磊 尚恩 ,容传染中守业邦经授权转载 ,文互头图来自摄图网

传染中文互联网 ,联网AI成为了“罪魁罪魁”之一 。AI

使命是正纵这样的。

最近巨匠不是容传染中都热衷于向AI咨询嘛,有位网友就问了Bing这么一个下场 :

Bing也是文互有问必答 ,给出了看似挺靠谱的联网谜底 :

在给出确定的回覆之后 ,Bing还知心地附带上了票价 、AI歇业光阴等细节信息。正纵

不外这位网友并无直接接管谜底,容传染中而是文互顺藤摸瓜点开了下方的“参考链接”。

此时网友觉察到了一丝丝的联网不同过错劲——这人的回覆奈何样“机里机气”的 。

于是他点开了这位叫“百变人生”的用户主页 ,蓦然觉察,介是个AI啊!

由于这位用户回覆下场速率可能说是极快,差未多少每一、2分钟就能搞定一个下场 。

致使能在1分钟之内回覆2个下场。

在这位网友加倍子细的审核之下 ,发现这些回覆的内容都是没经由核实的那种……

而且他以为 ,这便是导致Bing输入过错谜底的原因:

那末被网友发现的这位AI用户  ,如今奈何样样了?

从当初服从来看 ,他已经被被知乎“判处”为禁言形态 。

但尽管如斯 ,也有其余网友闪灼其辞地展现 :

若是点开知乎的“等你回覆”这个栏目,随机找一个下场,往下拉一拉 ,简直是能碰着良多“机言机语”的回覆 。

好比咱们在“AI在生涯中的运用途景有哪些 ?”的回覆中便找到了一个:

不光是回覆的语言“机言机语” ,致使回覆直接打上了“搜罗AI辅助创作”的标签 。

而后假如咱们把下场丢给ChatGPT ,那末患上到回覆……嗯 ,挺换汤不换药的。

事实上 ,诸如斯类的“AI传染源”不止是在这一个平台上有 。

就连重大的科普配图这事上 ,AI也是一再侵蚀。

网友们看完这事也是蚌埠住了 :“好家伙 ,不一个配图是河蚌” 。

致使种种AI天生的假往事也是不够为奇 。

好比前一段光阴,便有一则危言耸听的新闻在网上疯传 ,问题是《郑州鸡排店惊现血案 ,女子用砖头砸去世女子!》  。

但事实上 ,这则往事是江西女子陈某为吸粉引流,运用ChatGPT天生的。

不够为奇 ,广东深圳的洪某弟也是经由AI技术,宣告过《今晨 ,甘肃一火车撞上修路工人  , 致9人降生》假往事。

详细而言 ,他在全网搜查近多少年的社会热门往事,并运用AI软件对于往事光阴  、地址等妨碍更正编纂后 ,在某些平台赚取关注以及流量妨碍正当牟利 。

警方均已经对于他们接管了刑事欺压措施。

但着实这种“AI传染源”的天气不光仅是在国内存在 ,在外洋亦是如斯 。

挨次员问答社区Stack Overflow即是一个例子 。

早在去年年尾ChatGPT刚火起来的时候,Stack Overflow便猛然宣告“临时禁用”。

当时民间给进去的理由是这样的 :

Stack Overflow进一步论述了这种天气 。

他们以为从前用户回覆的下场,都是会有业余知识布景的其余用户浏览 ,并给出精确与否 ,至关于是核实过 。

但自打ChatGPT泛起之后,泛起了大批让人感应“很对于”的谜底;而有业余知识布景的用户数目是有限,无奈把这些天生的谜底都看个遍。

加之ChatGPT回覆这些个业余性下场 ,它的过错率是实着真实摆在那边的;因此Stack Overflow才抉择了禁用 。

一言蔽之,AI传染了社区情景 。

而且像在美版贴吧Reddit上 ,也是充斥着较多的ChatGPT板块、话题 :

良多用户在这种栏目之下会提出林林总总的下场 ,ChatGPT bot也是有问必答。

不外,仍是老下场 ,谜底的精确性若何 ,就不患上而知了 。

但这种天气眼前,着实还潜在着更大的隐患 。

AI模子取良大批互联网数据,却无奈很好地分说信息的着实性以及可信度。

服从便是 ,咱们不患上不面临一大堆快捷天生的低品质内容,让人眼花凌乱,头晕眼花。

很难想象ChatGPT这些大模子假如用这种数据磨炼,服从会是啥样……

而如斯滥用AI,反以前也是一种自噬 。

最近 ,英国以及加拿大的钻研职员在arXiv上宣告了一篇问题为《The Curse of Recursion: Training on Generated Data Makes Models Forget》的论文 。

品评辩说了如今AI天生内容传染互联网的现状 ,而后宣告了一项使人耽忧的发现,运用模子天生的内容磨炼其余模子 ,会导致服从模子泛起不可逆的缺陷 。

这种AI天生数据的“传染”会导致模子对于事实的认知发生扭曲 ,未来经由抓取互联网数据来磨炼模子会变患上愈加难题。

论文作者 ,剑桥大学以及爱丁堡大学清静工程教授Ross Anderson绝不避忌的直言 :

对于虚伪信息满天飞的情景 ,Google Brain的低级钻研迷信家达芙妮 · 伊波利托(Daphne Ippolito)展现:想在未来找到高品质且未被AI磨炼的数据 ,将难上加难 。

假如满屏都是这种无营养的劣质信息 ,如斯周而复始,那之后AI就不数据磨炼 ,输入的服从尚有啥意思呢  。

基于这种情景,斗果敢胆想象一下。一个成长于剩余、虚伪数据情景中的AI ,在进化成人前 ,可能就先被拟分解一个“智障机械人”、一个神思扭曲的神思智障 。

就像1996年的科幻笑剧片子《丈夫一箩筐》 ,影片陈说了一个艰深人克隆自己,而后又克隆克隆人 ,每一次克隆都导致克隆人的智力水平呈指数着落,蠢笨水平添添 。

那个时候,咱们可能将不患上不面临一个荒唐顺境 :人类缔造了具备惊强人干的AI,而它却塞满了无聊蠢笨的信息 。

假如AI被喂进的只是虚伪的剩余数据  ,咱们又能期待它们缔造出甚么样的内容呢 ?

假守光阴到那个时候,咱们约莫都市思念以前,向那些真正的人类智慧致敬吧。

话虽如斯,但也不全坏新闻  。好比部份外容平台已经开始关注AI天生详尽内容的下场 ,并推出相关纪律加以限度。

一些个AI公司也开始搞能分说AI天生内容的技术 ,以削减AI虚伪 、剩余信息的爆炸。

参考链接:

[1]https://www.v2ex.com/t/948487

[2]https://twitter.com/oran_ge/status/1669160826186633219

[3]https://www.qbitai.com/2022/12/40167.html

[4]https://arxiv.org/abs/2305.17493v2

[5]https://albertoromgar.medium.com/generative-ai-could-pollute-the-internet-to-death-fb84befac250

[6]https://futurism.com/ai-generates-fake-news

本文为专栏作者授权守业邦宣告,版权归原作者所有 。文章系作者总体意见,不代表守业邦态度,转载请分割原作者。若有任何疑难,请分割[email protected]。

    随机阅读

    热门排行

    友情链接