ChatGPT会停止学习吗?

Inquirer5月5日报道,凡是曾经求助于ChatGPT寻找答案的人可能曾经好奇过这个流行的人工智能(AI)工具从哪里获取提供的所有信息。简单来说,ChatGPT会贪婪地从开放网络上搜集所有的英语语言数据,并为您进行综合。互联网上发布的所有内容,从新闻文章到数字书籍、博客、播客、纪录片、计算机程序等等,都是这个AI系统的原材料。



对此类内容的未经授权使用引发了对知识产权侵权的担忧。事实上,多个计算机程序员、书籍作者、出版公司、新闻机构和其他各种内容生产者已经对OpenAI(ChatGPT的开发者)提起了多起诉讼,他们主张对这些强大的AI系统进行训练的受版权保护的作品的法律权利。


但同样令AI世界的许多观察者感到不安的还有一个同样重要的问题。考虑到目前可用于AI系统的计算能力不断增长,很快就会有可能在互联网上找到的所有由人类生成的数字材料都将被用尽。当达到那一点时,像ChatGPT这样的系统会怎么样?当它们已经用尽了可以继续训练的所有文本时会发生什么?


《纽约时报》技术记者、《天才制造者:将人工智能引入谷歌、Facebook和全球的独行者》一书的作者卡德·梅兹表示,事实上,这种情况已经开始出现。为了弥补原材料供应日益短缺的情况,OpenAI已经开始使用他们开发的语音识别工具转录来自各种平台的音频和视频文件。然后将数字转录本输入到他们的机器学习系统中,以构建更新更强大的ChatGPT版本。


但即使如此,这可能仅仅是一个权宜之计。随着时间的推移,这些人工智能工具可能不得不转向互联网上的非英语数字材料,并将其翻译成可读的英文文本。目前,根据《大西洋月刊》(2024年4月12日)的马特奥·王(Matteo Wong)的说法,“几乎90%的网站只用10种语言编写(英语、俄语、西班牙语、德语、法语、日语、土耳其语、葡萄牙语、意大利语和波斯语)。” 将会主导聊天机器人的世界观。王认为,世界其他7,000种语言,特别是那些未被Google翻译服务的语言,将进一步被推向边缘。


但梅兹认为,人类在网络上发布的数字内容的数量永远不可能与现在AI系统拥有的几乎不可枯竭的计算能力和内存相匹敌。那时,AI系统别无选择,只能训练自己处理机器生成的内容或“合成数据”。梅兹认为,对于AI聊天机器人来说,这可能是一个危险的转变,因为当它们尝试复制人类思维模式时,可能会放大由于“幻觉”或制造虚假信息而产生的错误。


这一切可能听起来超现实,但也许我们正在这里看到一个完全数字化的未来,带着它对速度的痴迷。我们人类是不是只是在危言耸听?因此,我询问了ChatGPT自身对这些问题的看法。ChatGPT开始否认道:“大型语言模型很可能不会很快用尽人类制造的数字数据供其学习。然而,如果真的发生了这种情况,这些模型可能会在学习新信息的能力上达到一个瓶颈。研究人员随后需要找到替代来源或开发新技术来不断改进模型。”


我:“所谓的合成数据是其中一种替代方案吗?”

(ChatGPT回答):是的,使用合成数据进行训练可能会导致模型在某些方面表现不佳,特别是当合成数据不能很好地模拟真实世界的情况时。因此,确保合成数据的质量和适用性对于训练准确的机器学习模型至关重要。


我:“机器从机器生成的数据中学习?这难道不会只会放大在过程中可能出现的错误吗?”

ChatGPT:“研究人员需要仔细设计和验证生成合成数据的算法,以最小化这些风险。此外,将合成数据与真实数据结合,并采用严格的验证技术,可以帮助减轻这些问题。合成数据的验证技术可以包括交叉验证、统计分析、领域专家审查、对抗性测试和微调。”


ChatGPT提供了这些验证措施的进一步阐述,其中大多数采用了机器执行的数学操作形式。我得出的结论是,人工智能系统所提供的不是我们理解的真相,而是对现实世界现象的模型。毫无疑问,ChatGPT极其擅长回答几乎任何信息、解决方案或建议的请求。人们很容易沉迷于其中,将其误认为是一个始终在身边的真实人类。但要小心。正如西蒙娜·德·波伏娃在小说《美好的图像》中通过其中一个角色所警告的那样:“很快,技术将对我们来说就像自然本身一样,我们将生活在一个完全非人类的世界中。”


新闻来源:Inquirer          作者:Randy David


编辑:Audrey

(声明:请读者严格遵守所在地法律法规,本文不代表任何投资建议)

本文来源:元宇宙头条 文章作者:元宇宙头条
收藏
举报
元宇宙头条
累计发布内容523篇 累计总热度10万+
523篇 10万+
FTX 后院起火,Binance 釜底抽薪
FTX 后院起火,Binance 釜底抽薪
FTX 后院起火,Binance 釜底抽薪

元宇宙头条现已开放专栏入驻,详情请见入驻指南: #

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表元宇宙头条观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

评论 共0条
默认
|
点赞
说点什么吧
相关文章
您需要登录后才可以回帖 立即登录