Tesla与X 首席执行官埃隆·马斯克 (Elon Musk) 似乎认为,仅使用人工数据训练 AI 模型正变得不可能。马斯克声称,用于训练 AI 模型的真实世界数据越来越缺乏,包括他的 Grok AI 聊天机器人。
“在 AI 训练中我们现在基本上已经耗尽了人类知识的累积总和,这基本上发生在去年。”
马斯克的观点与 OpenAI前研究员 Ilya Sutskever的说法一致。Ilya Sutskever在去年12月预测人工智能行业已经达到“数据峰值”。马斯克对这个问题的解决方案是合成数据。Google、OpenAI、Anthropic 和 Meta等都已经利用合成数据来训练他们的AI模型。
“补充真实世界数据的唯一方法是使用合成数据,人工智能在其中创建训练数据.”马斯克说。“使用合成数据......AI会对自己进行某种评分,并经历这个自我学习的过程。”
虽然使用合成数据可以为公司节省大量成本,但一些研究表明,过度依赖合成数据会导致模型崩溃,随着时间的推移,AI 的响应会变得不那么有创意,变得更加有偏见,因为它们在递归生成的数据上反复训练。
缺乏人类数据并没有阻止 X 将其 Grok AI 功能分拆到自己的 iOS 应用程序中。聊天机器人和图像生成器以完全缺乏知识产权或内容护栏而著称,过去只有每月花 8 美元购买 X 高级帐户的人才能使用。但是,任何人都可以免费下载新应用程序。
特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。
0条评论|0人参与网友评论


表情
登录|注册
|退出
分享到微博
发布最热评论
最新评论
更多精彩评论>>