新浪新闻客户端

大型语言模型(LLM)技术精要——走向AGI的思考 | 盘古智库新大航海时代系列讲座

大型语言模型(LLM)技术精要——走向AGI的思考 | 盘古智库新大航海时代系列讲座
2024年04月30日 18:45 新浪网 作者 盘古智库

  近年来,大型语言模型(LLM)及其在人工智能领域的应用已经成为科技研究的热点。

  4月29日,盘古智库举办新大航海时代系列讲座“大型语言模型(LLM)技术精要——走向AGI的思考”,邀请盘古智库学术委员会副主任委员,识因智能董事长、创始人王春辉博士担任主讲嘉宾。

  易鹏理事长在致辞中指出在新大航海时代,人工智能带来的技术变革将产生重大且深远的影响,我们应该积极拥抱新技术和新变革。希望通过今天的讲座,大家能对大型语言模型和通用人工智能形成更全面深入的认识。

  讲座中,王春辉博士深入讲解了大型语言模型的前沿技术,探讨了其在人工智能领域中的重要性,以及对实现通用人工智能(AGI)的潜在影响。

  在以Bert和GPT为代表的大型语言模型出现之前,自然语言处理(NLP)的主流技术是深度学习模型,即以LSTM模型与CNN模型作为典型的特征抽取器,以及以Sequence to Sequence + Attention作为各种具体任务典型的总体技术框架。但深度学习存在LSTM/CNN特征抽取器表达能力不够强和具体任务的训练数据总量有限等问题,阻碍了深度学习在NLP领域的成功突围。

  Bert和GPT这两个预训练模型的出现,无论在学术研究角度看,还是工业应用角度来看,都代表了NLP领域的技术飞跃,并带来了整个领域研究范式的转换,包括范式转换1.0—从深度学习到两阶段训练模型,以及范式转换2.0—从预训练模型走向通用人工智能,这种范式转换推动了NLP不同子领域的技术方法和技术框架日趋统一。

  大型语言模型从海量自由文本中学习大量知识,学习过程不需要借助人的介入,并且能灵活应用所学知识来解决实际问题。王春辉博士认为利用超大规模及足够多样性的数据、超大规模的模型,以及充分的训练过程能够训练出优秀的大型语言模型,这是揭开通用人工智能真正的钥匙。

  在提问与讨论环节,与会嘉宾围绕大型语言模型的技术发展、应用场景等方面的问题进行了深入交流。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。
来自于:北京
权利保护声明页/Notice to Right Holders

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2024 SINA Corporation

All Rights Reserved 新浪公司 版权所有