大型语言模型（LLM）技术精要——走向AGI的思考 | 盘古智库新大航海时代系列讲座|盘古|大航海时代|模型

　　近年来，大型语言模型（LLM）及其在人工智能领域的应用已经成为科技研究的热点。

　　4月29日，盘古智库举办新大航海时代系列讲座“大型语言模型（LLM）技术精要——走向AGI的思考”，邀请盘古智库学术委员会副主任委员，识因智能董事长、创始人王春辉博士担任主讲嘉宾。

　　易鹏理事长在致辞中指出在新大航海时代，人工智能带来的技术变革将产生重大且深远的影响，我们应该积极拥抱新技术和新变革。希望通过今天的讲座，大家能对大型语言模型和通用人工智能形成更全面深入的认识。

　　讲座中，王春辉博士深入讲解了大型语言模型的前沿技术，探讨了其在人工智能领域中的重要性，以及对实现通用人工智能（AGI）的潜在影响。

　　在以Bert和GPT为代表的大型语言模型出现之前，自然语言处理（NLP）的主流技术是深度学习模型，即以LSTM模型与CNN模型作为典型的特征抽取器，以及以Sequence to Sequence + Attention作为各种具体任务典型的总体技术框架。但深度学习存在LSTM／CNN特征抽取器表达能力不够强和具体任务的训练数据总量有限等问题，阻碍了深度学习在NLP领域的成功突围。

　　Bert和GPT这两个预训练模型的出现，无论在学术研究角度看，还是工业应用角度来看，都代表了NLP领域的技术飞跃，并带来了整个领域研究范式的转换，包括范式转换1.0—从深度学习到两阶段训练模型，以及范式转换2.0—从预训练模型走向通用人工智能，这种范式转换推动了NLP不同子领域的技术方法和技术框架日趋统一。

　　大型语言模型从海量自由文本中学习大量知识，学习过程不需要借助人的介入，并且能灵活应用所学知识来解决实际问题。王春辉博士认为利用超大规模及足够多样性的数据、超大规模的模型，以及充分的训练过程能够训练出优秀的大型语言模型，这是揭开通用人工智能真正的钥匙。

　　在提问与讨论环节，与会嘉宾围绕大型语言模型的技术发展、应用场景等方面的问题进行了深入交流。

特别声明：以上文章内容仅代表作者本人观点，不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。