新浪新闻客户端

Think Different:傅盛为何选择“私有化大模型”

Think Different:傅盛为何选择“私有化大模型”
2024年02月02日 18:37 新浪网 作者 侯继勇

  每一个创业者都希望预测环境改变的时点,恰逢其时地站到风口之上。但任何人都无法预测环境改变的时点,“用科技提升效率”是一个长期不可逆的趋势,是一个“质变引量变”的过程。

  社会科学与自然科学有一个显著的不同,那就是社会科学的规律是“量变引起质变”,而自然科学的规律是“质变引起量变”:在某个时间点,当基础科学获得重大突破后,科技创新的链式反应将发生,犹如核聚变一般。

  科普作家卓克将2023年称为人类科技奇迹年。1月21日,猎豹移动董事长兼CEO、猎户星空董事长傅盛在“在2024傅盛的开年AI大课暨猎户星空企业应用大模型发布会”上发表题为“AI大潮下如何创新”的主题演讲中强调了这一论点,其依据是:2023年是“大模型元年”,大模型是“质变引起量变”的“质变”。

  傅盛列举了三个人类历史上的科技奇迹年:1666年,牛顿发布万有引力定理和微积分,使得现代文明、工业大厦由此展开;1905年,爱因斯坦发布了四篇论文,像划破长空的流星一样,使整个天空为此照亮,他奠定了今天所有关于计算机科学、量子力学的基础;2023年,ChatGPT的横空出世,使得人类对科学的探索达到新的高度。2023年是质变的时点,傅盛认为2024年ChatGPT大模型引起的量变将开始,科技创新的链式反应将维系十年、二十年,甚至更长时间。

  360创始人周鸿祎参与了当天的论坛环节,英雄所见略同,他认为“工业革命100年、信息革命50年,AI再快也得5年,应该坚持长期主义,同时要聚焦,找一个‘小切口、大纵深’的方向,坚持用AI重做一遍。”

  双方对谈中,周鸿祎质疑傅盛“不做机器人了”,傅盛回应,猎户星空大模型(Orion-14B)在评测中表现了超强的多语言能力,超越了市面上许多更大参数的模型,尤其日语和韩语能力表现优秀,评测全球第一。为什么Orion-14B在语料训练中专门强化了日语和韩语?傅盛强调,旨在为猎户星空出海商用机器人应用提供支持,猎户星空机器人在日本和韩国不仅限于送餐服务,还能与用户进行流畅的交流。在以往的自然语言处理时代,定制过于复杂及繁琐,而如今通过应用Orion-14B基座的多语言能力,我们不仅在递送方面可以发挥极致,而且在语言交流方面也能轻松应对用户需求。

  基于私有化大模型的生成式应答能力,猎户星空机器人可以满足餐厅、酒店等复杂场景,在日、韩迅速普及,加速全球化进程。机器人是傅盛“降龙十八掌”的起手式,未来这一模式会在更多领域复制。

  在中国人的传统观念里,“他乡遇故知”是人生三大喜事之一,2008年傅盛离开360之后,俩各忙各事,交集不多。大模型遇故知,十五年过去了,论道大模型,AI成了两位‘故知’的他乡。

  2023年国内主流厂商的方向是卷千亿大模型,各种打榜比拼中,国内已经有很多大模型超过了Chat-GPT4。高分很容易,让大模型把题库跑一遍就能得高分,这样的高分是掩耳盗铃,没有意义,如同“应试教育”培养出来的高分低能。

  猎户星空的选择是百亿参数大模型,在探索中,傅盛发现,在企业应用场景中,基于百亿参数大模型,结合企业私有数据和应用,可以实现千亿模型的效果。企业通过私有化部署,把经营的全过程数据化,让AI整体参与提高公司决策竞争力,不止让公司拥有数字员工,还有数字老板。

  不同的选择背后逻辑是认知的不同,对于大多数人来说,OpenAI成功在前,模仿成功者是最没有风险的;傅盛的认知是,Think Different才有机会,尽管有风险,没关系,因为创业本身就意味着风险。

1

  Think Different,一个连续创业者的故事

  多年前的一个午后,旅行途中的傅盛站在斯坦福大学门口的草坪上,心中无比震惊:大草坪上竟然有人跑步,这可是一个工作日,这可是全球创新高地硅谷,他们怎么会有时间跑步?

  在101高速路高速上,横跨湾区的大桥上,正午、向西、向着太平洋的方向,傅盛赶上了堵车。很多车后拖着小船、游艇,那是带着家人度假的模式。加州的阳光很耀眼,傅盛觉得自己有点晕。

  傅盛晕的是,在中国的北京,程序员们工作加班累成狗,他们却这么休闲。但很多创新却来自这些休闲的人,PC互联网时代,中国的一些创新是“Copy to China”。很多年后,曾经光鲜的互联网大佬跌落神坛,网民爆锤他们“为什么不创新”。

  他遍访了很多美国初创企业,看到了琳琅满目的创新。在太平洋边上的半月湾,有一家仓库里的火箭公司,用3D打印的技术做发动引擎,把成本降下来。傅盛问:how many peaple do you have?老板说:three,还有一个兼职的学生。

  傅盛得出的经验是:勤奋不是成功的充分条件,勤奋必不可少,只靠勤奋却是不行的;同质化的勤奋就是卷,不同的道路才能胜出;你勤奋,对手会更勤奋;你不要利润,对手可以亏着卖……多年前的他预见到了中国互联网今天的“卷”。

  在帆船理论当中,后面的帆船跟着前面的帆船变帆,永远不可能超越前者。什么是创新?创新是在不同的路上找到出路,这样才能更小投入、更大产出。他想起了“Think Different”这个词,第一次听到这个词,是在著名的苹果1984宣传片里。

  正是想清楚了这一底层规律,傅盛决定让猎豹移动“Think Different、All in出海”,2012年正是中国移动互联网创新最卷的时刻,每家公司都在说要拿到移动互联网的船票。就连马化腾都说,如果微信晚出来三个月,腾讯就要被颠覆。

  2012年的猎豹移动为了出海,几乎放弃了所有国内业务,全力以赴出海。两年之内猎豹移动把月度活跃用户(MAU)做到5亿多(接近6亿),其中4亿多来自海外。2014年猎豹移动上市了,傅盛第一次创业成功了。

  2016年是中国互联网最喧嚣的一年,此后再未出现那样的盛景,各种新兴事物层出不穷,百团大战、小黄车大赛、新零售、互联网+……这些方向傅盛都看了,也曾心动过,但傅盛想做不同的事情,成立了猎户星空,并带领公司喊出了“All in AI”的口号。

  七年来,傅盛在AI领域埋头苦干,猎户星空在很多领域做到了行业领先,小米的小爱同学招标语音服务提供商,猎户星空在10多个竞争对手中准确率排名第一,最终胜出,喜马拉雅智能音箱的全套技术方案是猎户星空提供的,华为也选用了猎户星空。

  2022年北京冬奥会面向全社会招标,共9个品类,猎户星空独家中了5款,是中标最多的机器人企业,在接待和翻译两个品类中,猎户星空又是唯一入选的。冬奥会的选择绝对公开,完全是现场评测看效果,猎户星空领先优势明显。

  在中国创投领域,傅盛具有样本意义。作为一个连续创业者,傅盛20多年的心得是“Think Different是创新的不二法门,只有找到不同的路,才有可能真正实现爆发。”

2

  私有化大模型,“科技进化树”上的分枝

  在2022年11月30日之前,也就是ChatGPT-3.5横空出世之前,ChatGPT在硅谷就是一个笑话。在全球商业史上,这样的笑话很多,比如乔布斯主导的iPod和iPhone,它们刚发布的时候如此,马斯克的特斯拉电动车发布的时候亦是如此。

  傅盛去硅谷采访同行,所有人都说“不可能搞成”,通过预测下一个词怎么就产生智能,这件事不靠谱,如果靠谱谷歌为什么不做?笑话。现在,他们无一成了“笑话”。

  ChatGPT-3.5发布后,李开复称行业进入AI2.0时代。傅盛恰好在美国,使用后非常激动。傅盛常跟女儿一起交流产品,女儿一直调侃他说做了一个人工智障机器人。ChatGPT-3.5发布,机器人的智障时代结束了。

  先有智能还是先有语言?这是人类进化史上持久的争论。傅盛觉得:语言构建了人类对整个世界的认知,对逻辑的理解,产生了推理,推理产生智能,当ChatGPT通过不断的语料学习完成对语料的理解时,那么离通用人工智能就不远了。

  ChatGPT也是Think Different的结果,AI1.0时代,OpenAI是AI进化树上一棵不起眼的小分叉,OpenAI最早做了四个项目,OpenAI Universe、OpenAI Five、魔方机器人,ChatGPT是公司最不看好的,投入最少的。

  2023年3月,国内千亿大模型创业如火如荼,很多人觉得,不做千亿大模型上不了牌桌。傅盛与创投圈的朋友聚会,一周至少有四五次聚会都是讨论ChatGPT。傅盛的团队也找到他,说ChatGPT我们懂,OpenAI很早就用在NLP上,赶紧备好钱买A100,再不买就涨价了,以后可能买不到了。研发团队堵在办公室门口不让傅盛走,让他赶紧决策。傅盛的担心是,训练大模型这么大的投入,用在哪里?谁买单?

  傅盛的思考是,训练千亿大模型是技术皇冠上的明珠,技术团队都有摘取的愿景,但他关心的是,怎样才有独特的价值?

  时间来到6月,LlaMa来了,开源社区百花齐放,小参数模型的性能快速崛起,千亿参数可以涌现智能,百亿参数同样可以,LlaMa使得大模型的算法壁垒快速消失。在一些评测集上,百亿参数在某些能力上已经接近了ChatGPT。

  AI大模型的发展已经出现二元对立的局面,一边是有实力的大公司发展千亿大模型卷算力,一边是开源社区的极客爱好者,用更小的资源、更精巧的算法去实现智能,做平民化大模型。

  猎户星空的实践结果给行业带来了更多惊喜:加上企业私有数据,再加上应用的打磨,在具体的场景中,百亿参数的模型比千亿大模型表现更好。基于此,猎户星空发现了大模型变现的方向:为企业客户定制私有化大模型。

  傅盛举例,一家政务企业基于百亿参数大模型私有化部署后,回答社保、公积金等相关问题,结果优于千亿参数大模型。在用千亿参数大模型只有60%准确率的情况下,猎户星空用6个月的时间帮助客户一点点打磨到了97%的准确率。

  “修一个电灯泡是爱因斯坦帮你修,还是请胡师傅(电影《年会不能停》中的男主角),答案肯定是胡师傅。”傅盛说。

  科技树的生长不是在一个主干上从头长到尾,而是不断涌现新的分枝,某天某个分枝会变成主干,曾经的主干则会“凋零”。AI进化树的第一个分枝是GPT,第二个是LlaMa,是私有化大模型。傅盛预测“2024年过半千亿大模型会凋零”。

3

  数字老板,让“旧场景”里开“繁花”

  1月21日,猎户星空展示了基于140亿参数大模型打造的深度应用「聚言」三款案例,分别是聚言人力助手、聚言云资产助理、聚言创意助手。与一些千亿大模型只注重陪聊,好玩不中用不同,案例充分展现了在具体场景中如何解决企业客户面临实实在在的问题,并辅助其经营提效。

  聚言人力助手能让一个老板看2000名员工的周报,帮助公司发掘真正的核心员工,让老板听得到一线员工的呼声;聚言云资产助手让云成本降低30%,让老板知道公司的云成本花到哪里去了;聚言创意助手提供多AI智能体智囊团,让各个领域的专家为公司出谋划策,让老板不再为新营销策略决策而苦恼。猎户星空拿聚言云助手跑了一下猎豹的服务器,发现有20%多的服务器是可以省下来。降本效果立竿见影。

  历时不到半年,猎户星空帮助客户推进企业应用AI化。事实会说话,客户很快发现什么样的模型更适合自己,什么样的应用才能帮助企业降本增效。

  傅盛把企业用AI的水平总结成三个段位:青铜段位,比如一些做文案的公司,用大模型写一个段子,做几张图片;黄金段位,也即是数字员工水平,能把私有数据灌到大模型里,例如公司的行政文档,员工守则、请假条例,用于员工请假、差旅、报销等方面的管理,这是行业内讨论的比较多的应用;王者段位,也就是“数字老板”水平,AI参与企业经营全过程的数据,AI可以直接辅助经营决策,比如今天该不该发布一个产品,哪些费用可以减少,哪一个工作重点要加强……。

  这才是大模型应用的星辰与大海,全流程、全数据化,形成“数字老板”,能够理解企业各种经营细节的Copilot,帮老板提出经营决策建议,帮助企业真正完成流程重构。

  在“旧场景”里开“繁花”,这是AI创新与以前历史的显著不同。PC互联网、移动互联网时代,出现了很多新的应用场景。而在AI时代,AI本质上是在做很多人类的工作,这些工作早就存在,是熟悉的旧场景,而非新场景。

  在企业这个应用场景里,AI会把企业的业务分解成50个、100个,甚至更多任务,每一个任务都是一个小切口的场景,非常细分、垂直,比如HR,就可以细分成分解成简历评估、面试的问题准备,面试答案的评估,给员工写信的流程等。

  截至目前,受益大模型最多的企业是微软,原因就是微软有丰富的To B场景,比如微软office 365、bing、Asure云服务等,在这些应用中植入AI,赋能原有的业务场景就行,简单直接。

  具备To B基因,猎豹移动与微软有类似之处,2016年傅盛带领团队拓展新业务猎户星空,猎户星空机器人面对的客户是B类客户,猎豹移动还是亚马逊、Google云计算业务在中国最大的代理,帮助云计算实施与落地。

  1月13日,微软市值超越苹果成为全球市值最高的公司,这是一个标志:大模型时代,行业创新由To C向To B转移的标志。大模型时代如何创新?拆分旧有业务场景流程重构,旧场景里开“繁花”,这是一片堪比1990年代上海滩的沃土。

4

  不一样的未来,私有大模型拆解GPT“阳谋”

  用千亿参数大模型灌入私有化数据,能不能在“旧场景”里开“繁花”,从而完成企业的流程重构?不是不可以,只是太贵。参考人类技术进步的历史,成本永远是限制创新普及最主要的门槛。

  2023年5月,有客户找到傅盛,问能不能进行私有化部署,即前文所述涉及社保公积金的客户问答的政务客户,原因涉及用户隐私,不能放在公网上。当时咨询了一下,一个千亿参数大模型一年私有化授权费用是几千万。今天还是如此。

  傅盛说“私有化部署以后,买服务器让千亿参数大模型跑起来,最低成本160万,因为需要一个八卡的A100才能让千亿大模型实现基本的吐字,吐token,而且并发量极少。”既不中看,也不中用。客户的结论是:划不来。

  除了客户有数据隐私的担心,基于大模型开发的应用与服务提供商也更加担心:如果使用基于OpenAI的GPT Store(GPT商店),未来会不会给OpenAI交智商税?就像移动互联网时代交苹果税,PC时代交微软税一样。

  PC互联网时代,中国软件开发商少有赚钱的公司,因为前有盗版,后有微软;移动互联网时代,除了微信、抖音等超级APP,其余玩家在喝点残羹冷炙外,只能任由苹果、谷歌拿捏。猎豹移动曾是一家工具软件公司,对其间的甘苦深有体会。

  大模型时代若仍延续“ChatGPT+GPT Store”的格局,那么以前吃过的苦,未来的应用与服务提供商将会重新再吃一遍。它们的存在也会带来希望,一如当年的微信那样,拥有成长为一个超级应用的希望,只是这样的机会极小,就像2016年的千军万马过独木桥。

  LlaMa和开源的伟大在于,给行业带来了不一样的未来:基于“私有化大模型”,行业生态格局变了,资源配置方式变了,从集权到分权,从革命到共和,跟微软、苹果这样的暴君说再见,被服务的企业、开发者终于拿回了属于自己的权力。

  1月10日,OpenAI官宣GPT Store(GPT商店)正式上线,OpenAI创始人Sam·Altman将其称为“人工智能领域的苹果应用商店”。几乎同时,关于GPT的“阳谋”在硅谷流传。

  OpenAI创始人Altman在一次采访中说:以后AI应该变成什么样?今天跟它说“创建一家一万亿美金的公司”,它说“好的”,然后开始分析市场,创建创业计划,在网上找人力简历,发邮件雇人买东西,三年后,一家万亿美金的公司成立了。

  GPT Store让OpenAI具备了这样的能力:OpenAI今天几乎读取了互联网上所有公开数据,但这只是人类知识体系的冰山一角,企业私有数据是OpenAI没有的,推出GPT Store后,OpenAI将很快吞噬人类所有的企业私有数据。

  Altman说“以后95%的人都不要工作,5%的人工作就可以,AI给你们创造足够的财富,天天吃喝玩乐挺好的。”这样的未来真的美好吗?未来的企业、开发者、创业者甚至每个人真的可以混吃等死?人生的意义感何来?

  技术发展既给人类带来困惑,也带来惊喜,很多问题就是在发展中解决的。这不,LlaMa来了,每个企业拥有自己的私有化大模型时代到来了。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。
来自于:北京
权利保护声明页/Notice to Right Holders

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2024 SINA Corporation

All Rights Reserved 新浪公司 版权所有