|
% I3 |, b; f4 x+ F2 M( k
( ^' a- D$ |9 a* p2 m: A
作者|吴江华 e2 n" M1 Z7 A0 N" x9 x3 l
编辑|胡展嘉0 ]2 D! k1 x& f; U8 \* N. h' X
运营|陈佳慧
7 o& m# f+ J9 a! ?8 u% g5 W/ {3 `出品|零态LT(ID:LingTai_LT)
+ f4 f$ S& A$ V: qChat GPT引发的大模型混战,像极了20年前的互联网。. h4 h, I& c& K k) s, G$ e( m
近两个月中,已经有包括百度、阿里巴巴、字节跳动等超过五个,宣布要进军大模型的国内知名互联网公司。除此之外,游戏公司、云计算公司、软件公司…只要发布一个跟AI、中国版Chat GPT相关的动作,就能引发热议,带动一轮资本市场的膨胀,引发追随者的狂欢。# E" m% F4 {) i( ?% K- B! d( D
ChatGPT到底会像元宇宙概念一样,成为稍纵即逝的流星,还是会打破互联网旧秩序,构建新秩序,引发一场新的生产关系和生产力的改变?
) ~6 C' Z) }2 z, N0 l1 Z+ g现阶段无人能下定义,零态LT(ID:LingTai_LT)试图通过梳理出基础脉络和走向。, s, j$ K$ }6 q
01$ y! W8 |( F# m2 S" w
诸神混战
, ]% u9 I9 Z4 A* }( u三大格局林立
; x! M$ ~0 H& Y5 t: u先来看看大模型混战现状,目前进军玩家可以分为三类:一类是互联网大厂,一类是科技小巨人,一类是个人创业组队。( p# G$ x6 j8 n0 j/ y/ z! n( |5 u
互联网巨头有:百度文心一言,阿里巴巴通义千问,商汤日日新SenseNova体系,华为云盘古,知乎“知海图 AI”,360GPT,昆仑万维“天工”大模型,京东言犀等。小米CEO雷军4月14日发微博表示,小米全力以赴、坚决拥抱大模型和生成式人工智能(AIGC),并将推出相关技术和产品。
2 @7 h/ T8 n" o: t' S& p在巨头们的带领下,一些科技领域的小巨头企业,也纷纷下场。
) h; A1 _6 t# c由于没有巨头们的数据体量和资金规模,它们普遍的方向是选择接入某一大模型,并在此基础上开发出更具适配性的应用。比如,京东云旗下言犀人工智能应用平台将推出ChatJD;钉钉宣布正式接入阿里巴巴“通义千问”大模型;字节跳动旗下火山引擎发布自研DPU(数据处理单元)芯片,以及发布大模型训练云平台等;金山办公宣布将推出 WPS AI,类似于基于ChatGPT技术的微软Copilot产品,金山办公CEO章庆元透露这一技术由国内企业MiniMax提供;APUS推出1000亿参数、自研多模态的天燕大模型AiLMe,以及基于其技术的 7 款 产品;斑马智行宣布接入“通义千问”大模型,智己汽车成为首个上车品牌...
& n, h# |( E3 J; U7 k3 } I: S; ^
( U) h. c. q4 O( M' d3 T
还有一些如王慧文、李开复、王小川等互联网创业赛道的“老手”,利用个人影响力和IP,宣布创业组队搞生成式大模型。2 }+ p. E. c3 U7 m
3月19日,创新工场董事长兼CEO李开复宣布,成立Project AI 2.0公司,定位是AI 2.0全新平台和AI-first生产力应用的世界级公司。
2 Y4 g4 }/ j& r: k( h5 B1 \王慧文则在社交平台上发布的一则“组队拥抱新时代,打造中国Open AI”的求贤令也曾经刷屏。他称自己出资5千万美元做公司(光年之外)。其老搭档美团CEO王兴随后在朋友圈宣布,个人将参与王慧文创业公司“光年之外”的A轮投资,并出任董事。5 o# U6 V) q1 h9 Q5 g: N
前Google科学家李志飞在2月底的一次媒体访谈中表示,短期目标是在明年6月做出一个60分的通用大模型。
1 _& d% f2 x" w' l- d5 K前搜狗CEO王小川也表示,将进入中国版OpenAI的战场,并向媒体承认项目在“筹备中”。1 L6 v1 d- S' x) |5 \& `
前京东AI掌门人周伯文也宣布,表示不设上限诚招合伙人,一起打造中国版的 ChatGPT。垂直整合从自有基础大模型到应用、用户全场景闭环,实现生成式人工智能技术与商业价值 “双落地”。
* F9 N" i* M% C% p但在这种争分夺秒的官宣中,很多人打趣说国内GPT创业公司PPT的更新速度都赶不上 ChatGPT的版本迭代速度。
. t0 G8 [- Q8 b" I9 u" S( `& c C此外,一些长期深耕科技领域的专家,也趁AI的东风收割,生怕被时代落下。比如计算机科学家、自然语言模型专家吴军在4月3号公开喊话“Chat GPT不算新技术革命,带不来什么新机会”,但是却已经在《得到》上推出了主讲Chat GPT的课程,预售时间定在了4月26日,价格为69.9元。5 C/ P! f. J4 L3 h
除了激烈的竞争,不同格局之下的“隔空互怼”也没有缺席。王小川放话说,李彦宏是活在平行宇宙的人。李彦宏虽然没回应,但百度可不能被欺负,其高管回应:王小川脱离一线业务太久,顺便也讽刺了一把搜狗没干过百度的陈年旧事。
0 E7 o' K. k) h2 m% {+ H5 m这种状态,不仅让人有些激动,国内互联网大厂已经很久没有过这样的盛况了。
5 B P& s' a1 j
" D8 d- } I. T/ T9 m0 T4 ]+ k
) S& l3 `5 W+ o伴随着Chat GPT的爆火,芯片、人工智能、甚至只要发布一个和Chat GPT相似概念的公司股价都得到了正反馈。* ^5 Y; C0 c+ S1 ]5 D
除了百度、阿里,得益于Chat GPT概念爆火,一众入局的上市公司,都在股市上尝到了甜头,360宣布 GPT大模型——“360智脑”落地搜索场景,发布大模型次日股价高开5.53%,随后4月3日再次涨停。
# j. p! ~4 g/ g; U3 j/ m- {) o招银国际发表研报指,因近3个月ChatGPT对相关概念股股价的拉动,芯片、光模块、PCB、服务器年初至今已各涨65%、146%、45%、62%。
* g4 n$ m& m( Y' r5 a* e) B巨头混战大模型,能不能开启下一轮技术革命的热潮?谁究竟能脱颖而出?; k# e" ]! Y- B" O: _! u/ H
024 [* W+ f% u) T" P* f
别低估了大模型的门槛
/ W8 b0 ?- }. g) D; c. s今年2月份Chat GPT-4问世后,市场再次感知到了大模型的威力,相比于去年末发布的Chat GPT-3.5,新一代GPT算力和逻辑能力更强,商业价值也随之凸显。业内专家普遍认为,这将是开启下一个时代的技术竞争高地,如同千禧年的互联网一般。5 R$ J; j3 o( c2 j
但要真正做好大模型并不简单。7 ^" ]; k% m# e! p/ b
首先,Chat GPT门槛很高。国盛证券计算机分析师刘高畅和杨然在《Chat GPT需要多少算力》报告中估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM模型,训练成本介于200万美元至1200万美元之间。- N8 o$ d( P5 y8 ~6 P5 |
除了对大量数据需求外,训练大模型还需要芯片、服务器、算力甚至电费等方方面面的支持。
3 Y, F1 X1 V7 C! n有机构估算,假如平均每天约有1300万用户访问Chat GPT,那就需要3万多片英伟达A100GPU芯片,初期投入成本约为8亿美元,每日还需约5万美元的电费。) X( o4 P5 l9 w7 ?. h" q0 H
从这个角度来说,如此大的投入,最有胜算的一定是互联网大厂。它们资金雄厚,能够经受得住持久战的消耗。相比大厂,诸如WPS、图灵这类的公司则选择了更为灵活的模式,接入现有大模型,在此基础上研发更落地的应用。0 S0 i" s3 |2 i- U! f- E; B
比如金山办公发布的生成式人工智能应用“WPS AI”, 由国内合作伙伴MiniMax提供的;阿里集团旗下的斑马智行也是接入“通义千问”大模型;百度内部沟通产品“如流”自然也是接入“文心一言”大模型。
9 d* m1 l; S& }; f" H" E( g3 n至于个人创业团队,除非有源源不断的资金涌入,否则很难成型。虽然美团联合创始人王慧文宣称,“5000万美元,带资入组”,很多人惊呼觉得好大一笔钱,但专家却表示,5000万美元可能也烧不了多久!# X t0 A# n) b9 d- {
其次,就算有钱,真正实施起来,要训练出经受的住市场考验的大模型也并非一蹴而就。1 D6 q0 [4 z" I- o% A; ^0 I8 n z, J
) ?1 V# M+ q l& q) J A" P
5 u ^# A' C: y0 u: Q在众多行业人士和观察人士看来,当前国内算力稀缺、数据模型训练不足,甚至版权纠纷等问题难以忽视。比如文心一言发布之后,由于AI画画频繁出错,“胸有成竹”“夫妻肺片”“鱼香肉丝”等貌合神离的图片的出现,让用户既觉得有趣,又觉得槽点满满,成为“被玩坏”的一个梗,连李彦宏都出面自嘲说“文心一言是典型的需要靠反馈才能不断提升的产品”。6 d0 O% l4 t2 {' N5 X8 B4 E
同样在现场演示中翻车的还有阿里,钉钉的AI功能由“通义千问”大模型支撑,但是在文生图演示中,出现了和文心一言类似问题,比如输入“赴汤蹈火”表情,却出现了一锅汤上面有着火的类似汤圆造型的动漫人物。
& k0 X2 L8 ]& F; J; ^3 \6 ]* U6 p; Z也有业内人士表示,“现在的大语言模型还是存在胡说八道输出错误信息的问题,ChatGPT珠玉在前,留给大厂们的时间似乎并不算多。”6 s. i6 Q8 e+ W' r3 ]' L: m
从整体情况来说,这些大模型确实推出比较匆忙,但这不是本质问题,因为大模型需要长时间训练和积累,以及中文语料数据集的收集和理解。所以从这个方面来说,大厂还是具备很多优势,足够大的数据和训练试错容错机会是很多创业公司不具备的。
/ i! [5 t. |5 Z* Q再次,随着大模型的应用和AI的普及,本质上解构的是生产关系。过去是人生产内容,现在变成了人训练机器,机器生产内容。随着AIGC (AI Generated Content)的兴起,利用AI生成内容,被认为是继PGC、UGC之后的新型内容创作方式。无论是什么规模的公司,如果不进行变革性的重组,都将很难适应这个新时代。4 l& g& A- a& s/ u! J2 Z7 u
从这个角度来说,要进行内部人和生产关系的调整,可能对大厂的挑战更大,船大难掉头,但对于中小规模的科技公司和创业公司来说,则可以在初期就解决掉这些问题。可以用更轻盈的姿态迎接新技术革命。
' a! b. ]) z; K2 C. P* ~6 ?03! [1 X M; J% `% F' O) E
大模型混战
. @1 B) u. }' a% c能否开启下个“互联网20年”! I' K8 v* u- H E! O
综合目前的情况来看,AI技术被普遍认为是带来新一轮工业革命的基础。就像20年前,互联网大爆发的时代一样,参与者们希望抓住这次的技术革新,占据时代的红利。
2 U* `1 i- l6 u; v' g+ a* f& x8 @3 H% j为什么说,Chat GPT引发的大模型混战,和20年前互联网时代相似?本质上来说,Open AI的出现,就和1998年的互联网开端一样,被很多人认为是一个革命性的开端。3 _5 a7 h- L) J+ Y& A- p2 y8 ^
从客观上看,因为他们都具备相似的时代背景,20年前的互联网,得益于通信、数据传输网络的迅猛发展,10年前,随着智能手机的普及,上网费用的进一步降低,进入移动互联网黄金十年。而当前阶段,得益于云计算的普及,通信网络、基站等基础设施的完善,国内的AI技术也已经孕育了多年,所以趁着Chat GPT的热度,大模型的爆火也顺应了时代的节奏。 v* E5 |0 J4 |! k) z# K8 l
从主观上看,近两年,随着互联网发展进入瓶颈期,产业陷入低迷状态,所以无论是市场的呼唤还是用户的情绪,都期待一种具备革新能力的事物出现。" y: y& B6 b, x) Q5 ]' Y* ?, }5 C
但如今情况和20年前互联网时代又有所不同。- j: R' [, M6 t% ]
8 s: i1 t- m% P% e; p3 d, a1 t! [, m( m6 u
20年前的互联网时代经历了门户时代,电子商务时代,移动互联网时代,网络游戏等不同的细分时代,每个阶段都有领军企业推动产业进步。此外,在互联网时代快速发展的过程中,无论是做门户,电子商务,服务还是游戏,逻辑都是立足于基础设施的建设、技术保障、和应用场景进行APP开发。7 x1 C7 W G; c, @4 c0 y( ~
而大模型的状态是,依然处于探索期,无论是安全性还是应用场景上,都在迷茫阶段。连OpenAI公司CEO山姆·阿尔特曼(Sam Altman)都说:“我们完成对GPT-4的训练后,花了6个多月的时间,研究大模型的安全性…”他还表示,“现在并未训练GPT-5,在短期内也不会训练。”* `* a) }, }* J/ z
所有人都必须要承认的是,由于Open AI这个技术太新,应用场景还不明确,目前仅仅停留在AI生成内容,聊天,此外美国也没有成功的经验可以供我们完全复制,所以在这个赛道上,似乎所有人都站到了差不多的起点上,都在摸着石头过河。
3 F5 h, m, R U; V" `: N正如APUS创始人李涛所言,当下的大模型玩家,很多技术路线都不明确,行业依然处于早期状态,甚至可以称为“AI的公元前”,这种情况之下,对于很多创新公司而言,反而是最大的机会。“新的场景和新的物种,每一次新技术浪潮到来时,一定会出现新的企业,新物种淘汰掉旧物种,这几乎不可能是一种传承和继承的过程。”
1 J) v3 e& J6 _# G! |/ f但谁能真正拿到通往下个二十年的船票?目前没有人能给出定论。! e; g4 Q y: |% ^/ _+ T
本文为零态 LT 原创,未经允许请勿转载2 J6 t$ N: S1 S+ u' V
爆料、转载、商务合作
b# |- W0 t' h5 G( U关注零态视频号 离商业更近一步! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|