京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 185|回复: 0

追赶 ChatGPT,我们的差距在哪里?

[复制链接]

1599

主题

702

回帖

6941

积分

论坛元老

积分
6941
发表于 2023-4-3 14:55:39 | 显示全部楼层 |阅读模式 来自 江苏常州

2 ~0 }0 x- j! {) O$ L2 L" A; L) `- [$ p9 V4 S( D1 g3 r
图片来源 @视觉中国
( [% T$ N! f/ X; o+ p# W% t6 n% ?文 | 元宇宙日爆
/ S) D2 m* G) c. o( I又一家中国互联网巨头在追赶 ChatGPT 了。
; w$ l' _4 p3 {) O3 月底举行的博鳌亚洲论坛上,腾讯集团高级执行副总裁汤道生披露,腾讯正在研发 AIGC 以及大模型相关技术,类 ChatGPT 的对话机器人也在酝酿中。
3 n/ l. p( q8 U6 B& [' K$ B百度、华为,如今再加上腾讯,ChatGPT 出现之后,中国的互联网科技企业似乎一夜觉醒。不光公司,还有资本及创业大佬。: G3 x9 ?! Q3 f" Y; B, }
3 月 19 日,创新工场董事长兼 CEO 李开复在朋友圈高调宣布,正在亲自筹组中文版 ChatGPT 公司 "Project AI 2.0"。重燃创业野心的也不止李开复,美团王慧文、阿里贾扬清、搜狗王小川、京东周伯文均亲自下场,赶赴大模型赛道。8 `- s4 q! Y% ]. U9 G2 v
" 大佬攒局 " 往往是赛道火热的信号,仅今年前三个月,上万家新注册的公司在经营范围中写上了人工智能。企业如雨后春笋般涌现,人才紧俏起来。应了周鸿祎那句话:一人捅破窗户纸,千军万马独木桥。; {9 A/ w5 I  q$ ?% G0 H. R4 E+ ?
这一次不光是资本生意,还有需求催生。在人工智能上,以 OpenAI 为代表的抢跑选手引领自然语言大模型风潮,从产品上甩开中企老远,而中国还没有合格的 ChatGPT 满足各行各业对 AIGC 的体验。
4 Y! E6 T( p/ J" v腾讯们、李开复们现在做大模型还来得及吗?投入 10 年的李彦宏说,应用更靠谱。但真正稀缺的,仍然是底层基础设施。
! ^' ]3 W; k' k) w9 R( k5 I. h互联网大佬带头组队
9 p2 j& w4 d, i作为目前全球最火的自然语言大模型产品,ChatGPT 至今不对中国用户开放,背后的算法、芯片、数据更是全部被控制在美国公司手中。国产 ChatGPT 进入需求井喷期,一大批中国公司赶来,有互联网大厂,有资本大佬,也有创业公司,谁都不想错过这一次的 AI 革命。% ]9 Y, @3 h( B9 `- d, m6 `4 J& P
3 月 19 日,创新工场董事长兼 CEO 李开复在朋友圈宣布,成立 Project AI 2.0 公司," 不仅仅要做中文版 ChatGPT," 他这个公司定位为 AI 2.0 全新平台和 AI-first 生产力应用的 " 世界级公司 ",野心颇大。2 J; f) [+ f5 @( B4 O" l
一个月前,美团联创王慧文在朋友圈发 " 英雄帖 ",出资 5000 万美元,要创立新公司打造中国版 OpenAI。此外,阿里巴巴 " 框架大神 " 贾扬清、搜狗前任 CEO 王小川、京东曾经的 AI 掌门人周伯文都表明了同样的意愿。
- ~1 S/ o3 s- i1 ?9 s+ e! |  K互联网大佬蜂拥入局,中国企业重燃热情,包括创业企业和上市公司。9 Q( [' D9 }0 S. r' x
企查查数据显示,近三个月共有 108601 家新注册业企业在经营范畴中标注了人工智能,同比增长超 24%。《元宇宙日爆》统计,截至今年 3 月,已有 20 家上市公司布局了 AIGC 相关应用,涉及世纪虚拟人、AI 写作、AI 视频、AI 绘画、AI 营销等。
0 e0 I! H% H( ?+ w
, o; i, s- d% O: g0 U8 G% V3 A6 J- M' r: i. G

2 l  Z' W6 ]7 z; ^$ c8 b; m国内上市公司 AIGC 相关布局
+ B1 R; ^0 A  Z3 d) v" h8 bAIGC 创业公司千帆竞发,涉及领域包括上游的底层框架与工具、中游的行业服务、下游的包括文字、图像、视频、音频、游戏等应用场景,创业方向也从 C 端的娱乐游戏拓宽至工业、金融、医疗、教育等 2B 领域。不同应用场景已出现了一批代表性的玩家。
% X- X7 ^' N' @- S+ o3 p9 c3 k4 ^
: k( E( k5 W3 a* T! H9 [# [& L
0 {& u3 t- X$ }6 S% z' I9 K, {
9 s+ W+ B1 g" S5 s5 [4 Q国内创业公司 AIGC 相关布局7 E& P0 A" d* F! s
而在底层大模型上,中国互联网科技巨头的动作则最受瞩目,包括百度、华为、腾讯在内大厂均有自然语言大模型布局。
, o" d. F1 e+ A7 I3 月 16 日,百度履行承诺,发布基于文心大模型的生成式 AI 产品文心一言,27 日又面对企业发布了智能云 AI 底座文心千帆。4 X5 ]8 i4 f# t1 d# G* f
3 月 27 日,华为云官网显示,旗下的盘古系列 AI 大模型即将上线,涉及 NLP(自然语言)大模型、CV ( 计算机视觉 ) 大模型和科学计算大模型(气象大模型)。
% j! R4 G, g' ^% Z9 P% Z3 月 30 日,腾讯集团高级执行副总裁汤道生披露,腾讯正在研发 AIGC 以及大模型相关技术,并向澎湃新闻表示,正在研发类 ChatGPT 的对话机器人,对于腾讯的聊天机器人是集成到 QQ、微信,还是通过腾讯云向 B 端用户服务,汤道生说:" 都会有。"' N: j* s% x% j' _9 m
国内 AI" 三算 " 与海外存差距6 l8 `! `+ Y6 D# H
人工智能在当下的中国展现出全面开花的热闹。而资金雄厚、人才济济的大厂被视作最能与 OpenAI 比肩的选手。但最早发布产品的百度,其文心一言在文本、代码生成上尚不及 ChatGPT 的体验,图片生成的效果则被 Midjourney 拉开了距离。
# C3 j; j6 d6 W6 W赛道火热,产品不佳。中国的人工智能发展进入至暗时刻。缺的不仅是有实力的大模型,还有与之直接相关的人才和 AI" 三算 ",即算力、算法、算据。
2 t  u# r% p- s7 R先是业内曝出,百度文心大模型团队内的研发人员近期受到了其他公司的疯狂追捧,有 3 年左右相关经验的员工,可以直接给到原先年薪的两倍。而有涉及海内外人才市场的猎头称,诸多互联网大厂的第一诉求就是想找 OpenAI 项目里的华人。猎聘大数据研究院的统计数据也显示,近一年,AIGC 相关新发岗位同比增长了 42.5%。
% `6 s4 d% |) |1 r) N8 }抢人大战不仅在国内上演。0 t) c& K  v' Q" a, g
由于一大批硅谷 AI 大牛排着队挤进 OpenAI,谷歌一度遭遇 AI 人才流出。据外媒体统计,近几个月 OpenAI 已经雇用了超过 12 名谷歌的 AI 人才。4 K1 C3 p8 X1 `% y
但从公开消息看,到目前为止,还没有哪位 OpenAI 背景的华人专家流入中国大厂。
5 c- T' T; o3 j/ e! |) ZAI 人才紧俏,以芯片为核心硬件基础的算力一直被视为 " 卡脖子 " 的状态,而国产大模型的算据也与 GPT-4 存在肉眼可见的差距,预训练等大模型算法的距离直接以 " 肉眼可见 " 的产品拉胯摆在了用户面前。- [4 X; S- z, a. u: j7 r7 ^+ I
在算据上,国产大模型也与 GPT-4 存在差距。; i8 i; z: X3 ~; A7 i3 F" o4 d1 r
在自然语言大模型中,参数是衡量一个深度学习模型复杂度和能力的重要指标。参数多,意味着模型能够处理更多的数据,学习更多的知识。国外有研究人员将 GPT 参数规模与大脑神经元做类比,GPT-3 的规模与刺猬大脑类似,GPT-4 拥有 100 万亿个参数,基本达到人类大脑的规模。
8 n* f- h4 V. n7 h& A) p/ }) ?0 |8 N1 \# C9 i2 c9 a* ?
: J" c* p6 N* @3 I

: `: X# U4 B/ n3 C9 _! M2 l* O大模型参数对比
; E. b! L0 E1 a& y+ w再看国产大模型,即使是排名靠前的 M6 大模型,其参数规模也仍与 GPT-4 相差一个数量级,更多的大模型仍在 " 原始阶段 "。
3 ^# B5 Z) I/ D( k4 yGPT-4 百万亿的参数需要强大的算力来完成训练。算力,同样是 AI 的核心竞争要素,核心的核心是芯片。  ]6 c* B) F$ u( l% K& m
在 AI 芯片竞争方面,英伟达处于垄断地位,该公司推出的 A100 与 H100 是目前性能最强的数据中心专用 GPU,市面上几乎没有可替代的方案。ChatGPT 的训练用的正是英伟达顶配版 A100。1 F) [5 t3 A* [% d, c1 l! U
然而,在中美竞争下,A100 与 H100 已被限制出口中国,中国厂商只能用阉割版 A800 芯片,数据传输速度被降低了 30%,影响着 AI 集群的训练速度和效果。而国产优质芯片,虽能够为预训练大模型提供算力支撑,但仍存在明显差距。
0 M& g0 |" ?9 }& }( q2 y7 S4 G
; |; M6 S9 D* n6 G0 M4 x0 M# T1 _- [+ l# d- V& C

1 M$ A, l' ]: o/ F& r' o芯片性能对比
& E/ R9 {7 W2 z/ l% V$ i以 OpenAI 为例,该公司使用了数万块英伟达 A100 进行海量数据训练和推理。如果以 1 万枚英伟达 A800 GPU 为标准,仅 GPU 采购成本就超 10 亿美元。
; O, u. Y: t! C6 l如此现状下,国内的大模型研发机构面临两种选择," 烧钱 " 购买更多的芯片,等待国产芯片的算力突破。但现在的竞争态势下,等已经等不起了。
8 m6 n2 R) e+ T. ~; e0 I高昂的前期投入成本绝非普通创业公司可以负担,还要具备绝对顶尖的研发技术。很显然,AI 大模型仍是巨头的游戏。但掌握先发优势的 OpenAI 以 " 日更 " 速度向前跃进,互联网巨头与资本面临着一场 " 烧钱 " 硬仗。
. C. ~1 Z+ P/ X8 R8 {& J. kOpenAI 抢跑,中企如何赶超?3 \$ R& \2 d% ^. D: \
回顾 ChatGPT 的迭代,OpenAI 至少进行了三次技术路线的 " 自我革命 "。
7 b% C$ C1 M7 `* d  K从 2018 年 GPT-1 的推出到今年的 GPT-4,OpenAI 用了近 5 年。而百度在自然语言大模型的研发上用了 10 年。
7 ~* [' A. r9 S; \& t  e连李彦宏也认为,中国基本不会再出现一个 OpenAI," 没有必要再重新发明一遍轮子 ",在他看来," 大模型时代,最大的创业机会在应用," 他的判断基于上一次的移动互联网变革," 操作系统其实没几个,最成功的是微信、抖音、淘宝这些应用。" 他指出,未来 10 年,应用领域可能诞生 10 倍价值的机会。7 q& o- T9 ~& R# u
周鸿祎也在公开场所表示,目前中国发展 GPT 技术,首先要占据应用场景,同步全力发展核心算法技术。为什么要同步?如果等算法赶上 GPT-4 再上马,市场就错过了。
8 v% n6 W' q8 C0 |1 i, B" {另辟赛道,在现有大模型的基础上创新产品应用可能是大部分企业的超车机会。
5 c: X: f0 P( m. h就像移动互联网时代,尽管中国没有自己的操作系统,但仍有 Tiktok 这样的超级应用在海外市场杀出一片天。应用先行的优势是能快速的将 AI 生产力转化为商业价值,这是在移动互联网时代中国互联网企业探索出的超车捷径,也是在激烈的 AI 竞争中,大部分中企们赶超 ChatGPT 最经济、最现实的路径。
6 q$ z7 V1 A0 J+ n( A6 M6 b但由于 GPT-3 之后,OpenAI 的所有模型就没有再开源,GPT-4 的运行机制是什么,国内企业仍无从得知。; G' B( E4 C4 {) Y
面对竞争对手全面的科技封锁,中国人工智能想要长期发展就不能没有 " 根 "。旷视科技 CEO 印奇认为,中国攻坚 AI 大模型目前最重要的是要先能把 GPT-3.5 复现出来," 这是所有事情的起点 "。4 X* n# \7 S+ R, S, a1 }) w: ]
无论如何,发展好自身的硬实力,不在关键技术上被 " 卡脖子 ",将是 AI 时代下中企们无法逃避的 " 必修课 "。
" J  r' ^8 J0 R' s6 c针对国产 AI 大模型,周鸿祎指出:" 发展大语言模型,别人已经指明了技术路线,剩下的就是长期主义指导下的时间问题," 他认为," 中国有能力发展自己的 GPT,差距大概 2 年。"8 a4 [0 m6 |7 g6 f; s( p
百度有文心大模型,阿里有 M6,华为的盘古大模型箭在弦上,腾讯的混元大模型也在不断迭代。当李开复、王慧文等一众互联网大佬也亲赴大模型战场时,底层的重要价值已经不言而喻了。
' L9 F$ c8 o! o# v就像《三体》故事里的明喻一般," 基础科学 " 一旦被 " 智子 " 锁死,人类便永远失去探索宇宙真相的机会。底层大模型就是那个基础科学,在人工智能上,中国想要超越,不光需要资本、巨头,更需要的是能顶得住研发压力的 " 面壁人 "。7 A; Y! P8 g6 S5 y: I
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-8-19 20:17 , Processed in 0.040311 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表