|
|
- U% i, I& T# R7 t8 l" N+ ^8 b, w j B
- _6 Y6 V, Y& C: c% T7 m, P
撰文 | 张 宇
9 O1 v& C* R2 A6 x4 H( h/ q编辑 | 杨博丞
3 J7 {& k2 Y. x0 z1 d2 _题图 | IC Photo
. l! M: o" B/ v. A4 i2022 年 11 月,OpenAI 推出的新型 AI 聊天机器人工具 ChatGPT 在一夜之间火爆全球互联网,引来了无数人的关注,上线仅两个月,ChatGPT 的月活跃用户数就已突破了 1 亿,成为历史上增长最快的消费者应用程序。而截至 2023 年 4 月,ChatGPT 的全球访问量再创新高,达到 17.6 亿次,仅次于谷歌、百度等搜索引擎。6 R" M8 q5 y; }/ f/ M" z) I. I6 Y- c
! C/ ^7 q4 G* m) {( S$ ^2 H; _
6 Q9 ]1 |4 s& ~. m4 D8 g2 ~* K
: D1 H1 a: `# w% U. Y2 @$ I* ^% s面对强势崛起的 ChatGPT," 国产 ChatGPT" 如临大敌,疯狂涌入大模型赛道。据不完全统计,目前国内已有超过 40 家企业、机构发布了大模型产品或公布了大模型计划,其中不乏百度、阿里巴巴、京东、华为等各个领域的头部企业。
# j5 | A: m( d% \大模型是指具有巨量参数数量的人工神经网络模型,通常需要在大规模数据集上进行训练,并且需要使用大量的计算资源进行优化和调整,主要用于解决复杂的自然语言处理、计算机视觉和语音识别等任务。简而言之,大模型是 ChatGPT 及类 ChatGPT 产品的底层基础设施。6 S/ V3 l: T+ l7 h0 \" Z1 B1 T3 Z
入局大模型赛道已势在必行,在 ChatGPT 的诞生地美国,已有行业受到了 ChatGPT 的严重冲击。根据网络流量数据网站 SimilarWeb 的调研报告,2023 年 3 月,GPT-4、New Bing 等产品陆续上线后,美国在线教育公司 Chegg 网站转化访问量同比暴跌 89%。与此同时,Chegg 还面临着经营业绩下滑、股价腰斩等不利情况。2 }! u& g& j/ y5 ^ y7 V
而对于中国企业而言,在 ChatGPT 的冲击正式到来之前,布局大模型业务已经从一道选择题变成了必答题。随着越来越多的企业入局其中,大模型之战已经悄然打响。, R/ B* D0 O5 j3 ^
01.
: r6 m7 @- X/ ?& |2 D3 x( k! `
" n* [9 W) l" n9 `5 Y# D" 国产 ChatGPT" 百花齐放5 v# j5 r6 u6 d: n, Y4 _ d
国内大模型行业正进入 " 白热化 " 竞争状态。
c: O7 t5 B8 W, @& f) h: N百度打响了国内大模型竞赛的第一枪。3 月 16 日,被称为中国版 ChatGPT 的 " 文心一言 " 正式发布,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
9 Q7 j. D2 |; X8 j* ?! C" z6 [: G; h: H7 i) O# c v# P- }- K5 o- N" |
% J9 }& M, D9 P% n, W4 O0 [% w" E7 P! t1 T J! i& p
紧接着, 在 3 月 27 日,百度又正式推出了 " 文心千帆 " 大模型平台。文心千帆大模型平台整合了百度全套文心大模型、相应的开发工具链,未来还将支持第三方的开源大模型。
! M5 I% e' w5 t5 T O; Z同样跑步入局的还有阿里巴巴。4 月 11 日,在 2023 阿里云峰会上,阿里巴巴正式推出大模型 " 通义千问 "。" \. I% b/ {2 H D) w
通义千问是国内第二款类 ChatGPT 产品,基于统一学习范式 OFA 等底层技术打造,具备了能搞定多种任务的能力:不引入新增结构,单一模型即可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等 10 余项单模态和跨模态任务。升级后,更是可以处理超过包括语音和动作在内的 30 多种跨模态任务。+ ~4 U, Q% A) U X* L
战况大有愈演愈烈之势。同样在 4 月,360 集团推出了基于 360GPT 大模型开发的人工智能产品矩阵 "360 智脑 " 落地搜索场景;昆仑万维宣布联合奇点智源研发 " 天工 3.5" 国产大语言模型,定位为 " 中国第一个真正实现智能涌现 " 的大模型产品,具备智能问答、聊天互动、文本生成等多种应用功能以及丰富的科学、技术、文化、艺术和历史知识储备;商汤科技也发布了自研大模型系统 " 日日新 SenseNova",内含 AI 数字人视频生成平台 " 如影 ",3D 内容生成平台 " 琼宇 " 和 " 格物 ",类 ChatGPT 产品 "SenseChat" 等产品。
( M' T$ V4 k- l( X0 J. t进入 5 月以来,大模型领域的战火进一步蔓延,多个大模型产品陆续面世。
% A2 {0 G3 J$ a/ y9 }
0 {5 R# j- K3 p1 Q4 f6 t2 N- J! p v3 m# r, \+ \
, ]5 J$ \, a" O( S T+ I
5 月 5 日,网易有道发布了基于 " 子曰 " 大模型开发的 AI 口语老师剧透视频,介绍其基于教育场景的类 ChatGPT 产品布局;5 月 6 日,科大讯飞发布认知大模型 " 讯飞星火 ",并预计 2023 年内还会进行三次升级,分批次增强数学能力、补足代码能力,全面对标 ChatGPT;同一天,淘云科技发布了阿尔法蛋儿童认知大模型,为孩子在练表达、塑情商、启创造、助学习等方面带来全新交互体验。
/ O3 Z! H* V- x0 u* |7 Y除此之外,腾讯、华为、京东、字节跳动、小米等也均已推出了大模型产品。: L8 @6 y9 J! Q4 ?* T4 i
在国际上,大模型的战况同样激烈且焦灼。, @7 `( A7 ^; }3 n
4 月 13 日,亚马逊云科技发布多款 AI 产品,其中包括 AI 大模型服务 Amazon Bedrock、人工智能计算实例 Amazon EC2 Trn1n 和 Amazon EC2 Inf2、自研 " 泰坦 "(Titan)AI 大模型等;4 月 17 日,特斯拉 CEO 埃隆 · 马斯克表示即将推出 OpenAI 的竞争对手 TruthGPT,在此之前,其已成立了一家名为 X.AI 的新人工智能公司;5 月 11 日,谷歌在 I/O 开发者大会上推出新一代大模型,对 180 个国家和地区开放聊天机器人 Bard,发布对标 Office 全家桶的 Workspace,在安卓系统中也增加了相关功能。& K6 p9 W" f' p3 g4 y, }* Z
不过,尽管参与者众多,但截至目前,大模型产品距离真正实现落地还相差甚远。, w, x, f7 ?5 z; Z3 f
02.; Q$ q, G3 ] s% P' ?5 ~
商业化高墙难越" [ f: q" n+ P" |& B3 G, P {
大模型赛道的想象空间巨大。根据市场研究机构 MarketsandMarkets 的报告数据,全球生成式人工智能市场规模预计将从 2023 年的 113 亿美元增长到 2028 年的 518 亿美元,预测期内复合年增长率为 35.6%。由于云存储的创新使数据易于访问,以及人工智能和深度学习的发展,预计生成式人工智能市场在预测期内将以显著的速度增长。, s; |( D% ~) P7 I' O
但不容忽视的是,现阶段运行大模型仍然十分烧钱。: V7 ?9 _3 y/ i6 T# R" F/ g, u; k
英伟达披露的信息显示,训练一次 1750 亿参数的 GPT-3 需要 34 天、使用 1024 张 A100 GPU 芯片,同时,OpenAI 可能至少需要 3.24 万张 A100 用于日常推理,显著高于此前训练底层模型时的用量,由此推算,ChatGPT 硬件成本达 8 亿美元以上。
7 V. x4 j! n( {4 r近期,OpenAI 被爆出去年亏损额翻倍,达到 5.4 亿美元左右,资金主要用于支撑 ChatGPT 的运行等。OpenAI CEO 山姆 · 阿尔特曼更是坦言,OpenAI 可能需要在未来几年尝试筹集多达 1000 亿美元的资金,用来开发足够先进的通用 AI,同时维持公司的正常运转。
2 s8 Z: C/ S2 L1 U! [$ A7 d. l# {4 ?) v! X' Z
2 @/ Y* y4 ^. d# K6 q, }- D; w
1 w2 I& f- Z: ?$ m( {在大模型行业,企业疯狂烧钱已是常态。国盛证券在研报中指出,通过测算,2800 亿参数量的大模型预训练成本约为 200 万美元 / 次,谷歌的 PaLM 号称拥有 5400 亿参数,单次预训练成本将高达 1200 万美元。8 J w, h- D! m2 y
大模型一边陷入到烧钱泥潭中无法自拔,一边还面临商业化难以落地的困境。
3 I! t, S$ a8 J/ @' i. z以 OpenAI 为例,ChatGPT 迅速走红后,其商业模式主要分为两个部分,即 C 端推出订阅制会员和 B 端提供调用 API 接口。
; u6 W% f% h; f" @具体而言,针对 C 端市场,OpenAI 推出 ChatGPT Plus 订阅计划,每月收费 20 美元,相较于免费版本,即便在高峰时段用户也能正常访问 ChatGPT,响应时间更快,并且可以优先使用新功能等。而针对 B 端市场,OpenAI 发布了 ChatGPT API,开发者可以将 ChatGPT 集成到产品中,以更加高效地发挥出价值。% j6 s6 o4 e: s; K4 ~
不过,目前 ChatGPT 的商业化收效甚微,短期内难以覆盖预训练成本,但 ChatGPT 潜在的商业化能力已让不少企业感受到压力。谷歌 CEO 桑达尔 · 皮查伊认为,谷歌的主要搜索业务可能首次面临严重威胁,因此其召开会议重新定义 AI 战略,并计划在年内发布 20 款支持 AI 的新产品。" Y) H% x9 j4 N! Z) @
目前,OpenAI 还在探索商业化道路,其预计 2023 年收入为 2 亿美元,2024 年收入或超过 10 亿美元,但并没有给出明确的盈利时间。
5 J6 b1 B3 i; d一位 AI 行业人士向 DoNews(ID:ilovedonews)表示,除了 OpenAI 的探索方向外,业内在讨论的商业化方向主要针对 B 端,包括聚焦并进入垂直领域,如医疗、教育、金融等,以及促进 ChatGPT 云端化,打造云端 ChatGPT 模型与工具集。
! Y2 ^8 E2 K3 H虽然商业化高墙难越,但投资机构仍然十分看好大模型的商业化前景,比如红杉资本预测,ChatGPT 这类生成式人工智能工具,让机器开始大规模涉足知识类和创造性工作,这涉及数十亿人的工作,未来预计能够产生数万亿美元的经济价值。
' X* b. }5 R( d E03.
j2 s' s2 N1 k: a' E3 k
- m9 e( H. S# y4 |: {5 Y " 国产 ChatGPT" 何去何从* t& @4 T5 S% ]8 H/ H! b3 D
ChatGPT 爆火的同时,争议也不断涌现。2 @7 I6 S8 I! `: m& `7 ~. }3 |
美国率先宣布 " 封杀 "ChatGPT。3 月 30 日,美国科技伦理组织 " 人工智能与数字政策中心 "(CAIDP)要求美国联邦贸易委员会(FTC)禁止 OpenAI 发布新的商业版 GPT-4,理由是 GPT-4 存在偏见和欺骗性,对隐私和公共安全构成了风险。
7 n( }. f4 A0 E2 F( O8 }+ S- b美国参议院司法委员会下属的隐私、技术和法律小组委员会发布声明称,将于 5 月 16 日围绕 AI 在各个领域的普及,可能需要哪些法律来保障普通人的利益展开探讨。届时,山姆 · 阿尔特曼将首次在美国国会作证,这被外界解读为美国对 AI 监管的进一步升级。
9 @4 g! Y6 G) M6 z2 T) S: p* s" R9 [+ m2 _6 l7 n
9 b9 q: l L+ ~3 u, A% ^; a7 Y6 s3 Q. L& o2 g2 ~
其实不只美国,在全球各领域头部企业对大模型业务的追逐下,已经有越来越多国家加入监管行列。3 m# R; `) [# O8 |: v* {: h
除美国外,意大利、西班牙、德国等均对大模型发展密切关注,其中,意大利一度禁止 OpenAI 在意大利境内开展业务,相关监管机构认为,ChatGPT 及其母公司 OpenAI 违反了《欧洲通用数据保护条例》中的部分规定。
+ ]" m3 w) h0 B$ h' I S# ^1 F与此同时,国家网信办也发布了《生成式人工智能服务管理办法(征求意见稿)》,明确了生成式人工智能的定义,以及相关产品和服务提供者的合规义务,对生成式人工智能进行专项监管。
; \- C6 a0 z2 h! v" L/ A! S在监管趋严之下," 国产 ChatGPT" 应该何去何从?在征求意见稿中,明确规定 " 国产 ChatGPT" 需注重数据隐私安全,不能非法获取、披露、利用个人信息和隐私、商业秘密,不可侵犯知识产权;" 国产 ChatGPT" 生成的内容应当体现社会主义核心价值观,不能生成歧视性的内容等等。, f6 a( L+ Q) \; Q
值得一提的是,各国监管趋严并非意在制约大模型行业发展,而是要在合规框架下可控发展,对于 " 国产 ChatGPT" 而言,加强监管、净化行业环境、驱逐不良玩家可能会带来发展上的限制,但对行业的长期发展却大有裨益。如何合规发展,已成为 " 国产 ChatGPT" 的长期命题。/ I$ O9 b8 [, {* h7 T! @' K
7 S9 _4 O9 m, w% P% A
, L2 c9 y; B4 U; L9 j0 j
; z ?6 E. C/ B# o0 Q
\4 d' t5 ~5 k) h: C, [/ Y1 e- w; B9 H
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|