|
|
: |0 [; M, i4 i
新春佳节后,巨头们宣布类ChatGPT进展
! L0 m% }$ f0 M6 z" r( H3 M# P8 W 2月,微软宣布推出由ChatGPT支持的最新版本人工智能搜索引擎必应和Edge浏览器。2 k9 a, S- k- L( s! C- M) s
微软股价大涨4.2%,市值飙升800亿美元。3 R) v+ {+ M3 S/ @1 ]4 k
几乎同时,谷歌也将整合新的人工智能到搜索引擎中。
g( @) B% |9 V$ O 宣布人工智能对话式机器人Bard正在内测,并在未来几周内向大众提供服务。$ M" d3 L2 Y* N( p$ L7 b, g, `7 c; w
百度将于3月在中国推出类似ChatGPT的人工智能聊天机器人[文心一言]。 w. n3 {& Y9 D9 @! \0 y2 A
百度港股涨幅快速扩大,截至收盘大涨15.33%。
/ J5 H% e9 R* E& I% l; F4 R8 w5 D/ U 腾讯、阿里、华为也纷纷宣布正在申请人工智能人机对话专利。
! c& J, B& O, T/ p5 v8 K 360也于近期在互动平台上表示,计划尽快推出类ChatGPT技术的demo版产品。
7 J& }- ^+ c4 r ChatGPT的出现提升了自然语言处理能力的上限,打开了人工智能技术商业化落地且成为消费端爆款的大门,因此具有划时代的意义。
/ Z/ B7 r: `- q& c* }1 M# q ' ]! J" d. k0 q: f4 T- S
差异化战略,股价两重天
' y H; V+ k$ M. \* k6 [) n$ @! Z 2022年12月底,谷歌深感来自ChatGPT的压力,迅速抽调员工开展ChatGPT竞品产品的研究。0 G$ ], ^! _5 ~+ m2 \6 m
谷歌已向AI初创公司Anthropic投资了近4亿美元,Anthropic正在进行ChatGPT竞争产品的测试,这家公司成立于2021年,创始团队正是来自于ChatGPT的开发商OpenAI。
7 e- r' i$ O, g- } 谷歌宣布将推出名为Bard的AI聊天机器人,这款产品是基于对话应用语言模型(LaMDA)的实验性AI程序,目前已经开展测试,并在几周内向公众开放。/ A3 l" @ d) Q R# O' Q, ^6 H
6 Z) D; X& q+ D7 T- n0 w2 r" g
微软更是迅速响应,加快了相关应用的研发。
4 J5 Y8 q! F9 q, h% M+ U 近日,微软宣布将ChatGPT整合至全线产品中,并扩大与ChatGPT所有者OpenAI的深度合作。0 F5 X9 b7 c7 _( }/ M3 C7 @
推出由ChatGPT支持的,融入GPT-3.5语言技术的最新版本人工智能搜索引擎Bing(必应)和Edge浏览器。
# f3 s( O& y, D% ?( n! A 微软推出了集成ChatGPT技术的新版搜索引擎New Bing和浏览器Edge,这也成为微软在搜索引擎领域对抗谷歌的重要武器。5 b) _# }) I: Z# h& R" f
* v- _2 I8 @. H8 I# B; I
像谷歌和Meta这样的大公司肯定会有一定优势,因为他们拥有人力、技术和财力资源。$ ?# n3 ]; k+ `, p
因此,这些公司在市场上有足够的空间,这将是一场新的比赛,尤其是在深度和正确性方面。8 ]3 @+ S- t3 Q4 N0 g
相较之下,微软和亚马逊选择的应对策略是与OpenAI结盟,试图借其东风。
' D* q: D. O$ o6 G, n% u2 H7 P Bard作为对抗ChatGPT而推出的关键对标产品,可谓是备受关注。
; M5 w% V) @, i$ E2 z% r! { 按照谷歌的宣传,Bard是一项实验性对话式AI服务,由LaMDA提供支持,并运用到了谷歌的大型语言模型和网络信息构建。
{" m! N: A$ Y! m/ T$ a/ s7 G 可万万没想到,赶了个晚集的谷歌却在自己的发布会上翻车了。$ c( l4 y! H$ m5 }$ S3 g1 z T
发布会中展现的错误答案后,谷歌股价大跌7.68%,一夜之间市值缩水约7202亿元,是截止到目前AI犯过的最贵的错误。9 u0 s) X% f) X4 G& \
$ f' C2 d$ |3 O4 G! q2 } 出圈背后有AIGC的功劳
+ L7 Y6 m8 A! |+ d+ d2 { AIGC的核心变革,发生在内容层,位于数据层之上。4 S$ ]# S6 ?5 h7 g
AIGC在绘画和会话等方面突破的重要性,在人工智能领域相当于2016年,阿尔法狗战胜人类围棋冠军的价值。
, D" R" J& A1 Y C ChatGPT最大的意义是让人们看到了一个更加智能高效时代的轮廓。6 Z0 j4 R0 @4 _; _7 q" D$ N
ChatGP本身也是AI技术迭代到一定阶段后的产物。' H! d* [# d. y6 N3 ^
服务器+网络开启了人人上网的时代,而算力+算法将开启人人上算的时代。/ V! e( O% u8 M0 p
AI将以场景、应用、内容来创造用户的新需求。
) T% m$ l9 M# O/ \) M) j6 M AIGC技术主要涉及两个方面,自然语言处理(NLP)和AIGC生成算法,AIGC投资方向主要包括软硬件与数据集。
6 C7 {6 b9 ?: C/ u0 |5 z7 F 以ChatGPT为代表的大型语言模型(LLM)将会成为未来巨头争夺的重点。
) p. x4 D/ C6 j+ ` ChatGPT展示了巨大的应用潜力,完全不局限于创作文本或者图像。
9 o2 @7 B. q+ D) p 距离AIGC真正落地以及实际应用还有很远的路。3 ], G. R$ f4 l2 H# y& S
目前ChatGPT更像一个[玩具],还不是生产力工具。* Q/ k V$ r& e) T
西部证券则预测,AIGC或在2023年迎来发展大年,来到两年前自动驾驶的应用突破拐点。
' j7 V: [, @1 T5 N 6 Q m! v$ v5 V5 V' f7 S$ l
实现ChatGPT的最大亮点也是最大难点3 k& I1 Y5 k0 H0 q2 ?' R
ChatGPT需要把大模型尽量变成小模型或者稀疏模型,且大模型的训练和使用成本都很高。
2 S$ g5 s3 f/ S% ^' x* l 除了模型之外的另一个难点在于如何实现ChatGPT后半段的人工过程变成自动训练。5 A1 P% U: w6 o( W- {. N/ s
ChatGPT是在大模型的基础上,加入了很多人类反馈。这需要大量的人工,而这部分工作目前是至关重要的。
- ^ r% j8 c$ L2 _) f/ p5 n 截至目前,OpenAI已经总计获得超过110亿美元的融资,微软、谷歌风投、马斯克等均曾出手投资,而且其目前并未盈利。% D: ^: n7 z: F) p" U# q( p* R
如此巨额的投入恐怕今天的互联网巨头也只能望而却步。
2 d7 A4 z. _! y( F) `5 o8 { 但从另一个角度来说,这也给了创业型团队机会。通过不断深入挖掘某项技术,瞄准特定的细分赛道能够切到一块蛋糕。
/ V, R' Y) L/ g; @ 8 N- K. D; A1 _5 R+ U" V: j' ?
高算力带火芯片行业( t; d8 W5 y" X! N1 v, I2 z! n1 {
ChatGPT的注册用户便已经过亿,海量的用户访问曾多次导致ChatGPT官网因为访问数太多而宕机。1 W4 x% g2 G9 y$ s
这意味着,OpenAI要想保证用户体验,它就必须得加大算力的投入。
- P7 i5 e4 ?. w" ^6 E 而这就需要大量芯片的支持了,这无疑直接给本已快陷入沉寂的芯片市场注入了一剂猛药。
1 z5 J1 w9 a+ }$ A2 h* x5 X ChatGPT的总算力消耗约为3640PF-days,ChatGPT已导入了至少1万颗英伟达高端GPU。+ u" p3 j& d9 ^3 P/ o
而花旗集团预估,ChatGPT将可能促使英伟达相关产品在12个月内销售额达到30亿至110亿美元。( E9 C3 x5 y8 G3 d0 r' @7 }
ChatGPT的大火将促使算力需求大大增加,350瓦推理芯片会成为常态,技术上会推动大模型压缩到达一个新高潮,同时企业和个人的服务有许多可以基于类似技术构建。
8 \7 [) A7 s4 M3 o ?: u" w x 高性能计算芯片是一切AI的底层基础,目前AI芯片主要有通用GPU算力芯片和ASIC专用芯片两大类型。' N9 n! U; f3 ]% H3 p
或许在ChatGPT的帮助下,芯片行业将迎来新一轮的市场红利期。
0 B9 _) Q2 x6 A4 w3 N) w5 c4 d+ B , q5 A4 d% M R1 G' P
ChatGPT带来AI技术范式革新
: g+ j0 K6 \+ v* y( e- g6 ]; r 相比其他大模型,ChatGPT在AI的技术路线和训练方式上的变革,带来了业界意料之外的突破。* ^' k2 |3 }% {
ChatGPT有一个非常强大的技术底座,也就是InstructGPT模型。2 \3 O4 a" M R: y, U" B3 S
此前,GPT与BERT模型路线一直在竞争,2018年时BERT模型先赢了,但GPT模型参数和数据规模越做越大。' G/ v/ W2 C* q. @* A$ d5 n5 _( ]
最终结合人工反馈增强学习(RLHF),在ChatGPT上取得了重大突破,效果上反超了BERT模型路线。$ ?* U' |' L- i
ChatGPT引入了强化学习机制,在新版本上引入了人工标注的数据,通过人类的反馈,有针对性地进行优化。
0 ^$ q" f0 i( }1 Z% h 其中的难度在于,建立怎样的强化学习机制。过去业界也尝试了强化学习机制,但很多都不太成功,ChatGPT在这件事上取得了突破。
, n% M9 C9 ]0 ~ ChatGPT在数据质量和多样性上非常讲究。
, J4 }& o2 [. d ChatGPT强化学习的数据量并不大,但对数据多样性、标注体系都有精巧的设计,让数据发挥出了强大的作用。
( b0 l2 k& Q. J$ e+ c- k) X 5 o# Y: e+ z. F, b$ j$ f( F
成本导致国内与国外路线不同
4 I# \) _4 T+ ~1 G6 Y1 D ChatGPT的重点在于创造,通过大量的语料训练和强大的纠错能力,对素材进行消化、整理和再输出,这和过去国内关注的云计算或视觉技术是完全不同的思考方式。
3 F3 D* d, r9 R5 u0 u3 l 而导致上述分别的原因也很直接,那就是成本。; q& Z7 }# E3 D
ChatGPT背后有着海量的资料库和庞大的算力做支撑,变现方式目前来看却只有向企业提供服务,替代部分人工作业这一种。
4 X, o) F* b* ~ 对于产品化而言,即使再将成本下降10倍,这个商业模式也是无法成立的,因为这个成本与人类相比没有优势。
7 V2 z" ^) b% \ o
6 U, o Y' y& t. ~6 V) f( ? 背后的支撑是人工智能大模型
% v- u3 |7 ^0 E8 T# v" |+ O E 当前的人工智能大多是针对特定的场景应用进行训练,生成的模型难以迁移到其他应用, 属于[小模型]的范畴。; B! O" o' E0 v
整个过程不仅需要大量的手工调参,还需要给机器喂养海量的标注数据,这拉低了人工智能的研发效率,且成本较高。3 o) n5 w, @- ?
[大模型]通常是在无标注的大数据集上,采用自监督学习的方法进行训练。
( {2 d K+ T3 ~: r: F 在其他场景的应用中,开发者只需要对模型进行微调,就可以满足新应用场景的需要。& i# q. a) i- z: `% X9 [
这意味着,对大模型的改进可以让所有的下游小模型受益,大幅提升人工智能的适用场景和研发效率。
/ k* P$ A/ _6 X 因此大模型成为业界重点投入的方向,Open AI、谷歌、脸书、微软, 国内的百度、阿里、腾讯、华为和智源研究院等纷纷推出超大模型。$ B k6 s4 B' ^, @, U9 O2 |, f: z
特别是OpenAI GPT 3大模型在翻译、问答、内容生成等领域的不俗表现,让业界看到了达成通用人工智能的希望。
0 [: W" a6 l t- j5 J4 o 当前ChatGPT的版本为GPT 3.5,是在GPT3之上的调优,能力进一步增强。2 K; h$ t3 j7 J
业界普遍预测,GPT4将在今年推出,并具备更强大的通用能力。4 H' N& E( s0 K% s+ s
: k) S( D9 l" e N: r' ^/ J; X0 Q ChatGPT的产业未来与投资机会
3 G7 y& V; ~8 G# h1 j ChatGPT模型的出现对于文字/语音模态的 AIGC 应用具有重要意义,会对AI产业上下游产生重大影响。
6 ?# @/ n4 a1 y W$ P5 q 从下游相关受益应用来看,包括但不限于无代码编程、小说生成、对话类搜索引擎、语音陪伴、语音工作助手、对话虚拟人、人工智能客服、机器翻译、芯片设计等。
6 d4 ^4 }* H& T1 I/ E. @8 X 从上游增加需求来看,包括算力芯片、数据标注、自然语言处理(NLP)等。
5 o/ Z4 H* m/ k: F 随着算法技术和算力技术的不断进步,ChatGPT也会进一步走向更先进功能更强的版本,在越来越多的领域进行应用,为人类生成更多更美好的对话和内容。
6 z p) p' j% ?7 p, u& d- A) y ) s( w: @& M! g9 \# K3 h a3 U
核心技术之一是Transformer
6 F: T% l; t& l, r' } Transformer技术是近几年人工智能技术最大的亮点之一。; V& C" |+ R: J) E7 k! _' b+ L8 n
谷歌于2017年提出的一种采用注意力机制的深度学习模型,可以按输入数据各部分重要性的不同,而分配不同的权重。4 e- }% j0 P; K3 o2 e& b5 ~: R/ y$ W" r
Transformer的精度和性能上都要优于之前流行的CNN(卷积神经网络)、RNN(循环神经网络)等模型。
* J( W8 [" [* ^5 \9 A/ l 大幅提升了模型训练的效果,让人工智能得以在更大模型、更多数据、更强算力的基础上进一步增强能力。
5 f% l; x! n) a) s8 \; e5 `$ G- N 目前人工智能已经找到解决方案的问题,也只是可计算问题的一小部分。9 a6 [2 n2 d7 L8 l( L
2 o! r3 w- J7 e6 H" N" j 如果说传统的机器学习或人工智能是在水下一米的深处探索,那么深度学习的出现将人们带到了一百米的深水区;
! a( i5 s D8 |3 y6 l 而在Transformer、GPT等架构后,从业者们直接能抵达深度超过万米的马里亚纳海沟。
$ U6 | t9 @4 w' n7 P- P# l 过去5年中,大规模预训练语言模型受到业内越来越多的重视。$ a$ M$ u. k0 m, h4 k* O& u& R6 G
今天,全世界的人工智能研究有很多方向,也产生了大量的成果。. Q' @* n3 ?- w; k& t3 r
但是严格来说,所有这些最令人惊艳的结果, 90%以上是基于Transformer迭代来的这些大模型技术得到的。
+ u( F4 `* M, ]0 d* Y8 V 目前几乎所有的AI任务和项目,都会和大语言模型技术有关联,它已经代表了AI界最主流的科研和技术迭代方向。0 J. u; ^! @ o- x
未来,ChatGPT与更多的AI、云计算等信息技术的集成创新,将创造改变生产力曲线的工具,成为经济发展新动力。
2 D- Z7 c4 K5 w5 S
( w8 Q, g% T( Z7 i0 a. Z' F$ m1 \ 结尾:
" |5 V8 R, r6 ^/ \! ]# ? ChatGPT勾起人们对步入强人工智能时代的联想,即人工智能具有自己的意向性来设定目标。$ O& q/ X8 a3 b; D8 [
虽然强人工智能本身还存在诸多争论,但是分析人士普遍认可,人工智能的发展大年与信息时代新阶段将至。
% o. Y6 \) k5 d( ] d3 g2 B: V 部分资料参考:新京报:《人工智能大变局:科技巨头迎来ChatGPT“冲击波”》,猎云精选:《巨头混战ChatGPT,新纪元将启还是过度神化?》,数据公园:《ChatGPT“狂飙”》,界面新闻:《癫狂炒作下的科技公司众生相》,每日经济新闻:《ChatGPT让所有人疯狂,深度、准确性或成反攻“必杀技”》,中国新闻周刊:《仍在持续进化的ChatGPT为何如此强大?》,腾讯研究院:《有关ChatGPT的十个问题》0 {7 u0 r: F+ \, I: x
本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|