|
|
编辑部 发自 凹非寺8 K5 B3 d( \7 d7 B; e
量子位 | 公众号 QbitAI4 a0 |9 V7 R$ ~' V! q( ?5 E5 }
GPT-4发布一天之后,压力全部给到百度这边。
) N* l C. I; }+ u 就在刚刚,百度交卷。
M4 I2 j3 T& N 文心一言,百度全新一代知识增强大语言模型,正式在百度总部“挥手点江山”会议室里发布。
1 G" _3 x- o( r& x& i 在一片静寂的氛围里,李彦宏小步登场,语气里带着点紧张:% n6 b, A; H3 l: @& T! g1 C
大家的期望值,是我们对标ChatGPT,对标GPT-4,这个门槛有点高(笑)。% b4 ?& P. P4 y. b# z; O
十月怀胎,我们就带大家来看看这个AI大模型文心一言长什么样。
9 a+ n8 }' T* ], m7 o: |; r! S . d) c& Z+ @. r% s. z% Z
此前,有人狂转meme图把百度比作GPT-4旁边的垃圾箱。4 Y. u. u8 r( J) V7 M [
# Z! p; |( I- d- a; N* V c6 s 也有人鼓吹百度是全村的希望。
1 a" r- T2 m3 `5 W/ t 而在发布会进行的同时,百度港股市值大幅下跌,相关话题还冲上了微博热搜。
4 e1 K' c2 b) p( o# _
! i* E* Y+ b6 I$ g A( H. w 但直播弹幕中也有网友点赞:3 v3 T, C- y" {! H
# d5 o/ _ d: F- I. e5 Q: D 那么这个中国版ChatGPT到底实力如何?
" {5 Q a: ^+ ]1 z, G. Y 咱们就用百度发布会演示的预录制Demo,对比一下崭新出炉的GPT-4,先凭实力说话。
4 h6 b. s; A' { 文心一言 vs GPT-4
0 @( L( _ S: n/ L. N* k( F 和GPT-4一样,文心一言是一个多模态大模型。
% D) I- A* Q8 O- @- _) I6 X 李彦宏开场就展示了文心一言具备的5种能力,包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。
% N8 F {; b+ g' p0 s3 P 文心一言甚至还现场秀了一口接地气的四川话,现场网友发出一片笑声。
1 b+ I$ ~, p% |$ Z3 a 其他能力如何?我们具体展开来看。
4 n8 p& @2 [0 ]! V! I* K 文学创作' h% Q) x% ?5 k
在文学创作上,李彦宏一开场就搬出了《三体》作者刘慈欣坐镇。
' v- i4 b3 I5 k0 d: M1 e+ C/ c 先让文心一言介绍一下大刘,“毕竟我也是刘慈欣老乡嘛”:8 W& l& V6 y. V, c
6 U2 a% m9 ^! x2 N7 d% S
看起来没什么问题。同样的问题问问GPT-4呢?. [9 L: w5 |0 l5 H# g6 F( w
( A- h# o5 M' b- b& N 嗯???直接把刘慈欣的老家挪到了湖北省洪湖市。湖北人狂喜(doge)) ]# Y' G4 r5 y* A$ V6 ]- `
随后,李彦宏又展示了从哲学的角度对这段文章进行续写的demo:
0 o: x+ {) w" c# c* k
1 _' o# C2 d5 s" v3 k8 ? z 看起来中规中矩,比较理性。老样子,我们也来与GPT-4进行一波对比:
! [ Q& b9 L2 E4 L8 S( M7 k9 }
$ w# _! O ~; f9 W) T 这波你是想看GPT-4续写的《三体》,还是文心一言的?
* E, t) ^. B5 Q* i' k" _ 再来看看《三体》电视剧中扮演史强和汪淼的老搭档,于和伟和张鲁一,有什么共同点?
* K* ^5 q/ V$ Y9 j& p4 J/ R. n# b4 n 0 o7 }, I" Y- L' D) \
也没什么问题。) D' O1 ?8 a2 V- O; m
就是看起来展示的速度有点快,比李彦宏的语速还要快上那么一点点(手动狗头)。
5 c8 b, ^# }# [: {
" d. ?0 Y' T9 Z% K8 l, z6 V 商业文案创作
5 u6 k4 D" ~- X+ }0 K2 R4 N 接下来,李彦宏又展示了一下文心一言在商业文案创作上的能力。
' Z* U% p% J3 [& y3 R- }: y: P 比如给新公司起个名字。
- |# L$ g: B4 J6 R3 J
$ A/ R9 T" y1 x# t7 x: Y# P 并且这个名字它还不是瞎起的:, ~. w7 ~' Z# ?4 u4 v$ [
) D( p2 D6 }' d1 K7 X
再来看看GPT-4起名的效果?3 C1 ^* `' r; C. {& V/ |
" R$ b+ R7 }: z7 u3 | 看起来,GPT-4对中文的掌控能力相比之下还是少了一点精髓。7 r l2 r+ ^% c" b1 X0 }" S
至于写个公司成立的新闻稿?对文心一言来说似乎也不成问题:+ _! v K' H3 `0 L
' ], H9 Q; s: q0 g4 _" U
数理逻辑推算
' [$ Z, c* h( L2 d# F' | 数学能力,是考验生成式大模型的一大难题。ChatGPT刚上线时,也翻了不少车。
S& F" k% f, _: A& n( ` 不过在现场,文心一言处理的数学问题不算复杂,是小学数学竞赛常见的鸡兔同笼问题。
* l' b4 A; w$ k- F7 c
. c I( P8 ?' w( ^2 I# D2 L- y 彩蛋是,李彦宏现场展示的第一题,引得文心一言说出了《狂飙》里高启盛的经典台词:这题出得不对。
* {, F( w: o6 T2 d- a7 d# K ' U0 ~: I4 x9 E4 p J1 L2 u# `
修改一下题目,OK,再扔给文心一言试试:
) `4 _: q2 |6 s# |
~: D& o3 k5 W8 V# A9 j/ I 看起来,答案还算是有理有据,一步步逻辑推理出来的那种。
/ p% N) H9 O' t 李彦宏表示,这些题“不敢说百分之一百能做对,但至少体现了文心一言的思考历程”。
3 K: w0 Q0 k- d8 Y8 L 中文理解9 R4 e3 v: m! H% i9 g4 ^, P! v; x4 R
接下来,李彦宏着重展示了一下文心一言对中文的理解能力,并特意强调:
0 T# @! g, X5 \2 U( h 文心一言对中国文化的了解,理应超出任何一个预训练大模型。
2 A1 U/ _. ~ U5 h9 `: T. o 一上来就是一个成语,“洛阳纸贵。到底有多贵?”
8 M7 L4 ]% l9 C6 `8 c* }# N
- k6 [' U9 O+ s3 l, B# T3 ~ 这是文心一言的效果展示:9 ?2 o- g" L/ q$ E6 z. u
( b' {( f; L5 `4 R6 D# [
还解释了一下这个成语背后的经济学原理:$ Z* Y x4 s, d6 R% I3 w4 L
+ E% i# \, ?# L9 M0 S 那么,将这个问题抛给GPT-4呢?首先问问它,知不知道洛阳纸贵是什么意思:5 J3 U+ }6 {+ V
) e% d' C# Z$ ^- Z/ j( M* O" r% B
接下来,再问问他对应的经济学理论是什么:( ^+ Q, t1 l/ T- J* T
' v7 \, v8 s& Q0 R* H
这波看起来,GPT-4的中文理解似乎也不输文心一言啊。( @, y" r% r8 b7 ~' z
那么,再来看看二者写藏头诗的能力?2 C$ b% `# m8 z. B6 ]+ ^0 p
首先是文心一言的效果展示:
2 r0 F2 a# D" V( c9 o h' B
7 {! {3 M: s) u# |+ y0 }) b% ]4 c- ` 接下来,我们再看看GPT-4怎么说:; r7 @) q0 ?9 j% n3 w; |4 B
7 s! g2 W0 _; Z% ^
诶,看起来反而是GPT-4没有真正理解“藏头诗”的含义。
, U6 f+ J, ~; q3 E( u' F9 d 这波文化理解上,属实是文心一言“小胜一筹”了。; g! ^% G9 V {! s/ G
不过在英文上,李彦宏也承认,虽然文心一言也能处理,但能力是显著不如中文的。1 n( E6 n& W& D4 C2 e' ^2 Z
这也和百度目前能用到的训练数据有关。
2 e# v+ J2 l u( M# I8 e 多模态生成
: u) @- a, J! M8 m% s 最后,李彦宏还简单展示了一下文心一言多模态生成的能力。0 ^: T. @: P& W- r
首先来看看,为即将到来的2023世界智能交通大会创作海报——- J9 @5 e- c5 C# e& ?
4 E( `6 [* t6 T 而除了前文展示过的文字转四川话能力,文心一言还能文字转视频。3 C. B, c! c$ E" b- E" w
李彦宏一句指令“将以上内容生成视频”,很快啊,不到几秒钟,文心一言就把字幕和视频做好了:
/ L) ` r" \ E) x" |/ e6 n i B# P5 p& A/ l
有些遗憾的是,在ChatGPT被频频称赞的编程方面,文心一言并没有现场展示相关能力。* I" C2 @ d- X# V8 N, O8 ]' T( B
但王海峰透露,文心一言的训练数据中同样包括代码。 P: x/ |4 ~! H* ]) l' F
文心一言如何“跑通”?
- i1 Q/ Y6 k0 ~( p! t 正如ChatGPT脱胎于OpenAI的GPT系列,百度这次推出的文心一言(ERNIE Bot),背后也正是基于文心大模型技术打造。9 Y+ p! @+ p) O3 u0 |5 q J% w
据王海峰介绍,文心一言主要脱胎于两大模型:
; o+ e( P& I/ H9 o/ Y2 x0 ^3 F9 s1 p/ j 百度ERNIE系列知识增强千亿大模型,以及百度大规模开放域对话模型PLATO。0 Q% O( R& k: r3 H& N1 u2 ?
在此基础上,主要采用了六项核心技术。
7 y! L4 S* ^9 k4 Z" f 其中三个是广为人知的大模型技术,包括有监督精调、人类反馈强化学习(RLHF)和提示构建。
' M$ m: l3 c+ p2 o5 S8 h p.s. 人类反馈强化学习也是ChatGPT的关键技术。
) e0 W( d! X' E" p7 b5 B 另外三个,则是“百度比较有特色”的技术,包括知识增强、检索增强和对话增强技术。
7 m8 o" \7 Z; p2 f2 P! n
# b Z$ |8 e6 U T 首先来看与ChatGPT类似的技术:有监督精调、RLHF和提示构建。
2 a# y F+ j. _7 H `& R3 b 有监督精调,尤其指中文方面的数据精调。百度基于对中国语言文化和中国应用场景的理解,筛选了特定的数据来训练模型。2 `* x8 [ m) b" {+ X
- @& E% s) U. u& @7 p, g 至于人类反馈的强化学习(RLHF)和提示构建,操作上也与ChatGPT大差不差。- O) h1 |1 m6 w' S k- o9 J
7 `# a% u1 m8 z* b! v4 A8 B; R; H
随后是百度提出的、用于进一步改善模型效果的技术。
* `. u$ g% {$ Z# k9 K6 j- g6 ~ 知识增强,包括知识内化和知识外用两个部分。其中,知识内化即将知识“渗透”进模型参数中;知识外用指的是模型可以直接使用外部的知识。
- J. ]- ^1 y0 p- q, t. x3 Z9 A8 }
' T3 `& H# ~8 j2 b( _ 检索增强,则与百度搜索引擎积累的检索技术有关。
W) ]6 K/ S7 t- i7 F; K 百度将把检索技术和生成技术结合起来,先对内容进行检索后,将比较有用的部分用于生成,再整合输出结果:, ^. B) e5 k' p A+ j2 P
0 _+ a5 p9 d( l. C, g) E4 n 最后是对话增强部分,包括之前百度积累的记忆机制、上下文理解和对话规划等技术:" g- k) O% B' f7 N
$ P) T8 Q+ p+ s p8 |1 @, W
概括来看,文心一言表现出的能力,被李彦宏称为“智能涌现”:5 k% c `* x" y8 o1 t' \
当参数达到千亿量级,训练语料达到足够多的情况下,这种现象就会发生。' H, i8 a; m) ]1 j" ?* L
目前,百度拥有的AI技术可以分为四个部分,芯片(昆仑芯)、框架(飞桨)、模型(文心)和应用。
" {4 _( Q( O1 b# f- W2 d5 u0 H 之所以软硬件都要布局,百度称,是为了降低成本:0 \6 O" l3 n" e! d4 I
生成式AI需求的算力非常高,费用相当昂贵。6 s; t' x) l* Y, b6 u1 w
因此,如果在四层架构之间相互进行协同优化,就能让它的效率比别人更高,从而显著降低成本。
. A/ j9 S4 h7 n# f% i 李彦宏认为,这也正是百度的优势所在:
" u$ d5 B7 Y( `' f 四层都有领先产品的公司,绝无仅有。: E1 `9 N: k* v* p0 z
4 `+ c% u) y& u% F7 \6 K/ d, R/ e
这次文心大模型背后的硬件算力,也是通过百度智能云提供服务。; u( w) m- |2 v) t
目前,文心一言已经接入百度搜索,目的在于提升搜索资源效率。
1 b7 ?5 c! F# o* Y0 l' b; e! N# L 同时,包括小度和自动驾驶Apollo等产品,以及爱奇艺等公司也已经接入百度的文心一言模型。* \* c: \3 V% t7 _; B$ S
! f# S9 z0 r- \" P0 y 网友:看来还不用提前退休
$ U: h5 E3 g) V# i0 u; o9 W3 f 截至发稿,百度港股股价在一波明显下跌之后,有所回弹。9 l& F3 ~( }# F' w: M& V/ {! W
' ]9 Y4 ?. ~' ^. N& X' ~
发布会结束,网友反应最多的是“提前录制有点败好感”:' Z. J' d" y3 _; f' D! r* s* |, a
; U L) m y4 A' m) C# g6 ~ C: X0 b9 e" H3 X
对于这一点,李彦宏的解释是,给出的问题都比较长,为了节约现场时间,所以才用了提前录制的形式。
7 c+ ?; N# X- k- b6 X8 ] 还有不少网友对文心一言展示出的能力不太满意。有人调侃,看完之后感觉“提前退休的日子看起来还可以缓一缓”:
/ l: H2 i' |! ~. T0 g
: M. A9 m) `" R, l2 A 离GPT-4还差了20个老胡。
B1 b( C* F4 @5 J0 x% b
8 S' c/ j/ H2 R5 r; S. t {5 b 还有网友感觉,文心一言的发布会像极了毕业答辩的自己(doge):2 ]! l1 \* U0 J- A# T$ Q" M: U
) A a- |7 @6 {" Z+ i 不过也有网友表示,希望能给国产产品一点时间一点耐心。& R+ A9 \: }/ C; F, M6 Z$ I
& L/ z0 H; C* [$ U: Q" ~
发布会末尾,王海峰宣布,文心一言将从今天开始对外进行测试,包括个人用户和企业用户。. U8 F6 ~9 m9 V A2 f
是骡子是马,相信接下来,会得到更多验证。& L5 O4 ?3 H7 X, Q) V6 a! d
One More Thing L& U5 u$ y4 G' r q
对了,有网友表示,已经拿到了文心一言的内测资格:! D3 U# \6 w; B4 A R: K ~0 E
你好,感谢您体验文心一言,体验地址:8 ?6 f; m4 C4 a' ?3 Z7 s
https://yiyan.baidu.com/welcome,希望您在体验当中给予更多意见,文心一言邀请码:KFCVME50RMB,2023年3月16日24:00前有效。( }& ~* F% N: I, @ Y9 x
嗯,万物疯狂星期四(手动狗头)。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|