|
|
, t) d6 C9 X' U3 Z c
- a N n- f' y# F8 ]( Q新智元报道6 T% u, @5 \" h C) d8 M. ~3 Q
编辑:编辑部
6 J+ T3 M, z) M+ n( f【新智元导读】2月20日,复旦大学邱锡鹏团队推出中国版ChatGPT「MOSS」。发布当晚,服务器被挤爆。2月21日,复旦MOSS团队致歉,称模型还不成熟。. l! A9 u7 P2 p& }
今天,MOSS又火了。不仅登顶知乎热榜,收获近千万流量,还引来诸多媒体竞相报道。& U/ S% |* Q! ~0 A
( Z( C$ r5 p- [# o) F- z% l6 v: D% l' r* K
不过,这次出圈的,不是陪刘培强流浪的MOSS,而是复旦大学研发的中国版ChatGPT。
& a8 K3 g; S: i0 _' |3 M3 w
& J+ v' Q2 l2 f) g/ j# F& v' O; _国内首个对话式大型语言模型
- q& z6 a9 Z* M$ W7 @& OChatGPT自发布以来,已经收获了全球巨大关注。尤其是在春节后,ChatGPT突然走红,许多网友开始期待中国版聊天机器人的诞生。
/ ~+ B, T6 R; e: Y现在,这个愿望得以实现。复旦大学自然语言处理实验室表示,国内第一个对话式大型语言模型「MOSS」已由邱锡鹏教授团队发布至公开平台,邀公众参与内测。: ?# [) m# {2 K' g, V$ n+ c( U o
3 Y9 i" d, D4 h" v; C
; p J/ l% Z) X/ |+ D* o
MOSS可以执行一系列任务,如对话生成、编程、事实问答等。官网称,MOSS为生成的语言模型打开所有技术路径,以理解人类意图并具有对话能力。: }3 K- A! \) r/ h% U0 R
MOSS的出现为国内学术界和业界提供了重要经验,并有助于进一步探索和应用大型语言模型。
! y8 ^' q) ^. V$ Y! U" I# `7 @团队负责人邱锡鹏表示:「尽管MOSS仍有很大的改进空间,但其推出证明,国内科研团队有能力在开发ChatGPT产品的道路上克服重要的技术挑战。」8 J6 a% y8 ^& f$ [: Q0 d
3 B5 l% a1 M$ G% |* A, E0 _! ?" H3 Y3 `! e/ I. q! l Z6 t t
据悉,MOSS研发项目得到了上海人工智能实验室的大力支持。后期,该项目将会通过开源方式,和行业人士与社区分享。
- u5 j3 e% |; p1 p- ^' q. v# b+ C" g' |开源代码,打造MaaS生态; c) }7 v# u5 [+ U6 H0 t
MOSS的回答语言流畅、逻辑清晰且观点正确。科研团队在演示时,用英文输入多个指令,展示了MOSS多轮交互、表格生成、代码生成和解释能力。
' O/ s$ e& _' J5 c- P/ h+ w" O「告诉我5部科幻电影。」「生成一张展示这5部电影和导演的表格。」「增加一列表格,显示这些电影上映的时间。」在这个包含表格生成的多轮交互中,MOSS都顺利完成了任务。: X: }. u2 w6 O3 d8 j
% x. N& D3 j; i& K& w
9 u+ g- ^8 S2 }6 l6 L6 A }
然而,MOSS与ChatGPT最大的不同,在于其开源属性。) ~7 a: S" U% D' c- L* q# u8 D
由于ChatGPT并未开源,其技术解决方案的细节尚未披露,研究人员对此有很多猜测。一些专家认为,ChatGPT是一个复杂的组合系统,无法通过单一的生成语言模型实现。
- W, E+ s L4 j% c( Q$ l/ s0 c作为自然语言处理专家,邱锡鹏近年来一直致力于研究具有多任务学习能力的一般模型。为了探索ChatGPT的技术路线并获得LLM研究的一手经验,他带领团队加快了MOSS的开发。6 n8 d7 A2 ?& I& H* u0 e# L" O- x
0 ]9 \9 N- I/ o$ j/ P2 g" U" {; k6 t2 r+ ^% `; Y( x) @3 W
MOSS开发的基本步骤与ChatGPT相同,包括两个阶段:自然语言模型的基座训练和理解人类意图的对话能力训练。
4 r. B( @$ ^9 l+ M$ u4 @5 e: ?在对话能力培训阶段,OpenAI收集了至少数十万条人工指令,要求各行各业的专业标注员编写指令回复,然后将其输入模型库,以帮助ChatGPT逐步理解各种指令。
4 n# [, H& W/ O+ m) a4 ?/ S7 | N7 ?复旦团队采用不同的技术路线,通过允许MOSS与人类和其他对话模式互动,并在短时间内高效完成对话能力培训,从而显著提高学习效率和研发效率。
# b2 Q$ P9 w# s I为了提高研发效率,MOSS团队选择开源代码。对此,MOSS模型的官方公告表示:
" _0 t' b2 {; N3 j# l# i
1 _# W6 O1 F5 t9 G% D8 w预训练大语言模型的研发门槛很高,需要大量算力、训练语料和人工标注。在我国产业界,只有大型机构才有实力开发大模型。 MOSS开源后,可有效降低预训练语言模型的研发和应用门槛,让中小企业在其基础上开发出智能客服、智能家居、人工智能律师等各种垂直类产品。
$ r, K0 \ J# S: H9 L5 m' ?推出伊始便开源代码,虽然可以提高数据收集和研发效率,但也不得不称为一个冒险的举动。然而,这也为未来企业的发展提供了一个新的思路:MaaS(基础模型服务)。
. @1 p! L( I9 h. S在未来,企业或许不需要在大模型领域「卷生卷死」,有了类似于MOSS的高质量LLM,企业只需对已经完备的模型进行微调,就能获得所需的品质良好的垂类产品。
- _$ d9 _$ J% h8 Y+ |% K( i8 o* ]/ X, e
取名MOSS,致敬《流浪地球》
1 ]. j: |5 r8 R' ?# {3 P随着MOSS的推出,互联网上出现了怀疑的声音:为什么要叫MOSS?
* r& p3 P2 C8 U B. ~; _% X/ N' V! I% b9 Z0 W1 ?* j
- _0 j- `: Z2 B% e$ X
面对「蹭热度」的质疑,MOSS团队发公告予以澄清。公告称:+ ?. `+ [% M* A$ @8 E; Z
0 a8 p7 c+ G" g/ i- A尽管我们的对话模型和《流浪地球》中MOSS的能力不能相提并论,但就像过去NLP领域的其它优秀模型一样,作者们都希望使用自己喜欢的影视角色名称命名自己的模型,我们在训练完成第一代模型的时候,正值流浪地球2热映,片中MOSS给团队每个人都留下了深刻的印象,因此便使用了这样一个名称来指代我们的模型,以表示我们对最前沿AI模型的不懈追求。
7 E9 ?% m- G. D5 N; V% U/ P事实上,用大IP给科研项目命名并不是什么新鲜事。ChatGPT基础技术之一的Transformer,其名称来源于大热电影《变形金刚》(Transformer)。 J3 o6 F: {' z$ s6 u1 M
网友评价
+ E2 ]& F% b+ D: v' wMOSS一上线,官网都快被挤爆了,小编也只能乖乖排队等内测资格啦。
+ w2 I. a# [9 R! h/ T
7 W7 H% {' k, f( U
3 J, G* {7 ]5 O9 D' R) _体验地址:https://moss.fastnlp.top/: V! X2 o! D9 }% Y& F0 r
项目地址:https://txsun1997.github.io/blogs/moss.html- L( V. O) s W/ S4 v
不过,根据网上记者的对话以及知乎答友们的评价,咱也能来仔细瞅瞅MOSS了。
) O" V% g7 u6 Q! t+ \4 M1 C文风很AI,但未来可期
! t f* w: i0 d9 E* a" J基于目前已知的信息,「段小草」对Moss的特点进行了总结:
, r, S, {7 e& k) X+ I8 r# w' X1. 上下文的能力是有的,但不确定能保留多少,毕竟展示出来的上下文对话都不是太长;3 g7 r2 ?9 Y$ B n( z( E9 w' j
2. 文风很 AI,不过生成的内容不算长。即使是分 1、2、3、4 点回答的时候,句子也比较短。ChatGPT 一般会生成更长的展开。
. v7 x! n7 i2 }0 j3. 文章中也专门展示了英文能力,但还不确定训练集中不同语言语料的效果。& | J% u0 R8 {" w) D
4. 吸取 ChatGPT 和 NewBing 翻车的教训,在上线初期就套上了足够的道德枷锁。; g" B- f, N. k7 d6 t0 g- c, w
最后,「段小草」表示:「希望能尽快体验到产品,也期待看到更多产业落地。」$ F: T0 y O+ Z6 Q
MOSS回答:
4 J) b+ J! r- h' |" U8 U7 ?; S4 T0 v5 J# ~! s
. _' ^$ P7 j8 N4 f1 o9 J. X0 PChatGPT回答:. i5 w4 J; [( r& e0 ^, f
) o- Z" t3 m! M' H8 P
& M7 y! ]. X8 }回答地址:https://www.zhihu.com/question/585248111/answer/2903132579
/ V, N2 l9 j" }7 r, I- l# x+ b, r给国内AI开了个好头
# h3 G" v# ~! j的确,MOSS的发布对国内AI的发展肯定大有益处。* H" C7 E# Z @' I2 r: a
知友「极智视界」表示,在AI领域,技术源于美国而盛行于世界,例如框架类的pytorch、tensorflow,目标检测算法YOLO以及造就ChatGPT的transformer。我们「对标」国外的技术,虽然赶超美国可能做不到,但是「对标」的过程一定会让国内的AI有一个快速的发展。% T# P0 L/ V- Z' b3 L3 u- i
0 q# s U5 O. Q, d$ d5 r: ?! W- Z5 A# R
回答地址:https://www.zhihu.com/question/585248111/answer/2903303710) b; b6 S' }1 l5 t
「极智视界」还提到,国内首个类ChatGPT模型MOSS的发布既符合预期但也有些意外。
/ M& P5 f* n; T符合预期是因为近段时间以来也一直有国内版ChatGPT摩拳擦掌的消息,所以迟早都会来的;意外的是在当前这种强大的利益驱动下,研究机构居然还走到了大厂的前头。
X' a' S% L! n- @: A但总的来说这是一个令业界比较振奋的消息,咱们终于可以用上咱们自己的AI问答系统了。
" \$ Z. E. N. C$ j1 e& U+ x高校的重点还是理论探索
) w+ h% \% F* P6 p6 ]知友「卜寒兮」表示,想研发出类ChatGPT的产品,需要一个团队能撬动各个方面的资源,还要有过硬的技术做支撑。
3 X+ d" Z9 x7 r' w: \; p. }以ChatGPT为例,单单想要研发出一个成规模的LLM模型,就需要以下四个方面:
+ I- r d" `" c! a% r& X
5 v( b! P! v! g2 v9 y$ q1 a7 M
4 w) j8 n# a* `& ?- ~2 E7 {- + k+ T! A7 l# x9 m
海量数据的语料库:ChatGPT背后的模型的GPT-3、GPT-3.5系列,初代的GPT-3是2020年发布的,这个模型有1750亿个参数,训练它所使用的语料库包含45TB的数据、约3000亿个单词
/ N$ l |5 z( S1 O9 h/ l# W; N3 i* D, y2 H8 M, B2 Y4 r4 V
- , f7 Q& g/ x/ d
大量的人力:毕竟ChatGPT成功的背后是时薪不到2美刀的血汗工厂+ T9 Y0 J" B9 r
* C4 ]" n) \* P" ^9 f( }4 B# f
0 ]) D( [/ I7 o0 F算力的支撑:训练chatGPT这样规模的LLM模型需要目前世界上最强大的GPU来满足算力要求而像NVIDIA Tesla A100这种最新的AI超级计算机芯片已经禁止对国内出售了。国内除了几家互联网大厂,很少有公司有实力能长期投入大量资金在算力上,更不要提校内的科研团队了,靠点科研经费可远远不够。
9 U9 Y& {5 w, `+ ?; ]+ }/ ~& e& T
+ H3 i# _$ z0 k6 w* k! s+ N: J2 E- : E. x0 Q7 T2 y# g9 n# m2 ?0 q: q: E
技术上的壁垒:GPT-3的初代版本在2020年就出现了,而到2022年11月首次推出ChatGPT产品,这期间花了三四年的时间迭代不同的版本。这是一个长期的过程,意味着花大量的时间找到关键的训练tricks,反复调参,在不同的训练集上反复训练、微调,并且还有找到合适的训练方法,才能迭代出一个优秀的版本
2 J' L, D b6 t# I
' R2 {2 E* b6 B c! e$ u6 Q4 i! s
4 O% d" }# s5 M& @; q( k' |* u; Y5 r* x5 Z
回答地址:https://www.zhihu.com/question/585248111/answer/2903161180: Z2 C$ B9 {" Q6 Y
目前来看,还真的只有大公司才有能力做得出来。对于高校的科研团队,其优势在于技术和方法上的创新,所以还是要在这方面做更多功夫,为将来有一天该方向的发展做技术储备。! t- F- U9 g4 m) V
" @% Q9 q/ M1 a+ s
复旦MOSS团队:还不成熟8 O1 \! A0 @4 D. o
2月20日,就在MOSS模型公布的当晚,不少测试的网友发现,MOSS已经显示服务器流量过载,只能第二天再重试。( i6 u' v6 O7 M# V9 W+ H; e
2月21日,复旦团队在MOSS官网发布公告称:首先非常感谢大家的关注!MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。" n W5 l# H) N" p
# e/ E! _1 O* u, r3 r7 A0 Z3 ^7 x7 ~7 n
& ~# F$ |. Y& y# G9 N' w$ M! }我们一个学术研究的实验室无法做出和ChatGPT能力相近的模型,MOSS只是想在百亿规模参数上探索和验证 ChatGPT的技术路线,并且实现各种对话能力。 我们最初的想法只是想将MOSS进行内测,以便我们可以进一步优化,没有想到会引起这么大的关注,我们的计算资源不足以支持如此大的访问量,并且作为学术团队我们也没有相关的工程经验,给大家造成非常不好的体验和第一印象,在此向大家致以真诚的歉意。 在 MOSS完成初步的验证之后,我们会将MOSS的经验、代码、模型参数开源出来供大家参考。中国版ChatGPT的诞生还需要中国全体AI从业者的努力,也更需要不断。和人交互以提高能力。 ( z& P$ c% q( ^. p# J
参考资料:9 U+ ]1 q4 c) J4 Y, g# z
https://txsun1997.github.io/blogs/moss.html% x, z/ y) f' Q6 g
https://www.zhihu.com/question/585248111' l' p* s, ]0 O( K; G
https://m.weibo.cn/status/4871507265982631?wm=3333_2001&from=10D2293010&sourcetype=weixin&featurecode=newtitle, E4 R, d0 K% _! o
特别鸣谢:(授权转载)
1 S& Q7 @) k/ q1 Q8 x「段小草」https://www.zhihu.com/question/585248111/answer/2903132579
7 ~* @" q( Q. s, r「极智视界」https://www.zhihu.com/question/585248111/answer/2903303710
' @& L6 |& |' y5 n「卜寒兮」https://www.zhihu.com/question/585248111/answer/2903161180 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|