|
|
) ]; j, j4 Q, s0 J7 D. a1 F0 }5 u# s4 B6 f. E& e/ X
新智元报道- _3 Y2 P; S* u
编辑:编辑部
% h/ G$ [+ {7 Y+ g7 X5 D【新智元导读】2月20日,复旦大学邱锡鹏团队推出中国版ChatGPT「MOSS」。发布当晚,服务器被挤爆。2月21日,复旦MOSS团队致歉,称模型还不成熟。: W0 z4 G; H/ E8 Q3 X+ @% g! f
今天,MOSS又火了。不仅登顶知乎热榜,收获近千万流量,还引来诸多媒体竞相报道。. y: [0 D% X6 E- Q
# b7 T5 E1 m, Z7 ^8 P# I
- n" s: V2 b7 E+ V5 X, `
不过,这次出圈的,不是陪刘培强流浪的MOSS,而是复旦大学研发的中国版ChatGPT。
( A. v- {, P, O: `. @+ l* R9 `0 J
9 L. ^: U! L% o1 \1 y: P9 ?国内首个对话式大型语言模型3 l, _4 y4 Y# }
ChatGPT自发布以来,已经收获了全球巨大关注。尤其是在春节后,ChatGPT突然走红,许多网友开始期待中国版聊天机器人的诞生。. _$ d& T1 [& ]( N _+ K: X
现在,这个愿望得以实现。复旦大学自然语言处理实验室表示,国内第一个对话式大型语言模型「MOSS」已由邱锡鹏教授团队发布至公开平台,邀公众参与内测。
`$ w& ~3 s' D0 H1 H3 v1 I5 J+ p3 B. M
4 ?; N. c9 b: R' h0 o$ W; WMOSS可以执行一系列任务,如对话生成、编程、事实问答等。官网称,MOSS为生成的语言模型打开所有技术路径,以理解人类意图并具有对话能力。# S }. q: q5 e2 T2 J
MOSS的出现为国内学术界和业界提供了重要经验,并有助于进一步探索和应用大型语言模型。
0 f0 c" K f1 N' T- u团队负责人邱锡鹏表示:「尽管MOSS仍有很大的改进空间,但其推出证明,国内科研团队有能力在开发ChatGPT产品的道路上克服重要的技术挑战。」
" O- |! ?% |) { D2 S: x$ F; Y5 l: Z9 K
5 ~+ W0 W' h+ C$ s
据悉,MOSS研发项目得到了上海人工智能实验室的大力支持。后期,该项目将会通过开源方式,和行业人士与社区分享。
6 V$ n, k( z5 n) ?: D开源代码,打造MaaS生态; r3 s8 d, U2 a4 S) d0 B
MOSS的回答语言流畅、逻辑清晰且观点正确。科研团队在演示时,用英文输入多个指令,展示了MOSS多轮交互、表格生成、代码生成和解释能力。
7 a, }9 a" L0 F2 z2 Y2 j9 B* ^7 O「告诉我5部科幻电影。」「生成一张展示这5部电影和导演的表格。」「增加一列表格,显示这些电影上映的时间。」在这个包含表格生成的多轮交互中,MOSS都顺利完成了任务。
8 i# \7 k `) E$ k! I. ~% w8 n9 ~' S/ g
: \: c5 O1 C: k: `" i# ~! r8 m然而,MOSS与ChatGPT最大的不同,在于其开源属性。
" L* ^5 ]- ^7 D, e由于ChatGPT并未开源,其技术解决方案的细节尚未披露,研究人员对此有很多猜测。一些专家认为,ChatGPT是一个复杂的组合系统,无法通过单一的生成语言模型实现。
" n0 K- l5 H0 Y, B- o作为自然语言处理专家,邱锡鹏近年来一直致力于研究具有多任务学习能力的一般模型。为了探索ChatGPT的技术路线并获得LLM研究的一手经验,他带领团队加快了MOSS的开发。% @; f) i2 L" ^
1 Z* r3 P; [7 r' }& r1 ^9 J6 o
" `) {' U" i. Q; N8 A" yMOSS开发的基本步骤与ChatGPT相同,包括两个阶段:自然语言模型的基座训练和理解人类意图的对话能力训练。: B: \ Y+ B L* \+ ~
在对话能力培训阶段,OpenAI收集了至少数十万条人工指令,要求各行各业的专业标注员编写指令回复,然后将其输入模型库,以帮助ChatGPT逐步理解各种指令。
4 P$ j9 S+ Q' N$ S+ |+ e复旦团队采用不同的技术路线,通过允许MOSS与人类和其他对话模式互动,并在短时间内高效完成对话能力培训,从而显著提高学习效率和研发效率。( k$ Q% w: w. E
为了提高研发效率,MOSS团队选择开源代码。对此,MOSS模型的官方公告表示:
. @" y, |1 \. y
O' C8 I; }! ?( [6 v" `预训练大语言模型的研发门槛很高,需要大量算力、训练语料和人工标注。在我国产业界,只有大型机构才有实力开发大模型。 MOSS开源后,可有效降低预训练语言模型的研发和应用门槛,让中小企业在其基础上开发出智能客服、智能家居、人工智能律师等各种垂直类产品。
6 [' @& t7 y: y% {: I5 ?4 s推出伊始便开源代码,虽然可以提高数据收集和研发效率,但也不得不称为一个冒险的举动。然而,这也为未来企业的发展提供了一个新的思路:MaaS(基础模型服务)。' ` n% H! ^5 b; }+ S5 J n l5 u
在未来,企业或许不需要在大模型领域「卷生卷死」,有了类似于MOSS的高质量LLM,企业只需对已经完备的模型进行微调,就能获得所需的品质良好的垂类产品。
5 D. X/ U; T' }) g' r' c3 I1 L2 r, t6 V/ C6 q q1 s
取名MOSS,致敬《流浪地球》9 y9 j' R4 k2 i/ N) j- B7 G
随着MOSS的推出,互联网上出现了怀疑的声音:为什么要叫MOSS?1 F6 X' U6 q* s( o- f. J+ a! w5 c
( p z5 c6 D+ j k, m/ d" @3 ]! l$ T* S7 i0 |: _
面对「蹭热度」的质疑,MOSS团队发公告予以澄清。公告称:
8 l# E7 _, ?. k5 d6 L" j6 k4 Q9 D I: e- M5 m9 t
尽管我们的对话模型和《流浪地球》中MOSS的能力不能相提并论,但就像过去NLP领域的其它优秀模型一样,作者们都希望使用自己喜欢的影视角色名称命名自己的模型,我们在训练完成第一代模型的时候,正值流浪地球2热映,片中MOSS给团队每个人都留下了深刻的印象,因此便使用了这样一个名称来指代我们的模型,以表示我们对最前沿AI模型的不懈追求。
# Q& c1 o* p7 _$ @事实上,用大IP给科研项目命名并不是什么新鲜事。ChatGPT基础技术之一的Transformer,其名称来源于大热电影《变形金刚》(Transformer)。
z( |, _. o! H网友评价
$ D/ o; m# y" w/ w# I3 w: Y; FMOSS一上线,官网都快被挤爆了,小编也只能乖乖排队等内测资格啦。
$ q) w1 F4 W; M5 I
$ Q+ b2 D6 _" Z& H
+ l( I6 j7 L& K k4 v体验地址:https://moss.fastnlp.top/! G" }6 J$ Z0 Z: q8 ]& G6 H
项目地址:https://txsun1997.github.io/blogs/moss.html/ t2 F6 ?9 M+ @
不过,根据网上记者的对话以及知乎答友们的评价,咱也能来仔细瞅瞅MOSS了。
% B+ {0 ?) x* m1 D: B: R文风很AI,但未来可期
, Y; [2 M: H* r, j) f% Z基于目前已知的信息,「段小草」对Moss的特点进行了总结:
% u& l9 K+ `5 q7 y1. 上下文的能力是有的,但不确定能保留多少,毕竟展示出来的上下文对话都不是太长;
- e8 `, b/ X9 ^; |; Q2. 文风很 AI,不过生成的内容不算长。即使是分 1、2、3、4 点回答的时候,句子也比较短。ChatGPT 一般会生成更长的展开。' M' V" t- `) }1 I. `5 Z
3. 文章中也专门展示了英文能力,但还不确定训练集中不同语言语料的效果。7 Q( V1 W* d6 P7 \' E8 `1 ^
4. 吸取 ChatGPT 和 NewBing 翻车的教训,在上线初期就套上了足够的道德枷锁。
l& G2 U* V. d1 Y' y8 o最后,「段小草」表示:「希望能尽快体验到产品,也期待看到更多产业落地。」
! z) y% x# q; @1 i9 l/ [MOSS回答:
" Z) O" e9 D; I; ?; Y3 k: k+ |. i' ]. k4 i
. Q+ n0 g( E: c& q. X' }ChatGPT回答:! K( q6 F x: D' U
7 ~' e& J; f" O( d, y& E. b8 g
3 G, Y7 m+ s7 _$ T9 g" ]! R" B回答地址:https://www.zhihu.com/question/585248111/answer/29031325797 K. x! b. e' L. e) E, t. X
给国内AI开了个好头
8 \9 i6 p% z3 R3 v2 x的确,MOSS的发布对国内AI的发展肯定大有益处。2 U2 o/ Z: W! [9 Z( J/ {% [
知友「极智视界」表示,在AI领域,技术源于美国而盛行于世界,例如框架类的pytorch、tensorflow,目标检测算法YOLO以及造就ChatGPT的transformer。我们「对标」国外的技术,虽然赶超美国可能做不到,但是「对标」的过程一定会让国内的AI有一个快速的发展。0 I( \: K" G6 b3 k" t- d0 w8 G3 ~
7 H3 I- z; I$ a- E2 k! n6 y1 u
& B+ E. Y6 ?2 x; Y
回答地址:https://www.zhihu.com/question/585248111/answer/2903303710! b# J" x/ q f* i8 d3 x" s5 ^' v2 Q o
「极智视界」还提到,国内首个类ChatGPT模型MOSS的发布既符合预期但也有些意外。
$ e; d6 m0 L7 B- |符合预期是因为近段时间以来也一直有国内版ChatGPT摩拳擦掌的消息,所以迟早都会来的;意外的是在当前这种强大的利益驱动下,研究机构居然还走到了大厂的前头。/ j+ z9 k, T" w ^
但总的来说这是一个令业界比较振奋的消息,咱们终于可以用上咱们自己的AI问答系统了。( Y) W8 V5 q/ \& @+ {4 L
高校的重点还是理论探索8 }0 D# f# \; P" X; q* u5 L! E
知友「卜寒兮」表示,想研发出类ChatGPT的产品,需要一个团队能撬动各个方面的资源,还要有过硬的技术做支撑。
6 ?6 r: n; r# V) t. X* h1 n( S3 ~以ChatGPT为例,单单想要研发出一个成规模的LLM模型,就需要以下四个方面:4 r M; a1 I! @) U- W
, {- e( K# b4 B0 w6 Z2 N! e6 Q& y% a. c a3 m( M& ^
1 ?/ A( ^2 e1 u海量数据的语料库:ChatGPT背后的模型的GPT-3、GPT-3.5系列,初代的GPT-3是2020年发布的,这个模型有1750亿个参数,训练它所使用的语料库包含45TB的数据、约3000亿个单词4 `9 W) W! p" ?+ a3 m5 Y
6 }% t' Q4 F) ]0 C
- ! Q% w: l4 ~$ U7 e# ^; W
大量的人力:毕竟ChatGPT成功的背后是时薪不到2美刀的血汗工厂( c7 N! X0 I4 n2 d) w1 T" Z
# p+ Z M% L* _- ^; |8 c; u: h# }
0 ]/ E7 L( x& l9 i! y算力的支撑:训练chatGPT这样规模的LLM模型需要目前世界上最强大的GPU来满足算力要求而像NVIDIA Tesla A100这种最新的AI超级计算机芯片已经禁止对国内出售了。国内除了几家互联网大厂,很少有公司有实力能长期投入大量资金在算力上,更不要提校内的科研团队了,靠点科研经费可远远不够。/ F8 w8 a: N3 a+ q/ h* Y3 E2 f
" q) l( L/ J/ A( n+ I9 t6 X+ O- / J& l8 G( ?. W0 t+ v8 Y
技术上的壁垒:GPT-3的初代版本在2020年就出现了,而到2022年11月首次推出ChatGPT产品,这期间花了三四年的时间迭代不同的版本。这是一个长期的过程,意味着花大量的时间找到关键的训练tricks,反复调参,在不同的训练集上反复训练、微调,并且还有找到合适的训练方法,才能迭代出一个优秀的版本4 ]+ U: K4 U, Z
c( U2 F; h# M! I% A; C; D
0 b/ C I& Q6 E
# w/ G5 N$ d- f+ `
0 S2 v+ [5 `* ^) l! N回答地址:https://www.zhihu.com/question/585248111/answer/2903161180
. N. ^$ [1 V) f4 J, L9 Y- U目前来看,还真的只有大公司才有能力做得出来。对于高校的科研团队,其优势在于技术和方法上的创新,所以还是要在这方面做更多功夫,为将来有一天该方向的发展做技术储备。! }9 @9 l+ s/ W2 o
- D) L9 S+ a$ K* a8 j& g, X; o! d复旦MOSS团队:还不成熟. a" S3 o; s( P, y: o7 F: L% l
2月20日,就在MOSS模型公布的当晚,不少测试的网友发现,MOSS已经显示服务器流量过载,只能第二天再重试。( q6 o2 W* |4 w$ Z8 f+ t% X9 w' v
2月21日,复旦团队在MOSS官网发布公告称:首先非常感谢大家的关注!MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。, Y" A$ ? c% I
' N; x$ x9 [) s
( t" T* k# t5 c2 ?
$ T6 h( v9 t, n; o) Q$ k- F/ I
我们一个学术研究的实验室无法做出和ChatGPT能力相近的模型,MOSS只是想在百亿规模参数上探索和验证 ChatGPT的技术路线,并且实现各种对话能力。 我们最初的想法只是想将MOSS进行内测,以便我们可以进一步优化,没有想到会引起这么大的关注,我们的计算资源不足以支持如此大的访问量,并且作为学术团队我们也没有相关的工程经验,给大家造成非常不好的体验和第一印象,在此向大家致以真诚的歉意。 在 MOSS完成初步的验证之后,我们会将MOSS的经验、代码、模型参数开源出来供大家参考。中国版ChatGPT的诞生还需要中国全体AI从业者的努力,也更需要不断。和人交互以提高能力。
, N# E* `) Z2 u# T参考资料:
3 e6 o6 n& U! g( D: V* m& m' Shttps://txsun1997.github.io/blogs/moss.html" V& E! O7 I% ^" e) u+ ^+ ?
https://www.zhihu.com/question/585248111
0 W$ b5 o" J- l5 i) F! }8 l% ahttps://m.weibo.cn/status/4871507265982631?wm=3333_2001&from=10D2293010&sourcetype=weixin&featurecode=newtitle
- h+ ]; I8 J2 J# g& K G特别鸣谢:(授权转载)5 |1 a& g* A# A! @ F
「段小草」https://www.zhihu.com/question/585248111/answer/2903132579, M( A7 M( E5 m" T. I' g
「极智视界」https://www.zhihu.com/question/585248111/answer/2903303710
2 y+ q) ?- ]( p* Q; T, \: N「卜寒兮」https://www.zhihu.com/question/585248111/answer/2903161180 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|