|
|
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。2 U8 B. P, _. w7 H! A
这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。( w; G" V4 s! E. M: n9 G- |
一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。3 Z+ R0 ^, v3 c6 E" @ B
但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。9 _7 R6 o/ ?9 ~0 Q
! ~ h* v& B# w6 ]
鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。/ l) \% a4 J9 r% f8 x
不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。3 c5 W8 i7 t d& w2 v5 C7 {+ u
在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。
5 ?* E% y8 N' y+ m 研发人员占绝大多数. O" t# t0 Q! e! [! |
从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
y) h, M8 b" z' D 预训练部分的工作细分为:
+ I1 \4 j: O0 n$ B3 a+ a( ` 计算机集群扩展(Compute cluster scaling)# p+ S' t* t( C! L9 g" ]* T
数据(Data), Y" J. M9 V4 K7 o1 y
分布式训练基础设施(Distributed training infrastructure)
' C9 V" I F1 b! x A H# J 硬件正确性(Hardware correctness)
- c6 l) \: j/ B3 u 优化 & 架构(Optimization & architecture)# E# n( n) f( n! B+ O- D
Training run babysitting
5 U* l1 N* D L+ B* s; A 长上下文部分的工作细分为:, X5 @7 A# ` j: e: e$ M* M- t
长上下文研究(Long context research)+ M/ j3 M9 p7 O; l8 `4 W+ a
长上下文内核(Long context kernels)& [+ [2 G0 o/ D$ J# z5 G# o
视觉部分的工作细分为:3 W; ], z; L7 [
架构研究(Architecture research)
3 S7 i9 H0 T d0 J: V 计算机集群扩展(Compute cluster scaling)9 N+ I; A$ V1 D& u, E& [6 i
分布式训练基础设施(Distributed training infrastructure)
" E" e5 d- R, f+ x. l- [) U 硬件正确性(Hardware correctness)
, F# c, x3 k: i1 q# L4 B 数据(Data)
d: g4 P, B* z/ r 对齐数据(Alignment Data)
4 X% ]8 C# h* i a Training run babysitting2 u0 y5 f) D6 N/ X% n
部署 & 后训练(Deployment & post-training)
. d: {. R2 U3 z& p 强化学习 & 对齐部分的工作细分为:
# ^2 C0 A; e8 I0 `7 a 数据集贡献(Dataset contributions)4 ]- |* V, B: ]) \( f% f2 l7 e0 ?
数据基础设施(Data infrastructure)) [/ k4 C# f4 Z
ChatML 格式(ChatML format)' N7 G$ `# [) p7 B# Z! `
模型安全(Model safety)
: b/ }! B2 T, n7 _ Refusals& H2 u6 L: c8 w2 S
基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
8 B) h2 N3 ^) l+ r1 [; | Flagship training runs; o' X4 w. c8 o' |1 K9 l4 k* Q9 B
代码功能(Code capability)8 \9 J' q; y9 k, O6 @
评估 & 分析部分的工作细分为:( g C7 ~) D7 R6 ^0 k; f! J$ W/ Z
OpenAI Evals 库) m' L1 P/ N, B" a
模型等级评估基础设施(Model-graded evaluation infrastructure)
% J8 r- k* h* {; Q. y7 @. T. J$ k 加速预测(Acceleration forecasting)
% O, N/ g6 y2 z. H ChatGPT 评估# J8 ?0 ?2 {+ \; |( `( I8 N
能力评估(Capability evaluations)
! L# [5 v P& z, }! f7 b 编码评估(Coding evaluations): s* `. r0 s5 q" L$ r2 g
真实世界用例评估(Real-world use case evaluations)
8 O# {. `' n5 x3 @/ E4 r 污染调查(Contamination investigations): A# m; @- y, \
指令遵循和 API 评估(Instruction following and API evals)
) m+ L: E5 x, I( ?, j) z+ t6 F3 T& ] 新功能评估(Novel capability discovery)/ H! a3 l, T: ?( t2 Q
……% [0 J& _% E/ O% U2 a' I
细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。 s- s r$ r, Z' C2 \, R
在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
! L$ h/ S+ E; K+ @0 H 在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。
, V F( c9 A8 `- N' u
& e( N; f' k7 }8 l7 P 鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
& P2 c; I, R" Z; s' P2 o" J9 ~ 预训练组7 N: A' Y( m, Q$ C$ S
Trevor Cai
) Q* N8 k @ }; | Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。) ?5 t. ~9 d4 u. Q) Q+ ]
袁启明
: W" D3 w' z8 n- e$ J* X " k5 D. V' ]% c& C# x1 b+ j/ K4 W
袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。8 f0 \, [+ e5 H
Che Chang
8 w+ n. ?$ z. m( g Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。
) c8 ~ Y5 Q3 H; E8 `- a% D 欧阳龙
1 L1 D9 u$ s7 v$ L$ M2 M$ L8 G! I 欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
) b& h; e9 j$ H, U 翁丽莲
$ E$ M! p$ u8 a( @
) E6 h! H; W8 x3 ?; G 翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
! @/ g& ^* }3 k' ^ Tao Xu9 ? _* u3 Z' O: B" A6 w& T- F
Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。+ A* m6 }/ X7 ]& G
Jie Tang! m9 z* F4 x6 w; Q2 H* b: Y, U
5 h6 @/ P& [: @) W0 N
Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
) a1 c, m) B( J* t e Ben Wang
* E% X& E2 M, h6 C# m1 e' |1 j( O Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
* m! f( _1 X5 h: s$ ?& a 视觉组! ], j! K7 _- @8 X! q6 Y2 @$ ^
Mark Chen
1 t; |! W( R# O4 R3 P% S
c- q8 Q9 _: e5 e Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。6 P; n4 q# S# \6 l8 P1 H5 [
Casey Chu0 U* Z6 t, \: j* N- h J8 e: B
Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。, k5 R' j/ G' q" ~# Q
胡绳丽
4 A+ i4 _; p# B+ g5 |
" T$ o( S* `) P1 X! z+ L: ^) I0 h 胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。+ }% H z+ [ V4 J* v6 a. I5 h& _
Tianhao Zheng
) b$ ?5 j, g' N( ] Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
, m4 Y& M, \% K+ ^ F 翁家翌
! ?" _7 j$ a6 `. y; t, {
& H! Q& h5 b6 c 翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
8 {% p5 `: D9 M" V5 a) F% ^- k- e9 } 强化学习 & 对齐组4 V0 E4 I" s4 [$ T" i9 p
Chong Zhang, V' W1 u1 j; c) @
9 Q& T0 ~5 W$ c& ?5 {
Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。0 F% b6 b4 i t/ t, E. p) v
Shengjia Zhao
9 N* u" b* m7 a; b - x3 O X" w+ T! l; e
Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
2 |4 {1 x r/ B- v+ A8 g6 {) ^; s7 n Stephanie Lin
8 C( ~0 \. e8 K# d1 x; e+ G ) q: Y3 t2 o# n8 E+ ~" N f
Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。1 Z! N# h' n) C8 C3 s6 ?
Tong Mu
1 { V. u1 c, a# b; s 5 Q8 g: E+ a6 H# Q0 e
Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。3 _7 ]/ t, l3 ?: N' j( ~& p7 A; Y
Jeff Wu
+ F) J4 _3 U; s
& m* ^4 h' h" x0 \4 v q, [ Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。2 i2 h w" x: Q9 D
肖凯1 q+ q5 T T2 n3 w$ n, I
8 g- S( _# b% W) t# o) f 肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。# K4 h8 H1 E, X* c
Kevin Yu2 q" Y. {& ~% E# Q* Y* Q) ~0 b
- X; b; W7 p) d: @% T+ K
Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。 p" A& ^" |- V$ I
Haozhun Jin1 |3 U. V* C# k, l
. g- A6 q$ L, t* y4 r8 \
Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
$ X/ @5 x9 J( O8 ], n- L 顾世翔
3 n) X+ B# Q* z5 s
- D! p3 ? z% L) I7 b/ O 顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。4 D% A+ d% X$ v+ |; Y; w5 _
评估 & 分析团队" h* J- G( s3 _% p1 q; q8 N4 H
Alvin Wang
# G. s, _( D9 R" p" T$ \" w' d 2 M- C) f" m& Q0 k& l
Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
X" e* s8 l: `5 G Angela Jiang7 I5 j, i5 b% T0 ]: O
2 ] i0 @6 ]' U ^$ y4 G0 k Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。2 `' s, E( x, H( l* z! N* U
Jason Wei: e6 U) P: D( |
m P$ i- C8 O6 S/ K, I: \ L Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。$ X7 g& Q3 }) Y5 ^0 X: f, ?% a2 F3 d
Juntang Zhuang
, |; a- k) s0 p
" X: W( Y$ X: M" w T! d Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
( p$ q, [' H4 D8 b% J Derek Chen4 O- E$ R& j$ B
& z6 i3 Q& @) z- w4 z5 d# z+ n1 N Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。3 A5 c- @; `8 O0 \' z
宋飏
+ K/ P# @4 u, Q7 e) \ 7 l2 u7 _+ ^: V) a& h7 p9 m' \9 t
宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。/ t4 R7 a$ P5 F ^* |, k+ R
模型部署
; j3 I3 q1 m2 z w2 X6 V+ m) c Michael Wu
$ k- _, F& f" B$ q, h q 5 M. C" ?7 w6 [/ h( p1 _3 z
Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。% P3 e$ n! G1 l% B" y. v* B
Andrew Peng! |* I3 X( I/ m% L% y' k, g
& t5 P8 ~0 S b8 z. y Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
- M/ z5 p: e% U6 _9 {0 H 吴雪枫
7 v5 C" E; x- i z: Z
% L+ i0 I- C& W6 g6 w( p 吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
1 [; J7 _7 {2 `" X2 @5 {7 m" n Jason Chen
" o: R0 {) |9 P1 u 7 c* Q, t; ^) ]% k0 ^+ y8 l" m
Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。" @3 X/ v% ?+ L& v% ]
其他贡献者1 j0 W% w( r2 a* l. Q r' X
Xin Hu
6 Z7 S- y5 r$ d D% Z. s
/ C* B5 Y; b" f% ]$ | Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。: U! s" f$ L Y4 J0 S6 {% f. q
此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
1 l& G& O9 k' r) |$ m 参考链接:
4 o) f! O# d" P3 Z% n0 g https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
6 o% I9 n5 ~5 I# i https://cdn.openai.com/papers/gpt-4-system-card.pdf |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|