|
|
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。, Z8 z" c x0 e% c( L$ i z
这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。
/ @, g* F$ r+ X" F4 j# A' P8 q' \+ e 一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。! j; w! f: h6 b4 [
但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。9 J9 m% g. F2 f
7 p, {" u/ T3 ~, U
鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。9 B' d3 S4 {8 T5 K9 T5 c/ w
不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。
8 P! \; c8 W) B% K( a9 I 在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。" a+ S" a. B$ u
研发人员占绝大多数
! t/ I f5 B/ a* m/ m 从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
1 _& i. S! _2 F, K* Y9 f; Q7 e 预训练部分的工作细分为:
# a/ j1 q* v2 v3 h 计算机集群扩展(Compute cluster scaling)
3 q' ]) F. S% `+ r$ U 数据(Data)) A( B0 y% \6 u( L3 {5 K7 `+ z: W
分布式训练基础设施(Distributed training infrastructure)
3 y# |& l6 R) h+ r& o1 B: f) k 硬件正确性(Hardware correctness)# w1 H$ ?, J& R1 j/ X- k
优化 & 架构(Optimization & architecture)
9 i: ~0 d% m1 W1 ? m1 F9 z Training run babysitting8 W9 Y+ E$ C b
长上下文部分的工作细分为:3 v, I# s0 N: J! _
长上下文研究(Long context research)
& @0 }5 Q: N. d 长上下文内核(Long context kernels)4 A) Q1 _0 f8 u9 ]4 g
视觉部分的工作细分为:
! i9 G8 M! ?1 D: x# ` 架构研究(Architecture research)5 `4 [* _) Z7 u
计算机集群扩展(Compute cluster scaling)
* p' s" J; @' Q7 Q' _. k 分布式训练基础设施(Distributed training infrastructure)
/ p! l- Y$ P6 V4 N/ } 硬件正确性(Hardware correctness)3 \9 x. g! o% L) Z
数据(Data)8 h$ `4 ]5 S J- V' h8 j% V; m. D9 z- [
对齐数据(Alignment Data)
$ m% m, r O. ]/ N1 J5 T ^ Training run babysitting
5 @; K* z8 _' |% I9 ? 部署 & 后训练(Deployment & post-training)
' c1 z& N- a6 |3 Z/ o 强化学习 & 对齐部分的工作细分为:
g* @( D( p& T! E4 G 数据集贡献(Dataset contributions)
0 Q2 v) j" s: V$ C; i 数据基础设施(Data infrastructure)7 r9 H. n$ I9 `. E6 ^+ b
ChatML 格式(ChatML format)4 q8 N" r$ i1 L) c. z* A2 M
模型安全(Model safety); {2 a5 E0 {, G2 H* M3 n5 b7 y
Refusals
& ?1 A2 S) K2 F; i 基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)$ M7 x6 D: G* n5 P$ x) {/ [+ J6 g
Flagship training runs) }4 p, `% s7 P) s+ n
代码功能(Code capability)
- `* v' S5 p! ^6 n( w 评估 & 分析部分的工作细分为:
* |1 Y0 u" ]7 K5 t& k. O+ S0 O* } OpenAI Evals 库 [* m; s* r# x2 X
模型等级评估基础设施(Model-graded evaluation infrastructure)
! m* V; l1 m! k! D7 l& F( I* T6 j 加速预测(Acceleration forecasting): G; b3 J& y7 Y. D5 c- F7 U
ChatGPT 评估
D M+ n4 Y @+ e' v 能力评估(Capability evaluations)
" Y; a( z0 `& Z! s! L 编码评估(Coding evaluations)+ P7 j8 z$ q( t( e
真实世界用例评估(Real-world use case evaluations)# ]3 s9 F0 ]( W* t; Z% N# d
污染调查(Contamination investigations)
; K- h: h5 x5 n% K2 e+ q 指令遵循和 API 评估(Instruction following and API evals)
5 q- Z" G4 W) K$ O6 c% A 新功能评估(Novel capability discovery)- d7 a2 P/ J1 P7 [* a/ r0 H, j
……- x9 i* L+ E, `( c5 p1 D+ G4 e
细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
! o9 F" B/ n. Q+ R) m- A5 n 在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
4 [( y9 k+ S9 z8 l" f- X 在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。3 W# s1 N$ L) w
2 k2 P' `3 _0 N3 n; ^ 鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。) `) |- ?, ^: J' F+ \& w# k% N
预训练组
4 i7 `0 L3 ^, P2 h3 ?( D+ ^ Trevor Cai3 B2 K! N. X. Q, w
Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。( r Q: H: U4 H/ x6 ]. U1 H
袁启明
; }, [0 e. ?% V @* b, Y
! o+ h' O1 a7 ^/ R7 q# f 袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。. e' R4 ]8 f |
Che Chang8 t7 z/ n4 i$ p1 {9 Y$ t* t
Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。
6 f9 b! o' m4 u 欧阳龙
) ]7 M# w* n9 c& L+ q 欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
# P7 l- G5 b+ Y 翁丽莲! |& L6 {( \- M1 x8 s0 V4 j
; T! {7 k2 D% D2 q% H 翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
, ~- i3 m% ?. e$ H$ X0 U H/ o% N Tao Xu
0 o8 G9 V: h: l, S8 m$ ~3 A6 ]) C4 v Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。" S w, W, {6 c& m; U) O E
Jie Tang+ ]1 f2 n2 X% }/ i/ z
: l! u0 Q6 ]+ [+ J& | Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
8 I) l9 \1 J, U8 W5 [8 N& t Ben Wang
+ U4 Q1 |0 B7 W4 v- d& j Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。; S( _5 u8 Y1 y0 F* i! x# d3 m
视觉组- `$ F% j2 C8 ^9 c
Mark Chen
7 }7 A- m. A9 P+ K
# }* G6 ~- i/ b4 f* e Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
/ f. n5 h4 H$ D- Z! \' K6 G' M4 E Casey Chu% @# j7 [ ?- F6 ~, _# m
Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。
6 v2 {$ O' F5 g* p& K t 胡绳丽
' X a' D1 L$ d6 A1 a. t$ ^
3 A0 ~; x6 H) i4 m, ^1 B- u- L 胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。; z4 S4 R: t; h# v# f: r. n( z
Tianhao Zheng
, k, }/ j/ k) p9 J3 s) T* b3 s& T Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
6 A9 b0 |3 z, Z1 y8 \( K 翁家翌
% @) q, B$ g' [$ A 7 z+ o! c* I9 r! b' b- s
翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。7 ^# ~+ X1 H) Q T9 f/ M7 \
强化学习 & 对齐组5 L2 M8 g3 L8 X9 V8 i
Chong Zhang
( L; \) i# G, _6 ]
, x: G. `+ Y# y: p; I, C Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。# {+ a' L }! p! E6 S
Shengjia Zhao
: x( a x8 g1 f6 c# m+ Y$ [. J 7 z. m" l3 ~( W, |
Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。4 }# H/ l: k0 B8 a$ k/ w
Stephanie Lin
8 C3 e2 v* t B% E % I8 g' f4 z, N$ P1 E/ U/ `6 |
Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
$ s$ Z" F) E0 I8 H5 [5 x1 g9 y Tong Mu$ [2 B1 X" w5 W
V- C# Z- X1 M, m! H: m2 h6 N5 k Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。
8 k, [, ]: B5 w. @! K ?$ K Jeff Wu
+ k! Q& {( Y2 j9 ] 0 V. F$ c& C' L" W
Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
$ m; Y+ N" ]# c: o1 n; v 肖凯
" Z$ _% |( v6 N
( s8 w( B9 J' n: J7 ?0 C 肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。4 T$ ]* l& O! g% ?3 t4 j6 X
Kevin Yu
% P7 z( Z" u4 ~, h. d3 x8 F3 \% L% c
2 F' U2 I4 q. N% t9 Y' J; y; ` Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
) F3 F6 {6 ?- c, C# N Haozhun Jin
$ ]- {; l4 g7 A
4 A* [2 J$ |4 Y/ }/ ` Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
% t g# Y+ X `/ \! h6 d- M 顾世翔
/ j3 W8 e0 R% L 5 u! ^# m' A5 S& @
顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。
$ X" u5 D2 T8 B4 s; F 评估 & 分析团队
1 H1 d0 L2 F# j& z& }; N Alvin Wang1 {0 ]( p3 `8 K F& ]8 u6 s/ x
. T/ X, V3 @/ E Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。# j& l/ ]/ G, z" P
Angela Jiang' `: J3 K( i0 Z& w2 W
' `5 C6 m( B. g X' o* S) Y, X Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
& r1 y3 P! Q# H% d0 U2 {+ v Jason Wei9 [; w, d( [2 O# c; }3 [
3 c+ v5 N* k2 w( Z0 B; z o) m Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。3 a% U# W: Q) x9 O3 X$ `0 W) B
Juntang Zhuang
; Z2 z5 n3 E, z! f$ O) A/ M$ s
7 |( Z% [3 N4 Q) P Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
( q9 O7 e Q: U( j+ |5 m, C/ M7 J Derek Chen% ^9 g) l- S9 \! o
, Q+ b$ b! E- d+ O: o: a3 ? Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。, U g; n2 g s$ E5 H: M& K U
宋飏- L7 n; h. e' P1 I, Y% O) Y6 x
8 a6 d- y$ m4 N* N
宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
, P5 Q% R& x/ j6 K% E 模型部署
+ I; S. E9 J+ v$ q7 z3 i% a Michael Wu+ d! n L. E$ W
9 A1 f% r2 w/ k0 Y7 ]) C1 ~ Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。1 ~- e( C1 l# g% n- P
Andrew Peng4 A& R, f; | {9 U( i5 G5 a H' L
+ T1 B2 O' R* W; a) b
Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
$ C+ @! _: J! F5 T9 q S 吴雪枫8 q5 F; \4 F7 K' B( P: _# k$ S
$ l% z: G+ s* F6 ~1 n 吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
2 M& r, K9 s7 F) [4 B8 B8 d Jason Chen
q! y3 p2 Z% T. ]3 o) N& T 4 V2 m9 J" E! W$ E" g! U- w- M
Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。( Y6 \0 n' _( `* E e
其他贡献者
1 b$ V/ f' j6 n" v2 M Xin Hu
9 g5 c/ h. u( e. Y* Q, q: P
' V; d& v e# a! k) n Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
8 K, K" ^2 T1 p2 ?6 O m. Y' ?8 _) o 此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。) L$ {1 P. B) E( ?
参考链接:( {& O: B7 v( x/ i: ?$ F+ ~
https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd( ?9 F5 ^: s( h" K+ O4 V
https://cdn.openai.com/papers/gpt-4-system-card.pdf |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|