|
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
" F( ?3 K: ~3 m8 p 这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。5 Y3 Q. Y+ ?2 I
一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
- f4 D1 }! Z! t 但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。$ s& E! u3 Q1 ?' k2 J' ~1 P j
, N3 N1 `$ A, ^; X; j
鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
* s% X0 o. y) ^2 z- t 不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。
% c, e" Y6 O) W* j) |9 \+ u; h 在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。/ s9 f- H; d# u9 b" |9 \# @8 A
研发人员占绝大多数
6 V7 a( c3 b+ ^ 从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。- l h3 I- z( G
预训练部分的工作细分为:
/ Y, X1 n# V: E$ U2 J' @( c* p 计算机集群扩展(Compute cluster scaling)
1 F$ P) ]8 v. D1 ^3 j- b 数据(Data) X' D$ ^% z. Y; x. m$ Z; T
分布式训练基础设施(Distributed training infrastructure)
! M9 v0 J# d! B& A: D9 Y 硬件正确性(Hardware correctness)8 ]* v& N! | h
优化 & 架构(Optimization & architecture)
3 h0 _: U- H- V Training run babysitting
# Y6 t* Y1 A2 N! x0 B 长上下文部分的工作细分为:
# Q) I" k+ N8 E- ~4 U 长上下文研究(Long context research)& I' d2 J4 d, G0 k% c) h
长上下文内核(Long context kernels)
) W: H+ T6 m3 L d 视觉部分的工作细分为:
+ }2 _5 q4 e2 Q( \) i 架构研究(Architecture research): r3 U( k6 b! m: r( n' B: X# j
计算机集群扩展(Compute cluster scaling)
) H+ J8 v! X& p/ j7 Y( _4 u% q 分布式训练基础设施(Distributed training infrastructure)
& t7 u8 m" _5 @2 P+ e 硬件正确性(Hardware correctness)
, Y8 A; {; F! q! I. N0 a$ D+ I 数据(Data)' d* r! i5 i+ F1 h
对齐数据(Alignment Data)
- ~+ N5 ? e4 i$ l Training run babysitting
, ^( R; ]( F7 w 部署 & 后训练(Deployment & post-training)) y1 P$ l' a5 y- ~1 j
强化学习 & 对齐部分的工作细分为:
5 j. u7 a' b+ t' ^ 数据集贡献(Dataset contributions)
* L, {# ~4 Q- h& w! ` 数据基础设施(Data infrastructure)
( ]- M1 [; T# ~6 B; I; X- X ChatML 格式(ChatML format)
v+ t b& T: M" G 模型安全(Model safety)
+ y! K+ ?' R5 @ Refusals
3 o# k/ m1 L7 g+ M9 M' P5 K 基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)# V: p; ^! I- ?4 I8 Z
Flagship training runs i' a" @. R4 N3 n9 A
代码功能(Code capability)4 v6 f1 B! }* Y9 p+ B4 K. n
评估 & 分析部分的工作细分为:( ~. C6 O/ R+ z% N/ e
OpenAI Evals 库
) V% x9 V x; G* u. I; H' q 模型等级评估基础设施(Model-graded evaluation infrastructure); }! L$ }& R, [% _9 o8 ]
加速预测(Acceleration forecasting)" M, Y# N1 |$ a" {1 H ~7 ~9 k
ChatGPT 评估1 u2 q) ~3 {. f9 e( c2 o
能力评估(Capability evaluations)
, V; Z' O$ |8 k2 J1 ]; K 编码评估(Coding evaluations)
8 {/ }1 p7 N* }2 O7 {1 z5 _, w; O 真实世界用例评估(Real-world use case evaluations)! w) V7 t/ |; `4 t- Y
污染调查(Contamination investigations)
6 e* a" a+ Z* G5 T) f 指令遵循和 API 评估(Instruction following and API evals)
+ p4 P9 x2 f4 @8 n. P 新功能评估(Novel capability discovery)
) }( D; C! q% @( B ……
; Z7 f$ x6 \8 K. @2 u 细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
) I1 X6 Q: a2 p: w 在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
# @$ ]1 `. `- M 在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。
# Z4 b( T, R8 F$ L6 q , C( Q' c# Z! h& p2 B% j, o y' S
鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
/ N* m3 W6 _- K6 s 预训练组
7 G5 Z) k3 I% j' |) _ @ Trevor Cai, K% ~5 Q R. a, v7 z
Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。# v. A9 t# o3 Q' a! c
袁启明
8 ?- }; r& g! y; S6 R0 c
5 y; l' s9 H! J* O# m& L, C" O( a' i 袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
' a! c$ I e5 R% ]4 C. l1 s8 U Che Chang- G* t4 R% B; N; z/ f. v
Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。
* l+ Q, [5 ^ t4 ` G$ ` 欧阳龙
5 I% S+ P# G0 f5 ^0 g6 k4 k 欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
2 G" ]& f" V2 j+ p! [# u 翁丽莲
' B1 Z- o1 Y* y( |0 \' k3 B ! [2 l& W+ o/ e J
翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。( L4 s2 [/ T) F6 z) g O, h0 B
Tao Xu
+ U' C* s/ @. Q Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。- m; k3 w8 c/ t& l
Jie Tang* u7 s7 Z0 _- e! v! U6 i
6 X. A8 M# f% m0 q. e" d& w" q6 p
Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
# @' z* W: ]! H8 V+ C6 { Ben Wang
. v: F8 u% U% X* n Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
/ u7 J* Z9 `+ F- W% K* d 视觉组
p; ^, n i( L# _* N( R9 t Mark Chen
! ^* [% u ?% Z* N: m : X8 ]0 @0 R% j5 e, U7 I3 m/ e
Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。2 x0 G3 P/ D. I& B7 g7 l' j1 G
Casey Chu
( O/ {9 g1 ?" j; m Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。
, H6 D/ u$ d/ K/ H+ W 胡绳丽
. W w& E* l8 {# D! }# L
- t2 K& C( I$ q, r 胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。6 { E3 n- p" v$ J3 {' h" c9 ~1 z
Tianhao Zheng r- \6 G% j M4 Z# d3 f/ E$ G) o
Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。0 ]3 ^. [! J9 k* T
翁家翌
2 q1 y) h! r7 I8 M3 O# N" P
- r7 j; z; ^/ I5 v- _ 翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。( W) f( N! a! _% {. V
强化学习 & 对齐组) {+ x; U1 N7 K5 h/ Q: W7 x+ @# X
Chong Zhang
' p7 ~4 w. n: B# e# q4 g( W 3 {0 N8 Y2 ~$ J/ _* {2 [! V& Y3 N
Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。
% f9 h2 l& Z1 `) F' | Shengjia Zhao
0 M) U/ u& X: {) I8 Y5 n
# z) x/ p8 w3 w6 O* \ Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。$ m9 y2 t0 D! j# Q$ Q3 S; u
Stephanie Lin
' G& |5 W1 `" o9 h7 j : J; v c, a8 W1 t1 \
Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。% J! G' o, \7 D4 @- }: ], Z
Tong Mu
5 b: U" R7 ]: a W' A / h( O; H$ O! y! {
Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。
( @6 P0 m$ a$ m+ }2 D, }' c Jeff Wu
! c6 [: Z! T: N& m * v, l( s% L+ N5 x3 N/ u5 Y
Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
: A8 I) k( C3 R: t4 m 肖凯1 i" i% f1 w6 l. ]$ W# s- x1 B. @
6 d2 Y5 B: a4 w1 i: L: n
肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。3 w* {* x& A, L9 V- O
Kevin Yu
3 ]' z& F# V9 K% X# X/ Y + S9 [+ ^3 \) K* I4 z. v
Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。0 \+ S2 {1 f1 ~( b9 q8 }3 |
Haozhun Jin
1 T, u2 K" p; X' \" |7 E4 M0 O 3 V7 a* R& N. X4 Y% |4 x" l4 I
Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。$ T u$ y$ z$ K+ ?* R
顾世翔
) `& |( \- Y7 l
' A+ v# C' ?* N/ n 顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。# v; Y5 R h' t3 C! S
评估 & 分析团队' t% ?7 P: V, F: f3 `
Alvin Wang% {, k/ H+ M, K, Z; u$ t+ y
1 n( @' Y& ?/ ?: M6 i Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
# M- s- I' _( m: \( ]* U @7 w4 \ Angela Jiang
; F) A. k8 H" H4 O3 \' O
/ z3 F7 I7 Y: u" R) d" Y Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
( o4 p8 w$ C2 A3 n3 L Jason Wei7 _9 q% m( a2 |" H4 u; a/ I& T
* U& V0 j: V4 B3 y Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。4 m" I7 X9 c! s: t8 X' N) n) b
Juntang Zhuang h; c" v0 R0 r4 x& V# c& h8 Q
/ U4 U: e; }. E8 e9 j! h# C Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。0 w8 ]$ \* L1 {) w' R$ N H
Derek Chen% Z0 e y6 S- x- B0 Z0 f* N
1 \/ ~7 S' [, N+ i" V D
Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
+ n, p8 Y& J& b% r3 r: ` 宋飏9 ^! o0 c) O& A2 s e/ _% U; s
, D* [1 f4 ~- j$ |" T& X K4 K: s 宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。3 }+ T( o6 k2 W6 b% ^
模型部署5 y0 o- L6 {5 m/ u; ?
Michael Wu
/ Z4 p7 f8 A5 y! v- h2 B3 n$ G% y ; x9 O2 S8 A. y( |! i2 x
Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
+ i% c3 U E; L, X- A$ I- ^ Andrew Peng& B+ x/ }: H+ `/ ?2 }: A9 [. x& t, H
4 C _) p6 c% S5 ]
Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
2 _; y( `; T- v" `2 Q2 t 吴雪枫; I3 T2 O( U I, @, B' Y
6 }$ O o; ]" r9 Q
吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。 h& r& O+ S* k2 Z) W `
Jason Chen
9 P, Q5 a$ f. w
# B- q3 ]& O0 B g3 ?& j3 h Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。
" Y" V5 z0 {0 G$ o; t1 k. } 其他贡献者- A% I2 J8 U- Z4 {) f. J- ?
Xin Hu* X6 a% R9 b) h. p
* ~9 L5 i+ h6 w. _, t: X6 z Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
7 E5 K0 U- s$ O* i2 p 此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
1 j, {6 Z; u- ~# \4 t 参考链接:: V% z8 k- J" d: x/ _8 j
https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
1 c' J2 R4 D8 ] https://cdn.openai.com/papers/gpt-4-system-card.pdf |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|