|
|
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。& g/ A4 j+ T+ |/ } ~0 t
这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。
, r o' V9 X ]& ^ 一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
+ \2 i4 S. b4 e, L! F3 c& d 但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。% p# F, M* H! ] F" |0 Z/ `& C
D% ?# H" i4 C2 j( i
鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
; r$ O$ c$ K; a# S& g$ {( @, p* k 不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。, n$ O1 G' x* S0 J; l
在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。; O4 g8 C- R7 y9 \7 J
研发人员占绝大多数
: Z- N2 X' @! q+ K, E 从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
9 C, o' g% I; o# n 预训练部分的工作细分为:
! u4 @ E" ?7 C* `; S 计算机集群扩展(Compute cluster scaling)
+ \0 k+ q" Y9 c' F 数据(Data)) D5 m1 v4 _6 \" g) M5 w$ o
分布式训练基础设施(Distributed training infrastructure)7 B# g3 f: `) N2 N9 R
硬件正确性(Hardware correctness)* @( d, w7 C2 d3 D9 }0 S
优化 & 架构(Optimization & architecture)6 K) [" V7 k( m5 @- F C8 h* m
Training run babysitting
( z, s1 I6 ]* L 长上下文部分的工作细分为:- P' k( H% P* f& Z* H
长上下文研究(Long context research)
4 N" ~* h7 K9 |( O( ]; @ 长上下文内核(Long context kernels)
- `: N& i: d: Y: _& O5 \) E 视觉部分的工作细分为:
2 X: {8 E# W+ X' K 架构研究(Architecture research)
1 x, S/ u5 l1 W5 B: W3 F- P$ p 计算机集群扩展(Compute cluster scaling)' m' j. s1 e- u& [1 P! `
分布式训练基础设施(Distributed training infrastructure)
7 r% F; H7 Z C0 W: i/ @ 硬件正确性(Hardware correctness)3 [" f4 G. d8 M/ `
数据(Data)
9 ]4 s; |& _: s# X5 U( n7 ~, Q 对齐数据(Alignment Data)' D* I+ T+ k0 v7 n7 \' @. z% I
Training run babysitting
3 L9 \+ }! l/ m5 B* P 部署 & 后训练(Deployment & post-training)
0 y* k4 Z8 \7 n" ^2 F0 Q6 y! j 强化学习 & 对齐部分的工作细分为:& \3 x+ B: m& Y" v( U
数据集贡献(Dataset contributions)
% D# e$ N3 z! R* k, }# O$ [0 g 数据基础设施(Data infrastructure), b3 {6 N& ] X* d% W! e- w
ChatML 格式(ChatML format)
2 ]' S! K7 D1 ^ 模型安全(Model safety)
0 w j0 {7 w- q F0 j* M. B Refusals. Z K# C3 [0 O/ \2 P
基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
% Z9 y7 i5 Z2 S Flagship training runs
9 b0 G$ I) p! N; F$ q: O- S 代码功能(Code capability)
2 @5 l" O# ]/ L( G 评估 & 分析部分的工作细分为:5 t' [* M- `& i0 N& c3 i
OpenAI Evals 库
" B- D, w( G4 O/ s( g 模型等级评估基础设施(Model-graded evaluation infrastructure), }& F4 p& |' N
加速预测(Acceleration forecasting)
' R$ i+ G8 U% `* s( P ChatGPT 评估
2 G* g$ e5 {6 Z1 }! V5 E 能力评估(Capability evaluations)
: | b3 |* J( L' K* Z: E 编码评估(Coding evaluations)
1 `0 a* K) X7 T8 L4 J5 W' j5 l 真实世界用例评估(Real-world use case evaluations)
- ^* s3 y9 k* P* K- f6 h, q4 Q 污染调查(Contamination investigations)
4 W) \8 x' |% X4 n, ?% p1 S 指令遵循和 API 评估(Instruction following and API evals)
/ [4 L# C; o( F 新功能评估(Novel capability discovery)
3 C- ^; R5 ^: A8 f. I ……$ N3 z& _% v. ~+ `; d0 k1 L
细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。' Q; o$ H, F- i. m
在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
1 y/ `. ]" V2 M% t @ 在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。
5 {; X6 a2 h5 d4 ^ % F2 ^0 F z: v/ `
鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。4 ?0 L$ W# g+ u
预训练组
; w0 {. h* I( c( `# B4 H! a Trevor Cai
& T2 }, ^+ |' V- V; q9 O; T Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
# I& a( ^3 t4 _. h4 \ 袁启明5 F( r9 H* c% ^
1 m' D* A7 p7 k' a; d& Q
袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
3 o% R+ `" M! x Che Chang" G$ O9 }& t8 O3 \9 E: k/ m
Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。
( ~. `/ `2 N/ ~) h$ ~" y2 W' C 欧阳龙
9 `8 J4 L }, d- c# ? 欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。) {# h" I% h4 j7 h1 [/ y! R0 N2 `
翁丽莲- J/ o6 U$ p4 W) F' x) Y" o
; C4 [4 i- a/ n4 P4 I
翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。1 [. O# T! l7 C' b
Tao Xu
. T) d, G: I4 S0 H( t, w5 Y* u Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
6 E; k- _% N8 r* H4 F' d" o Jie Tang
- G5 S2 K1 o" I. H# I1 W
* \, D/ F- x! b; B8 e. `7 y Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。' E2 s) C& Q0 X
Ben Wang9 }9 Z8 ~6 U- j* Z
Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
, c6 v3 o2 u8 z 视觉组
- S6 O. U, k( v; t' _$ j Mark Chen
, n" X" J* \/ i* g' s; v$ ?4 D 4 G0 O* P* i- x' U. ~ J- ^
Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。2 N' A* N) H5 p2 N3 R3 e0 l& X
Casey Chu
2 o+ T* r+ y# U9 w, j+ r Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。
' R( \0 y. s# k( C% T& Z6 C }: R 胡绳丽
( l9 T, R: e7 H% }2 C# G
, ^9 c8 u9 P% a) f: ]$ n6 I/ Y 胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
0 o* z4 d( J, j, E4 Z* W& ^7 r6 t* R Tianhao Zheng* O4 O. g- N% T: H2 a9 J# g
Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。0 [8 b/ w0 Q. U' n
翁家翌5 o( Q7 j6 g7 X$ V2 H" `
, `+ M. G: _9 W, y
翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。- d# R6 K4 W0 O) u8 S$ u
强化学习 & 对齐组0 T- I7 Q) m$ O8 T6 D
Chong Zhang3 `3 V% j8 C7 }
7 ^; |7 o; X* H6 w& `( H; d1 u# k
Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。 u7 q6 K' Y) `& U, d
Shengjia Zhao
( v' A0 t: ?, A6 g0 D& U4 C
1 c3 d6 n$ G* ^/ K1 F7 F Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
5 X, A' y! b9 g) \5 o- i Stephanie Lin8 A2 a5 `2 U, d% t! l
3 f) L2 H1 e' S Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
- m6 ~* C6 e! y2 H) Q; K; z7 d& k Tong Mu
3 {$ S0 B( H0 E - u. w( [/ E9 n0 R% R, `! ~
Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。! g8 c3 o+ E @; I
Jeff Wu5 w% w- h2 F3 I. D
% j+ F* ?, v! e/ { Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。' l# y) L7 A3 F: j: V* i$ n* k
肖凯, z! h1 ]; b: P! a( J( l
, l. P3 a5 V' f3 A: N. @. K) x 肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。4 i2 j5 T% x3 \ }# X
Kevin Yu( k4 p: J5 `5 Z L
% @( d4 p; l; C
Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
2 z9 b1 _2 G; ^1 W) u W Haozhun Jin
. I4 q) T! \! c1 {; n
' y$ I( s& f3 ~# P& L* d Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
1 W3 e! q3 Z' {1 S 顾世翔
; e* c. M* k: w+ u8 W. s$ x" H+ @ 1 |+ \# n. @5 X' ~6 B7 ?! |( N
顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。1 _' r$ r P* h* v9 l$ U! q& g( i$ S
评估 & 分析团队
% S6 n8 w( S' z Alvin Wang
- s% W' l0 T# v8 @
! x8 H- D; k* Z1 z: c Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。3 s% ~/ M0 x! k- \1 z1 W# L9 d" Q
Angela Jiang% T2 C# U. K [' k: U
; E0 C2 Y& C+ i& P" ^5 m Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
. ~$ _$ Q: H, b4 H Jason Wei* K3 ~0 N8 h4 |+ @
* I( C5 V4 J' H* f4 @. R# [9 `
Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
+ j5 \; Q2 e: j% n1 p: s: a Juntang Zhuang, P5 Q* ]+ C7 q1 b6 ^" M$ x
: R7 P& `, ~- g% `
Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
+ t3 V# M% ?% K* J0 s& E$ k Derek Chen
l1 Y4 @7 I) f: n: A) c9 b! t
. ^$ f4 a+ W5 n: j Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
! i7 f( W0 l6 i" m. e: l 宋飏
# M' k$ ?9 l- @0 t1 Y! _3 X: N , \ v8 [* t) k$ K
宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。) E# i9 }+ C+ @$ j* x
模型部署
. C) m) c3 A2 I; p8 I; r Michael Wu
' A5 s8 B0 p- K7 ?7 S9 O 0 G6 x: O z2 _1 k4 t- ?
Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
7 W7 v/ X1 j, A2 D |. Z3 H Andrew Peng$ ]4 Q# g8 v* N) Y0 d- l! {
5 _; E0 ~1 O1 Q& F
Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
- Z- Q% e9 ?1 [ ?0 I6 e* F 吴雪枫
/ M# B0 _: v& Y4 f
1 D" ^+ H7 B/ | B 吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。0 G( K+ K; _( G/ x5 o6 ]+ S) ]% n
Jason Chen
- r# ~% }1 Y0 R$ y9 b0 c! R 8 b1 v. k; b/ Z; F0 G$ M! p& p! M
Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。
) @/ T/ c1 X" _/ [. i7 |8 L 其他贡献者
7 _$ M6 E9 Z' {; B4 _% L( Q$ ]' v Xin Hu
; x7 G. g- a# i- C% j- C % O% r; B' s6 s9 i4 F/ D' M# g
Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。5 `% t1 c$ ~9 n( G
此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。: V* Z2 U7 v1 B( }0 f
参考链接:& s7 I$ @+ Y- A3 g S: l3 P% c
https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
; N" m" }5 C2 z0 Z3 [" v https://cdn.openai.com/papers/gpt-4-system-card.pdf |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|