京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 856|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
2 C9 Q  E" F, E: e* Z  Y) Q            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。2 z, }( Z2 A& @0 b
            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
2 T. S4 x" C; n. C            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。+ k5 h$ ?6 u7 |. R; N
                        
; a3 t7 a& {* s) C5 e' q            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
  D) M$ H4 ]( a2 @5 s; \            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。
! x- x, ^3 }/ w4 K            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。1 P! B/ D8 x, h% F4 Z. Y' w5 ^
            研发人员占绝大多数4 Z4 m  S! [/ U+ g! G
            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。4 H# S- ?- K* e8 }" L8 Y
            预训练部分的工作细分为:5 o2 k  o* Q# H1 n5 }
            计算机集群扩展(Compute cluster scaling): v- B1 m# O) S% a2 |
            数据(Data)
% o8 _# Y+ y: V6 w0 H  `            分布式训练基础设施(Distributed training infrastructure)
2 J0 _# A# O/ b6 b1 x: g0 [            硬件正确性(Hardware correctness)
5 S" c+ f+ w4 E8 }$ c" J( B! c            优化 & 架构(Optimization & architecture)' b9 r. e1 P, @/ S; ]- G
            Training run babysitting2 }1 n' L( r: [5 `8 R; e- _/ s
            长上下文部分的工作细分为:
; [+ v7 L7 |  R- G6 \2 |- `7 h            长上下文研究(Long context research)
) J. w. s1 b! t  i4 m+ v            长上下文内核(Long context kernels)1 U0 _! ~; v( u9 ~/ c
            视觉部分的工作细分为:5 N! t4 Z" q  X+ N# P/ c1 p* t
            架构研究(Architecture research)3 ~5 B1 Y& F# f& P0 O# Z% a
            计算机集群扩展(Compute cluster scaling)
0 f. e$ `% J) v2 m$ }            分布式训练基础设施(Distributed training infrastructure)% G3 x! O, `8 K4 u4 G' l0 w5 X
            硬件正确性(Hardware correctness)
. ~7 A7 b% @1 R            数据(Data)
. Q- t0 Y8 L5 `. Y' j$ }( p            对齐数据(Alignment Data). T8 s. R0 d9 e& _1 X, h
            Training run babysitting" F% p$ s8 U$ @, P
            部署 & 后训练(Deployment & post-training)
( |" u$ o, E8 }. C5 B            强化学习 & 对齐部分的工作细分为:. m. m) k- S: W1 }: A" d
            数据集贡献(Dataset contributions)! d2 s# K, Q3 N5 ~: h
            数据基础设施(Data infrastructure)( F' J9 t! \' \* p
            ChatML 格式(ChatML format)1 V) P! D: F+ g; [& M
            模型安全(Model safety)
& J/ f7 j$ W$ n6 I7 |  C& M            Refusals
" [( \# N6 d4 u            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)' T' F! Z) c5 \. t9 z- C5 i
            Flagship training runs
% T% @! ~. O. m, F7 y8 ^  c* Z% l            代码功能(Code capability)% y" ?* a- t( G% ]9 L; V7 I
            评估 & 分析部分的工作细分为:4 X# u: J6 g  E$ i: z
            OpenAI Evals 库  S/ |8 ]# I8 ^/ v. W
            模型等级评估基础设施(Model-graded evaluation infrastructure)
. u' ?# e# \1 C$ B8 ^/ R            加速预测(Acceleration forecasting)  D7 E3 }: c6 Z8 j( K
            ChatGPT 评估
& r5 n1 d8 O* k7 I& Z0 A            能力评估(Capability evaluations)
3 x8 D7 S4 u& ?            编码评估(Coding evaluations)% Q/ j: ^5 \1 m$ u8 ?) O' p
            真实世界用例评估(Real-world use case evaluations)
( U) s! q8 D2 a% X2 Z' z" j# B            污染调查(Contamination investigations)
- K/ t" d& {# p; o1 j3 }2 |, R: Y            指令遵循和 API 评估(Instruction following and API evals)
: r- ^  X+ L/ L* r. X) c            新功能评估(Novel capability discovery)
: W" j5 \, v" M            ……
# s# S! g% u& G0 E            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
( G+ ]' V3 r: K9 P            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。7 t* f5 M6 n: a- r) F9 I
            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。
& }) f3 U! ?0 L4 D- Q: G                        
9 Z' G, K4 X, @8 B; ?            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。3 m. d6 {; G1 J1 X$ h0 q2 O3 p) S
            预训练组$ g6 |" r4 c; n6 m( {+ p
            Trevor Cai5 {, X/ z- |% I  H, `
            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。" a' H/ }) W" B  b" d
            袁启明2 l2 `$ H6 `. k( h1 D# e& x
                          r5 ]4 d: N3 M( ~+ M5 U/ a, T9 m
            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
. @. j0 C; K6 {5 m* J            Che Chang  ]& ]0 `4 q! C8 c+ ]
            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。2 I, c( q. ~& s/ ]/ A2 R+ O3 Q
            欧阳龙
( n2 V( h7 l) ^7 [8 }            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
$ D* v; a. k2 \* C: \8 P            翁丽莲% `; M% G/ Q' a7 u) N$ n
                        1 K7 U( J0 W' r+ A
            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。5 X8 o! H' K1 M' M4 [8 l) o
            Tao Xu
3 ^" ^6 P6 a% p* U- ^3 a            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。  q: X0 G( h/ t5 T( u
            Jie Tang2 \6 G/ d$ N$ D/ I
                        " P1 o  b/ |& y5 z0 I& w. Z
            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
4 z, e5 y8 f# B2 s1 K2 s- ?            Ben Wang
* B1 u( ?4 {7 Z0 @$ h+ w            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
( f) s, D' _* C, H% A! X# z1 i            视觉组. o0 ]( C3 W& S4 h
            Mark Chen
5 o( b; E! `+ I7 Q$ W! w# i                        
% @/ a) M; v. C( h+ R            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
3 e3 P  `9 M' p            Casey Chu& b2 L- K* o2 a# ?7 ]
            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。
0 J' U! T6 g( p9 t6 ?: W) K1 S6 W            胡绳丽1 t3 J) e! O& S
                        
9 }1 Q- V2 O* L/ u# C  ^& j            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。% S  S5 u6 C8 l- ~0 \7 N% Z) C
            Tianhao Zheng8 A% z3 D" v. x6 T- t% P& N
            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。: M$ ^' g0 T3 k4 T
            翁家翌
/ C2 D1 [5 Z! i+ ~% Q+ O: y                        
! [3 h  F+ Q9 B4 ^( J            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。& j: q) n4 t9 M  ]: B
            强化学习 & 对齐组
9 K: y& \9 X: X/ s7 u, x+ E( n, L            Chong Zhang
& c, S0 f9 i! O# J7 F                        
8 l. }3 n, m) N: X/ Q1 f3 R1 O            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。7 v: o/ x; w3 R, j/ d/ A
            Shengjia Zhao# D4 W$ F* T+ x0 I( @( e  s  ]
                        
" k; h( n/ x4 C0 J            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
8 B* l' n$ J6 |; y) V            Stephanie Lin
. L. k; h- d& _& E% w" Q# x                        3 t5 F: d0 a# |% G7 b( G& ]
            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。" {( e% @  c! L' U  ~3 P* n
            Tong Mu; w$ D5 V1 ^" y) @6 t' F" R
                        ; p* h+ }+ _/ ^/ Y" B8 M
            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。, Y1 \+ m; V0 S1 a+ t
            Jeff Wu. }6 x: j1 u6 }( d
                        
  ]+ \! {6 P; O9 {9 x/ o) w: Z" L            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
- [, U1 k( u# N) n( k, m- g0 g            肖凯
: E9 D! E6 A( C, ~9 j                        & G7 O; r/ @( V5 O( d
            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。
$ q: B% O" r/ M            Kevin Yu
5 e5 g7 e" }! C- X! w. O( V4 e                        , y/ h* i' p" P( o" x6 @3 x. v, q
            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
% E  [9 ]/ z1 ?) M! N; b9 ^            Haozhun Jin' Z6 y' C9 K# U' `
                        
# {5 C( e/ ^/ b# O! k7 x: q            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
- @* J  S/ P( a+ `- q8 W% i$ |            顾世翔+ `0 h+ H, k) [5 h) x; ~* X
                        
( V+ \& k( t2 z            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。) O+ ~* u3 A8 _1 C" n+ q
            评估 & 分析团队( L0 ]& r+ W' \0 Z% u, P
            Alvin Wang
& T0 d  x5 j: k9 B% A+ r( e                        
' }6 }$ `. L2 H; f% |            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。: b8 f5 T! ~1 @
            Angela Jiang
2 c2 S) x$ @8 }5 s6 D" c                        % q! T# Z5 d8 F" y
            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
. [( f# C' [  z7 N5 A            Jason Wei) n0 u0 v9 B1 Y6 W% ^' h
                        
: `5 ~+ H  w% o; f7 H( Z1 \            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
* q0 _$ [$ `( |' G  u            Juntang Zhuang
$ {6 N2 p/ x) n: w. L+ W                        
; Y( F! n2 ]& {. J3 ]  [4 b            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
; \0 l. w4 D6 B            Derek Chen5 K5 q1 [) ~# m, G3 a
                        ! K5 T# s- E# ?' U/ c- a8 b
            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
; z4 I- ]. n+ L2 P( ?* R5 i" M4 D            宋飏* C* ]; U5 v% r- m: w  U
                        % u& c& }8 O6 l; g. X4 D* \1 e8 e
            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
/ @5 h" g) x& P# W            模型部署5 |  Y# P6 I/ x# }- w% |
            Michael Wu5 a( \% F9 W' N" c
                        
  \+ Y; b+ l0 \1 V9 c* u( `0 P+ J8 h            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
7 ^  v1 E3 t9 A6 q2 z9 B+ M            Andrew Peng
4 t/ u: S* L& w8 T* s. o                        
7 }* U, n* D) ~            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。" n' h  `9 T4 S. c
            吴雪枫
- e+ [' k) k% C1 T8 D  W                        
2 K0 {. S5 M. R9 s" W* F* }9 \            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
" X2 Z# v# h6 s* @$ q            Jason Chen
  v+ U' x/ a$ b) {  C                        6 J4 q8 F  m2 U
            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。2 z5 [3 D# }: T& o/ x( _
            其他贡献者' x) t- [2 ]! l% D! S7 \
            Xin Hu5 Z8 {2 e! E) W9 Q
                        
1 l6 q- `/ {7 C+ \6 I7 P3 O+ t            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。% ?. V8 R! X) X  _( b
            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。: O) F, C! Z' b+ T
            参考链接:
& W9 }4 x8 ~0 V# u- I, @            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd. m* Y4 y/ }, v7 J0 K
            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-2-7 21:17 , Processed in 0.040912 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表