京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 917|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
  I, Q4 |8 Z) F* O- _8 m7 o            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。9 ^* P, a* |  \# `8 Q0 k# t. k6 u
            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
- y7 {0 p" Z& j& D( T            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。
/ \2 y9 v2 {3 c2 k' _4 G& [4 e  ?                        
0 W' ]4 ?* x: n7 U+ I/ x/ ?            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
, X! H' O8 T7 f% m' _            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。
9 O! {! `+ @. _7 l, ^) o            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。# [6 c! `# g+ R
            研发人员占绝大多数
1 M8 |1 o2 R4 F9 y( ?            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
5 a+ S" F  J4 U' U            预训练部分的工作细分为:
3 n. w& c. c" P8 e0 Q            计算机集群扩展(Compute cluster scaling)
6 J; ]) c/ s. O% c            数据(Data)
4 @2 n* I% |; [5 Z/ s: d            分布式训练基础设施(Distributed training infrastructure)5 g7 Q1 }/ N: \0 [4 X* g+ q: V  I
            硬件正确性(Hardware correctness)) \3 d0 n0 X; U+ g  \3 I% k
            优化 & 架构(Optimization & architecture); ^6 H/ X3 f, j$ u6 d+ u$ Q5 R
            Training run babysitting
4 A# }8 p# N# h2 R            长上下文部分的工作细分为:' E- S, z: S/ D2 }
            长上下文研究(Long context research)
" ?; T" d' E* T9 z, @3 G# d            长上下文内核(Long context kernels)& l8 v, x' ]  V5 N
            视觉部分的工作细分为:
4 h% a- R0 s5 _5 ~0 c            架构研究(Architecture research)- V4 h  {; W" Q! }' O7 t7 l
            计算机集群扩展(Compute cluster scaling)
8 B: e- D1 }  L  {0 y% s            分布式训练基础设施(Distributed training infrastructure)" _2 A& j" N$ D# x2 B+ ]: \
            硬件正确性(Hardware correctness)5 A: D; ^  t+ [
            数据(Data); I1 X7 g+ P7 o  b7 q, X  z
            对齐数据(Alignment Data)
) h# Y. z0 H! V* f            Training run babysitting) U5 _, U. d" ^
            部署 & 后训练(Deployment & post-training)
! }+ Q! }; W+ U8 x+ a! M            强化学习 & 对齐部分的工作细分为:
' }1 f3 j( p. V. E  k            数据集贡献(Dataset contributions)) j3 M" Z- n! i8 u7 k* o, I1 C
            数据基础设施(Data infrastructure)1 Y+ h6 X& [" c( F
            ChatML 格式(ChatML format)
% u, y; o& n* c; j! K  \0 m( i5 V1 e: E            模型安全(Model safety)' M* Y4 o/ y' s" p9 u5 X5 Q
            Refusals3 n8 Z" u* x3 V& _7 D1 n6 M' t
            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)" G9 C+ Y7 H2 ]. k
            Flagship training runs
: e& G4 x- ^. G9 H" E            代码功能(Code capability)
: q. M# T4 y3 C1 q            评估 & 分析部分的工作细分为:) `8 D. `2 V7 n9 S
            OpenAI Evals 库
) z8 j0 x% t0 ]* k            模型等级评估基础设施(Model-graded evaluation infrastructure)
7 P- D- {. T  a/ N            加速预测(Acceleration forecasting)
) p, o- i* }( j& g            ChatGPT 评估
+ g' G/ L4 A/ _/ g- d3 g( x            能力评估(Capability evaluations)- h+ V% t/ S4 L8 n% X
            编码评估(Coding evaluations)
+ ^9 |' l9 {6 z- }7 D            真实世界用例评估(Real-world use case evaluations)
: D" }" v( E% z$ ^/ ?, B0 s# [            污染调查(Contamination investigations)
+ H, |5 t& k: N3 A8 K. u            指令遵循和 API 评估(Instruction following and API evals)
0 Y! n( ?# h1 a) Q            新功能评估(Novel capability discovery)% q- i( L) b' d) R
            ……
3 a& h+ j4 F7 s. y- v            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
5 U7 c& |; P# I& l7 h8 J4 b$ C0 |6 S            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。9 r+ u0 x$ H9 n4 \' D
            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。
7 a( h& H6 y- O                        * N; Y" j( b, G2 O; Q1 g
            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
' f: N3 ^: s5 h6 q4 I- a) G            预训练组/ Y6 l3 l/ S5 G" L% Z3 z* v) D, p# v0 ~$ m
            Trevor Cai
* L  G# B; ]9 S. G( }* s6 v% j  o            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。; M* |  c9 C* w2 _" }
            袁启明: h# h% r7 q2 d- `2 h- s. \" h1 P
                        
& M9 N+ c* k4 g" P: M7 b            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。4 @! K" S4 A  J( `
            Che Chang: H% U  L% q3 |- Y* l1 h" b
            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。+ ~, m0 K! W' S0 x9 _; W8 x! T
            欧阳龙
- y6 {: l6 w5 G  }. l6 Y) ?            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
5 w# Z! K2 e+ l! C            翁丽莲
' K. A" Q& P4 f* Y                        0 W) K; h2 q3 |+ e) |+ t5 F4 R; d! @
            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。" B$ f& I- @: v' x+ t. q% }3 h$ U
            Tao Xu
/ p. I4 F" `4 k+ k$ G8 a0 }            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
+ K3 v# R$ r2 H( d% |            Jie Tang
  `$ p$ a* u5 }  R# e                        " Y$ c: G% }3 u) [& y4 d
            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。# X9 ~! y! l: i5 f) {+ U
            Ben Wang
3 F' W# s7 X7 }* i3 T8 v* u, o            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。: l5 e% |+ x$ y! |; w& n( f
            视觉组
5 @+ l1 d3 J5 Y  a3 b& o5 E            Mark Chen  X6 U" w5 p. |/ F& @% p
                        # V# n- ~: K! M! B; |" d, o" {
            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
- K2 X: ?1 y; U' O4 h. o            Casey Chu3 M* A4 v! C2 X# O4 I0 `
            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。
! p( a0 Y8 d5 R9 Y5 `* y1 S& _( \            胡绳丽  `# g" R; s3 f) C2 u, b7 R. @+ u6 J
                        
1 T( J, |7 b$ q1 m% g0 D% V1 s            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
+ `. Y& `* @% Z) w            Tianhao Zheng
% V' s' Y) ]$ f1 @' L" x            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。& Y( \, T! G. W
            翁家翌
) K! L# p( g7 Y0 R+ @                        
6 o0 ]0 K2 ~; x) ]7 Q+ s            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。& |( F8 ^5 ^: B; N  I0 E
            强化学习 & 对齐组$ Q% p# ~; s0 G' l# d& c+ U% s
            Chong Zhang
7 a& i0 v# t9 f3 s/ j2 H, D' ?1 G                        5 V% A4 T0 c* e% T4 U2 H
            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。8 Q/ _6 S7 r2 k' T- _5 l. o
            Shengjia Zhao9 R/ X1 ]0 ?$ {4 f5 x
                        
! N& W: j& x# T' U+ a            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
+ Z" C3 ^* y8 z! \5 L            Stephanie Lin# X) z3 v' c  v2 D
                        / f7 G$ n4 U+ X& C8 J5 E3 }1 G
            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
# i, ^0 F: I$ o  s7 }            Tong Mu. Y5 v# y  J) G5 c5 L
                        5 i  T. Y; w4 R5 V, m5 k
            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。) o# c% i& u+ [! m2 }
            Jeff Wu4 _! Z* g% O+ t, b& f4 ^; p
                        
9 \* ^. y, Z/ `0 t+ `/ v5 e            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。# Q) R. H( h% J  d
            肖凯$ S, T2 k3 l- x
                        : V$ w# b! r0 v9 Y; x2 S
            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。! W2 t& U; n, u2 e8 m4 A! }
            Kevin Yu
2 q3 S: {# l+ G8 W$ o1 ~9 ^) V                        * ?6 V  f$ ?" i. X* j/ U' O
            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
: b  Y/ J  \' i4 I; Y$ g            Haozhun Jin4 X& G8 `7 p0 b3 F
                        ) g" v+ ^# l4 a* g  \
            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。) ~8 M7 Q4 q$ h/ ]* K" }
            顾世翔
, D$ L& J- C! F9 t( E( v1 U1 {, Y1 a                        8 v- o5 \. j2 F' `" R" F
            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。- w- }# D! ]; t7 e; l/ `  \9 Y
            评估 & 分析团队" y# L; H$ C: X# ^
            Alvin Wang
  s" j- h. N9 x0 Q" o1 }: }& Z                        
" h& j! u+ C9 f4 Q8 ]            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。9 U, i5 c# y& y; B" J
            Angela Jiang6 y7 w9 t; ?! Y' p$ @
                        
" p9 ?1 G3 j0 o; |$ H: [            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
5 v. k- `5 y0 ^/ m  x            Jason Wei
0 o9 i4 t/ \2 w1 D* }* k                        
; T  c, O+ u% Q+ D" T8 a) Z            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
% X- P; g/ c* l- E9 B            Juntang Zhuang
! p# J% Y8 Y- y# p3 w* S- V. q2 p( a                        , t' E! e% `4 a1 z. X
            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
9 y' ~+ K& |# I" Z- p            Derek Chen
- x' J+ Y7 D% [. c                        5 ~2 z; ^/ n$ s8 s0 R! {
            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
* W# d( m/ K1 ^            宋飏
, W7 y  l, q, B5 ^2 [1 U                        
& P8 P, q7 G0 I5 K4 X1 x7 |' ^            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
# N; U6 f. q' I2 l            模型部署: L8 w3 |4 I  f; H1 e7 g2 k+ X
            Michael Wu3 I3 m, B, I, q8 S- u
                        & I5 i5 A( X& S' r
            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。# `0 g& P0 B+ h- N4 D+ W9 _: e
            Andrew Peng+ V  h+ L/ z+ l9 v* O* @
                        . B# x1 z5 [) Q- Y
            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
6 A; n& P3 B8 g9 `+ x            吴雪枫
# _: y, c' Q: k( Z  h# z* C                        
- d# M. R) ~$ d; i/ X. w            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
4 R7 d" e% h9 A/ b6 j6 B3 |            Jason Chen& V% j6 f/ ?4 _) _
                        3 W+ o+ g* Q4 {, _8 O0 _& u) g
            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。7 x+ u: t1 b6 t. b9 |
            其他贡献者. I% W5 H9 F- W+ C+ W; t: r
            Xin Hu
# q4 B6 r/ c2 o2 g) T, U; u. g                        
3 }) R5 V; I5 k. l, D5 m            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
" ?  I4 t" X( H            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
/ |6 G8 ~) @# w            参考链接:
8 _0 e- p9 g% w( B# a% g8 I            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
# a# S9 I+ y' Y: z- Y* T2 |            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-6-23 22:15 , Processed in 0.053738 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表