京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 916|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。, B2 l- c1 w0 h! L# \5 z: Q- X
            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。
+ R) d% M% _2 W+ ~' R            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
" \/ \7 z5 O  l( n. E$ h- x            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。
! J% P2 c0 V; x( d                        
; w6 \# Z8 w1 {# j1 j" E& ~8 B            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
, V8 c3 U' ~$ v0 w* |9 i/ C3 Q            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。) J0 R! E% K0 \5 P' E4 Q+ n
            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。
: g/ C" P) z, p7 T            研发人员占绝大多数1 G( v2 m3 [$ S/ q
            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
' B8 U0 A- s$ {/ L( J% N; @            预训练部分的工作细分为:
$ P7 c- i  ]& S5 y$ F4 H            计算机集群扩展(Compute cluster scaling)& |4 F) m9 q4 p
            数据(Data)- p3 a$ t9 [1 t
            分布式训练基础设施(Distributed training infrastructure)
) n# D# p, S, f' }. B3 R& s; d            硬件正确性(Hardware correctness)0 B* ~1 u0 x3 i. N# c1 H
            优化 & 架构(Optimization & architecture)8 ?5 s- l6 D8 z8 x# Y
            Training run babysitting
2 @/ U+ X, P; e' b+ p) p. h            长上下文部分的工作细分为:
, v1 X& O2 S0 f$ X            长上下文研究(Long context research)
& e: o* ~5 A; c# R* g1 m" q* z            长上下文内核(Long context kernels)
1 n& y8 Z& z: C0 |" i            视觉部分的工作细分为:: l( I2 M3 \. [. `& C& M; @, Q
            架构研究(Architecture research)- `$ @( D; y! l4 p8 ?
            计算机集群扩展(Compute cluster scaling)
1 ~8 ^( {' o4 C1 ^' v9 Y            分布式训练基础设施(Distributed training infrastructure)$ n1 U# l  j# k! b. `9 |" R
            硬件正确性(Hardware correctness)! F6 _1 N2 l4 I) [0 I7 a' V$ l
            数据(Data)  g& d6 J7 W0 }$ ^( c( X
            对齐数据(Alignment Data)
& r& G) Z- m0 ^7 S8 ]            Training run babysitting/ K( d$ E. O7 P- g# t4 R
            部署 & 后训练(Deployment & post-training)
" j$ L7 A* M9 l            强化学习 & 对齐部分的工作细分为:" w2 h+ e6 |: M" @) \9 w3 S
            数据集贡献(Dataset contributions)
" h, Q% e8 r, ?7 O$ G            数据基础设施(Data infrastructure)( c2 n& p3 y) M# m
            ChatML 格式(ChatML format)6 b4 q: N: n2 F+ F9 ]
            模型安全(Model safety)& s; ^' t1 ]9 F! F+ q& }
            Refusals4 r* H  ]5 k2 h6 b% p
            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
  F1 [5 @7 O: n7 _/ o            Flagship training runs
( f  X% Q$ d+ I6 @            代码功能(Code capability)) L% O( A+ w! P' N: o& K/ @
            评估 & 分析部分的工作细分为:
- O4 D3 Z; p3 i+ o: z2 d. h            OpenAI Evals 库! x% A  @" H# r
            模型等级评估基础设施(Model-graded evaluation infrastructure)& p2 D' `  c9 i/ G, ^
            加速预测(Acceleration forecasting)# ?! `8 ^8 X: ~9 p" q4 a5 I$ m
            ChatGPT 评估1 y  W3 t1 i: j3 V& x9 `! S
            能力评估(Capability evaluations)
4 H; u; j) K" q6 E/ M* c* L1 h, n            编码评估(Coding evaluations)
# x0 T1 J* h& N6 \: c9 Q/ }            真实世界用例评估(Real-world use case evaluations)- x7 f& [9 u# U/ S% k* M$ Z
            污染调查(Contamination investigations)4 _$ ~- }. A0 |( S7 q
            指令遵循和 API 评估(Instruction following and API evals)6 O( x! `6 ]- t
            新功能评估(Novel capability discovery)
% {3 J& j* x1 c) |. b. `            ……1 t# E) l' l& R" s
            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。0 z- t" p# {5 }' K/ P
            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
9 \, i! ]" q( d4 E( ?/ Z2 u            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。( Q' F1 [+ \2 m' ]. c6 G2 t
                        + t" a7 U' D. p! S
            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
, z- Q! Y2 X# C" A+ v& D+ L            预训练组
& z$ V3 W% I! z3 a0 d            Trevor Cai
# }: f8 G  l9 j            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。5 j1 J( o9 U1 E- Q7 l
            袁启明
3 |  W# e5 A6 E! w/ B' F  |                        # i3 @  D* e! Z- |) a) y
            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。! T3 U7 O! _" U8 m4 c7 _
            Che Chang
! e2 o. }" J' [7 n            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。
! Z' }- m; ?( b4 B            欧阳龙
9 z' |; O, X+ @9 y6 `            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。1 z2 b% r% W7 L1 K! c# V# o, H, H
            翁丽莲
! O5 H: x; }1 d  R                        
' u0 T" P; Z2 k            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
3 O0 m( W. B6 H' w) w$ d$ v: {$ _$ {6 F            Tao Xu, x. y6 `( B: S+ f# \& }) V' L
            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
6 ?/ ~  p$ j& z, M# }/ a            Jie Tang6 p1 N+ S  z& l7 Y8 P, \  w
                        $ u8 D; A' c! O0 h, V1 d
            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
$ u; x- N/ N7 e' F& G            Ben Wang
  y9 H5 z  g$ w! \; p            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。' [3 Q" U2 U/ _1 v2 w* f+ Y
            视觉组
% x/ Q' V- E0 [6 O$ I- j            Mark Chen; J2 K# u$ G7 x3 P( f# F
                        4 x0 c8 ]6 @+ v
            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。! y4 \8 p6 \0 ^, F9 y
            Casey Chu
; H' }3 U" G, s* ]            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。* q7 a; s. u/ J9 G9 t- g7 {
            胡绳丽" {" q4 x* T% a; j. [
                        + v# @: B5 m. O% a0 \
            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
2 m9 P7 U! f% w3 ~; A            Tianhao Zheng* W' D. y; y8 {' w; J! }1 p
            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。3 j5 A0 x% l2 u  ?' N% ~
            翁家翌$ s5 F8 Y4 q1 @) N  f4 D
                        
9 u0 W% Q+ [/ D" _- a/ I/ {            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
2 m: o% L6 Z% H( \: q. W4 S            强化学习 & 对齐组; u3 K9 V6 x' V/ A; I
            Chong Zhang
3 @' U& ~7 z1 j% B0 }3 X, S" @                        
& p3 T" X- O3 k6 |            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。# S; _+ O" b; R) z- {
            Shengjia Zhao  o' s8 w+ [  x, T
                        
$ E9 z0 w) X  K4 X3 ]            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。) ?$ w$ y8 k! T( q: k
            Stephanie Lin
' \$ @, H3 j- M' X4 a                        3 V6 c  _' m3 V9 i
            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
3 T" q( v' Q1 V8 w( t; ]$ W- v            Tong Mu
* ~2 v' d: c1 [6 F! p+ Y                        
4 Y3 |# O( N" w# ?3 ?$ G8 ?( d; I            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。" q5 }7 i; q: j, y% n3 j
            Jeff Wu
2 y% C2 o* V% c( h$ d. u7 ~                        
  n. s( d* B5 F  t) k; P. R            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
+ p& P# r& S* p, U, F            肖凯
" M$ O- @' _7 @                        
0 C* U- Q3 }8 z            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。* P, h0 y% ~! d$ P3 ~
            Kevin Yu+ p8 ^  t* y/ |% Q
                        ! @1 B% ~% b% y/ x' n7 M1 I
            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。& R( n' u) E2 B& S  G, A! o
            Haozhun Jin
7 U7 |8 j- `: v% x                        ( E% ~! f+ _# w3 w+ q
            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
, f' s5 @7 J2 f( s. ^8 ]. ]2 A            顾世翔
- p  I- y& I: O& v2 {  j2 f                        
) v: R' v! r: r& f            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。
- `" D' U; }- e7 j9 T5 E7 [            评估 & 分析团队
- b' I" ~8 s5 D9 m0 T4 K, ?$ ]# x            Alvin Wang
3 E2 o) i! ]) }% k' p6 D/ Q                        
# F# \0 h& j- q- x2 N            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
2 A" d# G0 i5 U6 h* w$ s4 x            Angela Jiang
% L! ]) L: x/ |  E( z" K                        
3 x, H0 o: r- Q1 x. J            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
9 w$ R3 J% X9 ~: B            Jason Wei
: ^" A2 ~/ N) ?* i. C% r* U                        
9 d' _" F. F' V5 ^7 {7 x            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。5 v% v. o3 a; G! U( X2 Z8 B
            Juntang Zhuang
+ C1 c/ e/ Q0 U/ X2 c  }; _                        
1 _2 f3 g' D# S% a/ e- A6 t8 x# y( y/ {            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。* k6 j! N, _- l/ Z
            Derek Chen7 e# r" B4 v* [7 m
                        # R! T* a% n  G+ M
            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。0 W1 e8 E2 D1 f- q7 ~+ X
            宋飏
( a! J/ U% G6 ?: X, }7 U/ w                        6 ?. T" k" ]4 [0 b5 A% T9 ^* T
            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
* l2 S+ G. z1 y            模型部署
( i8 Y3 @$ i: Z$ B3 @            Michael Wu( Q, V8 ?; j/ I! K' `  s9 O" U6 ~
                        
$ \$ @6 X3 f( \% H0 F            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。* R7 {8 S- v/ R4 u% T/ {. Z
            Andrew Peng( m! K8 ^' c* [& ]( _, D
                        0 H' B& z% `2 M4 v1 E! c
            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。3 b3 ?! F# c5 t
            吴雪枫! f6 Q4 s( S0 S& p) ~8 b/ U
                        
% \5 ^- y( m4 f8 w8 `( \5 q; O            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。9 v6 h) `2 T: d) ?' H2 M4 f  u
            Jason Chen. ?: i0 j  A) U
                        
- n% O1 `# B5 F$ a# h9 ^            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。* `# Y5 |, T- Q7 Z
            其他贡献者! N5 D9 O# s8 q) `, o8 [
            Xin Hu# g: j2 r* b7 u9 q
                        
7 N5 Z# a5 Y" p            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。% P( ]1 I6 i5 s2 e9 u
            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。9 H& y& M/ m9 h' [; c
            参考链接:$ F- _$ k# I" Z& ?
            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
6 @. R6 l2 ]: K, g; c) g. s            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-6-23 20:58 , Processed in 0.043641 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表