京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 914|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。! w& i; d5 _4 c
            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。
) a6 V- h( ?  U% V            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。  V5 H& @- n) g5 c. z
            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。
( L/ q" S$ t2 X/ k9 o6 k3 \* X. G                        
& b  p/ v8 Y+ \0 t            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
* g. J2 H$ I4 v: K            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。5 I0 l0 k, A8 j7 M
            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。5 l2 i) t5 l' X4 x
            研发人员占绝大多数, n8 s& E, W+ S, [
            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。- u7 r) b+ _$ i! C5 S3 v
            预训练部分的工作细分为:" q) _( [* p+ k- @/ g& ?
            计算机集群扩展(Compute cluster scaling)$ X/ G. @' A- K' J6 I$ a
            数据(Data)* C( o; p5 Z  c- r8 ?7 H( ]1 @
            分布式训练基础设施(Distributed training infrastructure)* q: o- T% z. A0 l0 u
            硬件正确性(Hardware correctness)
% K, b' h% ?- B  E            优化 & 架构(Optimization & architecture)8 x4 P1 h: {; H: p1 e
            Training run babysitting
( `. F- @' r* e& w" h3 l& X- P            长上下文部分的工作细分为:
5 S! Z8 O  f9 Y7 K% i! r4 }            长上下文研究(Long context research)
* t2 ^2 l- x9 X* f% e7 F# @            长上下文内核(Long context kernels)
, D  U3 H( c& s, O- Y" H; a            视觉部分的工作细分为:8 Q3 Z  }% A# n# v
            架构研究(Architecture research)
, s: Q! h& E) P6 x( J) O            计算机集群扩展(Compute cluster scaling)+ j7 z7 a. o/ t. _: g
            分布式训练基础设施(Distributed training infrastructure)
3 v# x) Q) t/ R4 c1 j  ?! r            硬件正确性(Hardware correctness)  G5 G4 y& A% \8 }9 C
            数据(Data)7 T; S# c0 i  _% n' t  u
            对齐数据(Alignment Data)& E7 U2 q0 W9 t  {* H, v) V) g
            Training run babysitting
" o* W2 d1 b* H' g            部署 & 后训练(Deployment & post-training): D, y4 m' q1 O/ M& ]. L2 R5 }1 H
            强化学习 & 对齐部分的工作细分为:
- ]- {' m+ `, q5 a1 g: S: x, z8 h            数据集贡献(Dataset contributions)
; i/ x2 y7 T1 t4 Q/ d- z            数据基础设施(Data infrastructure)5 h8 }# Z# ?( |  y4 W8 i
            ChatML 格式(ChatML format)
5 ]! r" r: Q8 z  W. j            模型安全(Model safety)
" z  \( L2 ]5 v  M1 q# D& ~; N            Refusals
1 A5 R3 w4 r% q' b$ D# h0 D            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
3 j  G8 k, P* S* B" c1 D            Flagship training runs7 o$ \3 a7 d' H+ G  X
            代码功能(Code capability), v, u$ O+ c  X' x
            评估 & 分析部分的工作细分为:
  \6 O* Z; ?$ f, G9 I  L            OpenAI Evals 库4 P8 }# m( p+ q
            模型等级评估基础设施(Model-graded evaluation infrastructure)
5 v% D& |0 F6 v1 R8 v            加速预测(Acceleration forecasting)& x' ?7 C7 i5 x  F. _- W
            ChatGPT 评估
9 n  }5 h- q& G7 M- L            能力评估(Capability evaluations)# T  Q8 O: g  @
            编码评估(Coding evaluations)9 ], A1 h$ L: V; b/ M
            真实世界用例评估(Real-world use case evaluations)7 ^; i! |; z; e
            污染调查(Contamination investigations)( x8 Q0 U3 K% H& e) t
            指令遵循和 API 评估(Instruction following and API evals)1 C) C- q2 Q: B- s/ l6 N
            新功能评估(Novel capability discovery)
9 {3 J. g) h- k. Y            ……% \- |; K" n% `6 _; v' A! g: x
            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。* |2 s& K& A  }6 P; `
            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。9 h' Y7 {, l! N: e
            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。: U+ M9 e6 i" V) ?
                        + d9 `. H" h$ O% r4 Q
            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
* G" }; x, n% M) a/ V            预训练组9 f& f2 x; A; z8 r
            Trevor Cai
8 D: n) X, V" \, y6 ^7 }            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。/ G* n4 ?# M$ U4 g- T, D& }
            袁启明/ j' {9 N/ o7 D% D  K
                        
( H# }+ V6 V. q/ q            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。) G+ v! W4 P6 t4 f8 l
            Che Chang
& E5 w1 q$ U& g' q) S            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。& S; r# T$ d- j
            欧阳龙% t4 e2 K. J$ \. E# ~% I$ f. \6 X
            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。9 k2 o0 x2 v# Q3 }: T
            翁丽莲
5 M. V* w( d5 X0 q/ e                        
1 a& S+ f/ t( Q: a. h            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
' Y; I1 ?, W; l6 s* `; t: x; y            Tao Xu+ _# g# F0 h# d3 @' g+ B. k
            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。' I7 ?3 q* x# U  }8 m$ d
            Jie Tang
+ P  ~! T# J$ e- i$ o6 V                          T! {7 b, |3 P5 N6 T3 R
            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。8 r/ a# H! C8 U  V! |$ G+ g
            Ben Wang! D3 i/ U% q* i* \9 X) {
            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
" H1 w2 z; B) E- a& @" s            视觉组
: n6 K6 ]1 Z5 n            Mark Chen0 e& e/ y! d1 v' G1 |1 f% O% i
                        
" s" T) ^# g( M& H4 c0 ]9 O% P            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
8 D6 @$ O! \3 b/ Q            Casey Chu
9 S1 c  n9 W- p9 O0 Z; @            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。8 @5 ]$ @" H, e6 t: P# q
            胡绳丽7 h( r9 H; Y0 @, k9 _6 ]$ O
                        
8 |/ B4 k, D% ^' h% f+ W            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
5 ^( V# F7 `" {            Tianhao Zheng( W% z( o+ d, s( v; e/ ]* j1 p
            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。5 H# V2 q2 q; o. \
            翁家翌3 O. _& z; a( ?, W8 l
                        
3 F0 c$ I: W$ e# {  o            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
; j5 Y: z5 R+ {; o: C            强化学习 & 对齐组, N  Z( G1 \% w! L9 W
            Chong Zhang
4 t3 G6 D8 }) v  b8 S                        
# p7 ]) {! c+ C            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。* w6 X4 @6 H. N1 n9 m
            Shengjia Zhao9 w7 O; D7 `, L8 U1 A, y" j
                        # O- w% Y! b& f1 Z9 a
            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。$ G/ n) O& V6 s7 R6 X
            Stephanie Lin
' K& o" D) g# E, l) D! |- s0 N  i5 H                        " Y% [- B+ e, `& f
            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
1 P. U3 F: f( l8 |+ W            Tong Mu, B, o+ o9 L2 Z) _
                        % [! k' x; v1 g' o* Z. w- G* X
            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。2 K+ S! j5 g- B! ]' L9 Q5 D
            Jeff Wu3 ]6 Y+ `( F6 I' N  A: [
                        7 y' E, e+ P$ ^) u& w" H
            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
- J# D  W- W0 x6 i1 t' X8 x8 H& h            肖凯
+ P- o* f( e/ A7 N" i; V, ^                        / |2 ^, D3 I/ l9 X' {* {+ h
            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。
6 F) |3 f" B2 S9 k! A8 p% g( ^# v            Kevin Yu) k) m4 y: h3 s; e4 l6 t2 e0 d; {
                        9 I  M5 v% l4 t) G0 c. Q4 m
            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
' _3 M) v- ~3 z: C            Haozhun Jin
8 u! @. j- O! v/ @                        5 D4 B. h' U8 {( G
            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
+ O. {3 y( I' w0 h            顾世翔
) v) J5 b& ^& D/ r                        4 g  y- w% g  h$ i+ ?& Z
            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。, \& W1 A" h& K' [9 o
            评估 & 分析团队/ n% }: K8 H% j, g# {
            Alvin Wang
- a! x7 ]% b5 M: i8 `9 V                        
& c0 P" [0 e, S* @/ P            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。9 [" }) y  D7 a
            Angela Jiang$ V. Y9 J  z2 n3 b
                        # Z7 e! _! R7 Z
            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
- `- x$ {! F3 @% [            Jason Wei
! p- z" @' T! l, q8 n: ?                        ; j1 {9 x) \( j* H7 n7 f2 `- t
            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。8 k; {  R8 v4 H4 m  D$ ?& {: o/ k
            Juntang Zhuang
; ~! X: u; W7 i) n1 `& A- S5 Z                        
1 ^; D6 k$ G6 S  \- W7 e            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。+ L# f2 J, B4 v& o1 j8 P  |$ ?; M
            Derek Chen
. [# P: U  a5 f: @2 T/ _                        - H! b1 M/ y7 H5 M& M. \. [1 p1 [
            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
: c8 |- W6 ^( Y0 U! Q) K0 L            宋飏
- v: X( m  f% A& C- W9 l: g, r* b                        
! }$ Y, \, v; B6 m# s% G; l3 F6 }            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。' p$ ]+ J+ x) e- S9 F4 d
            模型部署
" K9 L5 ]" x( G# g6 O! H            Michael Wu( p, s' }3 D$ `9 p' A
                        - i3 d- C. i' ^) v8 m+ n9 R
            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。+ U  C4 }' f: w2 e9 b$ y3 T5 Q
            Andrew Peng
' G: S6 y. J' p; L6 S/ |                        ! ?' o( z( n1 ]+ C5 u& t
            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
% w' P' R* ]4 ^            吴雪枫
$ W8 o4 j, T6 W$ Y/ S                        , j5 V, B* S9 c6 O0 O$ V
            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。* ^% N% G$ F5 A; z1 L
            Jason Chen9 [- a, y  H  _. H. r% g
                        1 r8 @& k" M7 j7 C* p# C' f- w2 h
            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。( {; V  ?! @0 D$ M& c3 c, Z( o: P2 f
            其他贡献者
, d! G# s$ `" |- q6 p& M# Q  r2 H% O            Xin Hu' \5 l4 G  L8 {
                        
; _* m# }# M; _9 X* n, o! g: d: _            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
, A& Z/ z/ }5 Y            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。6 n0 y# ?- {. }) Q, h& X! l8 Q6 D
            参考链接:
/ m6 _6 \+ R2 h' X# h, j3 ~7 V- Y            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd4 i: w+ l2 \* R" a, [3 @$ w
            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-6-23 19:49 , Processed in 0.107799 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表