京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 885|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。7 P' ~9 {- w( G" A" q, U/ ~, Z( O
            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。/ ]# X# ]$ G; l3 \/ N
            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。7 ]' l* o8 T. j2 F3 D+ R
            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。2 q5 K( S) @! m% I4 N5 n* B
                        
/ q0 o, L5 B* Z' B            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。& j* h8 D( z3 Z( }+ S' @
            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。
+ V9 ?& x1 v. z$ p            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。, C; q  |+ x6 S3 M( H9 f' s6 u/ _
            研发人员占绝大多数
) ~1 c3 p& v1 H3 \. V) u            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
/ V* p1 X. N8 N2 ^0 F% q& l) ?            预训练部分的工作细分为:
5 S2 Y) T9 d2 P* n4 M1 W            计算机集群扩展(Compute cluster scaling)
. [/ }( S, T7 J1 b% g            数据(Data)4 M7 O$ g2 S$ I9 D3 S
            分布式训练基础设施(Distributed training infrastructure)1 ]" Z1 ^% u( j* I0 a8 h! t
            硬件正确性(Hardware correctness)
1 h; Q6 W* v: ?* t) X2 M            优化 & 架构(Optimization & architecture)3 h; J7 k, q! X' G2 Z$ S
            Training run babysitting
7 `2 w9 k' u! t( L2 j            长上下文部分的工作细分为:2 v; l- `7 v- b9 ]
            长上下文研究(Long context research)8 }* X& G0 i( @" L/ R- `
            长上下文内核(Long context kernels)& m) [7 [5 k' F7 F8 |
            视觉部分的工作细分为:0 f9 `, A: n0 o. R
            架构研究(Architecture research)
0 n9 ?3 \9 @8 z  M$ p            计算机集群扩展(Compute cluster scaling)
: ^4 e. J/ c) H9 g+ X            分布式训练基础设施(Distributed training infrastructure)
+ a* E$ o9 S& o: J7 {7 ~- t            硬件正确性(Hardware correctness)4 P- P0 O7 K2 N/ ]( f9 {. Z
            数据(Data)
/ `, C, J) z, [% t: g) ]2 \& E0 G            对齐数据(Alignment Data)8 H) d$ D0 L9 @2 \! P3 R5 {& j
            Training run babysitting
% k( F  W5 Z) {            部署 & 后训练(Deployment & post-training)
2 S; _& T; S* j9 k; b2 E            强化学习 & 对齐部分的工作细分为:
& v1 r* W2 |& L$ A2 i' O' \0 V            数据集贡献(Dataset contributions)3 z2 P- A* c0 B9 u1 s& G& s5 E
            数据基础设施(Data infrastructure)0 A6 {8 G* R, W% R$ |# C( ~
            ChatML 格式(ChatML format)6 x3 m: w2 @7 p& F0 n, L' D
            模型安全(Model safety)" a9 N4 S( U6 H! \6 M
            Refusals/ |$ g0 a4 R8 ~6 j
            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
8 `3 ^% l. O7 h3 P$ F2 W% J6 ?            Flagship training runs5 k* H9 O5 Q' T8 l# @" V/ X
            代码功能(Code capability)
! T7 h2 V2 n/ c7 y) [8 p- T            评估 & 分析部分的工作细分为:
. m! @2 E8 N) {. q' o2 g1 J7 t            OpenAI Evals 库/ L0 ~4 P+ g0 J9 C/ c
            模型等级评估基础设施(Model-graded evaluation infrastructure)! v2 g) l9 t% h4 v4 d( G
            加速预测(Acceleration forecasting)
# w" B1 W  G9 U) [            ChatGPT 评估
! j2 S" v. k/ [9 N            能力评估(Capability evaluations)4 ?* X; p1 Z2 Z; g
            编码评估(Coding evaluations)
  G) y9 g: d& V/ C( b, ]            真实世界用例评估(Real-world use case evaluations)' m3 W: o: r* n7 s8 a& _
            污染调查(Contamination investigations)7 z! @* B6 R2 Z( o6 o2 b
            指令遵循和 API 评估(Instruction following and API evals)
/ l) b4 Y" m8 a* V            新功能评估(Novel capability discovery)
5 D8 {6 k+ z4 w( R            ……3 f; M' k1 z! m1 {
            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。6 J$ t) L0 h4 D3 l2 K& L8 y
            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。, {3 @) G. ?# D/ M/ @) I: ]
            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。
6 X, e! h: F+ }                        
- i0 _+ V% x& ]) M            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。6 t' M" y2 v5 I7 b% S, _3 U
            预训练组7 H9 @  _% q4 z' }/ R! F. q
            Trevor Cai
5 d# H5 K- m4 M1 `9 `            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。" ^- p) d$ \* {  `" M
            袁启明
/ \' T' E6 L  @* T1 O4 g8 R% s% T- o                        2 I  C* u& b3 U
            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
8 R2 M5 L6 \* ^8 o" R% ~            Che Chang" ?% e1 b$ x+ C* k) t8 |7 Y( ^
            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。% V& D6 \* S$ n7 k" m7 e2 i# W
            欧阳龙7 j8 s* U  u/ E7 s4 }2 O
            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
' _3 e% ]/ x4 w/ O2 o' @            翁丽莲' G! j4 H, Y: A) S
                        / ?% H8 X6 K4 Q7 g! a2 a
            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。6 w, t% h8 H1 _* ~6 T6 b
            Tao Xu  j* F" V, O( ^* {7 _
            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
( h8 H: Q, @- J. l) I            Jie Tang4 C4 P4 h' p0 c% @7 V# a
                        
5 \" o& B  P+ U  \            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。! {: H8 I" W5 z. K' _
            Ben Wang: N& C4 x% q5 t" ~8 G; V) ]
            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
" T$ C# ~3 Y9 K- T; |0 p            视觉组0 `( _$ q6 F; D
            Mark Chen
6 y/ g' L; C- \  I                        
; u7 K9 P( I) m, e, r1 P" k, O            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
# ~/ l' H0 o! H9 {7 I8 \7 r            Casey Chu' J1 j. ^. v5 @+ i; q8 [6 H
            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。
+ ^7 k! [5 v  F$ b& o            胡绳丽4 D4 R/ E; B4 ^. ^
                        
, x9 ~  U: x2 L+ k7 O5 \& V            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。4 X- @6 P8 l( z1 P3 s3 U
            Tianhao Zheng
# z, b4 v. t, |4 w4 R9 e. i            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。' L) l8 C' X0 O/ c# ~( l
            翁家翌
  }/ m1 e" l( b                        
* p' {8 B* A0 `8 N            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
8 B) J3 v3 i; m1 S# n            强化学习 & 对齐组* r* m% u3 T( U# J" u! \
            Chong Zhang
: ^8 S$ [8 m: n. @                        
2 L: R; `) S6 o/ v" t# x( _1 i            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。
$ @( m# U9 s5 H. r& f/ e7 _            Shengjia Zhao
0 v" @! y. v" w                        
! O2 ]- @. [8 Q2 q, G9 |            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。8 e# p: O, N3 M& r& O
            Stephanie Lin
3 k0 Z, M9 N  v( Q                        1 m3 t- N9 ?1 w: y( I% @% ?/ h
            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
7 I' Y5 S0 K- v. c            Tong Mu
1 M! o4 |8 ]* y/ Y                        ; H/ z1 Q- f; ~8 k5 a9 ~" y4 v
            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。
# J' R- K0 a$ X9 o            Jeff Wu
" A7 o6 y0 i. L3 ?/ ^                        3 Z& h( K" L2 J" Z
            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
2 q  L( U# K+ b            肖凯
9 h. _+ [3 A' s) G& ]                        " L5 y+ m4 U" y. _1 r+ G
            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。/ x; g8 e9 T& a
            Kevin Yu8 I$ Z0 z' v: B: U# d2 I9 w$ p
                        
  z3 E5 w+ _0 D/ [% H" C9 e            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。- w% U& X+ ]: e  o" P
            Haozhun Jin
% K/ }$ E0 q. F+ m                        % P  c4 x( }) h5 z+ i$ J
            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
. N$ d7 @: r- a5 O( F$ X            顾世翔
& K- D* ]8 z) g5 z) h1 L0 v                        
( C' ]' _4 p- X! r0 W& D            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。
9 |. p- \- [; t: u- S; ~( C4 @% K            评估 & 分析团队
: ?6 F) Y* f/ T% f6 T            Alvin Wang2 O$ @3 _' P- B
                        
5 Q+ @! J" V0 ]            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
4 A, r6 A5 q( W4 K8 t$ d+ M# `            Angela Jiang
. J6 L* A5 }, `                        
1 F/ [8 v# }  D! V/ w            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。2 e5 I! J+ k* I
            Jason Wei
# \& F1 Z9 H/ t% d$ b  X- B6 U                        $ w0 {" y) j9 \0 k6 U9 I) e1 r/ d
            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
2 ~: x3 M9 {# G) o$ Q1 Q* z& c, v            Juntang Zhuang
8 X- S' R5 P! G- H) C5 ?                        $ `7 `# `/ N7 d6 ]7 V- ?
            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
" v( Y# K5 K# |  c# ]            Derek Chen
+ z8 e0 t5 P) F" X2 C( D4 A                        
! j# n2 d; e1 g1 N6 J- r" W3 q% x            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
: D( R) j( j! h. N            宋飏
3 r: O, ?1 O$ }& C                        7 v! u) }8 V# n
            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
& O1 F0 K1 _# S6 T& u$ N" x            模型部署
- q& }  z! ?* H: f/ g( K4 r+ T; X            Michael Wu: Z' Y' Z+ c+ z1 {% m9 R! t
                        7 }6 F0 ?" [7 L9 G
            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。/ {- z$ N4 b' E) E+ r5 g
            Andrew Peng
% c' s4 w* @' u/ v: y                        ) M: x7 ^7 ?4 |% b6 d& n! p* Y
            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。1 r5 @/ @. k$ `) T7 M# x4 S
            吴雪枫
0 P) e: S. ]2 D; S; {* R4 q1 ?1 l$ y# w                        ' I2 m% t8 |4 W: Y0 p4 M/ |- G8 v
            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
  \8 I/ w0 M1 g( C  v            Jason Chen
- E  D/ s3 r% G' h3 J                        
7 V- w0 G0 b1 j. V% }, C            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。
% f1 k% J6 O# c/ p            其他贡献者( @. O7 V  e2 A% ?! s
            Xin Hu3 h( g0 C! m' b( _
                        
/ O: {, d8 X1 q6 e/ u: R8 l            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。2 e" g' h* _. B* l
            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
5 {: E7 [( N* H9 A0 v& v$ ?) @            参考链接:1 K! ]6 @7 X; U$ w
            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd+ G6 u0 G& u0 H) G6 \
            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-3-30 20:51 , Processed in 0.043228 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表