京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 883|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。. l  C5 G& L, f) g% K
            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。5 \! j  S: Q7 i# C  k+ L
            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。! A6 |1 Z) Q; ?* Z* Z, J$ U
            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。" }' j' c8 O( s& ]! W
                        5 B5 A7 p! I* [" |3 h* b
            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
' |) E: Z, B: `5 p  @            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。- c2 _: ~5 D/ o# k
            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。
6 \, {6 q0 R3 E  S, n0 V8 d1 @+ T            研发人员占绝大多数* {4 ?$ N# K1 x  i
            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
3 i6 o( o' ^9 E" ?9 D! I            预训练部分的工作细分为:
+ `. e! {9 X0 s' p9 n( w            计算机集群扩展(Compute cluster scaling)
6 a+ l* X3 X& Q            数据(Data)  T8 G8 |% W( n) ]8 Q
            分布式训练基础设施(Distributed training infrastructure)
% m. K3 Q+ ~2 c/ _            硬件正确性(Hardware correctness)
. ~! ~9 M& F. `! V! G5 X( e            优化 & 架构(Optimization & architecture)
& U. }: }) n9 o7 M! x            Training run babysitting9 b; Y! ~- [' P! z: k, O+ g
            长上下文部分的工作细分为:
( H7 J8 P) G/ G$ Y" z            长上下文研究(Long context research)
* f3 O4 f( X! w/ [( k            长上下文内核(Long context kernels)# |. P/ c* q$ j4 W8 M- @) ^
            视觉部分的工作细分为:
! `# Q7 {5 Y6 ?3 V            架构研究(Architecture research)
+ ~/ C6 u$ I0 P3 o+ {+ }! @  d            计算机集群扩展(Compute cluster scaling)- `2 }( \; }, e6 E8 d: i, L
            分布式训练基础设施(Distributed training infrastructure)2 J4 b8 W5 O" }
            硬件正确性(Hardware correctness)
& o3 N4 t6 @: d; j5 N/ C1 K            数据(Data)
, \1 A3 F3 n7 k& K) }7 |, y            对齐数据(Alignment Data)
2 ^! d! R6 z, I            Training run babysitting1 ?2 k0 r$ d8 E& U$ [7 w
            部署 & 后训练(Deployment & post-training)
9 ~; r/ R5 \2 q: Y0 {$ e+ f            强化学习 & 对齐部分的工作细分为:
0 B0 S4 t# V3 f; l: a3 o            数据集贡献(Dataset contributions)
$ b5 D; g* P1 Z+ y7 T/ n            数据基础设施(Data infrastructure)9 x" c8 t4 H1 o4 T$ G* L
            ChatML 格式(ChatML format)( v9 C& g, [' O1 E8 ^
            模型安全(Model safety)
! `7 P0 w/ R  {, q+ g; M3 n- S            Refusals
; K4 g% e( J% V6 S- o% P4 ~9 }' U$ D1 D            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
' m8 ~: J7 a3 s4 \$ U            Flagship training runs* e2 A5 o; f. u
            代码功能(Code capability)0 c6 e+ _4 _  F- x4 h
            评估 & 分析部分的工作细分为:
# C2 v0 G; t& V: g; \            OpenAI Evals 库
7 M( e% }! C' E% N            模型等级评估基础设施(Model-graded evaluation infrastructure)
# U: K7 X+ @. e7 B5 \            加速预测(Acceleration forecasting)
& y& q$ R! R, a+ @4 q) b  o4 s            ChatGPT 评估# Z4 r' o9 y6 u# Z, \
            能力评估(Capability evaluations)
6 b; \, ?7 `, Z- s3 N; m            编码评估(Coding evaluations)  j. u) L* m$ e0 E; `. R
            真实世界用例评估(Real-world use case evaluations)
2 t, O0 t+ G( F* d            污染调查(Contamination investigations)
/ s. [* D& L+ ]9 l            指令遵循和 API 评估(Instruction following and API evals)
$ ?! |0 T* K/ v' g( W# x: m            新功能评估(Novel capability discovery)0 N, i! D" I0 y7 S0 F% d
            ……4 g$ v7 i1 r5 b2 j
            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
0 Z% O% r4 t# M/ B0 j" n3 P7 \4 _: ~            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
# q+ F: ?: {1 q& e            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。( G6 I0 }, l& z3 e3 o7 `, a% z& Q% L
                        
+ {3 t6 T, m4 ?" h            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
/ x* B0 g3 t$ q( d            预训练组$ b) \' [) F: F+ x
            Trevor Cai# w5 ^9 u' ~% n* F: J
            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
8 s/ `1 P1 ?* }" E: h% B2 ]+ p            袁启明+ r9 Q5 H/ S4 O6 n$ b
                        : y5 x. d- h8 u* s4 b& V
            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
% V6 V" {4 {) a! e  v( b4 V            Che Chang) S* Z. b' D! Y# {' G
            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。: B, m, d, S# ?) K3 M0 i" S) |6 x
            欧阳龙& j/ D) N; o4 E: ]3 U
            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。6 ^% P9 q7 C8 q; P. H2 K
            翁丽莲, k3 O% W* [, ^. y6 u  B7 Q. w
                        & b. @, p; y+ J) P
            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
4 Z. S. }7 R( U            Tao Xu
4 e+ B0 U# Z5 r* a9 Q            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
4 A; {: V" n6 ?9 v3 I5 b( q            Jie Tang
$ v6 i; Z) H* T+ K                        
$ G7 h9 V9 c, j) t5 R+ k: A% c            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
) A" _; m4 ]0 W            Ben Wang
' {2 ]2 x+ i/ o6 \* @$ {! P. N7 }            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
, N6 W- t# B# Z* T" e; R  F            视觉组$ M# D5 L0 M' M* ^
            Mark Chen
# D' Z% S) q0 ^, E. L1 X0 i                        
* M! N$ u1 H+ \) O            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
1 M$ W( @8 o+ D$ ]            Casey Chu' U( g4 L+ L4 l
            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。
; |6 @" n- j8 I4 L) _4 O* }' X            胡绳丽
: U/ T8 c7 ~: B  N1 q: L2 `8 V                        
" A6 D; c/ n4 P3 D4 N            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。$ y+ k' Z8 Z9 \+ R# q3 Y4 h
            Tianhao Zheng6 P. g4 {2 j2 O& Y9 G
            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
5 [% l5 ]6 o1 v( M; T            翁家翌! v- O( Z  O) S
                        9 I/ B- H' l( f* t/ t" T6 J$ |& I7 A
            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
: H$ v# Y/ }+ }( T/ _            强化学习 & 对齐组
1 ]2 j3 e( k( C/ P            Chong Zhang* i" o. |3 n+ R. l# S
                        
3 Q3 J9 z4 N" q3 a" O            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。
4 I4 l  D$ w5 G! @6 D# Y* h8 o( \            Shengjia Zhao5 S! D; B. G5 I+ }
                        6 Z$ @- u1 V% ~
            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
# b( y1 F$ n/ y; s' \            Stephanie Lin" R* b6 T0 a$ e
                        
7 C& ^2 \: K- P  y+ |            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
5 D; }1 g9 X( I- |3 h! s            Tong Mu
! \$ y, r7 {+ o* Y                        ! ~! Y5 q1 L; D& c+ r( r
            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。
& d+ f* D- D* ?            Jeff Wu
3 r. W) Q5 w- P6 s) m, K. {                        
' n' r& Y2 b- I# d" `            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
- P6 X2 Z. E' [# V7 ], U. e            肖凯# d( L' t% m( _% x
                        + ?+ G& I6 b" x1 V# a) u' H
            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。4 @5 X/ M! |4 H% }' {* p# G
            Kevin Yu  \5 y3 \4 G: W' Q* t
                        
. V! |0 D5 y% L6 I            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
4 h, }+ s: L5 B5 H0 L8 {            Haozhun Jin
/ ?& |) T7 t+ L. p& `                        
& D$ d1 c0 @, m            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
8 Z5 _  n) |6 p: T            顾世翔
9 L! d3 x  ^1 i                        
% Q- f+ O3 S: s$ V" ], w7 f            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。+ i' P' ]  ]+ C8 X
            评估 & 分析团队
- ]- \0 l. \: E$ U            Alvin Wang" y: j# v3 K3 ~. T/ f# T/ c: U
                        $ \3 m6 B7 w* |
            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
! v$ |' y% V, p! i1 v            Angela Jiang! ?1 j8 K0 I2 [# t" }$ \) }) Z
                        
, Q$ Q% I+ J; f( ]            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。* I5 B5 t9 b& Q
            Jason Wei# ^# T) |8 e6 a! X
                        5 K9 u0 }# X, O2 @& ~& |+ `
            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
  Y# ^6 z9 m& E8 J$ {  j3 a            Juntang Zhuang
/ F# m# E% I0 {1 U' r5 W* M' y  W5 f                        
7 w" a4 s" k6 g9 ^. ^            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
$ ?' h0 W" C2 z4 x! q            Derek Chen* P* o3 f# F( h- t5 `
                        9 Z" L4 n- B3 e; t3 t# T7 b
            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。- |3 O& M  ~, \' f
            宋飏8 z% Q% J  I* q/ e
                        
3 l5 q! i( T7 s& t" M) }# y7 |9 Z4 H) Z            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。' S! a6 f  o1 q* f% ]9 O+ ?% g5 P
            模型部署/ D# b: ~' x- F# N6 K) s$ v5 E8 C
            Michael Wu+ l) A$ g3 Z  b4 Q" r4 P
                        9 S& L3 z+ ]5 X" `
            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
' J' t6 h+ F0 ]  X  f: ~            Andrew Peng
, M& r$ o* s& X% n( ~( U! K                        
. [" }' W4 C6 I/ y" G' M            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。% i6 U7 n  {; p, X5 r0 s
            吴雪枫
0 v. I; ^* b* u6 |) Q+ L8 T                        / v: u7 i9 ^, c( ^
            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
9 K0 m3 ~, G7 p! T: Q& |. G6 @            Jason Chen
+ z0 Y0 A/ G1 ?- p# A/ U$ \                        * w6 O  D3 L0 b1 A% ^
            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。" E6 k( P* n3 ~+ Y7 M2 F; I
            其他贡献者+ Q7 X  O+ l& M" E( Z
            Xin Hu
* \/ q" Z% Q6 d* W* A/ [/ e                        
! k+ E# \7 P0 h4 Q9 i" [            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。; p3 J5 E6 R; y* x4 O
            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
# A6 g0 L) K6 x+ y8 `$ O            参考链接:
4 t( e# p3 o* H* `. k, R& N+ p+ E            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd1 b) v3 S  ^5 o0 q: X
            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-3-30 19:06 , Processed in 0.048958 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表