京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 814|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
' N7 U. T1 d: i+ H& |+ `. E            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。0 W8 B' n+ m: p' }' S" s
            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。8 ?+ Z* N  g. z0 Y0 J
            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。$ l. D4 \, s6 t* c( q1 L8 Z
                        5 ~, s3 X$ q. Y
            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
& v! F; @4 h0 u0 y2 r' d            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。5 i, ^1 |, x4 x
            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。' H$ @9 x2 X3 `) N
            研发人员占绝大多数9 F/ I- M( Q2 \5 s( O' h- M
            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
5 |) b+ [1 Q6 _: [/ t            预训练部分的工作细分为:. k# W4 y, G  W6 k0 F& U
            计算机集群扩展(Compute cluster scaling)
4 `- y" P; i3 U+ W1 R            数据(Data)
5 I* }  E1 B7 T, E4 L% ^$ B( }            分布式训练基础设施(Distributed training infrastructure)
; h5 q- }+ @* _1 h            硬件正确性(Hardware correctness)
  F( p; c$ T+ A! @' T" M( T) q# t            优化 & 架构(Optimization & architecture)
0 A; l& }$ \8 M! P) ?  W            Training run babysitting; C3 m7 ~/ e5 M" D( I! G4 h( E4 j
            长上下文部分的工作细分为:
( J! g: Y3 S2 E            长上下文研究(Long context research)
6 X, n+ [) M, k# }, ~            长上下文内核(Long context kernels)8 j# _, f0 `  q& @2 F. e" I
            视觉部分的工作细分为:. ^  P( P% s7 f: V) @
            架构研究(Architecture research)
5 s# v8 |' n$ n  D8 V            计算机集群扩展(Compute cluster scaling)& G8 W  J5 ^4 i8 J5 C0 S4 |# I7 b7 [
            分布式训练基础设施(Distributed training infrastructure)
, d9 c# R; C6 Z- D, e            硬件正确性(Hardware correctness)5 j) A/ n7 h6 G( l
            数据(Data)+ M3 r; M3 @% e8 T
            对齐数据(Alignment Data)2 d6 L  u' L. L, L/ b* q% u
            Training run babysitting7 a. g. A8 n2 j: |6 `
            部署 & 后训练(Deployment & post-training)
$ \0 S9 r' K( q! N8 [4 H6 S: n7 ^            强化学习 & 对齐部分的工作细分为:
; Z. J7 I6 [1 O9 {# P: V) N            数据集贡献(Dataset contributions)' `6 k, @" B2 {' T: w$ v
            数据基础设施(Data infrastructure)
; B7 g& D% ~$ e2 W5 B) i            ChatML 格式(ChatML format)
* k0 O7 `9 B3 P' t            模型安全(Model safety)
, A* G& m4 n, h" \            Refusals9 `- {1 ]) v% _( K7 I
            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)  H! _4 J: g. M$ g  \% z
            Flagship training runs
% x  f6 M* L7 L" @  r            代码功能(Code capability)
& f1 I8 d4 A# i4 c            评估 & 分析部分的工作细分为:
  i- B% B" X4 q- ]3 ^            OpenAI Evals 库! Z' v  P, d: v% y7 n
            模型等级评估基础设施(Model-graded evaluation infrastructure)
2 l6 d+ P% ^# i( R7 W7 K( D8 ~            加速预测(Acceleration forecasting)% ^- Z& x; e7 o3 X6 T. r6 u0 D/ e
            ChatGPT 评估9 |' T2 m) ]/ D- O2 m: m6 s# T7 ~
            能力评估(Capability evaluations)1 }7 Y. g& ]1 f( G
            编码评估(Coding evaluations)$ b* Q6 K' ], j
            真实世界用例评估(Real-world use case evaluations)
" S; r# j; n0 l) t4 X            污染调查(Contamination investigations)
: x2 A1 l* ?3 G- Q            指令遵循和 API 评估(Instruction following and API evals)9 R8 L% P; {$ |, ^% @
            新功能评估(Novel capability discovery)
& r! M' e' \( Q+ U( F' W6 b' [            ……. F$ [% U( N0 t) M( h% N6 I1 q
            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。- [. R4 r2 A" g6 s
            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
. ]2 C  y: T" Y! O( W            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。
+ P; ]5 M' c4 ]2 t: L1 e                        * P$ u4 K) G7 y
            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。7 N& x  S6 c, i. ~
            预训练组1 o$ p+ Z+ o* @( T( ^0 ]
            Trevor Cai
' x; @+ z- l& H            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
  _" ]1 t) ?% ^. u& l0 z2 E0 |% o            袁启明
9 k0 x6 g4 I2 U2 N! {, l                        8 f! J" x. c# m
            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。3 T4 r+ S$ p; H! u) m
            Che Chang' F1 w, T  T9 l" q; z3 K
            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。
& q% x3 V4 R1 q! F$ {% P6 E, v3 v            欧阳龙( X& H0 r6 h, k! l3 [! D  Q
            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。# _+ z3 d5 |$ F9 f7 w% ~
            翁丽莲0 @: g6 E* L' j/ x
                        
( ~: N+ L1 s6 X# S# K            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
! a6 H" s1 [7 h' v7 U8 l            Tao Xu. s0 ?0 V& q  v$ e, u
            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
2 h1 d& V2 J* A            Jie Tang
+ g" W( P% U6 {- p                        
! E% H3 d! m) ^/ h            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
/ ~- M# z! ^: o- b            Ben Wang  U6 M* S- k. y+ A* X
            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。" ~! @/ u' R' L7 R# f4 a9 F& w, O
            视觉组
% ]9 L* q9 B& d" ]- k5 O            Mark Chen
4 d7 T: n7 s9 |1 M" f, k8 V                        
& H- ^2 s" i0 @5 _) e7 l            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
. m( R- G8 i) n            Casey Chu
# E/ _: _. r* z' g+ x            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。
( x# i( F9 y! e/ G$ h& _  b            胡绳丽
! H: H$ [+ |' W- w! Z                        6 H* Z. Y: K) u8 w( c4 q7 }
            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
! }( Y( L) D; R+ Y0 G5 w            Tianhao Zheng6 r8 k+ Y0 |# Z( }* L
            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。( O- {" N8 y# u8 s
            翁家翌3 I; ?, O/ P7 s# [) D& v% f& y, J
                        
! X( T! ?( h4 D            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。- O6 y, E0 q% G$ h; f/ ^4 i: ?8 L
            强化学习 & 对齐组5 g- g, f5 k* T$ \* N6 j! F$ B: n
            Chong Zhang/ r5 k# W% h! l4 B
                        
5 `% G" E! B0 ^/ ^2 [1 F  n, w            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。
! |8 [* [3 K  a! q            Shengjia Zhao
. K# m3 J2 K6 U) x9 H4 b9 W. n* |2 W                        % L- z/ v1 @$ u! L+ j
            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。- v7 v# r5 E  U8 @& s# B2 q
            Stephanie Lin1 y4 f( p2 }' _  M3 c
                        
6 r) M6 U2 x+ F+ l1 T1 k            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。  v6 C0 o: W5 `7 ~0 M
            Tong Mu
. [7 D! s* V; h$ U8 ^* E                        / M" [6 ?) i6 q# k
            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。
" U0 w0 T* N5 A) k" L  x1 M( k0 G            Jeff Wu, w7 k3 a6 `6 a( ]& l8 y
                        ' D0 e/ q6 I. E- [3 ^
            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。' O4 Z) x& a  A! n  p2 E
            肖凯
% z! k3 Q/ ], f2 V  o                        ( `% Y2 H1 r4 Q, ~3 j
            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。9 H) s; c4 _5 M
            Kevin Yu
6 `3 ~$ ?' r$ V, f( Z- F; v                        1 w- K5 G: |* i3 j, @4 T+ F
            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。7 \+ y  T( E" W& a
            Haozhun Jin5 p) Q8 M# @0 A: C
                        
- ~! J7 U- j! q# i6 X8 c# ~            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
' ]- R  i" Y( e: H6 l; z! Q            顾世翔
6 r9 \! Z, k; W, ], S                        8 j0 L" k. t4 x1 ^' G& G
            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。$ [/ u9 S  n/ }8 P
            评估 & 分析团队
5 G; Z7 V9 k7 {; K            Alvin Wang
- p+ A. k' `% J                        ; z. }- h6 }8 ?7 X+ O
            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
- n  D3 n- r. j            Angela Jiang; P+ B6 D; R: f2 r& S8 [
                        3 N/ |( I1 ?5 z5 d1 n; u  D
            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。; V) p+ s0 p5 j4 x1 j/ D4 T$ ]
            Jason Wei7 w' F0 `8 S9 s" G' [1 D- o
                        
" \/ H5 M- w4 B            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
; a6 ?# [& U1 Z            Juntang Zhuang! ^" m) t+ i6 i& a5 W5 L" x' p% z
                        + d! I, |- N9 ~- a' }
            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
$ O, R8 Z0 X0 @  g" A            Derek Chen5 V/ r# X( o% z. W8 Q
                        " ~8 O' a3 J2 z$ c4 H2 y
            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
+ i  A/ f. K$ c0 L; `# d' n) q# p            宋飏& w3 Q( [- N3 n: C* {: G
                        
% _. u' a) I# a1 A3 z            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。, |1 K" e3 N( |' E5 p' M
            模型部署/ F. Z. S1 C" K) x* Y+ y4 h$ @
            Michael Wu
2 E9 Z( w: C  c7 x- z                        
) {% V' e7 V( R( R, k  o            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
: ~, I! y  y# V# I& q, c* G            Andrew Peng  ^) m+ W$ |* [- \
                        
) Q3 E" p: W  w) u7 u            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。! d9 W- K& g$ j! ~, F1 r; E
            吴雪枫5 ~/ H; c2 w- R' S
                        4 |+ o% ?% D, r
            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
$ \/ e& e1 W3 o' c, v  V2 B9 d            Jason Chen+ b8 f8 |) C3 z& e7 Q" s# z
                        ( m( y# Q( k4 G' L# _& u% j
            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。! O/ t% D4 ]5 M3 ?. _+ B! d+ G
            其他贡献者2 [3 C% ~0 Q, V' t4 f, Q. Q
            Xin Hu
$ s( B# a; \) p* U1 V6 `) c* {, O                        
  j6 _/ t  O$ p2 }            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。* p+ L# b' g6 j  @2 p6 j
            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
. L: B0 }# Y, t; F3 a! ^            参考链接:) K/ x$ E4 Z" D' ]! x( w
            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
5 R5 l: L$ o3 C. [7 J            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-8-15 07:38 , Processed in 0.040834 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表