京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 813|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
0 w( E2 H9 r" G  \1 E0 c            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。( L! W. g( }6 X# H7 J
            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。1 r# T& s3 a! U% `
            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。: s( b  k* s3 g, c# x
                        & i$ n) P1 Y, m2 d% m) K: Q- P
            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。$ ?7 E+ R+ H& p) Y# ^5 V
            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。0 i, Q4 f+ O) _& P7 P. e/ q
            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。/ h$ }  }2 q  u. P: ~+ J' t, V
            研发人员占绝大多数
* W0 x/ b% Q: B6 h" @            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
' B! O0 H/ Z, D8 C1 {" i            预训练部分的工作细分为:
6 @& s2 ~- a2 ^! u" q. I3 B            计算机集群扩展(Compute cluster scaling)
0 B& M: T) J, H            数据(Data)* v1 j& I  @& G2 J
            分布式训练基础设施(Distributed training infrastructure)" x) P3 d: @+ w$ l8 Q( ^
            硬件正确性(Hardware correctness)
# r* ]6 c7 h# W) U; E            优化 & 架构(Optimization & architecture)+ Y* {. L5 Y& Q% o
            Training run babysitting* H. _) s& O$ s2 m9 L# W; _) ]
            长上下文部分的工作细分为:
8 w  Z' b3 B* R3 W            长上下文研究(Long context research)
8 \% s" U3 Q( K. O9 B' d            长上下文内核(Long context kernels)
0 e  K& m3 Q. f$ _            视觉部分的工作细分为:
- H, q% c+ P4 R6 `6 u( m            架构研究(Architecture research)
4 \7 r; U* q. D% l( f& j5 X            计算机集群扩展(Compute cluster scaling)
, w- K  M, \8 r& i            分布式训练基础设施(Distributed training infrastructure)2 H- T4 C! q* A0 [1 L) @
            硬件正确性(Hardware correctness)
# E+ `8 ]- C; y/ d7 k5 p$ w+ b            数据(Data)6 f7 |, v& A/ d$ X4 N
            对齐数据(Alignment Data)
4 T+ ~4 V' M5 N+ B+ n4 s7 K/ r" _            Training run babysitting6 h# k6 C; U+ D, v0 |
            部署 & 后训练(Deployment & post-training)
3 b/ J# Z# v+ @! e& t* p7 ?            强化学习 & 对齐部分的工作细分为:
5 z: o! ^* y. r: {8 Z6 f            数据集贡献(Dataset contributions): Q3 {  n8 j; b( w. f5 Z, a
            数据基础设施(Data infrastructure)3 B0 t7 Z8 T, E9 N
            ChatML 格式(ChatML format)
4 P6 M% H2 I# F: D            模型安全(Model safety)5 g; l& R* K8 e9 ]# g
            Refusals, p' N( {" @+ J  @' f
            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)$ u9 L, \$ d' u2 s; k" G8 l
            Flagship training runs
  K; w# A' k6 Z4 c, E- O  R            代码功能(Code capability): v/ v, W; {( S! R1 [
            评估 & 分析部分的工作细分为:" g6 H* r; v: c8 Q5 x8 _6 k3 P
            OpenAI Evals 库
: N0 m2 a8 i. J7 z3 ]7 Z            模型等级评估基础设施(Model-graded evaluation infrastructure); s7 ]/ l1 U: b9 b
            加速预测(Acceleration forecasting)
" w" Q; [) {: f' j+ {            ChatGPT 评估0 N& F2 e! r9 y- a0 a5 Y  s
            能力评估(Capability evaluations)8 n  e4 l) g) \9 t! x2 e
            编码评估(Coding evaluations), p- _5 w1 E- j7 |. D9 o  P' R
            真实世界用例评估(Real-world use case evaluations)
0 K0 N0 {! v6 v            污染调查(Contamination investigations)' |9 W! o0 M5 M$ u/ K
            指令遵循和 API 评估(Instruction following and API evals)
1 W; W+ D) L2 O) `1 g            新功能评估(Novel capability discovery)
: a! ]# W: J+ c$ a- D$ K, ~/ w            ……
) p1 E. H4 f8 r            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
! j" ^: O2 L( R! i4 }) i* R( c            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
& \$ k9 h: j& E2 s. `) ~' \: j/ z2 q            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。' B9 \4 C9 @' D, H( |- d5 R
                        % x0 L$ R1 t' @8 f% t2 N
            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
2 y0 }7 b% x2 v/ w5 s            预训练组! S: t' x' a( _0 [4 A
            Trevor Cai
/ F! ]3 ]! w$ ?9 G7 X5 m; U            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
- F' h7 C9 m4 o* p/ n            袁启明
* ~, K  B/ t4 i% Q2 l1 {                        , W) ~6 Z+ v% Y' E) {4 G
            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。% v6 i9 J4 c: F% P# C
            Che Chang- m4 i( B  u" D# S7 E, |' |
            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。
0 F# W7 P  g- m( }$ Q/ P3 P0 ^            欧阳龙
$ j5 ?7 q! W! R+ Y& w* b' _  a. {            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。5 p9 t& Y' l' x# b' M
            翁丽莲( Z/ s7 a- I' D; T$ ]3 i% I0 C
                        
+ A, D- ^  J' w4 U* T# I2 l            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。, \/ A* H: I; f! c# K/ R% W
            Tao Xu" G( }7 o- e2 N' B5 o8 b1 V
            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
3 q' @) C$ f2 X6 C            Jie Tang
  }8 }3 [$ p* g3 d; i! e                        0 T6 ~% R  D& m1 M$ T
            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
0 @$ d9 G/ f) N; D( {            Ben Wang: r( R+ ], @% G/ Q4 o& u
            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。' r- |4 V& I% Q& ]0 H2 i
            视觉组
. d( `3 }6 k, R            Mark Chen6 H6 Q% c  d3 G* d8 |/ c9 [  w% v" H
                        
6 w; n+ @* [5 b$ @, d            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
8 h8 M* w9 e% j, ^9 u            Casey Chu. r6 h* z7 U' x
            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。  m; i7 ^+ |' A- n6 H
            胡绳丽% h; a: s" d! \5 s+ B: }( U/ n! k7 d" D! J
                        
; d- y) [0 E( B3 V% C3 T5 {$ A            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
0 f3 ]0 ^! t4 O. t            Tianhao Zheng$ J" Q! j# M( J( f8 W) H
            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。) Y6 a' {+ i3 V4 v: a: l2 \$ m& P; r* k# w
            翁家翌7 M, J1 I- h3 n# c3 B
                        
+ [! ^0 S! x& ?% V9 r; x. \$ |            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
: \8 R0 n9 {) `            强化学习 & 对齐组
! o5 d# i, t4 E# Q0 O            Chong Zhang: E9 ?: N  |% h+ v$ n0 A
                        
. ]5 u8 ]) \6 y5 V) J6 L            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。) s/ l% R+ J+ _3 Y, e+ Z- X. I
            Shengjia Zhao3 Q, e# v& c& c3 v0 B. }5 A
                        
6 n, u4 m" G9 }' z) w# ?/ |            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。  W/ m0 ~% ~) q# k9 ~: }  x
            Stephanie Lin7 s; ?2 k$ a1 v% g9 E
                        
8 z* s4 b3 W2 R6 G% F3 n            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
3 i& I* U% b4 Z' A" O( T: B0 ^            Tong Mu
# ]. e/ W) c/ s% O5 A% v/ ~) F                        
1 `% b, U  q6 X- A$ Z2 y            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。1 R/ G8 f2 v4 y
            Jeff Wu4 U- }) _9 G# w9 l/ L3 k; j3 u
                        7 u# ]1 E% E" ^& i, N1 ^
            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
& P$ @0 K3 J2 S3 a# W0 }            肖凯+ D4 a% `; ~0 E# ?8 b& s
                        
0 l, B% N2 p* g            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。
  ?' j8 A5 A/ I3 {  P            Kevin Yu: I7 r5 x1 S* _4 }! k. l
                        # a. s7 S- u; N7 n+ {/ j* `  e
            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
3 c( t9 V4 `( ~            Haozhun Jin* P( F& n0 k' w  a+ e6 ^! y
                        
; Y8 s- ~/ D) B# O! x3 x' [            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。* c6 {# K4 [3 D6 j, [9 n! j) N
            顾世翔' _' m- T5 i! T- O
                        " C( l) |" O( j' z, C; k
            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。
2 f  v( f/ r! `8 L- G            评估 & 分析团队4 g+ F& r' a: u8 I' z  s
            Alvin Wang. H; Z! C5 H9 `
                        
0 u4 L, o9 g& i' O            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
; |1 ]- z$ o, N& C- t            Angela Jiang& o& `8 W( b: \0 B  e& e
                        ; w. b: |/ x) z* B
            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
! [: J" r* |: c# W% P2 F% |. y            Jason Wei
* M# U7 L' J5 P  a" `; Y                        
. A6 d+ m- g2 T0 W/ j; ?            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
+ D9 h6 x8 M+ B* ^8 ^7 {0 u3 D# X            Juntang Zhuang' N6 |, h* t, a+ ?5 w- Q
                        
  k9 Q4 F' B3 r2 f# W' x            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。* d# U) E, g5 Q+ W% e& D: ?7 u$ C$ U! H! x
            Derek Chen- O$ P5 {6 S$ l* R
                        
  T4 s3 b2 |3 N' i            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。4 Y; k4 D  Q7 n
            宋飏
8 @) t) X. H) N1 P2 D                        
3 r, `" H/ o* M; E' B1 n: }9 }( d            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。8 ?$ D8 `! R! F: G* R
            模型部署
, ~! O* ?0 \# V8 C- t9 P: i2 s' t            Michael Wu* @, X6 P, c. [! T/ Q$ Z
                        # X! Z: f$ `! i
            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
( f% [! N  @% [( x+ b" _* R            Andrew Peng3 D- R' W8 i# }
                        % f( g7 y( r2 M
            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。) l- _4 i" R; T) N2 x$ t! f2 {
            吴雪枫
( D" `1 K, B. N4 ^' ~                        
& B& p/ Z+ F7 F            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。9 Q% @& V6 I: V5 j! l6 i$ D$ s
            Jason Chen& D" s) ~- U5 M) k. i% n' F
                        
. @' a6 `  T) E! j- [- c. a0 ~* Q            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。1 `7 c* o3 p: X' s6 C' N6 X
            其他贡献者5 C! M/ [* `0 b! x
            Xin Hu
* A/ E( H+ W* N0 A0 P% I. X                        
4 X7 C$ _8 M0 _            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。1 e( A6 O, |5 x( _4 j) i
            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。' H  Q, E6 K5 W* A4 [
            参考链接:  o/ l$ A3 r" R5 @
            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
8 M$ P+ E. o* F+ I: g( C            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-8-15 07:35 , Processed in 0.047570 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表