京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 812|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
+ S* R8 E, b# q$ \            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。
& i# l+ P* n- e; ~* c% b* j& ]            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
" Z  L6 V3 M" S            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。" r" w2 }, g+ l
                        7 \2 \" s' T/ B1 E9 f
            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。4 I9 H) j: N5 M7 G
            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。0 S: m2 q% q! f8 W) O8 h& Y5 m) s9 q
            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。
- S3 h5 a( l) {! ~9 n( p. x            研发人员占绝大多数
9 b$ F9 E7 y2 g$ g3 i            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。. N+ w, C* O3 _% J9 R
            预训练部分的工作细分为:( _; J; Z/ ^0 v1 f% F( T. q+ B& }
            计算机集群扩展(Compute cluster scaling)" g8 ]! y+ [9 J
            数据(Data)
( ~! F6 p3 o1 @            分布式训练基础设施(Distributed training infrastructure)3 U- c& P9 a. U& z3 D& _+ R) u
            硬件正确性(Hardware correctness)
# v5 B2 [8 V9 D8 `            优化 & 架构(Optimization & architecture)# y- ~4 b* o  x1 g) P7 N4 q3 I5 J4 G
            Training run babysitting. k! F& ?1 v3 p* A* C: V
            长上下文部分的工作细分为:
* I4 \6 @( y' r" g8 s            长上下文研究(Long context research)% q9 f" j: q  H* |3 T, H& v( g8 X
            长上下文内核(Long context kernels)
$ q8 U  E) _8 z$ h4 k6 ]) t            视觉部分的工作细分为:
% M! b3 _: ^1 i. I            架构研究(Architecture research)
7 W. i: @9 ]  P- I$ m- A            计算机集群扩展(Compute cluster scaling)# v1 ^/ u- c# Y- r  @) V1 T
            分布式训练基础设施(Distributed training infrastructure)
: B5 N# m9 x2 a3 `; k: ]            硬件正确性(Hardware correctness)  i. R- b( ?, f0 v% O* [( w
            数据(Data)
5 E% k+ b! A* r/ _% X& o1 J            对齐数据(Alignment Data)7 [4 m: v  G; N9 B- `" m
            Training run babysitting
9 f0 q9 s% f  j" Y" [; A            部署 & 后训练(Deployment & post-training)
" d% J+ Z( |2 H' p+ K# s            强化学习 & 对齐部分的工作细分为:! l* r; S+ j4 G$ H( X$ d: _
            数据集贡献(Dataset contributions)- F0 y1 T9 z4 k/ Y7 l$ Y* O
            数据基础设施(Data infrastructure)" ^+ D6 t3 F" g/ v
            ChatML 格式(ChatML format)
& b8 Z: T4 w0 V7 H$ r& L$ ]            模型安全(Model safety)& a7 {% f: \' f& o
            Refusals% I- `$ n. m( x3 _3 Z* k7 G  }
            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
2 r5 p! T- A0 n# K            Flagship training runs" g/ o( ^% k2 f3 i1 K8 b) v
            代码功能(Code capability)1 v' A( A2 S& K6 }8 W  J7 V2 O
            评估 & 分析部分的工作细分为:
4 a. q7 J+ ?1 \& ?            OpenAI Evals 库
# l  v; b( F& f" \            模型等级评估基础设施(Model-graded evaluation infrastructure)
  e# N' f) i9 v+ Y( |! e            加速预测(Acceleration forecasting)
7 A. K' t3 T( ^+ [: l& h) o5 L- M            ChatGPT 评估4 Z, H# d8 _+ W, N7 {
            能力评估(Capability evaluations)
6 T4 a9 a7 u4 c+ ]            编码评估(Coding evaluations)
. l/ j1 ?& s& |6 O! t            真实世界用例评估(Real-world use case evaluations)
7 z  J* h' i& T5 I5 `            污染调查(Contamination investigations)5 d2 Q' X4 r8 M' e
            指令遵循和 API 评估(Instruction following and API evals)- H+ t7 P4 u0 `: K3 x% L
            新功能评估(Novel capability discovery)4 a$ _: `  G7 \
            ……8 M  B9 _' Y6 M; m9 G6 K1 _
            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。1 e3 A6 \" [, ?: g9 G
            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
9 Z$ D+ ^7 ^( e# N# @            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。2 F& p0 j5 Z; I  ^$ z
                        
3 ]2 M! p3 q/ K" f& b+ g: z            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。% _# X# e: a: b4 p
            预训练组) F$ q& p2 ]) R2 Q" |/ r) Z1 s
            Trevor Cai  K* y1 x- y0 Q' a: E/ t! r
            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。' i0 a- W+ E$ _8 B% O+ v2 z
            袁启明
% O' L& h1 O9 H; q                        
: z! g# P0 d1 D2 k9 K  u' o            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
0 i# `8 q! V+ t: O/ a% }            Che Chang
$ j3 }+ W8 j, R# k/ h            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。$ Z7 _% I8 w: c' h* ^
            欧阳龙3 Z5 Z1 w9 F* R2 P! A4 |
            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。  C: d% n: }: a9 n* J: i# Q) `4 h
            翁丽莲  Y3 ]( c+ o; i0 w
                        
3 v' ~, a+ i5 Z& ]            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
, |0 R8 E5 w( D' r  X            Tao Xu3 |. m& ]# E0 e) U, P0 S4 Q
            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
( x* k+ s) A* F; c# F            Jie Tang& S* ]5 [: O* f3 U) j# [
                        
# k; l  E% h; M9 w* V            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
: ]# i4 N6 N0 j7 Z: A" O            Ben Wang4 z3 O% B9 B, }. O! R5 Y" {6 V
            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。7 {1 P( }9 q& z* e
            视觉组+ G* N8 p, A% t$ A0 j: c4 D
            Mark Chen
- X+ s1 g8 `$ P4 G6 [3 f                        
, j  i! ?" ~" L% _# r            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。& y+ O5 r# q. y" O
            Casey Chu
4 ^% {$ j% D5 b% `            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。3 p$ z8 O  J$ j/ N# g( [0 J
            胡绳丽" ?; _4 y+ [4 z  G# H
                        
0 t8 g+ a( M5 r* ]            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
9 \$ ^" t* C% _) \6 B  ^/ ?4 ^& [            Tianhao Zheng
. Y, i6 Q% P% _& ?, H            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
9 Z0 W0 r* J/ Q; T; D" t! J            翁家翌
( T! k7 a( B* B1 B" M( E. U                        3 d3 X6 d7 K* K3 ?5 x
            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。+ A5 M* s; b, N& T
            强化学习 & 对齐组
' O" H$ i5 Q! S+ @            Chong Zhang( J; h& v5 N. `1 p9 [
                        
+ ~  w. N# r/ X            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。, i  }. r1 N, y4 [1 x' x$ y) d7 p
            Shengjia Zhao* |; K; \  |" Z* b1 f' e' z
                        ) F; _# f7 k) h
            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
9 p6 }6 B$ f  A# b$ |% P: e            Stephanie Lin) u. I: }, ~: g1 o
                        
* B0 P& W! e% k            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
' r$ Y' m  X! {            Tong Mu
; w* c0 p. J% e$ u1 a+ X                        2 l8 X. ?) t/ A, Z' U; m5 m
            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。
, i- w9 J; d" t2 k# A            Jeff Wu
  W& H" F5 `( R) p( G, e/ }( u: X                        
/ Q. z( H1 q3 k1 N) ?- s. W            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
0 O$ @/ q9 v/ E$ W0 d( Y            肖凯: c* v8 s' F8 O" P. Q6 Y% Z+ l1 X
                        
# P& L  \! {) ^5 K! h% f% Y) h9 {% e            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。
- c8 ^  [5 G0 w7 b' e# j            Kevin Yu) ]6 i' X) x+ j! p7 q# x3 d2 _2 P% ]
                        
6 |/ ?/ m" f5 Q4 a- I7 {" @            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。. Q7 ?9 i2 L* r1 u
            Haozhun Jin; g  F2 A+ E; ^7 o) E6 n! Q
                        
$ B! z) M7 G$ `& X9 A6 p            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。. W; z  ?0 p3 s# p" r( i
            顾世翔
; h* A$ o, u3 S# D                        $ s3 g, x& ~( r$ _! ?( I
            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。( M7 g0 s* u! ^6 L6 i$ z
            评估 & 分析团队8 A1 O% ?1 L- h- w: `
            Alvin Wang6 b# ~+ W% T, w4 c! u" j- i
                        
% t6 r4 X8 N9 O5 A3 b# f5 `4 C' e            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。5 [, S4 o, w# A/ [, {$ G: U
            Angela Jiang3 U2 ]* q( B) d4 X$ y; `7 e  j+ C
                        
. w' ?/ M4 s8 Q6 P. W7 R. |            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
* ?- a7 i+ i. h            Jason Wei) k4 @# T% }0 G
                        
8 }! @4 J0 U) `- r- B3 r! ~            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
; S. Q0 q+ w7 z. c  T            Juntang Zhuang, e7 n# m& ], s+ \) k
                        
; e- Z$ U: U6 Z            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。6 c' ]4 z2 a4 P$ ?$ i7 R
            Derek Chen: b1 v, A: ~, v2 R! p
                          j8 |4 r7 x$ r8 P7 ]
            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。, T  d0 I9 j- t/ L6 w
            宋飏
( U1 h3 ^' \4 I  y                        
% l( }. t: d0 I7 ?7 s+ `7 \            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
' l/ [* O4 G& y            模型部署
& k$ u9 o; g7 ]. r  f; c* y            Michael Wu
4 t7 A! h& N- Q1 X" H! N6 ?                        + I5 h$ j5 _! u! G8 v# r8 Y+ d3 d
            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
" \( M" p! z. a9 u" Z+ }! m. l            Andrew Peng" Y5 y+ d: ?/ i
                        
5 R% @! P$ B- v            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
/ x5 V' v6 a+ L' V3 ~4 A            吴雪枫! D  }0 l3 K4 N0 }8 x: }: c
                        
0 q$ L; X+ ^+ K* ]. a            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。* b: U1 m! Y- ]
            Jason Chen
5 q' Q0 A0 {' k; P. \* @% U                        + a# O% ^. f. n' U
            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。! c: j) G4 j5 ^
            其他贡献者9 L$ K; e3 X2 _( ~3 X- b5 j* w5 Q9 M
            Xin Hu, W' ^# s0 A  I  x( r
                        1 n( R/ u. G. W! u) `
            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
0 H; B& z! \+ j. u. D- j            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
! P2 `. _0 Y4 Y8 L4 F0 E. |            参考链接:
* ?3 K- Q7 y( Z$ A5 a$ c6 u            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
7 V. `/ ^+ w7 ]) ~/ n8 [8 M; Z; o            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-8-15 06:28 , Processed in 0.039972 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表