京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 915|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
, V6 d: [3 [( p9 B1 O            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。$ G3 `# K; ?9 T) g# V
            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
# G7 J: j9 R; c; x% |1 X! i            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。
9 W' j9 G/ w% _7 f; e, l' u  g                        
$ T" \- C1 Z( @# ~  L5 H8 @            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。1 N: b  ?$ Y% n! y
            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。6 O% @! L. Z+ V, F! L" [
            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。
) Y) W8 [4 B, B8 C            研发人员占绝大多数9 P/ W5 x0 q+ R
            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。, y, O5 b5 f0 m+ s) ?
            预训练部分的工作细分为:* w# x- S+ u6 Q; q1 t+ }- j5 d
            计算机集群扩展(Compute cluster scaling)
& p9 @6 T* f9 R6 @            数据(Data): ?$ D1 O* g; k1 I5 I- [
            分布式训练基础设施(Distributed training infrastructure)
- i! ]+ {: D7 g1 o1 w" p$ h) a            硬件正确性(Hardware correctness)
) g3 ?  ^3 e8 Y9 o            优化 & 架构(Optimization & architecture)( X% h; B( Y4 |
            Training run babysitting
" s- c* r' v+ Y            长上下文部分的工作细分为:( _& M1 n: d5 T  W
            长上下文研究(Long context research)
" s6 j* _* z& _4 f& c            长上下文内核(Long context kernels)
5 I8 h5 U( w- E8 i4 r            视觉部分的工作细分为:  u  M4 o/ \+ k' ~9 |. ~
            架构研究(Architecture research)9 k) t5 ^/ H# A* r2 n
            计算机集群扩展(Compute cluster scaling)  \) `3 i" J/ ?& y9 ?2 X
            分布式训练基础设施(Distributed training infrastructure): J. ]9 y8 B7 p5 v
            硬件正确性(Hardware correctness)
! A$ ]5 a; N/ ^" S# v: M4 B! \            数据(Data)1 l1 l8 }; {/ D3 O
            对齐数据(Alignment Data)
8 V+ K8 d) }; u* W            Training run babysitting
% L- c7 X  M- w7 L; s# P9 g; v            部署 & 后训练(Deployment & post-training)) D. k# F- u5 O# \) s8 `7 R
            强化学习 & 对齐部分的工作细分为:; h/ G% D  k- P" P6 U4 O4 l
            数据集贡献(Dataset contributions)
1 b9 C& F8 i$ {% P, ?2 j            数据基础设施(Data infrastructure)
* [% }( ]% |% N" u: _  X3 j% \& |            ChatML 格式(ChatML format)* j- D7 P* n; C7 l
            模型安全(Model safety)( d- k0 X  ?. n8 e% N3 ]; j9 H* H9 C
            Refusals
8 u: l4 K% \) X            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
( U! Z' \8 I; k6 N: a" k8 ^/ B            Flagship training runs
" e9 B7 Y- c7 U" P. ]3 P            代码功能(Code capability)9 ~( a" B: ]- |" P
            评估 & 分析部分的工作细分为:
1 O# B% v0 e% F$ `* t            OpenAI Evals 库
9 G% w* B  |# ?            模型等级评估基础设施(Model-graded evaluation infrastructure), [- {5 Y& {- T% \5 l1 ^' U6 ~: X
            加速预测(Acceleration forecasting)
; K  G! E- l) g& Y" L! N$ v# R/ L6 I            ChatGPT 评估
" r( ?" y+ F7 G# @: r            能力评估(Capability evaluations)
/ h: @) U, T9 T4 j+ O            编码评估(Coding evaluations)
  Z& d0 H3 l- n) l$ P9 K            真实世界用例评估(Real-world use case evaluations)" o6 S% b& Y! a& h& ]5 h* p" i
            污染调查(Contamination investigations)
: y4 K) o8 K4 [. L. h            指令遵循和 API 评估(Instruction following and API evals)
% {) i* a4 j0 E( ~9 n$ v8 I            新功能评估(Novel capability discovery)
5 X( Q* J) t! ?+ a/ i' {            ……
* Q# p5 {- Y& j+ v            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
4 [  R& h& K; Y3 S* n+ d, v            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
; ~: Z4 l, _* @  `6 W0 h4 G            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。/ r# W  y5 ~# F+ @" ?: }5 x
                        , _2 A" E& O8 D0 ^5 `% G# E
            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
8 t  ~1 ]$ U" H& a2 A            预训练组
/ I9 m. I% k" W# A" L3 C            Trevor Cai
! `$ Y! q( i! \# s( X! W            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。' d" i8 ]4 [3 K, d5 ]' y4 M
            袁启明
7 X2 ^- r+ h9 o                        0 v3 C1 o) y) Q: i
            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
  g! i0 W% o/ D2 F% D# h: w9 r            Che Chang3 J% H0 ]& ?, ]8 D" ?7 J5 m
            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。. {% `) e( }% G* {: Y0 l
            欧阳龙
6 z3 i2 A8 e; u5 e            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。- M; J4 f: d2 G8 d5 A% s, P, N
            翁丽莲
& B$ x2 b' Z; Q) r6 ]; f- H! L                        $ y9 F( T% O+ S0 n8 V( J9 L
            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
0 n- ?4 R' m; }/ A% L- Z6 c            Tao Xu
2 L; k/ i5 x" j0 M8 Z# X            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
$ o: i9 t. V/ e4 t; z& K            Jie Tang8 K( |: z5 C4 M8 V+ b
                        
! _  y3 J- v% B) ]            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。( l) x; B8 u4 f- k. y9 W+ U
            Ben Wang7 Z7 r) n$ J' s  F
            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。1 |+ z3 i3 L1 V" @6 P
            视觉组' J, s# u2 }/ |+ N
            Mark Chen
$ y6 j) u& U: ^9 b0 g                        " |/ r, f" s2 _% D$ [' C6 Z
            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。: N& E6 G; ^- s1 I; M5 c6 v% A
            Casey Chu- Z3 J& K  q2 n" B0 r2 v
            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。
# k' _: w% {! J7 O( \            胡绳丽
1 d- h, q9 G' v( T                        2 i3 y: ^5 u* O3 ^# j
            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。$ s' P6 P5 x% y/ m8 f
            Tianhao Zheng; P7 A, B: H5 U
            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
5 K4 ^  ^$ Z- n* B            翁家翌
7 W& x5 u1 o7 X  a4 ^( C' T; O                        
- V$ _, x  a0 Z7 U( W( {! K            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
1 u% v% B! I3 ?& |            强化学习 & 对齐组* B3 k2 J7 z* I+ c: H
            Chong Zhang
( A4 s" t) E% Z* n! j                        
- Y1 n( P& M! e) v* z, X            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。
0 G8 @. \0 v. o* B: H/ M' j            Shengjia Zhao1 q+ ~5 c5 D! F% u' J
                        
. L$ t' H0 i) @% V7 u! n0 V6 b1 Q            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
9 Z8 `2 X/ {/ v% }' C. c1 @7 l$ Y! V            Stephanie Lin
/ Y/ D$ {3 F/ v3 H1 `% k. Y3 x                        
; w; b# R5 G2 [; S/ {  [' ^. @            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
5 N: ]6 g% Q2 b. j3 Z4 n            Tong Mu4 s& X! E5 }5 ?$ s
                        / o1 p( R8 V8 {+ K4 e0 O) `
            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。
" H: O, t( ~7 r3 L5 d            Jeff Wu1 }+ I& G8 q* n/ T
                        
5 {& w* J7 W% o            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
0 D9 [) S# e, ~( H            肖凯1 O+ ]) Z! z6 Z1 |) T8 |
                        
' X- ]+ \, k6 Q. |            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。8 y: m1 }; D2 ^: k6 @. ?8 v* K
            Kevin Yu' q- x: b4 `% W% D
                        
0 [  ?: m7 ?' R8 Y0 H            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
9 \/ D+ R( G/ K: G. u3 U% p2 H            Haozhun Jin
  E4 N* y, @' ?- A7 t                          H- M4 [& |; E$ Y% b
            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。, l, S2 @* Y' U: ?7 n
            顾世翔1 C- g( [; H; D$ J! F2 R# F2 X) P
                        $ [6 C4 j: {  \# {* F
            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。2 m) L# o  J+ Y% L. t4 e; t  U
            评估 & 分析团队
7 R- r( a$ Z% _, V( H            Alvin Wang
" ~5 _# q7 [0 R! @" f# I                        6 @( Z& ]% j5 e; z$ f
            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
, G# A' {0 c9 ~) ?$ ?            Angela Jiang. K3 z) B- `7 m6 q2 Q/ m5 u
                        ) z% s3 Z4 a: n/ r% N9 o
            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
0 t4 |  V8 I, K& ?. N            Jason Wei+ H8 c) p7 Z1 o" c) w9 ~
                        * y: |; y+ e/ ?0 E* B
            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。0 T- R% J8 o# w' F7 Y+ p
            Juntang Zhuang& ^! Q) w+ U9 _# m, ~1 F* S
                        / f" T$ B# u1 @: n! t
            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。4 n8 W, Q2 B& u$ b$ P" |7 \
            Derek Chen
$ v' `. e+ \% e+ X7 P- N0 S                        
3 Q* x* Z0 U3 h6 E& `            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。# t0 `6 ^  J! @- e" S- K
            宋飏
! H7 Z/ r) E" Q, R% |                        
) w$ a$ ]7 W/ c  O, s5 J; T8 ~            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。0 z3 ^& n& p) e% o' Z
            模型部署) z( }/ n) U: n
            Michael Wu
$ X. x) y5 X  r1 N4 Q8 l8 H                        
( W- l/ _. e& Z' T' e0 U            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
) }$ v& }8 l* X4 k8 u1 j            Andrew Peng
6 ?& @- W$ x' f5 C6 R5 U                        6 |* C. ?- u1 J7 v0 b- {
            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。& d! _. N; {+ ]# t" ^% V
            吴雪枫
6 H6 [) U9 P; X3 {/ }, a" k$ S                        5 I6 L8 z- i2 X5 \
            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。6 h( d7 @; x- E/ W+ Y
            Jason Chen
" \; U5 B9 k; Y                        0 o3 N2 Q% G$ x# V. O9 d3 t: {) K
            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。6 c2 b7 H7 A& Y  m$ b0 w6 ?3 I
            其他贡献者7 @1 X( p% P% R  n: V( R7 C( B' x
            Xin Hu
$ Y% c/ M7 g3 ^3 ^; w                        2 L3 o9 f0 |6 L- ]
            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
2 K! @5 d- H1 g4 V9 a' q- {: Q. b            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。2 e% w- @7 T* y- a
            参考链接:0 M$ N* ^1 T6 L+ b4 W1 H
            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
' h+ w" D/ L+ {% G5 q- e, y            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-6-23 20:53 , Processed in 0.047583 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表