京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 884|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。7 q" Z5 V2 C& ?/ }: |( p6 s! T( o" Y
            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。* T- W# a& F$ W9 m/ B' v1 F
            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
0 U+ ^5 H1 v! z# g; C8 Q# p            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。" ?, _) k0 V: J  w3 p7 H, p
                        
3 y5 g! F$ B) L! |; V5 q            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
& j- X* P* ]- M' g+ ]            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。
1 }, z5 Y* I1 G! E5 z; {            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。) J  ^6 k; f' d; e$ O
            研发人员占绝大多数1 N7 ~  P; C4 q6 f# O* ]+ L
            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。! _1 q  Y# s- G4 q, a/ G$ J
            预训练部分的工作细分为:
) j5 Y# r7 k1 ?! v* R            计算机集群扩展(Compute cluster scaling)
) I4 x7 p  E2 U$ j            数据(Data)- @4 D" \' t! e# D/ a$ D
            分布式训练基础设施(Distributed training infrastructure)' C+ D9 K0 l/ W& g( j9 Q. ~
            硬件正确性(Hardware correctness)/ S1 [0 X8 O" P% I
            优化 & 架构(Optimization & architecture)/ ?9 O2 C5 U/ W: m; k; {# b+ H
            Training run babysitting
% m+ _+ _2 W( t  u# ^            长上下文部分的工作细分为:. F* q* Z2 a7 Z7 B
            长上下文研究(Long context research)
2 _, Q- D, O2 w" i            长上下文内核(Long context kernels)
' O$ e0 E/ C5 u            视觉部分的工作细分为:
; ]; H" H' l' M! P/ a            架构研究(Architecture research)
& L; s4 }7 X' s* q; L% p            计算机集群扩展(Compute cluster scaling)4 r7 B$ R' R0 }& N
            分布式训练基础设施(Distributed training infrastructure)
5 v* \" _. A; c4 E) ^            硬件正确性(Hardware correctness): K) i/ Q: u% V2 C# ~
            数据(Data)
' q& m2 |, ~& q; B' D            对齐数据(Alignment Data), Z' h8 w; L$ h+ F0 Y+ W
            Training run babysitting0 k* W! E2 ^" O5 H8 \6 l2 h& v4 |3 k
            部署 & 后训练(Deployment & post-training)) D: w  Z( w+ y( \. M3 {
            强化学习 & 对齐部分的工作细分为:
. g0 L4 s7 m5 e) U  Y            数据集贡献(Dataset contributions)
: N/ w7 V; v9 t! C! Q            数据基础设施(Data infrastructure)* E# S( }' z6 e/ \, }& r7 b
            ChatML 格式(ChatML format)! x# J! J9 c% W
            模型安全(Model safety)
: b+ G' [! P. R6 j. z            Refusals. X0 y' t! g8 E# t, e* c3 ]2 k
            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
$ I7 ~5 v2 Q$ x" V. y% a            Flagship training runs
- Y1 E$ `/ k+ Q! g! S  f            代码功能(Code capability)! O% b- X& O/ a1 V
            评估 & 分析部分的工作细分为:
5 C3 c  X- W7 I            OpenAI Evals 库0 e: b; D4 t/ H' x; p( Y' j
            模型等级评估基础设施(Model-graded evaluation infrastructure)
4 K! T& K6 o' T3 g* E) e            加速预测(Acceleration forecasting)
& p7 X, y3 I! w0 T            ChatGPT 评估
6 K4 G6 V! |! _. a9 a            能力评估(Capability evaluations)8 j" u" Q' m- ?& h$ V; v) F- |
            编码评估(Coding evaluations)
% t$ _9 I$ @6 m& K            真实世界用例评估(Real-world use case evaluations): K$ V9 w" M; c+ p
            污染调查(Contamination investigations)0 U) w. H' {! C/ ]0 c9 z
            指令遵循和 API 评估(Instruction following and API evals)* C4 U0 V9 B( `8 Q% z
            新功能评估(Novel capability discovery)
9 E4 f7 Z* D0 Z. l7 {+ Y. W% m6 b6 y            ……* W1 u  d! `$ w! R2 [$ m
            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
( X4 J; ~, P; ]& y4 J            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
4 N& }* ]* e7 ^. k( a6 e, k, o, R3 G            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。: _) W4 ~7 V" R( b0 T" v  S2 N7 c5 ~
                        9 I  L% J$ a: Q0 x
            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
6 \1 ~3 H9 u1 v: {* e            预训练组
- F* g, P4 D" g- d# a! C            Trevor Cai+ P3 F) a5 I0 R5 H
            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
4 a$ u  f/ U7 {" e8 i: v2 I0 _            袁启明" M2 w+ m5 p" P" z
                        
- R  x+ s2 E3 o2 F/ i8 }) S            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
6 ~; _3 z+ c1 D1 z! J1 c            Che Chang0 w( L/ m1 k( q+ r6 s
            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。- s' k0 r6 ?2 e1 A; s9 t
            欧阳龙
1 I+ ?$ M! ]# }2 m8 H" E# n) H            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。: a3 i& x& e- O9 z( o6 s9 \
            翁丽莲
& e. ^: M/ @6 T0 @' O" o; w. F! h$ R- X                        
% H7 o$ ^+ O* ]  k0 Z. f            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。) Y+ A* ?; h* A" X+ R  P# `- u
            Tao Xu" R+ y. {5 B( y' }% B0 @; C8 @
            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
2 a0 C4 @! z3 ~1 r3 R  M; ~! N4 c  {            Jie Tang
* \' v8 Z# X4 T' v                        
  |7 L5 ~& b: t            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
; u- ~5 \! K+ n! I4 g. j: }3 ^" k" j9 O9 Y            Ben Wang
3 Q) I  P8 u) P8 w' [            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
* j1 k% N: }% U            视觉组; e/ ]) u7 ?# E/ d
            Mark Chen
) }) g4 C& ~! A' S6 U                        
+ J9 N0 Q$ s3 U5 }+ F  U- r, r            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
8 p; A7 G& D  c' o1 y1 F            Casey Chu
7 n0 {* h/ |( ~3 e/ J) s" @            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。6 K, U; k% k8 r" j# o, `
            胡绳丽* X7 S& S' ^) d# K% [/ ^! u& Z
                        - E& I6 k- v# i) G+ X. z
            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
0 {" Y0 e% u4 x! F8 p$ ^            Tianhao Zheng$ l* k3 i' m( J2 i
            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。9 g0 ~' w7 U$ b$ j3 ^- F% b/ k
            翁家翌) P$ a! \- w) ?8 E# w
                        
& o# h0 n/ X* I& H" G6 C            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。5 g& e; |: r% q
            强化学习 & 对齐组4 O' y0 S9 R  R' e
            Chong Zhang
% c3 x. y+ s. h7 \; q- z! s                        
! }1 e5 a9 x5 c: {& O            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。' W+ O6 T8 J; a3 u( R
            Shengjia Zhao8 d1 [% e) j0 V! m2 P
                        ; T$ `4 y4 Z- E" z$ l& s$ Z
            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
, G% @5 k) V0 t            Stephanie Lin
! p' O5 U3 N0 I; j6 ^3 G; X' z# X8 j                        
4 M7 Y, T' v4 F5 ]/ [7 P% ], X            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
2 d5 }( }5 ~8 S; A            Tong Mu' X% g4 c! r: |2 l5 M2 Z, V2 A
                        
) T5 d$ P% T) F" ^  l0 v4 ^            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。" o2 k4 Q& f( f* a
            Jeff Wu2 p- A+ q, J3 Q
                        
) u# x' b, ~' o$ ?* C) T' O            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
( Q, f( k1 ^( A% t; D            肖凯
1 _# R2 \! H$ p1 c( x                        
0 T& N9 s9 h1 l! Z4 \( ~            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。
' u$ S. a8 y' u8 D- e$ [' Y            Kevin Yu9 s1 m7 H( x' y
                        3 [7 r5 M4 m" |% q8 Q
            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。3 E( ~1 {, x, R1 K' r
            Haozhun Jin, S% d" x3 ?5 }6 q8 l: h0 G
                        $ ~4 W) g& a; o( P/ Y
            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
; z! Y1 ?) a7 b# A% I            顾世翔( r) W6 Q/ G3 \
                        
4 S; \. Y/ A- l4 p            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。
( B) A8 L& P( f            评估 & 分析团队
, B% _+ g; C5 B+ @5 i& w8 j            Alvin Wang
7 ?2 X) R+ J8 h6 y! w                        
( _9 t' s6 E8 \. G0 L( C            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
3 h. k) Z7 A4 z' r+ B- y            Angela Jiang* h+ u8 a8 G+ w8 k/ k3 k2 ~) x6 ~
                        3 p0 C) \& Z: z- t2 a
            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
. r* e' ?' A, R            Jason Wei
- ~/ C$ d: n& L  q1 q. }0 u  |                        : Y+ P* x- ^% B5 k' E
            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
- |, f. G7 Y0 h0 K            Juntang Zhuang$ [; U' s0 M; y
                        5 A" X9 ?1 a* z6 [4 ?9 S: W
            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
6 E; E0 ?$ P+ A( z6 I: b. t9 T5 B            Derek Chen
0 q( m0 P' B! P; G; r4 h                        
; t5 C5 m0 G1 b+ N& `* n, w, Y            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。& g1 V: f# |; z0 D4 {; a
            宋飏, }' J4 f# W5 r6 K
                        
0 |+ v* s. u0 d8 y9 ]2 o  a* b            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。; Z* M9 t8 r+ k
            模型部署( v" N6 Q* ^) O0 L
            Michael Wu* w0 O: I! P% n2 e
                        
. i/ B/ o+ x% y4 R' S9 {. X2 x            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。0 A1 e- q% n% v# a" k" y' X$ y
            Andrew Peng
- N# n! Z( k* W$ _! Q$ s# u                        
9 \0 v9 E9 l9 k  A' u6 ^            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
. y% K! p' h3 v2 x            吴雪枫
4 e' c! W: O, w' E2 b1 n                        + k2 D6 Z) v- y3 b+ H
            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。9 E; m" @$ i/ k5 P* l- [! m
            Jason Chen
; n; G  W) N  ]* ?8 k                        2 z) k9 e4 K! l4 g- {
            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。, B6 D& ]. L9 @% J
            其他贡献者) I' _6 j% \1 w5 M
            Xin Hu4 r  i7 v5 P3 P
                          A' R9 D' M7 A7 N( A
            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
. u4 r& H0 E: A( C# _            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。( y) L+ t9 J* p' q4 [
            参考链接:" a4 Y9 `0 H2 |0 l' x* k; ^1 ?
            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd/ U: f' j9 }! S: ?' o
            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-3-30 20:46 , Processed in 0.041600 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表