京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 882|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
( [& F% _* F9 p3 g9 C            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。
( ?9 R- K5 a+ u$ e            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
' O5 V2 A( y( V' @5 w1 ^7 N6 K6 m# f            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。: ]* w5 z9 N3 E$ v3 G
                        $ n* Q1 D' b, u; J" Z
            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。; G7 I  {* G) V. q
            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。
6 J( Z7 [5 m/ }6 @9 P$ B            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。7 l) Z6 u" t$ o! r
            研发人员占绝大多数, r: r$ s, v7 _% Z
            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
4 ~4 w; {" B" s$ V0 A            预训练部分的工作细分为:' N( r3 }& R7 M1 [
            计算机集群扩展(Compute cluster scaling), A  r0 l1 q3 Q1 V! I# {6 n' p1 a8 k5 F
            数据(Data)
$ o' g6 ^& K3 Q$ o            分布式训练基础设施(Distributed training infrastructure)* {2 v3 k2 r8 ~2 V" U# m# u* Y
            硬件正确性(Hardware correctness)9 R/ d' e: b' }! F4 y3 B3 ^
            优化 & 架构(Optimization & architecture)
$ |) I" I8 {2 ]            Training run babysitting
& `' T' q# \, H# }8 o! L- u& o5 c            长上下文部分的工作细分为:
! @. k7 f& H' j            长上下文研究(Long context research)
2 c) X' I& O% M  f            长上下文内核(Long context kernels)
9 [4 r6 Z. f, c4 j3 b4 S            视觉部分的工作细分为:. \- {6 M7 L% r5 L$ o2 z
            架构研究(Architecture research), Q7 \+ V% }0 |  e4 U( |
            计算机集群扩展(Compute cluster scaling)
% Z  _1 N# ~; B6 y, c/ Q0 L- j1 ^            分布式训练基础设施(Distributed training infrastructure)
, W8 l9 @0 }- N5 b5 G+ f4 |            硬件正确性(Hardware correctness)5 ]8 C% ^8 ?( @' \- z  _0 M9 w2 f
            数据(Data)
8 T$ s% J( `: p* j) M  |1 l            对齐数据(Alignment Data)
9 S+ j* n4 a6 p; ]* O0 D            Training run babysitting
2 K  j7 y  A+ G3 a6 I( V            部署 & 后训练(Deployment & post-training)
. I  n- B5 J$ i1 @. J9 @! u1 c            强化学习 & 对齐部分的工作细分为:
% Q) \/ {: I2 c0 P/ x/ y; ^: p/ `            数据集贡献(Dataset contributions)
# c$ O) O, S6 ^: Y+ v! l6 U$ s            数据基础设施(Data infrastructure)
* Y. d' K4 l0 l4 c0 N            ChatML 格式(ChatML format)1 o" n$ O5 @" I# X7 w
            模型安全(Model safety)0 z( W- _6 `7 {  k
            Refusals
) G1 N( h" B2 w( F# a7 |            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
# V+ p6 x% B' b4 q            Flagship training runs4 U4 T/ m+ l! R; z* g/ E. S+ ?
            代码功能(Code capability)
4 S# p9 p2 m' {! B; ?/ @            评估 & 分析部分的工作细分为:
  ~. H: f" V1 o9 n/ R; z            OpenAI Evals 库& _7 ?8 b; F, ~( \' |/ ]
            模型等级评估基础设施(Model-graded evaluation infrastructure)3 f7 b6 F# T2 |3 C9 z! M
            加速预测(Acceleration forecasting)
" X: O+ C! N+ p- _3 o7 A            ChatGPT 评估
. M% P! ^' _3 ]! w: d/ G1 D' n            能力评估(Capability evaluations)
% x# P) I; L6 D2 t, @5 j% M- F            编码评估(Coding evaluations)
4 ]8 b& ]; L  v' H4 F            真实世界用例评估(Real-world use case evaluations)
( T) e& O) V$ Q3 j) x" e            污染调查(Contamination investigations)
, J: m, ^- @- {& N; ?, I8 J5 J            指令遵循和 API 评估(Instruction following and API evals), j- w# d! ]. f
            新功能评估(Novel capability discovery)
8 q8 `. ^5 i# `5 c# X1 R            ……
, E: h8 ^, y: A4 E" g0 F& L/ Q            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
# W5 C2 Q( k6 b6 d            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
: j4 t- k2 H4 U- E( j% p            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。4 C2 f6 e7 C( p. v/ f& e2 d
                        ! l+ f0 q. ^0 @5 e  s( p
            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
% O$ V: y1 r# I0 w: J: ?5 I            预训练组4 y: n7 N6 ]1 b; i9 I  F' O
            Trevor Cai0 ?# {/ g. ?2 \1 T, }
            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。! z2 ?# a3 @, j( c  R
            袁启明; F# i: V2 s2 Y' F" D
                        
' v' v+ a* p. b6 J% @            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
8 Z. Z/ N$ J9 E8 ?2 D  K            Che Chang
5 h4 W# ^: \3 A; K* z            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。6 V2 q/ ?6 Q5 m1 Q2 _! v$ Y& V
            欧阳龙
$ ~8 P% v3 d! s9 t5 u. s- }# k" U            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
: T2 f/ i; T3 a) ?            翁丽莲
7 r. l0 z/ S' c. J4 w                        ' L+ ]* N6 d# Q4 S' z7 u6 b
            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。7 b* x5 P' e7 O
            Tao Xu& W  m; i8 v% A. y  ~7 b
            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。; Y' ]9 J/ v6 n- Y+ G5 }9 D, G
            Jie Tang
, H2 a+ D- z; j' P5 Q                        & m5 I( P' i- Y0 x( @
            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
- a' i0 y6 O& `; U8 a7 E            Ben Wang4 J$ n. i7 ~' x! F' u
            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。& S/ \+ G8 o7 n
            视觉组
% t+ m9 r; }# `. f' B            Mark Chen
- f1 G# e7 E9 n( h9 ]1 ^0 ^                        9 C8 ~+ i& E+ I( a: _
            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
3 h% d3 H! E% \7 r! ?; z            Casey Chu$ c4 a5 @7 N: F  o' b
            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。: t( {% T; `( `) U! j
            胡绳丽  v. A' |$ r, Y. `% T' V
                          x5 I+ b  ]; @. ^, `
            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
( ^, h8 V# R* e7 N2 g. n            Tianhao Zheng
4 x/ O. A3 k8 g9 F; @+ t1 F' ]            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
' _/ X% u) a$ m9 d+ l* w- t            翁家翌
6 X7 v; C0 J" S. y                        " o8 M: }4 \. e2 N1 Q, ~# {: a
            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
3 m/ P0 ^" C* R; U  ^5 G+ ]            强化学习 & 对齐组
2 I) \: @+ x8 e! F( G$ Q            Chong Zhang: }- l! d# N; K2 T# D
                        
+ z0 s# u* O& f1 q            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。
4 C2 K- ~; Q% X- o  @. Q* x            Shengjia Zhao/ m! {  f1 K2 ]2 B% U! U) c; L: O% E
                        4 C1 w2 E1 w1 Q- w
            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。! s' S+ V2 K$ O1 L& l7 ^
            Stephanie Lin
" {! |4 x. J- x                        5 K  K% a- ?" T9 S
            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。5 u9 L& X) l% g! V4 m
            Tong Mu( ]; V! E/ U. i* t2 G) |
                        7 m1 R/ m3 y2 q( [
            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。
& h1 [! ^! d* ]6 o$ k            Jeff Wu
; d/ k; z: w, c9 w& G                        
6 K2 @$ d" ^' o, o, M0 B            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
) X% |  S) P5 x$ I            肖凯
' W* _3 z$ a$ f: j! v* `7 N8 j                        4 @6 y$ \0 d; ~7 p8 Z& z
            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。8 b9 Q6 s8 \* [
            Kevin Yu$ a  b" c* N& R6 ]) w/ p# J
                        / O2 x) l1 ~4 ]9 Y: n
            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
: P+ C% O$ k3 x) T6 Q3 u) r            Haozhun Jin* p* r8 ~  {2 w) y
                        
* T% S1 E* p+ c# c! Q+ M            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。% q2 M1 i& ]) y; r; \
            顾世翔
! a: b( t6 s" x5 q2 y                        $ a7 q  F$ g, q3 m+ D
            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。
( ~0 @6 a8 y; T% w8 m* D5 e            评估 & 分析团队3 R$ E7 q% H% Q0 M" f9 h6 J
            Alvin Wang
* {- d0 _' H( Q- g) o& @  }                        : p+ c+ _1 Q* c/ Y0 I
            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
9 Z1 D. S/ f! P            Angela Jiang
% h: K, ^5 p+ _" W: y$ f, R                          G4 W4 }3 b: r# T/ @7 C
            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
" @$ Y* x. \4 Y  Z3 t. B, n# i2 p            Jason Wei& x* N% d4 e% I/ [
                        
/ y: U2 N; O/ S            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。* b/ L3 Q2 h" S" ]  ^# V
            Juntang Zhuang% c6 L) P- }4 b) I) g5 e1 F
                        0 {. k! O* ~9 ~7 t- R4 r
            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。+ r% |4 w! [1 g1 ~7 f
            Derek Chen- }# C+ b+ U& b) g: ~- r0 K
                        ( F' L9 @* j/ P! G& q
            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
/ v( W' J% U7 K            宋飏
9 A4 `, G; O; C% @5 t2 R                        
7 v0 f: R5 h& A- \: y9 |            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。4 u) F! }4 @( h+ ?1 e
            模型部署( D! W: D# g. [: v$ ^0 G/ m9 G
            Michael Wu7 f/ h; m& f5 \; L4 h
                        
" M/ O. M* N9 t0 W            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
% H$ m! l8 ~4 Q8 C9 S            Andrew Peng8 t  t3 t( J/ _% h  ]( F
                        
2 R0 ?  r) \' J  G6 c1 F5 ?& Z            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。! z" R6 s0 ]/ N/ f1 |
            吴雪枫
& Y1 ~, o4 H- J8 n4 p) }                        
( T/ h9 i! r& ~5 e            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
! G) v4 V& n) K' _* [; O            Jason Chen% D: X0 ~* X* y% L5 f$ b, ]7 m8 [) s3 R
                        
; T( G, f3 s; C2 @+ G            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。
9 h3 k1 u( ^$ s! K; o5 I2 T) T            其他贡献者  |6 j9 J% P+ R0 P, C4 b6 y# [$ n
            Xin Hu
1 q. r- R% ]. f2 r) G4 S! k4 P+ X                          P! W7 W1 \8 k# Y; G" h. z
            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。: @- ?8 p3 t+ R* I5 ~$ G
            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
" g9 C. ?" I) H+ y4 h6 ]1 \            参考链接:$ A, O9 X' J9 N4 s$ R" B* s
            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
! |7 G% w2 o1 p9 o' E/ C            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-3-30 19:04 , Processed in 0.043701 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表