京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 854|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。* w1 g4 f& C8 R" ^! u/ C
            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。: @; K: {* P+ c+ |+ ~+ @
            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
' {- v5 r  L$ O( v, M            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。8 v4 Q# u+ `& \- A; r
                        
" O# u% \% L/ K  A% J4 E            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。: [/ p' B9 h' U( M% ]% e
            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。
" O2 A6 D& y$ c  z. [% d            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。
" T3 ~, k' m8 `+ p+ R            研发人员占绝大多数
+ m8 B1 Y& L0 e- Y1 v            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。* y8 e8 t+ v, A! j( B' ^  v
            预训练部分的工作细分为:" c1 v5 z. l. g( [
            计算机集群扩展(Compute cluster scaling)) t$ c  B( |8 ?0 i$ U
            数据(Data), g1 B0 \: R* V) N
            分布式训练基础设施(Distributed training infrastructure)0 y3 D  c" x4 j- H; \1 e& u5 n
            硬件正确性(Hardware correctness)
* C2 t2 C2 ?+ j+ I+ _- R3 `; p            优化 & 架构(Optimization & architecture)2 R- k1 ~  ^5 @8 }$ z  T- J
            Training run babysitting
  Z! Q- L& Q, K. o% r3 e' a            长上下文部分的工作细分为:1 S+ T$ W8 ^* Y- N
            长上下文研究(Long context research)
, N  z- r5 J) P            长上下文内核(Long context kernels)( n3 c' j/ a# y/ F) L
            视觉部分的工作细分为:
. {6 o7 }1 v" w            架构研究(Architecture research)) S* ?3 P3 ^$ K. D" f
            计算机集群扩展(Compute cluster scaling)* D7 q# ^2 ]: p/ j$ z
            分布式训练基础设施(Distributed training infrastructure)3 ]4 h6 x" o0 v( S% w% p
            硬件正确性(Hardware correctness)/ c! b9 O: S: m4 D3 d5 `
            数据(Data)
( L/ m! I9 \" A5 N+ N! m+ h            对齐数据(Alignment Data)9 }6 m) ]5 H# V# t" q) _
            Training run babysitting
  ~1 z- c7 v+ p: M            部署 & 后训练(Deployment & post-training)" m3 s) J4 Q9 R3 \1 O
            强化学习 & 对齐部分的工作细分为:
* G2 Y5 h9 H6 o  h6 g, R& |8 w$ g            数据集贡献(Dataset contributions)
9 {3 F; {, L( Y% Q2 @  E9 G            数据基础设施(Data infrastructure)
, i8 O1 b/ Z" E' h) U6 K$ V2 ^            ChatML 格式(ChatML format)9 A' ~5 W& o( a* o( ~
            模型安全(Model safety)' @; S0 }: j0 z& f7 U
            Refusals
* R/ m0 I6 E6 \7 x  p  H9 ?0 N            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)3 |) z5 G) [! a' U. ~2 j
            Flagship training runs- d. b1 V& J! m) G
            代码功能(Code capability)
' @6 [0 r( \5 H/ |7 j8 E) x3 T, c            评估 & 分析部分的工作细分为:
% A# U. r2 V7 b6 C, T. E5 K            OpenAI Evals 库
  h2 A1 X. E- z0 K            模型等级评估基础设施(Model-graded evaluation infrastructure)) E. R) p7 V# D- ?6 N! z' F
            加速预测(Acceleration forecasting)$ G3 l  H4 ~: f
            ChatGPT 评估2 S+ r( m# C7 ]+ c: M8 K
            能力评估(Capability evaluations)& s" T# h+ U0 y
            编码评估(Coding evaluations)
; P9 z# C) G; L9 X9 u            真实世界用例评估(Real-world use case evaluations)
* p7 M! T: L9 _. k: J: C, F! \            污染调查(Contamination investigations)
/ P* {) @  r: B$ P            指令遵循和 API 评估(Instruction following and API evals)
% D% a* e8 }0 Y9 O            新功能评估(Novel capability discovery)+ q$ r2 t# V/ t* q* j
            ……
5 i( j6 @% y: X: b9 f% ?            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。5 E+ K2 g8 r- _& |
            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
, L5 b3 h' @6 w7 V$ v' X. d% j  }: P            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。4 g" ]  @; m) Y( y: L
                        
% {* V0 W/ S( M9 D# A            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
7 b' f! \  m. f" \* F            预训练组! y- e: f/ o( }3 f/ |
            Trevor Cai
  t4 P2 A4 k8 \! T            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
2 t5 x+ Z4 Z2 }' q( p! i            袁启明* [5 C1 ?% v/ |; r/ j) B9 G
                        
) M* g) H6 I9 e2 z2 v: f; f            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
, X; i) p2 a/ C/ L0 q" G( W& u            Che Chang
$ a7 [; y- C4 |6 i            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。
1 d* j, @% S8 w+ w7 l, M" y5 d            欧阳龙
1 Q+ z4 Z/ B9 t/ f1 A* j            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
$ }* q  A$ V& T. W# B            翁丽莲
& n1 _8 x" [. x# D                        
& O* @2 t7 [: o            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
- a: M, O# Z* u6 l) d* B4 t            Tao Xu  R0 l" h! n+ T4 i
            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
# j9 n$ J' O0 V7 `            Jie Tang; Q0 o! p1 h! \$ n- w7 O0 O
                        
7 V( @# r0 G$ ]0 V$ ^- k& S# N" S9 @5 a0 D            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
# |6 V6 k# g/ z) v% d            Ben Wang8 e& v% M0 {& p+ o1 [
            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。# j) c5 R+ j# n
            视觉组
7 _+ i  F6 V! z% h* C            Mark Chen
5 s- A0 F& ~. n                        
0 V  G) v# {* {            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。9 f6 o- P! j  M
            Casey Chu
5 Q3 w) {1 C4 v0 Y  m            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。
! ]" S9 {/ m+ `' u. b            胡绳丽
$ b: Q# m* k+ ?                        
* E" p1 P1 Q- I            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
8 p4 h) d. A2 {: a7 V7 v            Tianhao Zheng; m; j8 ~9 [/ `6 l: Z
            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
, [5 J- R9 H8 M$ {0 B            翁家翌- _) B) d/ ]; a* e: [/ d
                        
1 W( K3 x- S. B* a4 H8 D3 d+ {            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
) ~7 r% R8 e7 }/ l# c% Q2 j; l            强化学习 & 对齐组9 T2 E. J/ C$ @
            Chong Zhang% U7 V$ z# ?* E0 m$ J! J
                        
5 D& H3 Z* m" h% l% d9 c, ~            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。
, }' ^8 c. u2 W$ U0 s+ L+ r            Shengjia Zhao, a+ d: \* o6 X6 U1 A
                          W1 i. \2 {8 o# M  ~9 q% b
            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
* a0 m3 ?0 Q) g! F- b& C            Stephanie Lin
! ?; }( R/ [4 a                        
# n6 w! U- z$ a( }            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
9 ~, f" [* Y- q2 _( Q            Tong Mu% z' J" e3 W4 m+ Q
                        1 D) o7 a1 l8 N  d8 Y: @  D& R6 S
            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。
8 v. A/ f+ F7 C. [0 ~2 m% h            Jeff Wu
0 @- |; o0 J/ Z  W) Q                        
' f- N8 g. Y0 l            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。2 |" _" I# v& k2 _! m
            肖凯
+ m' Y. J* H' ~; @2 B! ]                        # H- y* u: A- {: z; h+ _
            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。
" B; a, G9 I$ F+ f  i( C( l: H            Kevin Yu7 n0 K+ D* h  |" S# i
                        
( W* F' {) s- |1 {            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
+ v2 t, `0 g( I: T            Haozhun Jin6 i$ a  Q7 E; q; y
                        
% A& k- x& {4 b2 K' D            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
5 }/ C2 |# v0 K3 W& V6 t* U            顾世翔3 m1 j9 V5 Y! c, K
                        
+ }" Y  n8 z7 r9 O' d+ ]: l* M            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。0 Y. {1 J; o2 V' A9 r
            评估 & 分析团队
$ }% L& m4 z0 \0 R- V0 }1 M            Alvin Wang
" l  X" L8 E1 y- f6 ]( Z- {; V0 P                        8 N% d+ x8 `3 ^. @
            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。- S/ X2 W) _. N9 y! B' g* ^6 t
            Angela Jiang
4 j2 `9 y) t" @  P' a                        ( u' u7 s* I  d; G, p6 g1 k. j( [
            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。2 a# x* P$ M8 E* y; U# f
            Jason Wei
0 G; h1 s% G9 s! ?5 n& v# @4 [                        2 ~, ?- \/ d' e. f8 k- r$ }* z0 c
            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
& J1 H, F* B* P% \0 K            Juntang Zhuang8 t; D) B9 ?! U$ W) n4 u
                        : c- ~* Y3 p( \* m( _  ]! }. V+ H
            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
1 [+ X8 u; N5 N2 I            Derek Chen
- s5 C1 U$ I, I- H: c                        
/ [0 M4 q2 c: u/ b, n* Z. B; U( l            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
9 c% q+ L0 f) j# [- G  s& m) k' a            宋飏- l5 m1 _* K/ ]) S
                        
2 G) U' R. I! Y* c' m# E9 j) n( |            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
, b' }, r4 W9 J            模型部署4 [+ R) L$ q$ z* G# k% ~8 {( [
            Michael Wu' N, W, r0 t, Z5 j  I6 w
                        
6 ~" T" ~4 F* a" [- [2 \2 d            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
0 {! B# P2 n7 X5 y7 P            Andrew Peng
/ m+ z7 ]  O7 h/ I. j5 [' P                        ! b& z. X' @  O  k  P
            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
. `6 ^: _6 Z* m* Q" J; j5 N; f' i0 D            吴雪枫: l' @2 U( p7 a: U3 m* _5 }
                        
) h0 T4 S8 t# W, t            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
- Z( D% Q4 J2 r            Jason Chen
; A- o; F. V1 |! W                        1 I3 i, I  V/ t8 a# o. ?4 u0 N
            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。
+ _0 F* |' Z7 q( ]            其他贡献者1 J& H) t% C/ t
            Xin Hu
1 G( A/ _+ C$ u2 y+ ^; j                        
8 Q  u3 a- |5 M0 w5 U( Z            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
7 Q, ?; }" E$ D: R            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。( H8 ?% g9 K8 P3 [
            参考链接:* u0 R! q0 x& p
            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd/ R: o' ?, [) M' _" J1 N
            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-2-7 17:48 , Processed in 0.040067 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表