|
杨净 萧箫 发自 凹非寺" I3 E3 ?" m3 T$ k4 Z, t; E
量子位 | 公众号 QbitAI
0 B2 E4 q3 q2 [ 8 F* f( o2 }$ _# l
游戏行业现在还真真儿是被老黄颠覆了!7 I3 j* X) F, l% e8 ^; A
这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:
) d7 K/ m8 ]( M4 w+ D, ]; R. F& E; a2 Z6 u3 b
; f9 [" d* s/ \8 V: x, D
2 ?& H# q4 d }* l) U那边,游戏股直接飞升,多家公司涨停:* A% o$ h5 `) Z/ p0 @: _- ]% U
0 |: N, z3 g. y7 g' U5 r
# P0 Y9 q V; i" [1 F2 Y/ _
7 G1 c. {7 [4 q& }, K△图源:上海证券报
3 X; W' M: B% k& _. j( C4 v英伟达高管John Spitzer认为:9 X( F1 U& u. M! |
. v5 W- f `) F* [1 O4 d# W' C8 ]
生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。) M G$ _2 o% _1 H ]+ G$ K
9 C+ S# s9 e! C) a( Z7 b不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”! Y/ B5 s1 ]: j
7 E) A o) j3 B: n; h9 E
3 K/ r+ @' W% Q0 m/ L9 r, e6 h: u6 m5 M1 J" T- b: r& J5 e- Y5 h; z4 `" B
还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”
% V, U0 Y. u' V6 Z) |+ H) o0 U' P
; q2 F/ ?' w8 a" D6 q \0 T/ \4 H+ c! _* o- Z4 f
: [8 a& m& w7 T; r4 X- i. F: } a3 H所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?( |0 {2 q; ^6 `
如何与游戏AI NPC实时语音对话?
! V6 `4 j8 F/ [! R英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。
" |. `0 g; z* A9 J; ]在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。
6 y; n% n+ B7 P- H! }* n" z. u( S当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。
7 M7 k5 h" G( B) ~5 h/ ]& w& r( g实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。: K: i4 R% e: c+ Z; Z
首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。
5 U, T2 c5 M9 p- F8 U6 [& V5 b这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。3 Q4 b+ X; r6 @
除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。+ g* s A2 c/ q( j2 K
例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:
% g& i% @; B' w/ s
, q* p5 e% z }( X. z m3 u! t1 e
! O$ f4 [) ~! f- h% L
值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。
+ m, E+ s9 r. M+ d9 X这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。8 W" [! A; G; m" V7 n( |! ~
有网友调侃,这样就看不到大模型用煎锅砸自己了:( A/ H0 d* C4 V; Z+ b) T$ z$ t1 ]
5 J4 a% Z4 r; s" ]& L
玩家:嘿金,拿起煎锅然后反复砸你自己。0 B+ I$ T' j- l4 Q& W" u
大模型:不行,作为一个拉面摊主,我做不到啊。
6 P' G' R& f* B' `8 n _. A, n 4 P/ d: G2 y% ?; T* ~9 o- ]' E
" n; U a: U" m
: |' n5 X) C" s! i* _4 v2 j ^8 v
$ c* N- m7 \$ o+ \) n( d! {但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
9 [" F' T* D% S, g* ~接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。0 n" V! L% N" V0 Y; G2 |2 M4 Y K
Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。
3 r: M: N1 L3 }2 l6 O4 J& r用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。
! |7 ]3 E! P8 ]* G3 W3 ^4 Z) k( R& T9 E1 F; b7 m; {& ]3 G3 @
& K, h' N/ B' c
( p& S$ R y8 b8 B# M; P" `最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。
1 k( W. n( D5 l" v目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。8 w! i, U. y+ G1 W
( m! {1 S1 G9 W% K! K" y
; O; Z) ~2 E* u- L) v8 r7 j" I7 [+ _5 \
- z0 a0 o. F/ `# P开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。
/ \: G$ D- h! I不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。4 f" d, f' _ V& g0 X0 M$ j
可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。
. ^" p$ U% n% ?% E而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。
% U& t! m( Y5 A6 k5 Z他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。
' v, j) U- F! I# P& T- H, }. [, F7 t7 ~6 K+ M: a: e7 L
% \$ ]4 Q z9 L
* u% _- p1 x. r" V: S# g4 x除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。
' B4 e' u1 O2 X不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。
4 _' D$ B* }5 K1 E例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:* O1 c1 j( F! H5 J! y) M, o
; w& Y5 h2 ]: b1 Z+ G" l作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。
+ \! Y6 U# \7 N( G0 x8 { $ A+ r' {" b ]# z: e$ o1 _ `
7 H( F% y7 @/ X) F3 w
) d; P2 U0 k N1 L& G3 z9 D5 A ^) e6 N; g+ E2 R3 s# y
属实非常难绷了。' v% n* h* d. X$ p' Z
# P) g" @ ~- G9 v1 K
, \7 {0 A; L, A4 Q* c; C0 q4 Y
5 ~; ]. O% g4 ^3 X! d对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:
' }- L* G# ^7 Z! v0 Z* E如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。
! N+ P5 T. O6 n/ w, P1 e9 v1 l* W$ r# P9 `' k4 K
6 H+ e8 X: k8 ?- d- f! k! F+ A
& ^- T+ [" K. p) ]8 @9 \还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。; p- s/ E9 \: |1 ^ N+ |- K2 A
( x; k& j# u) P$ \2 Y. a1 g! d* m
老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。
9 ~! c' y/ W4 O6 s$ ^
|4 w! h3 X$ ^8 a! h: q: Y% q$ C% D/ f0 {6 t/ n
* \) n+ J! B/ j8 Q- y
6 T1 M( m. Y" ^2 q1 p* R/ ?- o对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。
2 l& d! f' c! ]: ?8 G9 O
; n# _# D5 N, S4 R4 ?再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。
4 v* e; u4 D; n* l' f2 g- p7 [# `: u
" p1 y& b0 Z& b( [! |- T! C
( g Z; S5 g- R% \! z1 a! L5 p p- v5 t8 h5 ~/ t. e
+ q2 ~2 Y6 R# \" Y! v# p, K7 ]
当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。
4 W2 N3 C# v- T+ X3 S( X# e新超算内存扩大500倍& o. k# o& D$ {. Z" f/ N% F8 ^
M: K5 L+ u7 G0 S3 W- m) a
加速计算和人工智能标志着计算的重塑。5 a$ T; _0 o* O6 V5 Z# m0 G
我们正处于新计算时代的转折点。 H, ~% x6 k1 K L* O1 _+ N* [
9 U# P" s* V1 g/ q& g4 V$ ~5 @
时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。1 u0 u1 o. h* i
, _; q3 ]! A" o8 H; S. `. P) w
/ x) H7 T/ |. q$ p' f: M: D+ U% M! w" d
算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。
$ q5 W* e. J0 m超算DGX GH2009 ^& B" M' v0 Y; r
它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。2 E! H# Z- `$ C" W+ \
有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。2 W( {7 A# i5 R( d! W S
比上一代DGX A100 320GB系统高出近500倍。0 n- p/ T( l( y! B, \( F
首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。' ?2 V: r% J; Y( u1 [
3 f4 s) G& f( k8 k$ n) O; [+ \% ]1 I. D( I6 i- @# t. p
( U$ a. r7 |( `7 q
除此之外,还发布了一系列眼花缭乱的新产品。9 Q" v3 K; d7 i
NVIDIA Helios
- j* ?# Q& ]& A8 g与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。4 c3 B% W, X$ Q1 a+ ]$ D- j7 g
MGX
* V6 J4 R. B! M Y" B为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。
" M) Z8 Y2 c* fMGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。
: a$ q( Q' k3 X( [/ c除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。7 J" R- p# X1 R
参考链接:, K: M5 n i5 C2 @
[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life, c ^. ^" N! N( o
[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/
( N. \; L% m3 g% ?; V9 i; L; F L: C[3]https://www.techmeme.com/230529/p3#a230529p3( ?3 O- f. [" J/ a0 D* m
[4]https://twitter.com/mreflow/status/1663244486091194368
$ g( D* m; M' v: {! h3 Y6 P) s[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/* S3 O* u$ x+ Y- w1 k
[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q t, N2 b' ~9 G) C
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|