|
|
杨净 萧箫 发自 凹非寺
4 r! P# p% T7 t, S量子位 | 公众号 QbitAI
+ |3 x+ Q' R ~- U
0 f% p, A* K& p) ~7 T6 I {游戏行业现在还真真儿是被老黄颠覆了!& L$ J/ c. @/ K% A1 u% k9 i: z& V. M) Y
这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:7 [) t% A) f6 N
! P0 q1 _; W: @6 z& U
! [9 ]9 e( _$ h- S0 j" w N
% Z" e; _# _) {) _" g# J/ H那边,游戏股直接飞升,多家公司涨停:3 m( b% h7 |/ Z) ]: {" J
8 g! {5 c, k7 k& x8 B _2 `0 U7 X
8 K8 z+ v7 C/ X. r7 `# [. G+ {) A* D" y- \2 J% y
△图源:上海证券报
! i; u+ l) E# K: B英伟达高管John Spitzer认为:8 B# M/ T/ r' P3 r8 f1 V+ {, E
) a& _% B6 a% G- j4 y
生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。5 m ]& N0 W" T+ W" s: C; B
0 C1 {2 @2 `+ T不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”+ M I/ a @, l p9 G
, z6 N+ \1 ]( ~2 o. E; i( C) v
) f" c! x) [& j( t9 K8 x8 u' \ S; f; r- n
还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”
3 p8 I: O. E' ` A
: ]" s2 v3 j6 c& M
6 ~) [; v8 _/ Z: q( Q+ l* U4 }, M5 k0 S
所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?
% b1 g `+ ^& o" ]9 V- M( G如何与游戏AI NPC实时语音对话?
4 p2 _( W% z0 a& |8 Z! _6 o英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。5 j- v$ d) Z+ g* @' f7 ~
在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。, E3 Y& m8 n. X9 r6 ]& e4 k8 u
当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。
# p. H( f' V* Q8 c" o实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。% r5 k0 A5 ]1 a
首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。
+ h. W- M6 `) O) Q这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。
6 e2 v' n6 T5 _' M4 G# T1 A2 `除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。3 P" Z7 X. Y: \; K
例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:
- I, V# }3 k& r' J/ J- t, X# a( o( W. `' p+ j9 @5 u' o
& y+ ?2 x% O% a( d! l! H. X: O7 Z4 ?
值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。" f. d, j( u2 q; g
这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。! V5 Z" C! e; Y7 L8 c# E9 ?
有网友调侃,这样就看不到大模型用煎锅砸自己了:
+ g. W8 m7 {4 G9 Q7 J0 ]; u# q" ], p+ U& U$ \6 a: S
玩家:嘿金,拿起煎锅然后反复砸你自己。, g& H( G; k ~
大模型:不行,作为一个拉面摊主,我做不到啊。% B5 V$ ~- F. A3 v" e5 g. z
1 g# [/ i$ T' r8 K0 \! F
8 `& R* u* d8 J$ Z) ]% b. c% O, e( u
9 ]5 w" y0 i1 {0 n
. Z& z1 Y0 \' `8 I但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。; V Y$ X" b: x4 G" E
接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。
) k* |3 F: I0 ]7 b9 {Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。
% n0 v' N& {) t. S5 {用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。' [' H; Q9 b- c+ T9 _) B
h0 J, l$ i0 K/ d
( L' b' m7 z; n# t) L
* o0 R' T- b( X! E3 B- [; D最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。
" t+ O- Y) {0 |1 U1 Y目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。
( H z3 }0 l; a- y& z& w3 k0 ^5 X9 b
# S' @/ r1 }% T% B x: F" N2 |( o' k
' Q; H6 f8 G$ \* S开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。' u1 ]9 y. A- J
不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。
5 P4 a. @0 E3 C: x$ t可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。* I, e- {% w4 c' k5 D, \2 G
而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。8 }% V m& b2 l8 ^
他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。' g* A1 F2 l6 Z. Q* b
( D9 u$ ?/ h. _1 {- ?( K* L/ K2 A' f0 D
, l1 ], M+ C3 l& q" `9 a除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。6 e" J+ B* S! e7 r, c7 R5 e( a
不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。' F- d4 u. u5 d) V
例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:# k# z3 L7 i; Q6 V5 J
' _9 a5 H. }8 g9 K m A O作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。0 u( A: c$ c! |& L' _/ c
. w. h1 U6 a% i0 u9 }2 ]1 G9 ?' @+ S/ O- F
h0 R Q, ~% A
- ]5 a3 N: T0 D3 n属实非常难绷了。
+ x3 ~+ V. N" c4 s. ?6 k- x! v, y7 c5 v9 {, p9 ^" B" f! P
" D W# Q K; u
/ S& K1 G' ?/ f对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:5 E% s) Z) F. P4 ~
如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。
! Z: M' \7 V6 i% f. U$ p; {0 W
3 ^) o! `0 U. O' Q
7 T( d) c. J% u$ L8 z$ g( C
' W7 X; V e3 E. X; ^还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。
; d8 B7 _/ b7 \, e( r: I) i
6 [. N3 G4 ^5 G4 i老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。: l# V! Q. d) Y; U* S# k/ ~
7 ^" y3 g: }4 g- a
( B, m+ e7 {3 y5 V& @, }. l
2 k, h/ K9 |+ M; ]% K7 ]
! K' G* C: t4 N; O8 i对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。
# ~( R; k6 Y6 D! T( v; ~
8 Y! f2 V# j* b8 w5 _0 a再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。
) V& o- B! V: e$ ^% l
8 B/ W+ r9 v$ s
/ g" Z7 b$ m! A+ Q- T
5 k: \- z2 _7 T) r2 u
2 u0 f. |" `1 h! F当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。
5 K* U% c* o, e2 Q新超算内存扩大500倍
/ `0 l- u" u" A6 h/ z/ \
. S. d1 H9 z0 b9 I! L$ W% N. G加速计算和人工智能标志着计算的重塑。
. n/ w% ?5 c5 ^8 q8 ^, l我们正处于新计算时代的转折点。& e! Q! x( o* R3 ]6 R" {
, y1 k3 M9 l: z" v2 x# R; g时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。
7 U: X6 J% n% w" _! d U6 H" y3 ^& M7 y" l6 j! j
$ _* Y3 Z9 z9 |
& U( U c0 U. ?+ Z! c! O0 c' X* d. S算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。0 d4 O8 b h+ Z- y2 ?; R: A h1 z: s
超算DGX GH200
7 Y& ~- P0 s2 e$ @5 o3 ]$ g/ _# b它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。& m" @, S+ S/ Z
有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。
$ K' f0 i4 U+ t) V; O比上一代DGX A100 320GB系统高出近500倍。
& N% g: k$ V: u! b5 a首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。
3 ~' `+ c9 w$ G. x) x% b* i) b
$ L3 B7 K/ T. E0 R" A1 `# B2 ?! z- u! H2 a" u/ l7 h7 v) Q. p# `7 z
8 c7 T ?/ }* i Z0 O/ {
除此之外,还发布了一系列眼花缭乱的新产品。7 T2 J3 y! y, F- C* {
NVIDIA Helios
* Q b# l- a) |, I4 }与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。7 Q) l+ P; O) _) @$ f
MGX( S! o4 ~% c. x1 T0 k. u
为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。
3 ~0 j* q; t5 `6 G- FMGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。
- N4 n7 ]" D# f0 W( k( a _除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。! B J+ g+ L( q4 P- E+ [& s
参考链接:
& q1 y" K( z; d% g, C) \0 Y! a" u[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life& L$ u4 U0 J: z! v/ R
[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/$ P+ j6 O: \, a% i. g
[3]https://www.techmeme.com/230529/p3#a230529p32 p: M1 L' W4 y# k
[4]https://twitter.com/mreflow/status/1663244486091194368
4 B( I3 C! h7 i. J3 ~% ?3 ][5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/+ ~/ l. k3 C& Y7 g6 s
[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q
) F+ r0 l& V( t& ][7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|