|
|
杨净 萧箫 发自 凹非寺" \3 D* |# E l# T5 F
量子位 | 公众号 QbitAI
& }2 X& m: w/ G4 `2 |4 t 6 x0 e3 A T8 H8 n! k
游戏行业现在还真真儿是被老黄颠覆了!& P1 r1 M. A6 j' Y
这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:
/ K8 k2 F4 H3 U. e$ A" _1 _9 x7 J
; h, L t) h3 T6 V& }
6 X7 A% D8 V% ?, A9 \8 t- R那边,游戏股直接飞升,多家公司涨停:/ S6 c5 f1 W8 m# E5 _! ]2 i
9 a6 I1 E( z4 q! L7 N+ ] o \( K6 S9 q8 @ p8 R4 ?
$ k1 l" |4 u. V; S△图源:上海证券报
+ p$ C! c7 p# Y2 `& M, D英伟达高管John Spitzer认为:
; s \% [! _. M* T
0 i! }* X; {' E1 Q" j# [" R3 a1 e生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。
! E' `* U/ T7 z. x% N
& e+ A1 Q& }9 T不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”
' Q0 s& n2 k0 O( K( {4 d
" d$ L# D. i/ e( I# z$ V
% M! q+ O) Z2 K% ^$ E4 F, [; f+ |
1 B8 C3 q( l: q q/ }5 A3 {9 }还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”, ]0 [2 E5 i3 z/ W# m4 _
: Q: N1 i6 U7 D1 z% j" v" P
. ~8 N0 i! S; o9 w& X( _- J) u f$ y( U' ]6 Q! q7 h7 x$ O
所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?( o3 P, G; P5 V' L$ S' L
如何与游戏AI NPC实时语音对话?
% e+ R% e& u* T: N5 @0 M2 d+ e英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。/ N, n4 @+ @: }% u [2 k; }
在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。
& A6 f X; l/ S `. |* e0 @当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。
! w6 v' o1 @" D7 \5 a/ a6 |/ A实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。
' @7 z+ R1 a0 }) }! B- z B首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。
5 K+ S2 d' z/ r! t7 l4 m) `( p这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。
, n* I5 w, M0 V3 {6 A) |除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。- O2 N" \- }6 A) W q8 e$ }
例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:( W$ Y% i( `9 P7 y
8 o, J# T, K* P" Q8 k9 _/ C* c* H' a( A$ ?2 Y1 C
! W# k. j/ Y; k' y
值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。
3 l$ j1 }( s4 ]这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。
R1 R0 B% W8 m有网友调侃,这样就看不到大模型用煎锅砸自己了:
0 E. O& P7 [ h0 T, \4 d7 X: M" [1 P |& _2 A: b
玩家:嘿金,拿起煎锅然后反复砸你自己。
) E! p) g+ [3 u" c+ O大模型:不行,作为一个拉面摊主,我做不到啊。
( G3 j9 Z- W3 [+ c M5 W
# l( H; H. ]2 k D6 ~+ u7 b7 g: ? d. J9 e
0 F. d5 j7 J% }" t
0 _1 N& ~! d$ X! y! k/ @但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
+ t: G: u2 h- {/ _# A接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。9 P5 v7 p5 H w
Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。
" x; E; x! m; f6 n- [0 P7 n% W用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。# Z/ b* o1 L7 m& ^
4 u5 t: Z! [" O8 S- I6 \
1 `4 S/ Q$ h ^, j! X9 O' v# c: `* U" e9 S
最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。! e$ z" h* p: @! ~
目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。9 C6 B3 R) r* U8 t5 y5 [1 q. _
+ i/ P7 D3 }! x+ ~
# w3 ~9 k: p' V2 r0 C3 r9 ~; |
% b- I: B3 i8 H7 {开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。! B4 o. ~" z( [1 Z$ \/ a# h
不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。$ G; a8 R: g1 [5 K; W3 u
可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。/ i- b1 H7 p4 d ]4 X
而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。. C" [8 c, F; ?) Z" }0 |6 Q q* F
他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。
$ E. p& S2 _( V9 Z6 }) I* u* ]% w5 S9 y) y6 e
7 i/ l2 _' L/ o6 o1 [0 Q( V% W7 @/ _! b$ Y4 i( m. E' a* m. d5 w& o4 y
除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。# a6 B& y$ g% W$ x7 K, }" |
不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。
/ j* m b4 U" v0 m; T! ^" l$ {例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:
3 G: S) I6 W4 J; c" t
0 t. I/ J6 i9 P' s; c$ L% O, H作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。
6 [6 O Q- u" T- g / y/ C/ J8 o+ }& C; m' Y6 J
! _! N: a% q4 ^( x/ r: A6 s) {* Z% C
3 H8 V7 u& o* J4 x8 t
$ z6 V) @4 O R6 \属实非常难绷了。* l) J; v4 f5 z4 b1 N' v9 [
, {+ y/ o+ q; N# @: r1 ?' P! h/ B4 h. ^6 O F5 ^
3 s& Y% M8 q' ?& Z' A对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:
- X# O' N8 l' x) ^- k* W" Z如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。
5 V0 N$ M. D& J8 v. Q! x
# J6 j- O6 O$ W
. g m0 H2 N1 \6 O4 I% x9 V, W$ x# s; J6 i8 {, i
还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。: V: G g( x9 q/ a" e- K
: b) h4 i& r" X) R* a
老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。# }9 ~5 N2 i# S; ~! G+ L/ N; W
/ n$ c5 A" o, ]$ Q
w- ]0 H. L- k" h9 X0 S* s" q0 U$ X
) b/ O: T/ s: D" M7 b- Y0 x
对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。
) N2 @( @/ S) U5 l5 i- W5 q9 A% [( P( P# f) D
再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。
- _" [/ P6 G9 q- v. w 2 t0 E* y( ]+ n) z6 |- V6 ` l! a$ i2 h, B
5 p) e) }/ v% \7 }. u
/ G8 F0 N' e& @5 Q9 E' k
' m3 @2 l( y6 h6 S/ Q, S2 q9 s当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。
* M/ L9 X& _1 O( M9 G5 [新超算内存扩大500倍+ t4 i) k3 ~. p7 j; _- ?
" `" G% k x; t9 p加速计算和人工智能标志着计算的重塑。
- I% c6 H4 j. @& r# Y% Z% x2 w% k我们正处于新计算时代的转折点。
' j1 _' Z2 y5 o, a$ ?4 o $ j, s8 j( p h j) n. I6 z( x
时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。
; m s- d+ G% A+ c, [9 `' B% D5 d' ~0 p$ V
4 l5 \7 X6 H7 v5 l& w
4 {& Q) q# Q( g算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。: R- ^$ z. S$ W9 c; y& b0 p" a
超算DGX GH200
5 R9 G2 T# j; `7 U3 M5 |它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。& ]+ q" A$ C1 i5 W8 i) \
有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。. n2 K# r' O. ]- \. Y, d, Z* h6 |7 ^
比上一代DGX A100 320GB系统高出近500倍。
$ c- r$ n h6 U( u- A首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。
% Y O {- D% i
+ p9 N0 F! r: Y! \9 r8 _/ }: h4 N& Q' L8 I1 i% G
8 z4 R, @# t3 A
除此之外,还发布了一系列眼花缭乱的新产品。5 o$ q' J/ @8 g2 K" ?7 y3 G
NVIDIA Helios
3 t3 U8 \% c1 w9 Y a0 T与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。
; \8 Q. F( w, V% k' EMGX
4 z- c7 _, ^9 K, g1 `. Z9 S5 `3 u0 i为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。9 D1 j' d7 ~: H* E( d8 g" \
MGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。, S) z: e+ Z+ p, r* j
除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。: p1 ~: j/ w; {: W" b
参考链接:
4 [- T; x4 X) T) z7 e' T# a0 _[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life+ P; H2 P% e' W9 p
[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/
6 K4 R7 h7 \8 f$ X, Y# w[3]https://www.techmeme.com/230529/p3#a230529p3
T6 t6 @6 g- d: G/ W2 h# p[4]https://twitter.com/mreflow/status/1663244486091194368+ S. O: u$ k4 ]1 A) G
[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
. U7 e, n, P' X# D[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q1 [* e/ I8 R* o. e- z+ K4 ^
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|