|
|
杨净 萧箫 发自 凹非寺
5 C B2 d# [; T5 ^. H量子位 | 公众号 QbitAI
6 o/ J/ D7 u& z : h, W! H9 x5 \' J/ s
游戏行业现在还真真儿是被老黄颠覆了!
% m* p5 ]( x1 S这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:) S, D% W7 a5 H: T' y. x( `
( C9 N: y9 b/ Z
% x" o3 o" S* k- `3 d' R B
- j) ^* h# Z5 f) l. m/ T那边,游戏股直接飞升,多家公司涨停:
/ X% m1 j* K" m! U9 t0 Y
# J c4 s; q1 G8 `" L! L% v
# b: y* V: k4 x8 l6 P) E2 \: Y d
7 ?. p% A; ]& ^△图源:上海证券报
$ L" ^! b1 J' x2 V& E英伟达高管John Spitzer认为:' ^8 U* `. _! `3 A% s
9 G. j# q1 {8 i( {4 L. m i生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。
9 H {; U6 a/ G& c7 P
7 O) {7 F' X, w7 c+ V3 m8 H不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”
6 v* [3 d% S0 {) l: l! b* n9 [: X, O& M, ~! T
' R! I9 ^6 a# `- K% ?* L' \# d4 u7 L$ [& w) K7 {
还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”
$ O& o' w6 h+ a1 I* E* e, l% f6 M& y3 l T8 [
" J6 {) v% [2 T ?7 s1 _
4 N2 U4 ]3 G# N4 h& h5 l所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?
2 |- M, m+ I, v+ H, S' D如何与游戏AI NPC实时语音对话?
+ O b; }, E# r- I3 z4 v5 W英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。
% x# n0 W' F: y$ ~在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。1 S% L+ `3 k) g0 E
当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。7 I" h' l9 S; w5 p! G0 `8 i3 Z" X
实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。
( u9 t3 J8 I) C7 M首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。* S0 Y7 ]3 |+ c1 G/ h4 A1 E
这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。/ r: G4 C% |: k+ U
除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。
) |6 ~! p x6 O" K2 Y# U3 Z例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:
+ r: k% \* L1 I; J! U2 H/ W/ b! x. m1 f3 ~
8 U+ }/ S$ I3 x" z& U
0 s, a! h+ B: C/ H; g
值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。
1 C8 r6 J$ t( ^0 O0 k这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。
6 z& \( e$ \" i' Z0 J有网友调侃,这样就看不到大模型用煎锅砸自己了:
/ J; l6 s k5 h' {4 Z9 F3 a( j1 W/ {- d# E' R2 F* {7 r+ q Y
玩家:嘿金,拿起煎锅然后反复砸你自己。+ n5 |. d/ T- I$ [# u9 A
大模型:不行,作为一个拉面摊主,我做不到啊。2 Z! X& X8 s5 n+ {# n. @: R8 Z
7 P; P( K% W' K. J3 ]! H: C, y/ `. h1 f5 V
, l4 X0 W3 u: W( a7 Q) `) W1 S+ }2 M6 [
但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。7 U8 _/ e/ i- H$ s+ a6 L
接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。
/ Q6 l6 q9 U+ V/ R4 {9 ]1 z& I/ A; ZRiva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。7 Z) S3 U) \' h5 i% `0 v3 v
用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。- \% A, g- S6 C' w# a# B$ r, q
$ j) [- @/ X) J& d8 ]
u9 l2 ` H$ z$ [* g
0 Q1 [- t _$ \+ Y* E最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。- H* e- X8 J' ]. M8 z
目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。# P |. F; x1 A& R5 I
7 u# P! B L, H8 V5 Y; h
5 X9 C3 d9 B$ r t
+ d( D2 V* ?4 J% z7 t$ q8 t) P- Q' G开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。% T4 D9 a4 Z1 [! g
不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。
6 s4 T8 D2 c, G3 B# j. J可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。
4 }# k& J% p( _而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。) y! D0 O! {' R C- @
他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。
4 T* @4 d6 O4 T8 Y- t' l: [, J) a: D& e! X) P/ D" g1 o
, q Z( k Q" R& T% f5 M5 l7 a
& d* X0 K5 Q. @" O# `除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。: q* g& v& J/ r3 V/ Z9 K4 L
不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。
* e5 F$ D! |8 _3 P1 h, ?; ?, Y例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:
* k9 y( k0 P& [! [1 v. s6 @
. O0 c; i7 N- e9 z作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。
( X# r n' n+ h+ S; d5 H; c% s0 I
: t- M7 T6 }9 s2 q, t% C9 v d1 b. k% t( s
7 i) V7 `/ S3 w' _ u+ a, Z! i& y2 H! l
属实非常难绷了。
* v% U9 y( Q, M4 z* u/ y8 ^4 C, o; h! ?5 N
* V1 [5 i: w, ~9 N0 q( Y- j" d* r/ e' P1 M& p
对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:
% T, I7 T/ {$ ]4 m0 A如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。, s8 ^/ }7 v2 h& c/ c
5 g% T; r" y, |3 Y, k, E
" D( M: |8 r A; X# ^+ Z6 Y, ^* T0 U& y
还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。
$ F& ]! A }/ D2 }5 Z q
4 c& H/ Y5 Z- ~老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。' j% ?& s' w* s5 q$ U- V5 p& V& p
1 b, A- v' i' _/ f
+ S5 S% J) v- [( b. S
# b, Y& }8 s" }$ S5 j7 y1 K4 }3 f
7 R% Z( r4 D4 n6 L3 \3 k \对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。. z2 f# [1 P8 f! H: y# A2 \
5 f7 W) ~$ n- F& r再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。
& ]4 w( L. r" s0 R1 x % g2 a$ n% z0 ~# z
( F( I3 j$ H( f, Y: g
; I$ I6 H$ _) B1 s6 _% r7 i7 n1 G3 T1 H) L3 M
当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。
6 q, @: z. F4 V5 e. _! z新超算内存扩大500倍
# ~+ p: v" ^& R8 X3 _6 m2 y
. `1 K: B# E7 t9 V* o3 y; o加速计算和人工智能标志着计算的重塑。( h p% W. s, z9 B7 n
我们正处于新计算时代的转折点。4 z7 h3 ], r$ j) t% z
4 ?: n8 Z& H K) f( V/ \# x- L5 i
时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。
; ~! G. f4 v& [" d m3 x6 ]% @, v! f- J
J( c* K( y' Q) }3 k+ U' r* X# f: ?
t: Q+ J" S: z算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。
& x8 d% j5 ~1 A3 T& E/ ?# P- t超算DGX GH200
! q( ~. i- T/ t( K它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。; E9 L5 B3 D/ y8 z
有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。, y+ A7 ^9 B$ l0 ~* `
比上一代DGX A100 320GB系统高出近500倍。
+ s1 w" N1 k: s# f% o7 u: S1 o1 z首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。. A' D& m1 s' R) }: f1 I
/ A {6 M* Z. C! K7 [' v- h" B ]) \% m2 M; i2 {
( C; F) j5 a5 i) h
除此之外,还发布了一系列眼花缭乱的新产品。
7 W# b' J _( I4 r% u2 RNVIDIA Helios$ J9 n. A! X; P5 g0 @
与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。: M9 d( r' a, b& Y% q& _
MGX
* {) f. F* r3 l p为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。- C8 }% S- F# E& g
MGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。/ M, l9 ~3 q; l6 v
除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。8 v7 k8 ^( S3 k- ^7 O& E4 e( \
参考链接:. n# P2 T0 U7 g2 b3 ]% f0 b, j
[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life
& J/ Q3 f+ k, x. l3 Q2 w[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/
# O" d& y/ w3 }" t8 i[3]https://www.techmeme.com/230529/p3#a230529p3
. c7 w& s' O( t6 ^" S0 _' @[4]https://twitter.com/mreflow/status/1663244486091194368
3 E4 j2 f0 q2 x6 P4 K7 g" a! ?[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
* w* d1 S( U) p$ h$ z0 J[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q/ @6 m* j% }! A. T4 Y
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|