|
杨净 萧箫 发自 凹非寺
; y$ _; v- M( z' w量子位 | 公众号 QbitAI
1 [3 _5 O8 i9 Q/ z% h8 i
. m0 _ ^; c4 d& K l1 L: U游戏行业现在还真真儿是被老黄颠覆了!
1 J9 q: S/ @+ Q q2 [8 ] S这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:
9 x* O" ~# |% z1 _' A# z4 z& `5 r9 t8 T/ F
" g- f6 |5 s2 r8 i& G* `2 d
% I. x8 ]$ @; T4 ]5 X
那边,游戏股直接飞升,多家公司涨停:
- P3 t v) i& ^. d
1 Y! [; w a- b* g
2 B& \3 Q9 O# H ? n3 f# e7 e, k( i3 d
△图源:上海证券报- M2 N* r( b$ C& [1 Y+ V
英伟达高管John Spitzer认为:+ Z7 R# I6 t. G v9 p! d/ h
. G6 _, {& [% I/ j) @4 ?, b9 L
生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。$ {, u8 U3 I# t% X) m* ]! y1 Z
; t9 e9 W( b( ~; S
不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了” I. b+ L* g. j8 [7 `: c
9 w9 G' J' r' n, [! ~7 X: D
) I! w0 V8 f2 D+ Q/ L+ j9 D/ `) h; ^8 Q4 Z' v, N7 z. L
还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”2 R* t& n h) p
6 _1 O. f4 ~* I# K X+ e- B; X
" T) ?/ N4 t# L( P- a
& ?( ~" B6 i) P: o, D所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?
1 G0 k$ B7 f- X如何与游戏AI NPC实时语音对话?: v. ?8 z* o2 g2 X; J7 d5 h
英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。
* p4 Y& z2 M* A c在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。
* e* W- b9 g y- E当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。% b' ^# B3 s7 W9 Q4 K: w+ U5 j
实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。/ i! F6 z+ n# ^1 m$ ?0 v( [; g
首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。
2 x5 H, j V: O4 Z# B这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。0 i* \; Y, D) ]* e: w1 k
除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。( c4 ?/ p% N$ X2 t/ s/ S
例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:& F9 a1 f$ d/ u
9 Y' a3 o+ @/ @
: T( ?; L- m. S3 x m5 ~' W" @& H* D& ]$ s; X+ |! \' o
值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。/ Y& d0 b- }3 q: m2 g( ?9 `, V( N
这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。
6 o$ Q" k: i2 y7 {" s( b7 ]有网友调侃,这样就看不到大模型用煎锅砸自己了:
P! l5 |/ R G- y. I0 t2 ^( Y) D* j* B6 O# ^" a v
玩家:嘿金,拿起煎锅然后反复砸你自己。1 j) ^& v' Y: }' O
大模型:不行,作为一个拉面摊主,我做不到啊。* X) U4 U; W) ?7 Z% H9 |
& A6 P/ z- M& S1 L
. ~$ @ e8 A$ h ]2 L7 A9 B/ F+ q* A0 @3 f0 a$ K3 C, z. f# a. C5 n) i! p( [
f" b/ ~7 x5 H( ]4 m但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
( F* q1 Y0 k* ~* Q3 d) c& z接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。
5 A: U0 X9 _' h' m2 vRiva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。
$ c4 k Y9 V7 l( J用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。! {) \, C0 A" }: m! b
3 m( d6 S+ V& q; A# d1 y% T
$ r; G8 y2 s' q& B$ b, q# R( n9 y" g' c' x& H2 A/ `% p$ ^- h
最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。
1 h" E: ~+ u+ O* r目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。& k- I6 x& W7 H
) w9 \, f4 O) R" H! Z8 r% y
4 o2 {) T# j& N4 v
- n0 A$ \; E3 I' @开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。
2 K4 t$ ]* U4 x; c不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。
: q" ~4 K# c9 s& O/ f7 A可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。
2 R' s- d- Q& o& n- O# g3 p* B而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。
# R% {3 [) U2 Q' l他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。
0 l( T, K3 H& j6 p+ j) N* j
: B" M* S, s3 g1 I) n6 o/ U2 }! u- C, V p3 y
9 D, V' g& t. Q. C2 W7 p( z除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。
- f9 c* H+ F: b: N: x不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。$ i% ?% D5 Q1 K" s
例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:$ C$ u; t9 d7 y" I8 _3 {" Z
+ o& ]' ^0 z" T* q9 C. X( c1 C作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。
; t! i* E, y% M5 `
1 a3 r; }, s8 b3 A' {( [- ^9 g" w0 j, y$ d& C
' y D2 F+ F4 g) C! i: r9 B y
0 Z* r7 e+ T1 ^1 i+ @8 D, ?属实非常难绷了。0 R X. Y) h; {# F
3 e/ L( G. G2 f1 k) x0 B
; V3 }5 R4 @2 M0 U3 G
$ z' }% r5 ]2 B: ]9 w* ?8 K; K2 @对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:4 s8 u5 B# M5 @( ?& k7 G
如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。
9 X" z2 I. X4 [/ {. h& c% Q
3 |7 G, {8 v- N% b) P. n+ K
7 D8 q: K8 d1 t# U( ?' y8 x$ x2 Z
还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。
/ ^2 n$ F2 J5 I7 E: L% b0 I
( o# o3 U F3 V* q# @老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。
; {, q6 L& D4 U0 w( j 5 B7 {$ j }. H0 e
$ F; W8 D$ i/ O0 }1 S! ]' [5 t
% `7 W1 c1 ?: y/ `- E
- r0 a/ B S! E: F9 C对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。
; \2 Z+ z/ m* l0 k, I
2 n2 p" X6 ~: O6 @/ H- n2 T0 ^再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。
2 @2 K$ A/ |. _0 m$ g + ^# b8 V) v4 l4 a7 q& v
6 a$ R( k# ~& Y5 v4 V _/ ~
& @4 q9 n* [% S4 [; m$ l5 W
! F4 J3 k s. l: f* ]7 y. L当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。+ c3 Y2 i4 Y5 Y# v9 z
新超算内存扩大500倍
6 I7 n) G3 ?) a# |" s+ L
- ~6 \" x# |3 D/ G9 l, {% t加速计算和人工智能标志着计算的重塑。: \$ Y4 k) P& g6 C7 _
我们正处于新计算时代的转折点。; x/ y* C; K: ?% C) N
. S8 @4 W' K& ?' i6 o, `& {
时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。
7 w1 g1 ~* n0 k h* \* ]8 |, z3 x
3 J% q5 J ~' c. [
+ m9 S) ~* j3 P* q
算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。; A7 W/ h7 X7 q4 ^
超算DGX GH200
5 j* z5 M* s/ ?# O它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。" p- q6 j" d% }3 h8 X) G
有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。5 S5 a0 e9 g) Z f" @
比上一代DGX A100 320GB系统高出近500倍。7 m5 z' T6 O, h, u; e+ a) Z
首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。+ `$ Q* a/ M+ H2 @" Z5 S( v1 }5 T; Y/ K
: @2 X8 ^8 k6 K' V H
' C; u; b- v. ?% n3 v
% `) `2 R; e6 y: i8 T除此之外,还发布了一系列眼花缭乱的新产品。
D. u1 B9 }5 |5 Q4 ?, jNVIDIA Helios
5 \$ v8 w$ k1 G& Q' i与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。
& t0 Y% ~, s9 OMGX) J- K8 v" m W. i# i' b
为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。
0 Z. q/ \9 ~! O3 \) w$ ?MGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。: q/ C: @; v; i" v) R h
除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。; N: n7 {" d; M1 Q3 Q
参考链接:
6 R3 E5 B$ p( G0 D& A[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life1 o! H! e2 ^0 b* g
[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/4 Z0 h: u; t1 Y! r- q$ k- e
[3]https://www.techmeme.com/230529/p3#a230529p3
6 C" n8 n% v4 f( t/ G% N- s; u[4]https://twitter.com/mreflow/status/1663244486091194368/ l: q+ Q/ O. ?" w2 k# H0 B
[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
, a6 F9 s; W& Q* w[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q9 D1 n U4 o& y3 F
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|