|
杨净 萧箫 发自 凹非寺% W$ `. m. F- e- c5 \4 }# S
量子位 | 公众号 QbitAI
7 m2 p) z9 m) T0 P$ ~. ]6 o # C! u) R8 Q( {+ J: Q: H
游戏行业现在还真真儿是被老黄颠覆了!
9 P4 ~1 k" q: p: N这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:6 e& C3 W: x* W3 t* t
; g. T4 a) H6 k$ t. ]
+ u1 C: P# r& m/ d9 ~ R$ M) Z! v
那边,游戏股直接飞升,多家公司涨停:1 a2 d- v d9 w6 P% e! K3 Q
7 j% C# }6 m) y" M' d
- o( f* M$ H* j: |5 S" u. H
" ?& p p; Z, F' U; M) s+ f3 M△图源:上海证券报
, }; S5 B9 E4 V7 ?, `& _' g英伟达高管John Spitzer认为:: j/ Y, p0 F1 R4 [2 i
( y6 d2 V& D" A" o生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。
- [5 E: x6 S& W& ^
0 y7 W9 o, F& ~8 A* t& D6 u, f0 l不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”
+ Y( T; E0 F& x8 s0 z* @1 ~( ?' G6 N# i4 W5 \
) g' p* ?# ~( X) b; e1 i1 v/ q
! @4 K7 ?/ R+ x" A8 s( j还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”' |: L3 M2 q" h8 T5 }5 H7 X% u
4 L& h* U" w9 q: o
& H( v. ~/ W, J; b* u7 i5 t
+ n8 F s2 t5 ]. R; K所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?
2 y% g5 S; M0 }) Y如何与游戏AI NPC实时语音对话?
' q8 i$ Z2 p# H) I# m7 V' \7 o英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。( c" e9 C5 a4 f5 e. B
在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。7 S* T* o# f- q
当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。6 N t7 K6 Z8 ?" H( i! d
实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。! \+ j( _5 N& a; d l( [
首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。& Z7 s+ k2 Z! \6 o7 G/ e
这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。
: C5 `, c0 X, }. k: w3 e) J除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。5 I4 D% I3 H3 E" Z. n
例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:
& _+ f- P% r5 n$ M$ x2 R& q7 i; U4 o- x8 K" U9 W/ C8 B+ X
6 d6 V3 d+ J1 E7 Z
5 h- {% m5 t2 C4 ^/ `值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。
: [. i0 Q! t/ p* s! ?3 `) C这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。* ?+ M0 c: e* p( D) e6 n1 x
有网友调侃,这样就看不到大模型用煎锅砸自己了:
; a, G+ P7 ^. M7 B) c6 M: {" u/ S6 E5 W6 V
玩家:嘿金,拿起煎锅然后反复砸你自己。5 u1 _3 J: }8 u0 Q$ q9 g1 J( s- G
大模型:不行,作为一个拉面摊主,我做不到啊。
( T6 i+ V! _4 i% X( Z# |3 X( c$ T 6 s9 U, g p6 ~$ N; z
: o1 s1 i3 a8 G3 |
, a8 B4 o) P: F. V2 ~
' }" w/ y' c4 Y9 j1 P但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
2 [( U5 G3 B3 X$ g h$ F接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。" ]$ R* I, F& U6 H3 y9 U" _; ?/ L
Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。
( a* c" Z& ^9 C* o% c0 {" D用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。
4 a9 k* h8 o/ v+ ~, O, D4 G7 @! {5 k; O
F/ T5 ^! m9 }
% s) ]( c' A% D" z: L3 Y) a
最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。
1 ?& _: V {, `4 [- U8 w( p" d目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。4 m7 d; Y3 O% e2 V$ O2 V0 K& x% s' Z) M
3 p- q F. n0 M3 Z
, d# d) {' w: [0 K6 s8 m, c3 `8 F) b5 y2 ?( T- R# y M: B
开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。
$ m" P; _2 O% m不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。
/ F/ _2 k, Q7 N3 Q可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。5 |0 P6 G0 F. U% h9 M: V1 T
而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。
4 |5 ]. d1 a2 p* T9 Z他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。
2 c& F- b9 |; k3 T3 c
! i( z' k' B. }( h5 V# A0 U4 b' ?5 q# i) X/ T9 |+ h4 V3 P
/ X% j- Y; J: Y/ K' F除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。$ ], ]8 b8 C) e/ G( M& [& |. i
不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。, F% h% l4 `1 G" g% P; {( e3 t# r
例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:
. T2 V; `1 [; }; K; t
- h" Q z( T1 J6 _0 C作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。
$ g, N) b2 s3 c; t
$ @! Q9 V5 V2 l& d+ y( c7 ^* S! ]
6 P. X, A3 Y5 P8 T) T" x( m0 f- p5 ~. ?
* ]. r0 R K: N0 N- B4 F$ q属实非常难绷了。- G1 y0 y5 e; ]0 f$ ]* \
1 O7 y6 w) ^4 X. _! A/ J& d7 w! F' Q9 p& ~4 P4 _0 w0 S
+ a0 g+ t/ }; R9 N7 Y3 Q' E. o# h
对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:( g$ @. O4 ^# F4 E
如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。1 N" o8 s3 ^( i' O' r) T
" i* f" F) S$ a7 ~; W1 N$ N' S; R
?7 w" v- K' r
4 v$ H$ \# @, h4 t" B3 \
还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。( \1 J4 j# g" y1 `: ~" W4 o
7 I ]# t1 u5 T6 M' E2 t# l* p( z
老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。# c0 A e$ K* W; u5 M6 N- y5 U* t
* r- ]# t7 [& b# ?
! O6 Y+ ]3 v. j) c
$ ]7 Y. f* \* c% ~
/ w h! V- M1 i: ~4 ]" g) z8 g7 P9 q对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。" c8 h; p- A+ t, L( \# G% Y
% {% p( E+ R: E* i* Y- q1 Z9 S) A再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。
6 g4 w% T5 h4 ` 4 t/ Z& r; D3 b! }6 q/ ] S+ ]' m9 w
3 R$ w! k ^! i: O
8 j, C i9 ~: l2 C! y) e
0 W" @, s' P% \7 F当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。' l, i) j1 C& E
新超算内存扩大500倍
( U) s" B/ P; X
% f# T* @; x Y: S) @: v加速计算和人工智能标志着计算的重塑。0 ^( |7 \& R+ i* M& l* H
我们正处于新计算时代的转折点。
5 W1 ^9 }- n+ Z: O' u) w# x
@+ B( J$ u4 V时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。8 Z" ~" ^/ F! l8 K
" t5 M' ^9 O3 I2 K" X
# I6 Z+ p; z- W4 h+ N d- z' H
: q. }: y# u2 m- Z' P, `) F4 G9 z算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。* V1 s5 `: }/ U; E9 G- P+ k
超算DGX GH200
" f0 W l7 X/ \9 @0 [它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。" n$ ~$ v! |; g" Q: R$ E
有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。
a5 Q O" i1 n( T2 _! [/ Q比上一代DGX A100 320GB系统高出近500倍。8 z4 S- J% r& J Q. T7 _
首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。
8 s& Q1 s8 q9 ~, |& N8 a8 L# u2 _) I$ r
* T8 z) p9 |; G/ o2 D4 g7 `2 T: v9 T7 q7 s4 o, M
3 ?3 D8 R/ S9 C& a/ R/ K: g. h. j
除此之外,还发布了一系列眼花缭乱的新产品。" n/ g; [& `8 e3 k' A
NVIDIA Helios
& s. W) a8 q, o9 }; T9 R# _与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。. l A+ C, t/ W" V
MGX
& p) [9 t$ D* j u0 ~+ c0 f/ W. S为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。
5 ^' Z5 o6 p/ ], oMGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。
6 v" u! |8 H, W6 _0 B# m除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。 v- U* P0 ~, t+ }
参考链接:7 `# {; y4 d) v O
[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life) q @' ^, e2 I
[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/' g& ?. R. `8 Z
[3]https://www.techmeme.com/230529/p3#a230529p39 s3 P, f+ J4 \& d
[4]https://twitter.com/mreflow/status/1663244486091194368
" G+ l; D) _( R4 M; M[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
# J( I z1 K$ J+ x% X' m3 l/ m[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q9 M) C- E! ^( Z$ ^% F
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|