|
杨净 萧箫 发自 凹非寺
2 k# H, D/ j- B4 g# ]! e量子位 | 公众号 QbitAI
% Y( a/ \6 d& {# m2 `
! ?" L1 P6 e) ^4 o游戏行业现在还真真儿是被老黄颠覆了!
8 A$ w7 t7 e8 Z5 P9 {6 ?+ r这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:( M' g1 b4 V: i1 k2 w* l
! g# V- V- V+ M) ~
4 A9 Z+ x0 T( Y5 k
- E* ~3 F. |. i3 o, y% [- r那边,游戏股直接飞升,多家公司涨停:4 ?, s& j9 r; E; Q: t& b
+ O8 D8 H- T$ ]$ k9 g/ N# l
+ {$ _/ m: A& z% `7 |& U) J
+ ]" {0 j% ~2 C6 l# x
△图源:上海证券报# }" ~3 T k$ g! Y- J
英伟达高管John Spitzer认为:
4 g. l7 U- M( w* R
% K, r$ ~% A4 b( z- K% p生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。& N& O1 q1 v8 L$ d0 z6 r
# m1 U+ L5 B9 C: o2 T+ d
不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”
8 [0 q) X) D0 y0 W, B+ r* q: d8 ?
' q- ^- l' S6 |, r0 D/ {0 o+ y' [4 @# I% }- N$ V
还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”
% K2 X: E( b4 [( V, l9 C o2 S1 Y
& X$ \: U/ [7 i. ?6 [7 l( Q$ F7 I( t. h, f4 B) G
0 v8 Q7 F( _* A) U所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?
( E' I# G& ]1 H; N如何与游戏AI NPC实时语音对话?
6 Y) d; }4 R; A7 X英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。; ]: {8 i) c" {! Y
在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。7 S* ] \/ w5 z( u1 W
当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。
" u8 u9 L( [, {. a# B+ S实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。& h& H" b1 d |' U
首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。
' a) W# X# f6 _- s这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。: f: P0 |8 p! A+ ?3 Q7 X
除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。
9 x3 [" V9 V' M1 J, f例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:
B) C8 a$ q" u9 f8 o z9 ]1 T, k4 x* M* ]* q$ ~! c
. ]8 G3 w) X. y, i# F
' {$ Q! U! M) L/ A3 b值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。
& Q" }! F, N# m" t/ D, n9 {这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。
0 c: @/ V! A7 _! Z$ t( J有网友调侃,这样就看不到大模型用煎锅砸自己了:
# R1 q3 A1 M5 L4 B$ T4 d# z) f0 X+ _2 I: ^
玩家:嘿金,拿起煎锅然后反复砸你自己。% S0 w% \) _7 g# ]" ?! d3 y
大模型:不行,作为一个拉面摊主,我做不到啊。; q/ \+ m B- O* Y( a7 a" h& Z
. Q1 L6 y% `; r
) [, D$ l+ B5 v7 w
& x$ O7 G2 B3 V/ ]( n; m
2 Y, w5 b N9 ` m; w9 `1 z7 w但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
9 p0 S: B# K3 e. M# c) R接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。) ^$ f- x+ s% o8 z
Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。" {& P. c9 B u$ \
用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。
0 L0 b1 K! ?# V* M- G
5 O( a% b$ ~/ ] S# w7 o, d5 F6 V' s# a. Q4 C. i3 P* e9 r5 R
0 U; P( g% L" g* k% G最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。
. h! S. v9 _+ y' p" E1 G0 R& T8 E目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。
5 ?9 [# E+ f6 u5 I% T. d4 \. O5 s u9 C5 o) n2 \
& z+ _4 S: g( h, S" R$ ?8 B- f9 q7 z( |$ C, W/ ~. p& U
开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。
/ C% Z# G) m4 e- k3 W不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。
* _" }$ y: r6 |. t% W' E( e1 v; C可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。& a4 F% d& z) E
而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。% B8 @: w# E# R0 L
他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。6 s6 x4 c0 V1 u
( P5 m7 e4 A, z6 g, a* T# W$ E
) {, w4 m/ U/ Q- @0 r; ^4 O2 X' l; A( Z$ A& I# d
除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。) T: D8 {" ~' c
不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。
2 [0 I- t/ }1 A) f例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:
6 W' J' o, s" x$ Z0 z$ V- O% I5 a) H( b, }* v8 u' h8 H
作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。/ y8 `2 M1 h) M
9 M5 @- U/ ]. ?* U7 c5 `% G
( ^5 a. s2 `! U% U7 _1 g
1 e6 [: u1 m6 @! ]6 @
- R# P9 I" y% H+ m$ S
属实非常难绷了。5 o" n6 F$ S- i" N
8 k4 F6 @ }/ X/ r9 h1 z# x N' J& H. Y& D5 I
! K0 G3 \# W2 b! [. B T3 @2 V对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:
+ J. c% F& K. r6 j; G1 {. L如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。7 [8 o9 x* e+ ?
2 c1 w' C1 M# a; N7 D' u6 \& n; \: Q D3 k$ C. ]' m9 r
1 h- ~# B6 E, U1 O6 T4 U' S
还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。
* u+ Z% t: z/ u! P' W4 l8 p$ W8 A: U/ c. H2 Y, l/ M; N2 Q
老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。2 ~2 T) N. j- X- \$ z2 W
% F: j! x" L# `2 T0 L. d
5 b; t4 h2 t' l, H$ k$ ~7 F
& \6 V3 A, ?$ x: q2 D0 ]1 t
+ ], T9 m0 N7 F对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。
L8 |7 f; B0 U) e9 C w+ d {6 v; L" w* G. l; a y d' w4 Y) T. t
再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。7 e/ X% h/ K* i+ `
) \1 E3 F: |3 f+ P: ?# b
6 S* ?, @! o8 G6 J9 k1 c& z2 n
. a0 A+ B. F. Y+ \9 F$ c0 S/ M2 g0 x% j! M
当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。' X5 ]* z6 i0 C. b. G
新超算内存扩大500倍$ w1 | ?9 P0 p% N$ b& p
7 `) K. f7 x' M加速计算和人工智能标志着计算的重塑。
1 W: K. ~* }8 e( ]& x我们正处于新计算时代的转折点。
5 q, K0 r$ J# V/ y+ P! U) S# Z - F8 l. A/ P/ V J1 {
时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。
, n/ G" _% r8 V) B& j% ]
2 @/ r% j0 n* `; y8 {9 k( S& G+ e* z6 K! Q6 _! v3 D) y8 m, z3 X7 t0 s% w6 D
; ?7 ^! r+ P1 e
算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。" @8 \' l# {$ S1 x7 y" e! F
超算DGX GH200
. K* _. f; I; ]& j$ a9 X8 c7 z8 V它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。! k- T6 x: O, T7 s$ a! d. S$ G
有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。- \: L! X6 U6 m& c& D
比上一代DGX A100 320GB系统高出近500倍。4 Y6 B/ U$ b- h( s( C6 f
首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。; T2 K l2 f' Q2 i6 H5 }7 ~% E
+ U- j+ m: U# ]$ n( {4 G. t0 J4 p3 q, H$ s# W: ^
" F% C* x1 H1 G \# Z' P
除此之外,还发布了一系列眼花缭乱的新产品。
/ a- V* [8 e2 g$ ^NVIDIA Helios [9 W4 c }) W6 s/ @. Z
与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。
+ m/ l4 D$ u, E3 lMGX
/ v; E2 M% t# G- i为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。2 I4 G4 C; v5 V4 F
MGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。7 n: Z% W: s5 O7 x' w" o. e
除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。2 }: J0 t! u3 ^# B9 P6 }4 o
参考链接:* c& F8 m [! C8 K3 j
[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life
# _+ a4 F) {; L+ k3 B[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/
& a! f* z& v& ]" C& j3 x[3]https://www.techmeme.com/230529/p3#a230529p3
5 ?" D4 O* R0 p& h, \/ j- ^& Q[4]https://twitter.com/mreflow/status/16632444860911943684 a* e V! U, E+ `
[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
$ U4 y5 R6 F5 J/ ^6 R1 j[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q
6 y9 `# ]; k) _ e# F[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|