京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 731|回复: 5

AI开始为数字人注入灵魂

[复制链接]

1696

主题

650

回帖

7058

积分

论坛元老

积分
7058
发表于 2023-5-18 17:38:53 | 显示全部楼层 |阅读模式 来自 江苏常州
这几天,国内“冷门歌手”凭借AI翻唱再度走红。  u8 E0 w8 n- V- c
B站网友用AI模型生成了歌手孙燕姿的AI分身,其实跟车载导航上的“林志玲”、“郭德纲”类似。拿歌手本人的音频去训练,生成一个音色一模一样的“孙燕姿”。
) b, f' l- T9 ]4 H/ [( i8 @然后,让偶像唱自己喜欢的歌的心愿,就以这样一种诡异的方式实现了。0 K- g! o5 k( `3 Y' F& @7 ~' A
海外的玩法更加离谱。7 ?0 w& e8 e3 c7 @( C+ p( y6 [
美国一个拥有180万粉丝的23岁女网红,通过用GPT-4复刻了自己的AI分身,然后同时与1000多个网友谈恋爱,每分钟收费1美元。
6 o/ g; _! R0 z/ w$ R( G仅一周,她就狂赚了7.16万美元。2 v( J6 e6 x2 _+ Y2 F4 [% Y5 y: K0 @
并且还远不止如此,现在她的“男友”还在急速增加中,目前已经增加到了近万人,排队等待与她“谈恋爱”时间已经长达96小时。1 j3 ?' M6 d2 E2 u0 r8 U
有分析认为,按照趋势,她月入500万美元没有任何难度,如果不是技术限制,她赚到的钱,将可能是一个天文数字。
+ K+ v8 ^  u& ]# b这些现象已经可以充分说明,一个由AI+带来的新技术红利时代,正在被急速到来。' E/ O; K( Z) k' U9 v8 a5 [6 M
01 数字人军团涌入直播间
4 j* X$ E. ?) \6 H. ~) J2 \直播带货是虚拟IP变现最具潜力的场景。1 h/ F6 e1 y- `+ s& b7 |  _2 X8 P4 `) b
Z世代对社交、视频、网购等工具的使用深度遥遥领先于全网平均水平,数字人和虚拟空间结合的新玩法给他们带来了体验感和交互性,虚拟IP的核心粉丝大多来自18-24岁的年轻群体。0 Y5 A) S8 \# i% e
这一趋势让品牌方看到了让产品打破圈层的机会。
9 P- v: f. U2 a7 ?6 k& m2020年,虚拟歌手洛天依和乐正绫等来到淘宝直播间,为博士伦、美的、欧舒丹等品牌带货。这场直播观看人数高达270万,有近200万人打赏互动。
- t/ x4 N: L0 u% T这在当时一度掀起巨大的讨论,虚拟数字人直播的时代已经来了。" g, A7 {8 C. l" N/ c$ G- j
而随着今年由chatGPT掀起的人工智能大模型热潮,虚拟数字人领域又迎来一轮更加磅礴的爆发。
; n6 S' |1 Y# E0 K7 D' ^一大批量的虚拟数字人开始扎堆涌进直播间。# h7 Q  ]9 w) n$ h) t' Y) a
今年4月份,天娱数科旗下的虚拟数字人“朏朏”已完成 ChatGPT 模型接入,并完成直播首秀,不仅能够实时响应顾客的提问,还能根据不同问题进行自主回答。9 `$ v6 h! r. S! h) p/ B" t
在短视频上,出现过很多这样的场景:一家公司的整个办公室里空无一人,只有一排排办公桌上有数十台电脑屏幕里的AI美女们正在直播......
! d$ m$ k$ C5 k- @- t: ^4 r图源:短视频
/ C0 J7 }1 m) Y& P) P  N这家公司,只靠2D超写实的虚拟形象,提前准备好的话术和背景,就可以直播一天,虽然单个效果不如真人直播,但成本低到令人发指,而且还可以超低成本复制,胜在以量取胜,真正是做到躺着让AI挣钱也并非不可能。
, x/ H9 c* K# _0 Y0 }0 z" D# }: K这一切,在说明,一场基于“AI+”的内容效率革命,正在数字人领域爆发。
# F% N5 j' c' Z" \( R虚拟数字人根据制作技术、应用场景、形象特点分为很多种。- {& }7 ]- t0 e2 K! M
与3D人气偶像不同,现在大多数直播间里说话的根据真人原型复刻声音、表情的2D写实数字人,你根本分辨不出是真是假,但制作成本远低于勇闯娱乐圈的A-Soul IP们。
, `6 y% O& X9 t( I一个虚拟主播可以进行7*24全天候的直播工作,随叫随到,也不用担心人设翻车的问题,减少了直播运营中的人工成本。& w3 u$ O0 O: E( P, l
这背后,是AIGC在重新塑造数字人的生产流程。
* _& @/ U8 x9 Q2D数字人的制作用上了深度学习,只需要确定形象设计,图文音频数据经过采集、预处理后上传到模型训练,制作方式相对3D更简单,更标准化,制作效能不断提升。2 u) ]) A# U; p0 d0 Y6 {4 D
这种工厂流水线的方式,使数字人的制作门槛、成本和周期得到了大幅缩短。
& l8 ?2 n* |8 B3 c9 }8 n同时,随着行业制作端的技术迭代和成本骤降,针对小型客户的数字人解决方案也开始涌现。
  y( }% Z; o$ p/ z# ]在4月份,腾讯云发布的数字人生产平台,需要生成真人形象的数字分身可以在平台上采购服务,只需上传图像音视频即可实现定制,根据不同音色、视频时长收费。
9 T; U0 T  B/ m: n除了制作数字人,还可以提供整套数字人直播解决方案,功能包括了真人音频接管直播间,获取用户评论智能回复,定价仅需要千元级别。9 g$ J; i! S; K1 j& e0 W
而有些渠道商,打包售卖AI主播的定价甚至只要200元以内。
: V7 `+ h8 |# E& A/ f( i+ u! n这些主播形象大多来自模特经纪公司的授权,投放质量虽然粗糙,抠图痕迹明显,声音也没有特点。0 Y: s9 m) m- P+ R  }+ J
但对普通的中小企业来说,没有大V带货,花不起上百万定制高端IP,想要压缩运营成本, 快速起量,几千块的数字人已经够香了。  K% f" B) U4 S( F0 e1 S
企业如果想要自己修改代码,产出不同的数字人,还可以向技术提供商购买源码,售价要比直接买AI主播更贵,不仅能自用,还可以使用源码发展代理,甚至比自己做数字人直播还赚钱。
% b9 H! l" D3 Z6 {0 G1 Q; J但AI数字人的故事,还没有讲完。. z! c% L) z8 r  i1 L8 H( @& |
02 AI注入灵魂
: I' w- j9 J5 u# |! U! EIDC在《中国AI数字人市场现状与机会分析》报告中将数字人分为五个等级,目前数字人发展经历从手工制作到AI建模的阶段,初步具备人的外形,但还只能做简单的交互决策。
7 o# U% ~8 E; _7 k9 @4 H! o: U当智能化水平来到L4、L5级别时,AI驱动的数字人能够接管大多数场景决策,支持更多模态的实时交互,类似钢铁侠的私人AI管家“贾维斯”。7 S; X/ I5 i2 O' S
虚拟数字人过去三十年的发展,技术发展和市场需求基本围绕着两点在演变,一是视觉效果;二是交互体验。( w! `! q0 K- b7 @
虚拟数字人最早出现在游戏、动漫、电影里,对新潮事物的情感连接和IP价值的延伸遥相呼应。
3 Q% a7 H" R3 x1 Z: [早期的角色型IP使用手绘,动作要一张一张地画。1982年,日本动画《超时空要塞》的女主角林明美成为了首个发行音乐专辑的虚拟歌手。
5 ]7 _4 P7 Z3 G5 P  @; y在电影里,形象可以用计算机建模,但动作还得让人来做,CG技术和动作捕捉等技术逐渐普及,依靠绿幕,捕捉设备,演员可以成为任何角色。
+ W! j: t/ m" |' g千禧年后,从02年的《指环王》到去年的《阿凡达2》,角色的渲染效果已经细致入微,为艺术创作带来了巨大便利。
' q( \+ M$ {. Z& x# c" |到这里,数字人技术的发展围绕更像“人”的极限一步步逼近,不仅仅要求外观、服装上的视觉效果趋近真实,还包括驱动(呈现真实细腻的表情和动作)和渲染(让画面更加精细实时)。
% Q/ ~4 T, \4 o1 J; H' ?  N不过,总觉得还是缺了点什么。! ?) y3 u  W- H8 D2 h% V& k8 p: V
1970 年,日本机器人专家森昌弘提出“恐怖谷”理论,由于机器人与人类在外表、动作上相似,所以人类会对机器人产生正面的情感。( N3 e, a- ~* S; Q" T9 n( }
当机器人与人类的相似程度达到一个特定程度的时候,一点点的差别都会被放大,并带来负面和反感情绪。而当机器人与人类的相似度继续上升,人类对其情感会再度回到正面。0 c- y3 v3 p  h5 |5 q
与电影不同,社交属性更强的应用场景对数字人实时交互的要求更高,不只是满足于制作一个好看的“花瓶”而已。
" h/ d7 Q2 l! g在交互方面,自然语言模型填补了这一空缺。3 ?- w2 n4 T% l7 g, K' r0 H- r
文本生成能力已经惊艳众人的GPT,给数字人的“智商”加上了两道杠。2 O3 l- `0 r) X! p4 i4 z/ Y
NLP大模型是AI驱动虚拟人的技术基石,简单来讲就是让虚拟数字人能说会道,减少标准化内容的制作成本,被训练来担任智能客服、主持人、导游等角色。长期来看,随着个性化和情感理解的能力提高,为老人提供陪伴关怀,成为小孩子的”私人教师“也将实现。+ l! x6 b/ B% y3 @
此外,嘴型动作也可以由AI驱动,建立起与文本的映射关系,随着写实程度的提高,微表情也就更丰富,说话的时候表情、口型能够对得上,这样的数字人不仅“形似人”,而且“神似人”。, H7 i, F4 W. O2 y/ z
Midjourney是基于diffusion model扩散模型的爆款产品,在去年7月发布,通过文本输入指令训练AI绘画。& e" \" D! s5 a) D: O) q, V0 A
有机构测算过,目前其年收入就已经能够达到1亿美元的规模。. k9 ~( ?* \6 E. v* I4 b9 N( K
有B站up主用Midjourney复原了奶奶的写实形象,从外观上看,衰老的皮纹和白头发细节感十足,加上过去的音频重现奶奶的声音,最后通过D-ID生成了奶奶的数字分身。
  y! {) P: r3 k, S为了弥补未与奶奶好好告别的小遗憾,孙子和眼前的数字“奶奶”开启了对话,而“奶奶”亲切地回应,其实是ChatGPT提供的回答素材。
; N" t% v: l% [- V' f  x图源:B站
# K- D( V: V5 c* D4 O) l正是通过这些用户端的越来越多的尝试,反过来为AI的“人格化”不断添加海量训练素材,加速丰富AI模型数据,最终让AI为数字人注入灵魂,带来更大可能。- R: z1 H# h& C* L6 W; K& K
03 尾声
$ X4 b. y6 T: J8 k' F对虚拟分身的探索至今持续了三十余年,从手绘到真人驱动,再到AI驱动,拟真感和交互性的体验进步打开了广阔的应用场景,涓流汇成大海。
# _' C: p9 m4 @# h/ C% N  u4 NAIGC帮助将普通人的外观、声音等特征全面数字化,更低的制作门槛打开了市场的想象空间。
8 P& V- N6 V% I- F- x5 fIDC预计,到2026年中国AI数字人市场规模将达到102.4亿元人民币,但能够给我们带来多么良好的体验,决定了数字人最终的命运。# ?8 c. n1 P9 p" F+ V' c" U
同时,AI数字人具备下一代人机交互入口的潜质,未来我们面对的或不再是冰冷的屏幕,而是生动活泼的数字人类,越能够挖掘最深层次的情感需求,成为我们生活里的参与者。1 a' w0 v/ `% F2 k8 t
或许正如AI教父所言,人类只是智慧演化的过渡阶段,以便创造出数字智能,如今我们终于有一个长得像人类的数字分身,像我们一样说话,以后或许还能像我们一样思考。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1694

主题

712

回帖

7240

积分

论坛元老

积分
7240
发表于 2023-5-18 17:51:17 | 显示全部楼层 来自 江苏常州
很好的组合,促进从虚拟走向现实,反正网上都是假的
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1645

主题

690

回帖

6643

积分

论坛元老

积分
6643
发表于 2023-5-18 18:02:43 | 显示全部楼层 来自 江苏常州
几年后根本分不清网络那头是个人还是机器
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1629

主题

690

回帖

6632

积分

论坛元老

积分
6632
发表于 2023-5-18 18:15:20 | 显示全部楼层 来自 江苏常州
转发了
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1612

主题

636

回帖

6758

积分

论坛元老

积分
6758
发表于 2023-5-18 18:26:49 | 显示全部楼层 来自 江苏常州
转发了
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1683

主题

711

回帖

7218

积分

论坛元老

积分
7218
发表于 2023-5-18 18:38:37 | 显示全部楼层 来自 江苏常州
转发了
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-12-17 17:13 , Processed in 0.044054 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表