|
|
芯东西(公众号:aichip001)
7 d9 _) ~2 a+ ^3 u. N作者 | ZeR0
O1 P0 Z E: x L% U编辑 | 漠影$ s* c- X7 B9 B% G
芯东西 6 月 15 日报道,又一家国产 GPU 公司的新品出鞘!今日下午,中科恒星(简称 ATS)宣布推出国产自主 GPU 架构 " 天狼星 "。
! h# H: ]) E6 T; r- o( B# K% w
. I6 @( X) v8 Z& c. F% H( ^ w0 h2 `. r
$ ?: j1 d# {2 X* v0 {
▲邓仰东博士介绍 " 天狼星 "GPU 架构6 C1 O% A( T2 h% m q
中科恒星成立于 2019 年 8 月,致力于自研核心图形架构 GPU 芯片,提供芯片产品和相关系统解决方案。其研发团队由卡内基梅隆大学电子与计算机工程博士、清华大学软件学院、微电子学研究所副教授、NVIDIA 合作教授邓仰东博士带队。
+ z' r2 M2 q5 L9 ^ ^邓仰东是 GPU 通用计算最早研究人员之一,被誉为 "GPU 通用计算先行者 ",长期从事图形处理器体系结构、并行计算研究和芯片产品开发工作,曾设计出全球第一个基于 FPGA 的 GPU 仿真平台,研究成果在 ISCA、MICRO 等顶级会议和期刊发表;撰写过多部教材和专著,其中《异构处理器 OpenCL 编程导论》是国内 GPU 异构计算第一部教材,《3-Dimensional VLSI》是三维集成电路的第一部专著。5 R& x i6 e- n ]$ [8 ]
谈及给 GPU 架构取名为 " 天狼星 " 的原因,中天恒星创始人黄永博士说:" 我们的架构全部是以恒星来命名的。Stellar 是恒星、星宿、星座的意思,引申出来有超一流、卓越的含义。第二代架构命名为大角星;大角星是第二亮的恒星。只是因为距离地球更远,所以看起来没有天狼星亮;实际上,大角星比天狼星更亮,其亮度是太阳的 110 倍。"6 G% Q; ]/ h1 Q+ i( g
一、三个技术优势:性价比、自主 IP、完备交付能力
( v. D, U% Z5 x) f由中天恒星联合创始人、总架构师邓仰东带队研发的 " 天狼星 "GPU 架构,主要有三个技术优势:4 P* R* k8 n# e+ j9 B8 r
第一、面向亿级订单市场,以独立显卡 GPU 芯片主流产品为突破口,瞄准需求广阔、增长强劲的亿级刚需市场,突出性价比优势。
! r2 N( M. h6 {0 i: g J第二、拥有完全自主知识产权,以清华大学超过 10 年研究基础为依托的自研核心架构,确保产品迭代自主可控;以基础理论研究为基础,从数学公式推导开始,从架构设计、算法模型、原理验证、硬件实现、驱动开发等环节全部正向设计;核心架构完整知识产权,已申请专利和著作权数百项,数十项已获授权;相关研究成果发表于 ISCA、Micro、IEEE TPDS、IEEE TCAD 等顶级会议和期刊。
8 E. k5 p6 j# d6 s/ J, l* Y第三、完备的交付能力,上下游产业链准备充分,确保产品量产自主可控;芯片设计完成全面验证,确保流片成功;软硬件接口符合国际标准,确保芯片装机即可使用,包括操作系统认证:Windows WHQL;API 认证:OpenGL Conformance Test;外围接口认证:HDMI DP CTS;专业测试认证:PHY layer 和 LIINK layer;质量体系认证:显卡 3C 认证(中国)、 日本 VCCI 、欧盟 CE、 美国 FCC。7 T0 ^* x) P. j3 o- U/ a" h: Y( a
& t; j$ d& D, |& g V# T
2 v. w7 x) o0 N0 Q+ J/ D* V1 l5 j$ o% a) G) L6 j4 u$ q
▲邓仰东博士分享图形 GPU 市场及规模
: i+ w4 x; t' C8 r) Y& J# m国际信息显示学会中国总裁 fellow、俄罗斯工程院外籍院士、国际信息显示学会北京分会理事长严群博士现场分享说,今天看到的显示内容,显示的所有都在显示的平面上,没有跳跃出平面的状态,最大的问题就是它的互动性没法体现。我们现在逐步进入到下一代显示,显示的内容不仅在平面上,而且可以跳到空间上,跟人进行实时影像交互,预计五年到十年可能就会到来。他谈道,做空间三维影像对数据量的要求非常大、计算需求非常大,这个生态是非常需要有高算力的图形化处理硬件。
/ S% E* }8 H% f* E" D( o 二、七大架构亮点:灵活优化的指令集,支持物理真实渲染,片上互联架构
2 b2 b& l! q6 E" 天狼星 "GPU 架构亮相,该架构有七大亮点:
7 k% L/ g9 q* C' M/ |一是具有 3D 图形引擎 +2D 图形加速 + 视频引擎。* N( J# }% h6 X" P6 K
二是自主可控 / 灵活优化的指令集和 VLIW/SIMD 机器指令集(ICCD ’ 13);其中,自主可控 / 灵活优化的指令集,保证 GPU 芯片迭代的软件兼容。) @0 N! l& t0 g- f. `: u: N4 a& t: V8 U
三是 SIMT 计算框架,充分利用图形应用的数据并行性( DATE ’ 12.ICCD ’ 13,TVLSI15)。3 e$ ^3 [' `" d$ `" K: _0 a# l
四是支持物理真实渲染 ( ACMComputingSurvey ’ 14,SIGGRAPHASIA ’ 14.15)。: @# k4 Z q2 C h9 K
五是 Shader Core(Graphics ProcessingCluster),包括 SIMT 独立指令执行单元、以 32 位浮点 ALU 为基础的统一图形架构(ICCD13)以及集成寄存器堆、纹理 / 数据缓存。9 q ]; B3 h, A a5 l
六是延迟聚集式全局线程调度技术(ISCA20、TPDS21、TCAD ’ 21)。
) c$ e2 J7 L, \3 O4 W K( u七是具有良好性能伸缩性的片上互联架构(MICRO ’ 20、TPDS ’ 21)。* j* c+ t% Y0 H1 L& v$ [
" 把自己的钱掏出来做这件事,把整个产品、公司的命运和自己的命运联系起来,这是我看到比较少的," 上海市集成电路行业协会秘书长郭奕武也来到现场表示祝贺," 他们非常踏实地在做事情,我觉得在这个方面值得大家学习,也是值得大家肯定的。"( q( z: X8 Q" C" `+ @
他总结说,中天恒星自研架构有几个特点:一是 3D 图形渲染,二是指令集的自主可控,三是框架结构,包括在整个储存器当中的 DDR4,中天恒星都用上了,决定了其未来的产品、用途非常广泛,而且可以用在各个方面。" [) a/ d0 ?" z# I0 Q5 @
三、核心图形引擎完全自主设计,不涉及第三方 IP: j* w" B, D: e& G! O
当前,Imagination 和 Vivante 两家公司是主要的 GPU IP 来源,这些 IP 主要是针对移动应用的 GPU 内核,不适合桌面应用。此外,购买第三方的 IP,难以形成成熟的图形显卡级 GPU,核心电路专利无法自控和自主迭代。4 ~- u" S' ?, E1 N
邓仰东谈道:" 很多国产的 GPU 的 IP 授权主要购买的第三方。中天恒星的路线有所不同,核心的图形引擎完全自主设计的,所以 3D 图形引擎这块不涉及到别人的知识产权,也没有 IP 的问题,全部是我们自己拥有,从 0 到完整架构的实现,都是我们自主的技术。"7 U' d, e3 h% @3 B/ s
自研 GPU 架构存在极高的技术挑战。据邓仰东分享,GPU 设计有几个地方非常复杂:
8 u# F8 q$ L, j* _% {: }) ~8 g6 }一个是架构级的设计,这其实是个统筹的艺术。GPU 本身的资源,在所谓的 uni 版的 shader,所有的计算资源是一样的,大家都用 32 比特或者 64 比特的浮点运算单元,这是一个配合的问题。
0 X' O! V) v1 Q6 ~. [有很多个核共享 L2 的 cash,然后每个核内有自身的计算单元,还有通往片外的各种通道,实际上片上还有一些针对图形的,比如像纹理的缓存;这些虽然很容易知道是什么样的模块,难的是如何配合起来实现整体性能最优。
, q6 u3 o* O' o换言之,如何通过统筹协调,能够适应绝大多数图形应用。在大多数情况下,均衡的设计保持性能每秒至少 30 帧,这是一个极具挑战的地方。
6 z0 E: _0 a% o' k7 B5 C二是架构仿真的时间非常长,需要经验也需要直觉,去找出架构问题到底出在哪里。这是一个很大的挑战,需要有多年的积累才能去做这件事。
- m- C1 U* i/ n* i# ~3 F: a 结语:四年潜心研发,2025 年量产第二代 GPU 架构
) v' F! o3 r! }8 z* S4 ~* {' m- n" 天狼星 "GPU 架构并非一蹴而就,而经历了长期耕耘:2019 年,第一代 " 天狼星 " 架构芯片设计验证完成。2021 年,第一代 " 天狼星 " 架构 GPU 诞生;2022 年,定义第二代 GPU 架构 " 大角星 ";2023 年,第一代 " 天狼星 " 架构 GPU 实现量产。( M; X$ Y. \9 ?+ `; v
据悉,2024 年,中天恒星会继续优化基于 " 天狼星 " 架构的 GPU。2025 年,将量产第二代 GPU 架构 " 大角星 "。2 k0 w2 s. A8 ^2 V1 A$ _& V
中天恒星将提供 GPU 芯片、板卡和系统解决方案,以 PC 标准市场(包括台式机、一体机、笔记本电脑和部分服务器)为核心目标,逐渐拓展至大屏电视、数据中心、云渲染和车载智能系统等市场。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|