一、摩尔线程简史:光速创业 全线出击
如今,我们已经有了较为成熟的自主cpu处理器、nand闪存、dram内存、os操作系统,而作为计算平台中非常关键的一环,gpu显卡,却一直存在严重的缺失,主要是它不但在硬件设计上难度极大,生态培育更是难上加难,非一朝一夕之功。
国内做gpu的企业其实并不少,但很多都是仅限特定行业领域,或者面向高性能计算,真正敢于全面布局,敢于进军消费者市场的,就不能不提到摩尔线程(moorethread)。
5月31日,摩尔线向快科技发出2023年夏季发布会的邀请,原本以为这次的核心就是新一代游戏与服务器显卡,结果发现我们的格局实在是太小了,摩尔线程的布局远不止于此。
从娱乐与创作到ai与云计算,从国产化数字办公到元宇宙,摩尔线程一口气带来了全新游戏显卡与整机、dx11驱动、物理引擎、云桌面方案与一体机、开发工具、代码移植工具、ai内容创作、元宇宙与数字人等等诸多方面的突破性进展,掀开了国产化gpu及生态全新的一页。
摩尔线程这个名字相信大家都不陌生了,这里再简单介绍一下它的历史。
摩尔线程成立于2020年10月,到今天也才不过两岁半多点,但成绩斐然。
摩尔线程的创始人是原nvidia全球副总裁、中国区总经理张建中先生,他于2005年加入nvidia,带领团队开拓了nvidia gpu在中国完整的生态体系,推动中国成为nvidia全球最重要的市场,没有之一。
摩尔线程的核心创建团队基本都来自nvidia,拥有完整的高端芯片人才团队,全面覆盖gpu芯片ip研发、系统软硬件设计、生态建设和市场营销等。
2022年,摩尔线程就推出了gpu统一系统架构musa,发布并量产“苏堤”和“春晓”两颗全功能gpu芯片,这也是国内采用现代gpu架构,唯一内置图形渲染、视频编解码、ai计算加速、物理仿真、科学计算四大引擎的全功能高端gpu芯片。
产品方面,摩尔线程也迅速完成了全线布局,速度之快、范围之广如同开挂一般。
硬件方面包括面向数字办公的桌面显卡mtt s10/s30/s50、第一款国产游戏显卡mtt s80、针对数据中心的全功能mtt s2000/s3000。
软件方面则有首个元宇宙计算平台mtverse、自研gpu物理引擎alphacore、数字人解决方案digitalme、aigc内容生成平台摩笔马良,等等。
mtt s30整机
mtt s3000服务器八卡并行
生态方面,摩尔线程已与200多家伙伴达成战略合作,尤其是在整机、板卡的国产化数字办公方面,实现了高质量交付。
pes完美体验系统联盟合作伙伴数量也在不断增长,覆盖国内外主流cpu厂商、操作系统厂商、oem厂商、软件服务厂商、云服务厂商、系统软件开发商。
二、mtt s70、dx11和整机:软硬兼施 真正可玩
这次发布会,相信大家最关心的就是新发布的第二款游戏显卡mtt s70,不过在介绍它之前,我们先简要回顾一下第一个勇敢杀入游戏市场的mtt s80。
mtt s80基于代号“春堤”的gpu芯片,集成200亿个晶体管,配备4096个musa架构核心、128个tensor张量核心,并内置musa智能多媒体引擎2.0(h.264/h.265/av1编解码器)、musa安全引擎1.0、musa多位虚拟化引擎(sr-iov)。
核心频率1.8ghz,fp32浮点算力达到14.4tfops(每秒14.4万亿次),int8整数算力达到57.6tops(每秒57.6万亿次)。
该设备采用了16gb gddr6高容量显存,具备256-bit位宽,其等效频率为14ghz,带宽高达448gb/s。
系统接口首发也是迄今唯一采用pcie 5.0 x16,显示输出支持dp 1.2a、hdmi 2.1、8k30,也是国内首款支持windows环境、directx图形接口的显卡产品。
mtt s70可以视为mtt s80的小弟,整体造型基本不变,还是精致、硬朗的三风扇散热器,规格上则做了一些精简。
核心数量减少到3584个,核心频率降至1.6ghz,fp32浮点算力来到11.2tflops,系统接口改为pcie 4.0 x16,支持四路8k30超高清显示输出。
但比较奇特的是显存,容量设置为前无古人的7gb,位宽对应224-bit,等效频率还是14ghz,带宽则是392gb/s。
摩尔线程副总裁、产品事业部总经理董龙飞表示,摩尔线程做高端卡的一个理念就是真材实料,s80就提供了16gb大容量显存,非常适合高分辨率游戏、ai等场景,但成本也就高了,因此又做了更有性价比的s70 7gb。
目前,mtt s70 7gb已经上市,售价为2499元。
相比硬件方面的迭代,驱动、游戏等软件方面的进步更令人欣喜。
mtt s80发布近半年的时间里,windows驱动已完成了5次升级,完善支持的游戏数量超过60款(当然更多游戏可以玩只是未经完全适配),在网吧里最流行的50款游戏已经适配了20多款。
游戏性能自发布以来已经平均提升大约50%,尤其是《英雄联盟》、《穿越火线》、《dota2》等主流网游的表现更上一层,《nba2k online2》的性能甚至已经达到了早期的大约2.5倍。
同时,50多款主板、30多款显示器都得到了很好的支持。
在此基础上,摩尔线程对于dx11的支持,更令我们兴奋。
不同于intel显卡优先适配dx12,然后向下推进dx11、dx 9的做法,服务中国市场与中国玩家的摩尔线程,选择了从用户基础最为广泛的dx9入手,满足更多玩家的迫切需求。
目前,摩尔线程显卡虽然还不能确保所有dx9游戏都跑的很好,原因也是多方面的,包括游戏开发非标准化、游戏优化面向其他厂商显卡、国外游戏与国内硬件匹配不足等等,但是已经完成了100%支持dx9。
眼下,摩尔线程已经开始向dx11全面冲刺,成为第一家真正支持dx11游戏的中国gpu公司。
按照规划,摩尔线程将于6月下旬发布dx11社区版驱动,首批支持《原神》和《dota2》等3a游戏。
同时,摩尔线程在“摩卡玩家”社区启动“alpha行动”,召集更多玩家对dx11社区版驱动的使用和反馈,加速驱动的迭代速度。
据摩尔线程mtt s80、s70显卡产品经理马鉴透露,dx11驱动目前的进度在80%左右,摩尔线程会加快步骤进行开放正式版的下载。
对于光线追踪、类dlss超分技术,摩尔线程也已经在布局之中。
考虑到mtt s系列游戏显卡毕竟是新鲜事物,软硬件兼容性还在起步阶段,为了方便用户更稳定地使用它们、尽可能发挥最大潜力,摩尔线程这次还特意发布了整机产品“智娱魔方”。
智娱魔方在高颜值的外观之内,可以选配mtt s80/s70两款显卡,同时预装精选的游戏中心,确保开机就能玩。
同时,它还内置了pes系统管理中心,方便实时监控系统状态;链接云端应用,可以随时体验最新进展。
摩尔线程还将为用户开放ubuntu驱动下载,支持ai计算领域的学习与应用开发。
在发布会现场,我们也上手体验了基于mtt s70显卡的智娱魔方整机。
精致小巧的整体设计让人感觉眼前一亮,首批适配的dx11游戏都相当丝滑,画质、帧率都完全可以满足主流玩家的需求,同时在开发、计算方面也可圈可点。
三、摩笔马良:ai至上 更懂中文
ai,无疑是当下最为火爆的话题,而要想实现良好的ai应用,从硬件算力到创作平台都不可或缺。
摩尔线程从一开始就将aigc视为核心发展方向,现正式推出软硬件一体化的aigc内容创作平台“摩笔马良”,为用户提供零成本的ai创作平台。
摩笔马良运用了行业前沿的多模态预训练大模型/生成扩散模型。
首先,多模态预训练模型通过海量图文数据进行对比学习训练,掌握到图片与文本之间的关联,并构建图像与文本编码器。
在生成过程中,编码器会将输入文本先进行隐式编码,结合图片、语义、图像掩模等其他的条件输入,由生成模型及解码器最终生成图像。
它支持中英双语文字描述,可以一次性生成多张图片;
支持图片生图,通过边缘检测、骨骼检测、深度检测等使得图片更加精准;
支持多种模型、多种风格、多位艺术家,包括通用、人像、2.5d、二次元等;
支持敏感内容过滤,提供更安全的创作环境;
支持诸多个性化功能,如简笔画生成、相似生成、局部替换、边缘扩展、高清超分等等,可以将作品以画廊的方式发布、分享。
尤为值得一提的是,摩笔马良对中文、中国文化有着更准确、更深入的理解,便于进行中文运笔意境创作。
摩笔马良aigc平台已经上线内测,提供多种接入方式,可以通过web和小程序登录,也可以通过丰富的api供用户远程调用。
对于需要完整解决方案的用户,摩尔线程也提供了私有化部署能力,包括gpu集群、异构算力调度平台、api接口,以及类似于摩笔马良的样板应用。
摩尔线程元宇宙战略的重点并不只是aigc,而是提供一种围绕人、场景和内容提供元计算算力的方式。虽然说元宇宙概念的热度没有以往那么高,但在摩尔线程看来,元宇宙并没有褪去,而是需要更优秀的计算平台、更合理的应用场景来推动,是一项长期工程。
为此,摩尔线程升级了mtverse元宇宙平台,现已支持支持云端实时渲染。
mtverse是一个提供可扩展性能、实时渲染与模拟、ai驱动的多元化算力支持的元宇宙平台。
领先的第三方idc服务商世纪互联,已经在云端率先部署摩尔线程千卡级别的gpu算力集群,并将mtverse平台与虚幻引擎、云渲染流化技术结合,为51world旗下的51meet元宇宙高精度开放平台提供计算加速。
这是首个实现国产化闭环的元宇宙应用,在多人并发下,用户可以享受低延迟、高保真、沉浸式的元宇宙体验。
此外,咪咕元宇宙、智汇云舟视频孪生、瞰景三维重构等元宇宙应用也都在陆续更新中。
此外,摩尔线程还升级了digitalme数字人解决方案,可用于直播、社交、影视动画、办公、娱乐等场景。
digitalme方案包括“女娲”数字人生成器、“画皮”表情驱动引擎、“随影”动作驱动引擎、“随答”对话系统四大部分。
其中,“随答”升级了两大主体能力,一是通过语音与人自然交互,实现“能听能说”,二是基于大语言模型的智能问答,实现“会思考且言之有物”。
发布会中,摩尔线程展示了两个数字人产品方案——2d播报数字人和3d交互数字人。
有趣的是,本次发布会的线上部分,就是由数字人版的张建中主持的,很多人表示直到看完发布会都没发现其中端倪。
四、云桌面与数字办公:全新升级 降本增效
今年年初,摩尔线程推出了基于多功能服务器gpu mt s2000的云桌面产品与解决方案,包括vpc云桌面虚拟化gpu产品mt vgpu 1.0、mt gpu直通、mt gpu加速协议编码等。
摩尔线程还在中国信通院的领导下,联合移动云、中国电信研究院,共同发布了《新型gpu云桌面发展白皮书》,明确定义了云桌面场景的体验标准。
基于这一标准,在视频播放、网页浏览、office办公、教育教学软件四个主要场景中,基于摩尔线程mtt s2000的单台服务器,能够同时支持超过40路的高清用户并发。
相比于传统cpu云桌面方案,其性能可提升近5倍,整体tco成本降低60%以上。
本次发布会上,云桌面产品mt vgpu升级到了全新的2.1版本,主要变化有四点:
一是新增支持mtt s3000显卡,单卡并发的虚拟机数量达到28个,性能提升多达40%;
二是新增支持gpu超分技术、sr-iov虚拟化,其中前者可让虚拟机数量翻倍,后者能提供更好的qos、隔离性和安全性;
三是整体画质从1080p升级到4k;
四是通过驱动更新,增加支持windows server服务器系统,完全支持h.264、h.265、av1视频编解码,支持更多浏览器和更多视频播放器。
与此同时,摩尔线程还推出了mccx vdi云桌面一体机,是包括服务器、瘦终端、软件在内的端到端完整交付方案。
它主要面向教育和办公领域,还有专门的教改特别版、办公体验增强版。
其中,教改特别版可以有效加速19款教改类软件,比如tello edu、code craft等等。
办公体验增强版则针对60余款办公类软件进行了定制优化,比如office和wps办公软件、adobe reader pdf阅读器、视频会议、winrar解压缩软件等等。
目前,摩尔线程的云桌面方案已经与天翼云电脑、移动云电脑等10余家客户的产品完成适配,并与深信服、新华三信息、华云、酷栈科技、庭宇科技完成了产品导入,将在各行各业落地。
同时,摩尔线程的国产化数字办公解决方案也已全面升级。
摩尔线程已率先支持opengl 4.0、vulkan 1.3的完整功能,并且100%通过了接口兼容性测试,还支持tessellation曲面细分等图形特性,提供更精细的几何纹理效果。
国产生态繁荣发展的同时,无论是cpu处理器还是os操作系统,都有各种各样的方案,彼此组合起来有上百种之多,适配的难度和复杂度非常高。
为此,摩尔线程支持了dkms动态内核模块,从而方便快速适配各种cpu+os的版本组合,开发效率可提升数十倍。
目前,摩尔线程的办公解决方案已经成功适了麒麟、openkylin、统信、深度、凝思、中科方德、普华等国产操作系统,并率先与统信uos、麒麟os完成全面兼容性认证,成为国内首家通过统信uhql质量认证的gpu企业。
此外,摩尔线程gpu已经加速了近百款国产应用,包括办公类、视频会议类、影音类、浏览器类、视频剪辑类、设计类、gis类等。
五、开发工具:零成本移植 搞定cuda
开发gpu和显卡非常难,软件开发与生态推广更是难上加难,尤其是全球gpu行业已经几乎被nvidia及其cuda所垄断,amd、intel都难以撼动其地位,更别说在这方面几乎是一片空白的国产厂商了。
2022年,摩尔线程推出了元计算统一系统架构“musa”,颇有点直接对标cuda的意味,它包括统一的编程模型、软件运行库、驱动程序框架、指令集架构、芯片架构,可以说从硬件底层到软件开发,提供了一套完整的解决方案。
围绕musa架构,摩尔线程这次宣布了一系列重要技术更新。
一是软件工具包musa toolkit 1.0。
它包含musa驱动(通用计算/图形渲染/多媒体/多卡互联)、运行时库、c++标准库、编译器、ai加速库、模板库、算法库、通用计算库、数学库、通信库、多媒体库等等,极为丰富。
可以说,这个软件工具包为开发者提供了一站式的全套深度服务,可以根据需要从不同角度调用摩尔线程gpu的硬件能力,从而充分释放其计算能力、图形能力。
二是代码移植工具musify。
它可以快速将现有的cuda程序迁移至musa平台,零成本完成cuda代码自动移植。
自动移植完成后,开发者在短时间内即可完成热点分析、针对性优化,大大缩短迁移优化的周期,省时、省力、省事、省心。
在以往,这类移植需要投入数百人天的开发成本,而如今有了musify,只需短短的几人天或者十几人天。
在当下gpu生态开发几乎都围绕cuda进行、专门为其优化的大环境下,能够做到快速简单移植,并确保性能发挥,无疑是最为合理的一条破局之路。
三是开源的mt pytorch ai框架。
基于摩尔线程musa,开发者可以复用pytorch开源社区的大量模型算子,降低开发成本,并支持种模型的推理,覆盖cv、nlp、tts语音、aigc、数字人等多个领域,能够运行chatglm、stable diffusion、llama等典型的大模型分布式多卡推理。
利用数据并行、模型并行、zero等分布式训练技术,mt pytorch可完成简单基础模型以及典型transformer结构的nlp语言模型的训练。
四是实时流体仿真工具catalyst fx的全新版本。
它基于摩尔线程自研多平台物理引擎alphacore,可以在houdini中不改变原有工作流的前提下直接进行流体效果制作,相比原生pyrofx性能提升5-10倍。
alphacore已经对dx11 compute shader计算版本进行深度优化,在流体力学仿真方面, mtt s80运行catalyst fx的性能已经达到市场主流显卡的2倍以上。
此外,相比传统的houdini vellume的制作流程,摩尔线程gpu加速的柔性体仿真工具verafiber,能够将解算效率提升至3-5倍。
目前,catalyst fx和verafiber已经完成了houdini插件接口的开发,houdini插件的beta测试版本将于6月6日开放下载。
应用合作方面,catalyst fx houdini版插件已与国内著名电影后期特效制作公司morevfx完成交付对接,verafiber被网易游戏投资的cg动画制作团队dovfx 数海文化成功运用于游戏cg片头中复杂角色的布料和毛发仿真。
不熄动画、融创动画、追光动画、平塔工作室等,也都是摩尔线程alphacore的生态合作伙伴。
为了汇聚开发者力量、扩大生态,摩尔线程还启动了musa社区开发者计划。
摩尔线程为合作伙伴和开发者提供包括musa开发工具、编程指南、系列教程、开源框架及模型库等在内的完整资源。
摩尔线程将与第三方社区合作,推动新算法模型、计算系统和平台的开发。
六、结语:国产之光 未来可期
摩尔线程诞生之初,其实很多人并不太看好,毕竟在当前的大环境和行业态势下,在nvidia这样的国际巨头几乎垄断的情况下,重新开发一款国产自主的gpu,还要做好驱动程序、软硬件兼容性,建立起一整套生态系统,让各种计算、图形性能充分释放,并广泛地商用落地,几乎是不可想象的事情。
可以说,某种程度上,做gpu显卡,要比做cpu处理器难得多。
但是,短短两年多的时间,摩尔线程的表现,值得让更多人了解他们——
构建统一系统架构,打造现代gpu架构,图形渲染、加速计算、显示与编解码、ai等全覆盖;
硬件产品覆盖桌面、工作站、服务器、云端等多场景,迅速商用落地,尤其是极其有勇气地将游戏显卡拿到大众用户面前,接受真实的考验与反馈;
驱动开发快速迭代,游戏、硬件兼容性稳步拓展,性能持续提升,释放潜力;
开发工具与软件产品不断丰富,为开发者和用户提供全套的解决方案;
生态建设持续扩大,合作伙伴遍及各行各业……
作为gpu行业的新生力量,摩尔线程快速崛起,构建了丰富的产品线,将触角延伸到图形、计算、ai等各个层面、各种场景,同时在开发、生态方面不遗余力地推荐,格局之大更令人惊叹,破局之快令人惊诧。
其实,在当前的大环境下,摩尔线程无疑选择了最难的一条路,几乎从零开始构建全套的方案与生态,注定无比吃力,而一旦取得真正突破,这是真正能自主掌握未来命运的。
步子太大,会不会……?对此,摩尔线程有着清醒、长远的认识,从创业之初就有了明确的的定位和方向。
摩尔线程副总裁、产品事业部总经理董龙飞就直言,作为一家芯片公司,摩尔线程要做的不只是推出几张卡,而是在充分认识到图形计算与ai融合的大趋势下,从芯片底层架构开始构建,并利用软件层面的加速去把底层架构的功能和潜力充分释放出来,从而形成一个大的产业。
作为一颗新星,摩尔线程还有很多不足,还有太多地方需要补课,但通过两年多来的实战表现,相信大家对它都有了相当的认知和相当的信心,对于其未来也有了更多的期许。
以上就是真正的国产显卡之光!摩尔线程国产gpu、ai与元宇宙多项进展深入解读的详细内容。