业内：DeepSeek或准备适配国产GPU 绕过CUDA展现工程开云体育实力

开云体育NEWS CENTER

您当前位置：首页 > 开云体育

业内：DeepSeek或准备适配国产GPU 绕过CUDA展现工程开云体育实力

2025-06-14

浏览次数：次

返回列表

　　开云体育[永久网址:363050.com]成立于2022年在中国，是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网，欢迎注册体验！

业内：DeepSeek或准备适配国产GPU 绕过CUDA展现工程开云体育实力

　　尽管春节假期已经过半，但“来自东方的神秘力量的 DeepSeek”仍在全球范围内引起热议。各路业内人士从不同角度分析 DeepSeek 的模型和技术。

　　韩国 Mirae Asset Securities Research 的一名分析师在 X 撰写长文分析称，这一突破是通过实施大量细粒度优化和使用英伟达的汇编式 PTX 编程实现的，而非通过 CUDA 中的某些功能。CUDA 是由英伟达开发的一种通用编程框架，允许开发者利用 GPU 进行通用计算。如果 DeepSeek 绕过了 CUDA，这说明其研发团队在大模型训练中采用了不同的技术路径。

　　对于程序开发人员来说，CUDA 类似于一种高级语言，降低了开发难度，使开发者能够专注于算法逻辑而无需过多考虑硬件执行细节。例如，使用高级语言进行变量赋值操作只需一条命令，而用汇编语言则需要多条指令并理解寄存器、内存等概念。因此，CUDA 便于开发基于 GPU 的算法设计。

　　大模型开发商通常基于 CUDA 进行研发，因为 CUDA 已经封装了一些常用函数，简化了开发过程。然而，这种通用性也带来了一定的灵活性损失。对于有特定需求的开发者，如需要精细化控制多个 GPU 之间的数据传输，CUDA 可能无法提供高效的解决方案。

　　当使用单个 GPU 时，CUDA 非常适用。但在多节点多 GPU 环境下，CUDA 的抽象层面效率较低。开发者可以通过组合 GPU 驱动提供的函数接口来提高效率，或者直接调用底层硬件接口以实现更高效的大模型研发。绕过 CUDA 可以直接根据 GPU 的驱动函数进行新的开发，从而实现更加细粒度的操作。

　　DeepSeek 在多节点通信时绕过了 CUDA 直接使用 PTX，这使得模型训练速度更快。这意味着在相同时间内可以处理更多数据，间接提高了模型效果。绕过 CUDA 并非新鲜做法，一些开源框架如 Triton 也在尝试替代 CUDA。

　　俄美今日开谈谈什么？为何选在沙特？乌欧又在“焦虑”什么？乌克兰问题成焦点

　　美国东部8州遭洪灾影响上亿人？肯塔基紧急状态，真有这么严重吗致命风暴致8人死亡

　　1月6日，A股三大股指涨跌不一，沪指下跌一度击穿3200点，深证成指、创业板指微微翻红。截止午时11：30分：上证指数下跌0.15%，报3206.75点；深证成指下跌0.19%，报9916.08点；创业板指下跌0.41%，报2024.16点...

上一篇：DeepSe开云体育ek会成为AI界的“伤仲永”么？

下一篇：为何DeepSeek引领AI应用层突破投资人如何应对新趋势？开云APP下载

首页

关于我们

开云体育

产品展示

留言板

咨询研究

联系我们

开云体育NEWS CENTER

业内：DeepSeek或准备适配国产GPU 绕过CUDA展现工程开云体育实力