搜索优化
English
全部
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
搜索
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
15 小时
DeepSeek新动向:或将拥抱国产GPU,绕过CUDA加速研发?
近期,有消息称DeepSeek在大模型研发领域取得了突破性进展,正着手适配国产GPU,这一消息在业界引起了广泛关注。据悉,DeepSeek在研发过程中成功绕过了英伟达CUDA的限制,直接基于GPU驱动函数进行新开发,这一创新举措为更加精细化的操作提供 ...
腾讯网
9 小时
DeepSeek准备适配国产GPU,绕开英伟达CUDA
DeepSeek要适配国产GPU了?这确实是大好事一件。据报道,DeepSeek在研发大模型时绕过了英伟达的护城河CUDA,这意味着可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。例如DeepSeek在多节点通信时绕过了 ...
15 小时
DeepSeek突破英伟达CUDA限制,迈向国产GPU适配新时代
在全球人工智能技术飞速发展的浪潮中,DeepSeek的最新消息无疑为我们带来了一丝振奋。DeepSeek宣布其大模型研发将适配国产GPU,成功绕开英伟达的CUDA,开启了一条全新的道路。这项技术突破不仅意味着更高效的数据处理能力,也为中国在人工智能领 ...
1 天
绕开英伟达护城河CUDA!消息称DeepSeek准备适配国产GPU
DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。 譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 ...
5 天
“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问 ...
DeepSeek做了PTX级别的优化不意味着完全脱离了CUDA生态,但确实代表他们有优化其他GPU的能力。来自Mirae Asset Securities ...
腾讯网
2 天
宗熙先生谈显卡(4):什么是CUDA内核?它的用途和工作原理
英伟达显卡的CUDA内核的英文为“Compute Unified Device Architecture”,简而言之,它是由英伟达开发的一种并行计算平台和编程模型,允许开发者利用NVIDIA ...
腾讯网
1 天
传DeepSeek绕过CUDA?业内人士称或为适配国产GPU做准备
好消息啊,兄弟们!来自东方的神秘力量的 DeepSeek继续轰动世界,韩国分析师撰写长文分析称:“这一突破是通过实施大量细粒度优化和使用英伟达的汇编式 PTX 编程,而非通过英伟达 CUDA 中的某些功能来实现的。” ...
腾讯网
1 天
绕开CUDA,DeepSeek为国产GPU“破局”?
对于长期苦于CUDA生态限制的AMD以及国内的GPU公司来说,这无疑是一个绝佳的机会。事实上,在此前DeepSeek本地部署的文档中,已经明确支持华为昇腾芯片。可以预见的是,华为等国内GPU公司针对DeepSeek训练的硬件升级已经在紧锣密鼓地攻克中 ...
1 天
绕开CUDA!DeepSeek准备适配国产GPU
DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。 譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 ...
3 天
“DeepSeek甚至绕过了CUDA”,工程师灵魂提问:英伟达护城河还在吗?
来自 Mirae Asset Securities Research (韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。 在使用英伟达的H800 ...
13 小时
DeepSeek绕过CUDA实现AI突破,引发行业震动!
近日,人工智能领域迎来了一项重大突破。DeepSeek利用2048个英伟达H800 GPU的集群,在大约两个月的时间内成功训练出了一款包含6710亿个参数的混合专家(MoE)语言模型。这一成果不仅在规模上令人瞩目,更在效率上远超行业领先者,其效率比Meta等公司高出10倍。据Mirae Asset Securities Korea的分析报告指出,这一突破的关键在于DeepSeek实施了大量细粒度优 ...
中华网
2 天
业内:DeepSeek或准备适配国产GPU 绕过CUDA展现工程实力
大模型开发商通常基于 CUDA 进行研发,因为 CUDA 已经封装了一些常用函数,简化了开发过程。然而,这种通用性也带来了一定的灵活性损失。对于有特定需求的开发者,如需要精细化控制多个 GPU 之间的数据传输,CUDA 可能无法提供高效的解决方案。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈