Deepseek Benchmark - 搜索 News

6 小时

快科技2月9日消息，DeepSeek火得一塌糊涂，国内外的相关企业都在积极适配支持，而对于AI大模型来说，使用GPU运行无疑是最高效的，比如AMD，无论是Instinct加速卡还是Radeon游戏卡，都已经适配到位。

图片来源：UnsplashZ Highlights在LoRA中，每一个专家都会被训练；而ESFT会优先微调适合做某个任务的专家，其他专家不会被过拟合，因此相比LoRA会有更强的泛化能力——让专业的人做专业的事。林纳斯说过，Talk is cheap, ...

腾讯网10 天

刷爆全网的DeepSeek 赢麻了？新加坡前总理夫人转发点破真相？

最近，中国的AI工具DeepSeek在全网爆红，各种消息铺天盖地，在一片喧嚣中，新加坡前总理夫人何晶转发的一篇冷静分析，或许会带你重新思考这场 AI 热潮的本质。 DeepSeek 有多火？

2 天

吴恩达：DeepSeek 启示

大约一周前，DeepSeek 发布了 DeepSeek-R1，这是一款性能对标 OpenAI o1 的杰出模型，且以 MIT 许可协议开放权重。通过 Qwen（我的团队已使用数月）、Kimi、InternVL 和 DeepSeek ...

11 天

人气超ChatGPT的“东方力量”，DeepSeek强在哪？

在全球人工智能（AI）领域，突然涌现出的中国AI模型DeepSeek无疑成为了新年伊始的一大焦点。近日，这款国产AI大模型以超越ChatGPT的人气，给硅谷科技股带来重创，市值蒸发超万亿美元，令许多海外网友惊叹“实力惊人”。

腾讯网2 天

DeepSeek-R1｜集智百科

导语DeepSeek-R1是DeepSeek团队推出的第一代推理模型，通过强化学习（RL）和蒸馏技术显著提升了语言模型的推理能力。DeepSeek-R1-Zero模型在没有监督微调（SFT）的情况下，通过大规模强化学习训练展现出强大的推理能力，但存在 ...

腾讯网13 天

DeepSeek登顶中美双榜，CNBC 40分钟深度专题访谈实录

DeepSeek横空出世，美国AI界感到了威胁 2025年1月20日，DeepSeek正式发布DeepSeek-R1模型，并同步开源模型权重。 DeepSeek-R大模型，成本价格低廉，在许多第三方测试中，该模型的表现也优于OpenAI的最新模型 o1，让硅谷震惊，甚至引发了Meta内部的恐慌，工程师们开始连夜尝试复制DeepSeek的成果。

虎嗅网3 天

冲击DeepSeek R1，谷歌Gemini 2.0全型号刷榜

在 2024 年谷歌 I/O 大会上，Gemini 2.0 Flash （实验版本）首次亮相，此后便作为强大的主力模型而深受开发者的喜爱，并最适合大规模处理高容量、高频率任务，并能够通过 100 万 tokens 上下文窗口对海量信息进行多模态推理 ...

FT中文网2 天

DeepSeek热潮之下，回归常识

在2023年新年，业界为ChatGPT展示功能而激动，随后2024年文生视频大模型Sora让人惊艳不已。就在美国科技公司看似一骑绝尘的时候，在2025的春节前后，中国的深度求索(DeepSeek震)动中美科技界。 DeepSeek引发的关注，被美国市场的带动强化。 1月26日发布之后 ...

New York Times3 天

DeepSeek如何回答“敏感”问题？

随着世界急于了解DeepSeek，搞清楚它的精密程度、它对全球人工智能竞争的影响，人们也有一个自然而然的问题：考虑到它是由一家中国公司开发的，它怎么处理中国的审查制度呢？我决定测试一下。我住在中国，用一个中国的手机号码在中国的互联网上注册了 ...

New York Times4 天

改变国运的突破？DeepSeek引爆中国社交媒体

中国初创公司DeepSeek能以极低的成本建立与OpenAI不相上下的人工智能模型，这一消息让硅谷陷入恐慌。 Violeta Santos Moura/Reuters 在中国国内，它被称为与美国进行全球技术竞争的临界点，也是硅谷的“至暗时刻”，这话让人想起温斯顿·丘吉尔。这可能是改变国运的 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果