推理 - 搜索 News

13 小时

Sebastian Raschka：关于DeepSeek R1和推理模型，我有几点看法

著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。这一次，他将立足于 DeepSeek 技术报告，介绍用于构建推理模型的四种主要方法，也就是如何通过推理能力来增强 LLM。Sebastian Raschka ...

6 小时

DeepSeek-R1推理本地跑，7GB GPU体验啊哈时刻？GRPO内存暴降，GitHub超2万星

【新智元导读】黑科技来了！开源LLM微调神器Unsloth近期更新，将GRPO训练的内存使用减少了80%！只需7GB VRAM，本地就能体验AI「啊哈时刻」。

1 天

深度解析DeepSeek：AI芯片新时代的推理引擎

基于当前的市场现状，AI芯片初创企业如d-Matrix和Etched则认为，DeepSeek的推出将加速推理计算在整个AI周期中的采纳。通过结合小型开源模型的普及，推理计算将不仅限于少数巨头公司，而是会进入到更多的中小企业和开发者手中。这一变化将促进 ...

知乎 on MSN1 天

报道称李飞飞团队用不到 50 美元训练出媲美DeepSeek R1的 AI 推理模型 ...

媒体/自媒体的宣传出现了「一丢丢偏差」，我先结合论文简要说几点最关键的看法帮大家省流，然后还原一下这篇 AI 论文是如何在信息传递的过程中逐渐「被标题党」的。大家可以按需阅读。下面的讨论主要基于最广为流传且被很多官媒转发的信息： ...

1 天

英伟达跌倒，AI芯片创企却吃饱？DeepSeek开启推理大时代

近日，AI芯片巨头英伟达股价遭遇重挫，起因是DeepSeek ...

虎嗅网18 小时

你以为的DeepSeek推理，可能只是文字魔术

春节这几天，围绕 DeepSeek，朋友圈和微信群吵翻了天，大多数议题和结论都跟科学本身关系不大，我也无意参与。利用这几天闲暇，我对 DeepSeek 做了一些深度测试，暂时没有要下的结论，但是有些疑虑。最主要的疑虑是大家最津津乐道的 DeepSeek ...

腾讯网19 天

DeepSeek开源推理大模型R1：纯强化学习实现接近OpenAI o1水平，成本降至1/30

1 月 20 日，DeepSeek 发布了全新的开源推理大模型 DeepSeek-R1，在数学、编程和推理等多个任务上达到了与 OpenAI o1 相当的表现水平，同时将应用程序 ...

36氪20 天

Search版o1：推理过程会主动查资料，整体性能优于人类专家，清华 ...

这就是人大、清华联手推出的最新「Agentic搜索增强推理模型框架」Search-o1的特别之处。项目团队成员发现，o1和o1类模型在推理过程中表现突出 ...

2 天

将集体学习引入树搜索，新方法CoMCTS实现o1-like的推理与反思

尽管多模态大语言模型（MLLM）在简单任务上最近取得了显著进展，但在复杂推理任务中表现仍然不佳。费曼的格言可能是这种现象的完美隐喻：只有掌握推理过程的每一步，才能真正解决问题。然而，当前的 MLLM 更擅长直接生成简短的最终答案，缺乏中间推理能力。本篇文章旨在开发一种通过学习创造推理过程中每个中间步骤直至最终答案的 MLLM，以实现问题的深入理解与解决。

36氪1 个月

7B模型数学推理击穿o1，直逼全美20%尖子生，四轮进化，微软华人新作 ...

微软团队推出rStar-Math，小模型超越o1，刷新数学推理SOTA。【导读】小模型也能击败o1？微软全华人团队提出rStar-Math算法，三大革命性技术突破 ...

腾讯网23 天

阶跃星辰发布Step R-mini！推理模型从此不再文理偏科

这是阶跃星辰 Step 系列模型家族的首个推理模型。类似 OpenAI o1 的推理模型在国内终于卷起来了。刚刚，国产大模型「六小虎」成员阶跃星辰发布了 ...

证券之星 on MSN1 天

大华股份获得发明专利授权：“一种用于音视频的模型推理方法 ...

证券之星消息，根据天眼查APP数据显示大华股份（002236）新获得一项发明专利授权，专利名为“一种用于音视频的模型推理方法、装置及电子设备”，专利申请号为CN202411557017.7，授权日为2025年2月7日。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果