著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。这一次,他将立足于 DeepSeek 技术报告,介绍用于构建推理模型的四种主要方法,也就是如何通过推理能力来增强 LLM。Sebastian Raschka ...
【新智元导读】 黑科技来了 ! 开源LLM微调神器Unsloth近期更新,将GRPO训练的内存使用减少了80%!只需7GB VRAM,本地就能体验AI「啊哈时刻」。
基于当前的市场现状,AI芯片初创企业如d-Matrix和Etched则认为,DeepSeek的推出将加速推理计算在整个AI周期中的采纳。通过结合小型开源模型的普及,推理计算将不仅限于少数巨头公司,而是会进入到更多的中小企业和开发者手中。这一变化将促进 ...
1 天
知乎 on MSN报道称李飞飞团队用不到 50 美元训练出媲美DeepSeek R1的 AI 推理模型 ...媒体/自媒体的宣传出现了「一丢丢偏差」,我先结合论文简要说几点最关键的看法帮大家省流,然后还原一下这篇 AI 论文是如何在信息传递的过程中逐渐「被标题党」的。大家可以按需阅读。 下面的讨论主要基于最广为流传且被很多官媒转发的信息: ...
近日,AI芯片巨头英伟达股价遭遇重挫,起因是DeepSeek ...
春节这几天,围绕 DeepSeek,朋友圈和微信群吵翻了天,大多数议题和结论都跟科学本身关系不大,我也无意参与。利用这几天闲暇,我对 DeepSeek 做了一些深度测试,暂时没有要下的结论,但是有些疑虑。最主要的疑虑是大家最津津乐道的 DeepSeek ...
1 月 20 日,DeepSeek 发布了全新的开源推理大模型 DeepSeek-R1,在数学、编程和推理等多个任务上达到了与 OpenAI o1 相当的表现水平,同时将应用程序 ...
这就是人大、清华联手推出的最新「Agentic搜索增强推理模型框架」Search-o1的特别之处。 项目团队成员发现,o1和o1类模型在推理过程中表现突出 ...
尽管多模态大语言模型(MLLM)在简单任务上最近取得了显著进展,但在复杂推理任务中表现仍然不佳。费曼的格言可能是这种现象的完美隐喻:只有掌握推理过程的每一步,才能真正解决问题。然而,当前的 MLLM 更擅长直接生成简短的最终答案,缺乏中间推理能力。本篇文章旨在开发一种通过学习创造推理过程中每个中间步骤直至最终答案的 MLLM,以实现问题的深入理解与解决。
微软团队推出rStar-Math,小模型超越o1,刷新数学推理SOTA。 【导读】小模型也能击败o1?微软全华人团队提出rStar-Math算法,三大革命性技术突破 ...
这是阶跃星辰 Step 系列模型家族的首个推理模型。 类似 OpenAI o1 的推理模型在国内终于卷起来了。 刚刚,国产大模型「六小虎」成员阶跃星辰发布了 ...
1 天
证券之星 on MSN大华股份获得发明专利授权:“一种用于音视频的模型推理方法 ...证券之星消息,根据天眼查APP数据显示大华股份(002236)新获得一项发明专利授权,专利名为“一种用于音视频的模型推理方法、装置及电子设备”,专利申请号为CN202411557017.7,授权日为2025年2月7日。
当前正在显示可能无法访问的结果。
隐藏无法访问的结果