About Zero - 搜索 News

来自MSN11 小时

这款模型最近真的很火，让我想起了当初kimi刚发布的时候。网上关于它的讨论基本都聚焦在“便宜，开源，创新”这几点上，对于吃瓜群众来说足以呼应他们的情绪了，但从开发者的角度来说，我们更想知道，可以从这个“自学成才”的模型中学到什么？ “自学成才” ...

知乎 on MSN12 小时

华人研究团队揭秘：DeepSeek-R1-Zero或许并不存在「顿悟时刻」

选自oatllm.notion.site，机器之心编译，编译：杜伟、蛋酱。在过去这半个月里，关于 DeepSeek 的一切都会迅速成为焦点。一项非常鼓舞人心的发现是：DeepSeek-R1-Zero 通过纯强化学习（RL）实现了「顿悟」。在那个瞬间，模型学会了自我反思等涌现技能，帮助它进行上下文搜索，从而解决复杂的推理问题。在 R1-Zero ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

今日热点