About Zero - 搜索 News

来自MSN11 小时

这款模型最近真的很火，让我想起了当初kimi刚发布的时候。网上关于它的讨论基本都聚焦在“便宜，开源，创新”这几点上，对于吃瓜群众来说足以呼应他们的情绪了，但从开发者的角度来说，我们更想知道，可以从这个“自学成才”的模型中学到什么？ “自学成才” ...

1 天

DeepSeek-R1-Zero不存在顿悟时刻？华人团队揭秘真相：或只因强化学习

【新智元导读】最近某个华人团队发现：类似DeepSeek-R1-Zero的「顿悟时刻」，可能并不存在。类似复现实验中之所以出现响应变长现象，或许只是因为强化学习，而不是所谓的「顿悟」。最近，「啊哈时刻」（Aha ...

1 天

华人团队揭示DeepSeek-R1-Zero无顿悟时刻真相为何在强化学习中

研究团队在回顾过去的实验后指出，顿悟时刻在模型训练的初期阶段就已经显现，换言之，这种自我反思不需要经过强化学习的训练。他们测试了多个不同基础模型的表现，结果令人震惊：在未经过任何训练的部分，模型已经展现出了自我反思的特征。

2 天

雷神Zero 2024款游戏本限时抢购！抢购价12758元

2025年02月07日 16:24中关村在线 ...

腾讯网2 天

显存狂降80%！Unsloth黑科技优化GRPO流程，让人人都能训自己的Deepseek R1

我们知道 Deepseek R1 核心的贡献是揭示了一个“aha”时刻，在 R1-Zero 中通过使用 GRPO （Group Relative Policy Optimization）在没有人类反馈的情况下自主学会了分配更多的思考时间。

腾讯网2 天

华人研究团队揭秘：DeepSeek-R1-Zero或许并不存在「顿悟时刻」

选自oatllm.notion.site机器之心编译编译：杜伟、蛋酱自我反思（尤其是肤浅的）有时对模型性能的助益不大。在过去这半个月里，关于 DeepSeek 的一切都会迅速成为焦点。一项非常鼓舞人心的发现是：DeepSeek-R1-Zero ...

2 天

Hugging Face 推出 “Pi-Zero”，AI机器人更容易构建和部署

近日，Hugging Face 与 Physical Intelligence 联合推出了 “Pi0”（Pi-Zero），这是首个将自然语言命令直接转化为物理动作的基础模型。这一创新性发布吸引了广泛关注，Hugging Face 的首席研究科学家 Remi Cadene 在社交媒体上宣布，“ Pi0是最先进的视觉语言动作模型，能够将自然语言命令转化为自主行为。” ...

2 天

微星二季度将推5款AMD B850主板，含两款PROJECT ZERO背插新品

近日，据国外知名科技媒体Wccftech报道，微星计划在2025年第二季度推出五款基于AMD B850芯片组的主板，进一步拓展其中端市场产品线。这一消息无疑为期待高性能与稳定性兼具的玩家们带来了新的选择。

中华网3 天

小米SU7 Ultra今起正式到店样车抵达全国42城112店

小米汽车官方宣布，小米SU7Ultra样车已陆续到达全国42个城市112家店。该车型于去年10月正式发布，并公布预售价格为81.49万元，预计今年2月底上市。

3 天

H.C. Wainwright维持Gevo股票买入评级，目标价14美元

周三，目前股价为1.86美元、市值4.3亿美元的Gevo, Inc. (NASDAQ: GEVO )获得了H.C. Wainwright的积极展望，分析师Amit Dayal重申了该公司股票的买入评级和14.00美元的目标价。此次评级确认是在Gevo于2月3日宣布以2.1亿美元成功收购Red Trail Energy之后。此次交易的资金来源包括Gevo提供的约1.1亿美元股权、来自Orion ...

4 天

大年初四，DeepMind研究员兴奋分享R1-Zero模型新进展

在大年初四这个特殊的日子里，Daya Guo不仅沉浸在节日的喜悦中，还积极回应了网友们关于DeepSeek ...

来自MSN4 天

《七龙珠电光炸裂！ZERO》总销量突破500万份

发行商Bandai Namco和开发商Spike Chunsoft宣布，《七龙珠电光炸裂！ZERO（Dragon Ball: Sparking! ZERO）》总销量已超过500万份。这是迄今为止销量最快的龙珠主机游戏。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果