【新智元导读】 黑科技来了 ! 开源LLM微调神器Unsloth近期更新,将GRPO训练的内存使用减少了80%!只需7GB VRAM,本地就能体验AI「啊哈时刻」。
传统的大语言模型遵循一个相对简单的扩展逻辑:每一代模型的计算能力大约是前一代的 100 倍。正如 Altman 所说:“在过去的范式中,我们只做预训练,从 GPT-1 到 GPT-4,每个版本都大约是前一个版本的 100 ...
去年OpenAI祭出ChatGPT o1时,全网都在刷屏式震惊:原来只要给AI套上"思维链"的紧箍咒,就能让模型智商原地起飞!但 ...
在近日的一场对话活动中,OpenAI的CEO山姆·奥特曼(Sam Altman)首次公开了该公司的内部推理模型的最新进展。这一模型在编程能力方面的表现已跻身全球前50名,预计到今年年底将有可能登顶。这样的信息不仅深刻影响了AI领域的发展,也引发了关于未来技术趋势的广泛讨论。
春节这几天,围绕 DeepSeek,朋友圈和微信群吵翻了天,大多数议题和结论都跟科学本身关系不大,我也无意参与。利用这几天闲暇,我对 DeepSeek 做了一些深度测试,暂时没有要下的结论,但是有些疑虑。最主要的疑虑是大家最津津乐道的 DeepSeek ...
曾经一位经验丰富的行业分析师需要花费数天甚至数周才能完成的专业研究报告,现在借助这项突破性功能,只需5-30分钟就能完成。这个堪比"AI研究员"的功能,能够自主分析复杂的专业信息,实时查找和综合数百个在线资源,最终生成一份专业水准的完整报告。