搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 24 小时
时间不限
过去 1 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
9 小时
DeepSeek涨价引发市场变革,AI推理需求快速上涨
近日,DeepSeek宣布其V3 ...
来自MSN
1 小时
推理时也能做偏好优化,无需额外重训练,来自上海AI Lab港中文等
TPO团队 投稿量子位 | 公众号 QbitAI 随着大语⾔模型(LLMs)在各类任务中展现出令人瞩目的能力,如何确保它们⽣成的回复既符合预期又安全,始终是⼀项关键挑战。 传统的偏好对⻬⽅法,如基于⼈类反馈的强化学习(RLHF)和直接偏好优化(DPO ...
21ic
3 小时
DeepSeek 推理型AI尽显高效训练的小模型之威
DeepSeek-R1 质疑了这样一种假设,即通过对正确或错误行为的标记示例进行训练,或者从隐藏模式中提取信息,模型的推理能力就会得到提高。 密歇根州立大学博士生张逸骅 撰写了数十篇机器学习方面的论文,他说:"它的核心假设很简约,却不那么简单: 我们能否只通过奖励信号来教会模型正确回答,从而让它自己摸索出最优的思考方式? " ...
17 小时
橙柚青全面接入DeepSeek-R1数据模型升级外贸智能化服务
2025年2月9日,重庆橙柚青网络科技有限公司(以下简称“橙柚青”)宣布,公司已全面接入DeepSeek-R1数据模型,旨在进一步提升公司在人工智能领域的技术实力和服务水平。这一举措标志着橙柚青在AI技术应用方面迈出了重要一步。
来自MSN
7 小时
为什么在推理型大语言模型中使用思维链提示可能会适得其反
本文探讨了链式思维提示技术在生成式AI和大语言模型中的应用。作者指出,新一代AI模型已内置链式思维功能,无需额外要求。但显式使用该技术可能导致重复、延迟或错误。文章就如何正确使用链式思维提示给出了建议,以充分发挥AI的推理能力。
6 小时
训推全面支持、开箱即用!DeepSeek V3昇思MindSpore版本上线开源社区
近日,基于昇腾AI硬件与昇思MindSporeAI框架版本的DeepSeek-V3完成开发支持并上线昇思开源社区,面向开发者提供开箱即用的预训练和推理能力,并已成功在大规模集群上预训练和部署。
23 小时
OpenAI内部已实现GPT-4.5?未来会走向开源?Altman透露发展路线
传统的大语言模型遵循一个相对简单的扩展逻辑:每一代模型的计算能力大约是前一代的 100 倍。正如 Altman 所说:“在过去的范式中,我们只做预训练,从 GPT-1 到 GPT-4,每个版本都大约是前一个版本的 100 ...
来自MSN
3 小时
DeepSeek从入门到精通-超详细使用手册
01摘要DeepSeek-R1的推出,标志着中国在大模型研发与应用领域迈出了坚实的一步。它不仅具备强大的推理能力,更在处理复杂任务时展现出卓越的性能。据官方资料显示,DeepSeek-R1在逻辑推理、数学推理和实时问题解决方面表现突出,这得益于其独特 ...
虎嗅网
8 小时
奥特曼:GPT-4.5已经实现,AI编程年底完胜人类
除了o1/o3,OpenAI另一个尚未公开的内部推理模型曝光了。爆料者正是CEO奥特曼本人。据他透露,与全球顶尖程序员相比,当前这一内部模型的编程能力已达Top50,甚至今年年底将排名第一。而且针对大家近来尤为关注的算力问题,他更是直言:在内部,我们已经达到了GPT 4.5,而达到GPT ...
1 小时
中国信通院牵头 3 项人工智能软硬件国际标准成功立项
本次,中国信通院在 ITU 立项的 3 项标准,充分考虑大模型对人工智能边端、集群软硬件系统及算子库的能力要求及挑战, 对于引导产业发展方向、提升我国在人工智能基础软硬件领域影响力具有重要意义 。
来自MSN
9 小时
华为云上线DeepSeek大模型 华为算力产业链有望站上风口
2月8日,清昴智能的玄武智算云平台已全面支持DeepSeek V3/R1模型,并基于昇腾硬件实现了高效部署。而此前,华为宣布ModelEngine AI平台全面支持DeepSeek全系列大模型的本地部署与优化。
it168
2 小时
DeepSeek火了,大模型的原生安全怎么做?
永信至诚依托「数字风洞」产品体系构建的AI大模型专属数字健康解决方案,基于“原生安全”管理思路,以独立的测评视角提供有落地价值的解决方案,以企业业务发展为核心,以风险综合管理为框架,以AI智能体生命周期为轴,以传统安全技术和手段为器,让安全工作融入到 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈