推理 - 搜索 News

9 小时

近日，DeepSeek宣布其V3 ...

来自MSN1 小时

TPO团队投稿量子位 | 公众号 QbitAI 随着大语⾔模型（LLMs）在各类任务中展现出令人瞩目的能力，如何确保它们⽣成的回复既符合预期又安全，始终是⼀项关键挑战。传统的偏好对⻬⽅法，如基于⼈类反馈的强化学习（RLHF）和直接偏好优化（DPO ...

21ic3 小时

DeepSeek 推理型AI尽显高效训练的小模型之威

DeepSeek-R1 质疑了这样一种假设，即通过对正确或错误行为的标记示例进行训练，或者从隐藏模式中提取信息，模型的推理能力就会得到提高。密歇根州立大学博士生张逸骅撰写了数十篇机器学习方面的论文，他说："它的核心假设很简约，却不那么简单：我们能否只通过奖励信号来教会模型正确回答，从而让它自己摸索出最优的思考方式？ " ...

17 小时

橙柚青全面接入DeepSeek-R1数据模型升级外贸智能化服务

2025年2月9日，重庆橙柚青网络科技有限公司（以下简称“橙柚青”）宣布，公司已全面接入DeepSeek-R1数据模型，旨在进一步提升公司在人工智能领域的技术实力和服务水平。这一举措标志着橙柚青在AI技术应用方面迈出了重要一步。

来自MSN7 小时

为什么在推理型大语言模型中使用思维链提示可能会适得其反

本文探讨了链式思维提示技术在生成式AI和大语言模型中的应用。作者指出,新一代AI模型已内置链式思维功能,无需额外要求。但显式使用该技术可能导致重复、延迟或错误。文章就如何正确使用链式思维提示给出了建议,以充分发挥AI的推理能力。

6 小时

训推全面支持、开箱即用！DeepSeek V3昇思MindSpore版本上线开源社区

近日，基于昇腾AI硬件与昇思MindSporeAI框架版本的DeepSeek-V3完成开发支持并上线昇思开源社区，面向开发者提供开箱即用的预训练和推理能力，并已成功在大规模集群上预训练和部署。

23 小时

OpenAI内部已实现GPT-4.5？未来会走向开源？Altman透露发展路线

传统的大语言模型遵循一个相对简单的扩展逻辑：每一代模型的计算能力大约是前一代的 100 倍。正如 Altman 所说：“在过去的范式中，我们只做预训练，从 GPT-1 到 GPT-4，每个版本都大约是前一个版本的 100 ...

来自MSN3 小时

DeepSeek从入门到精通-超详细使用手册

01摘要DeepSeek-R1的推出，标志着中国在大模型研发与应用领域迈出了坚实的一步。它不仅具备强大的推理能力，更在处理复杂任务时展现出卓越的性能。据官方资料显示，DeepSeek-R1在逻辑推理、数学推理和实时问题解决方面表现突出，这得益于其独特 ...

虎嗅网8 小时

奥特曼：GPT-4.5已经实现，AI编程年底完胜人类

除了o1/o3，OpenAI另一个尚未公开的内部推理模型曝光了。爆料者正是CEO奥特曼本人。据他透露，与全球顶尖程序员相比，当前这一内部模型的编程能力已达Top50，甚至今年年底将排名第一。而且针对大家近来尤为关注的算力问题，他更是直言：在内部，我们已经达到了GPT 4.5，而达到GPT ...

1 小时

中国信通院牵头 3 项人工智能软硬件国际标准成功立项

本次，中国信通院在 ITU 立项的 3 项标准，充分考虑大模型对人工智能边端、集群软硬件系统及算子库的能力要求及挑战，对于引导产业发展方向、提升我国在人工智能基础软硬件领域影响力具有重要意义。

来自MSN9 小时

华为云上线DeepSeek大模型华为算力产业链有望站上风口

2月8日，清昴智能的玄武智算云平台已全面支持DeepSeek V3/R1模型，并基于昇腾硬件实现了高效部署。而此前，华为宣布ModelEngine AI平台全面支持DeepSeek全系列大模型的本地部署与优化。

it1682 小时

DeepSeek火了，大模型的原生安全怎么做？

永信至诚依托「数字风洞」产品体系构建的AI大模型专属数字健康解决方案,基于“原生安全”管理思路,以独立的测评视角提供有落地价值的解决方案,以企业业务发展为核心,以风险综合管理为框架,以AI智能体生命周期为轴,以传统安全技术和手段为器,让安全工作融入到 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果