Meta Llama3 - 搜索 News

3 小时

最近一短时间以来，被国内一家AI大模型初创公司DeepSeek刷屏了。短短几个月内，DeepSeek推出的两款开源大语言模型——DeepSeek-V3和DeepSeek-R1，不仅在多个关键性能指标上与世界*大模型，如Meta的Llama ...

it1683 小时

永信至诚AI「数字风洞」团队春节攻坚：DeepSeek水平到底如何？企业10 ...

杭州深度求索公司发布的DeepSeek-r1模型无疑成为春节科技圈顶流。临近除夕，永信至诚接到多家企业用户咨询，总结下来大体这几个问题：大模型时代来了，怎么可以搭上这趟车？如何在自己传统行业内卷中借力大模型提升能力？

6 小时

永信至诚AI「数字风洞」团队连轴攻坚：回答DeepSeek到底什么水平？

为了认真回答这些问题，及时解答用户的疑问，永信至诚AI实验室当即决定，这个年就在公司跟“大模型们”一起过了，全组人员放弃春节休假时间，说干就干，全面投入大模型测评工作。并将这次春节专项任务命名为：“爆竹行动”。

6 小时

DeepSeek流量超Gemini登顶全球第二！马斯克挟xAI更强模型宣战

日前，美股收盘英伟达股价暴跌17%，市值一夜蒸发5888.62亿美元。业界认为这是受到中国AI大模型DeepSeek人工智能模型冲击，导致美国芯片股集体下跌，英伟达受到最严重冲击。DeepSeek-R1API服务定价为每百万输入tokens1元/4元 ...

6 小时

DeepSeek，搅了谁的局？

DeepSeek的出现，一度让全球算力概念股暴跌，叠加美股科技股普跌的影响，英伟达股价下跌近17%，市值蒸发近6000亿美元，规模创美股史上最大。OpenAI和谷歌也在近期紧急上线最新模型，AI行业堪称烈火烹油。

中华网17 小时

马斯克谈DeepSeek xAI即将发布更强模型

DeepSeek 火了，全球出现了 2000 多个假冒网站，其中 60% 的 IP 在美国。这些假冒域名被用于钓鱼诈骗、域名抢注和流量劫持。从创建时间来看，冒名 IP 域名的注册数量从 1 月 27 日开始激增，随后从 2 月初逐渐减少。

23 小时

DeepSeek崛起：超越谷歌Gemini的AI聊天革命与未来展望

在人工智能领域，竞争的激烈程度似乎达到了新的高峰。近期，DeepSeek以惊人的增幅超越了谷歌的Gemini，成为全球第二受欢迎的AI聊天机器人。这一变化，标志着市场上的格局正在发生剧烈改变。DeepSeek自推出以来，仅用两个月的时间便吸引了大量用 ...

2 天on MSN

新王诞生：DeepSeek 双模型 GitHub Star 数首次超越 OpenAI

IT之家 2 月 7 日消息，DeepSeek 旗下两大开源项目刚刚在 GitHub 平台实现历史性突破。截至IT之家发稿，DeepSeek-V3 已经以 7.83 万的 Star 数成功超越 OpenAI 明星项目 Whisper（7.58 万） ...

搜狐14 天

DeepSeek-V3：低成本AI大模型引发行业震荡，不容错过的人工智能新星

DeepSeek-V3的成功归功于其独特的训练方法和强大的架构。与Meta Llama3模型相比，DeepSeek-V3在训练参数量上实现了对比，同时避免了对高级显卡的依赖。DeepSeek公司利用2048块H800显卡，耗时仅两个月就完成了训练，这种效率相较于Meta使用的16,384块更强的H100显卡和54天 ...

51CTO18 天

中科院北大等揭示「蒸馏真相」：除Claude豆包Gemini，其他很多模型都 ...

GLM4-plus：我是ChatGLM，是由一家名为智谱AI的中国公司开发的人工智能助手。 Llama3.1-70B-Instruct：我是一个名为Llama的人工智能模型，由美国的Meta AI创建。 Phi-4：我是Phi-4，由美国的微软研究院团队开发。 Claude3.5-Sonnet：我是Claude，是由Anthropic开发的人工智能助手。

IT之家20 天

剪映海外版 CapCut 停运当天，Meta 宣布推出移动端视频编辑软件“Edits”

IT之家1 月 20 日消息，剪映海外版（CapCut）于美国停止运营当日，Instagram 首席执行官 Adam Mosseri 在 Instagram 平台上发布视频，宣布推出一款名为“Edits”的移动端视频编辑软件。为此 Adam Mosseri 评论道：“目前有很多事情正在进行中，无论最后会发生什么，我们的 ...

GitHub22 天

README_zh-CN.md

模型具备以下特点：更低的代价取得更高的性能: 在推理、知识类任务上取得同量级最优性能，超过Llama3.1-8B和Qwen2.5-7B。值得关注的是InternLM3只用了4万亿词元进行训练，对比同级别模型训练成本节省75%以上。深度思考能力: InternLM3支持通过长思维链求解复杂推理 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果