Meta Llama3 - 搜索 News

中华网1 小时

马斯克谈DeepSeek xAI即将发布更强模型

DeepSeek 火了，全球出现了 2000 多个假冒网站，其中 60% 的 IP 在美国。这些假冒域名被用于钓鱼诈骗、域名抢注和流量劫持。从创建时间来看，冒名 IP 域名的注册数量从 1 月 27 日开始激增，随后从 2 月初逐渐减少。

1 天

我们应如何看待DeepSeek的557.6万美元训练成本？｜甲子光年

简单来说，DeepSeek-V3仅使用了2048块英伟达H800 GPU，耗费了557.6万美元就完成了训练，相比同等规模的模型（如GPT-4、GPT-4o、Llama 3.1），训练成本大幅降低。

红板报 on MSN1 天

DeepSeek 官网全球日访问量已超越谷歌 Gemini

品玩2月8日讯，据 SimilarWeb 数据显示，DeepSeek.com 的日访问量已经超过了谷歌的 Gemini 和 Character.AI。报告显示 DeepSeek 的 V3 模型在第三方基准测试中表现优于 Meta 的 Llama 3 ...

2 天on MSN

新王诞生：DeepSeek 双模型 GitHub Star 数首次超越 OpenAI

IT之家 2 月 7 日消息，DeepSeek 旗下两大开源项目刚刚在 GitHub 平台实现历史性突破。截至IT之家发稿，DeepSeek-V3 已经以 7.83 万的 Star 数成功超越 OpenAI 明星项目 Whisper（7.58 万） ...

搜狐14 天

DeepSeek-V3：低成本AI大模型引发行业震荡，不容错过的人工智能新星

DeepSeek-V3的成功归功于其独特的训练方法和强大的架构。与Meta Llama3模型相比，DeepSeek-V3在训练参数量上实现了对比，同时避免了对高级显卡的依赖。DeepSeek公司利用2048块H800显卡，耗时仅两个月就完成了训练，这种效率相较于Meta使用的16,384块更强的H100显卡和54天 ...

搜狐15 天

硅谷的AI大梦：Meta再遭DeepSeek重创，恐慌蔓延

比赛的数据显然有很大的不同。在DeepSeek-V3的高光时刻，其280万乘GPU小时的训练时间与Meta Llama3.1-405B形成鲜明对比后者居然耗费了3080万GPU小时，成本之巨简直令人咋舌。不仅如此，OpenAI的GPT-4o训练费用达到一亿美元，这种“花小钱办大事”不仅让投资者们眉头 ...

51CTO19 天

过年了！Kimi深夜炸场：满血版多模态o1级推理模型！OpenAI外全球首次 ...

昨晚十点，Kimi弹了条推送。大晚上的，他们就这么波澜不惊地发了一个SOTA 模型出来！就是这个 k1.5 多模态思考模型，性能实现有多逆天呢：在 short-CoT 模式下， Kimi k1.5 的多项能力，大幅超越了全球范围内短思考 SOTA 模型 GPT-4o 和 Claude 3.5 Sonnet 的水平，领先 ...

IT之家20 天

剪映海外版 CapCut 停运当天，Meta 宣布推出移动端视频编辑软件“Edits”

IT之家1 月 20 日消息，剪映海外版（CapCut）于美国停止运营当日，Instagram 首席执行官 Adam Mosseri 在 Instagram 平台上发布视频，宣布推出一款名为“Edits”的移动端视频编辑软件。为此 Adam Mosseri 评论道：“目前有很多事情正在进行中，无论最后会发生什么，我们的 ...

GitHub21 天

README_zh-CN.md

模型具备以下特点：更低的代价取得更高的性能: 在推理、知识类任务上取得同量级最优性能，超过Llama3.1-8B和Qwen2.5-7B。值得关注的是InternLM3只用了4万亿词元进行训练，对比同级别模型训练成本节省75%以上。深度思考能力: InternLM3支持通过长思维链求解复杂推理 ...

站长之家24 天

法庭文件显示Meta 高管痴迷于在内部击败 OpenAI 的 GPT-4

在 Meta 正在进行的人工智能版权案件之一 Kadrey v. Meta 中，法院公布的内部消息揭示了该公司在开发 Llama3 时的激烈竞争和潜在版权问题。Meta的高层领导和研究人员全力以赴，力图在AI模型开发中超越 OpenAI 和 Anthropic 等公司，并将其 GPT-4 和 Claude 视为努力的黄金 ...

IT之家24 天

为超越 OpenAI GPT-4，Meta 不惜使用争议数据训练 Llama 3

IT之家1 月 15 日消息，周二，在一场涉及 Meta 的人工智能版权案件（Kadrey 诉 Meta 案）中，法院公开了 Meta 高管和研究人员的内部通信记录。这些文件显示，Meta 在开发其最新 AI 模型 Llama 3 的过程中，高管和研究人员将超越 OpenAI 的 GPT-4 视为核心目标，并在内部 ...

新浪网24 天

为超越 OpenAI GPT-4，Meta 不惜使用争议数据训练 Llama 3

这些文件显示，Meta 在开发其最新 AI 模型 Llama 3 的过程中，高管和研究人员将超越 OpenAI 的 GPT-4 视为核心目标，并在内部讨论中表现出极强的竞争 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果