Meta Llama 2 - 搜索 News

10 天

中国AI创业公司DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌，因为在前者的低成本高歌猛进下，后者无法解释自己的超高预算的合理性。Meta的Llama 3系列模型的计算预算多达3930万H100 GPU Hours—— ...

腾讯网3 天

Mistral AI发布新模型：24B规模，性能比肩Meta Llama 70B模型

此次推出的新模型拥有240亿参数，在标准基准测试中的准确率达81%，并且每秒能够处理150个Token。Mistral AI在发布该模型时采用了适用性更加广泛的Apache ...

19 天

Meta挑战OpenAI，Llama 3的高风险训练之路

尽管Meta CEO马尔克·扎克伯格曾公开表示希望缩小Llama模型与其他闭源模型的差距，公司内部也因此承受着巨大的压力。扎克伯格在2024年7月的一封信中信心满满地指出，Llama 3已经能与最先进的模型一争高下，并在某些领域处于领先。最终在2024年4月，Meta正式推出了Llama 3，这款开源模型在性能上与市场上的闭源模型不相上下，甚至打败了Mistral的开源模型。

来自MSN3 个月

Meta 推出 Llama 3.2 1B/3B 模型量化版，功耗更低

IT之家 10 月 27 日消息，继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后，Meta 于 10 月 24 日发布了这两个模型的量化版本，量化后的模型大小平均减少了 ...

腾讯网4 天

Meta电话会摘要：扎克伯格称DeepSeek多方面有创新，值得行业学习

扎克伯格还表示，DeepSeek在技术上具有多项创新，这些创新不仅值得Meta学习，也可能对整个人工智能行业的发展产生深远影响。这些技术使得DeepSeek能够在较低的计算资源需求下实现高性能，这对于资源有限的团队来说具有重要意义。

来自MSN9 个月

Meta 发布 Llama 3，号称是最强大的开源大语言模型

除了 Llama 3，Meta 还发布了新的信任和安全工具，包括 Llama Guard 2、Code Shield 和 CyberSec Eval 2。即将扩展应用生态 Meta 即将在 Facebook、Instagram、WhatsApp ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果