中国AI创业公司DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌,因为在前者的低成本高歌猛进下,后者无法解释自己的超高预算的合理性。Meta的Llama 3系列模型的计算预算多达3930万H100 GPU Hours—— ...
此次推出的新模型拥有240亿参数,在标准基准测试中的准确率达81%,并且每秒能够处理150个Token。Mistral AI在发布该模型时采用了适用性更加广泛的Apache ...
尽管Meta CEO马尔克·扎克伯格曾公开表示希望缩小Llama模型与其他闭源模型的差距,公司内部也因此承受着巨大的压力。扎克伯格在2024年7月的一封信中信心满满地指出,Llama 3已经能与最先进的模型一争高下,并在某些领域处于领先。最终在2024年4月,Meta正式推出了Llama 3,这款开源模型在性能上与市场上的闭源模型不相上下,甚至打败了Mistral的开源模型。
IT之家 10 月 27 日消息,继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后,Meta 于 10 月 24 日发布了这两个模型的量化版本,量化后的模型大小平均减少了 ...
扎克伯格还表示,DeepSeek在技术上具有多项创新,这些创新不仅值得Meta学习,也可能对整个人工智能行业的发展产生深远影响。这些技术使得DeepSeek能够在较低的计算资源需求下实现高性能,这对于资源有限的团队来说具有重要意义。
除了 Llama 3,Meta 还发布了新的信任和安全工具,包括 Llama Guard 2、Code Shield 和 CyberSec Eval 2。 即将扩展应用生态 Meta 即将在 Facebook、Instagram、WhatsApp ...