Meta推出Llama3.370B:新一代AI模型性能超越GPT-4和Gemini1.5Pro

Meta近日宣布，推出其Llama系列的最新成员——Llama3.370B。Meta的生成式AI副总裁Ahmad Al-Dahle在X平台上发布了这一消息，并指出，Llama3.370B在性能上相较于Meta之前最大的Llama模型Llama3.1405B取得了显著进步，同时成本大幅降低。

Al-Dahle表示，通过利用训练后的最新技术，Llama3.370B不仅提升了性能，而且降低了运营成本。根据Meta发布的基准测试结果，Llama3.370B在多个领域超过了谷歌的Gemini1.5Pro、OpenAI的GPT-4和亚马逊新发布的Nova Pro，尤其在评估模型理解语言能力的MMLU测试中表现优异。

Meta推出Llama3.370B:新一代AI模型性能超越GPT-4和Gemini1.5Pro插图

该模型现已可以从Hugging Face和Llama官方平台等来源下载，Meta的这一举措旨在通过“开放”模型来主导AI领域。Meta的Llama模型可以应用于多种场景，并支持商业化，虽然Meta对一些开发者设定了使用限制，要求每月用户超过7亿的平台申请特别许可。尽管如此，Llama模型的下载量已突破6.5亿次，表明其在全球AI开发者中受到了广泛欢迎。

为了支撑未来更大规模的AI模型训练，Meta正在大力投资计算基础设施。该公司近日宣布将在路易斯安那州建设一个100亿美元的AI数据中心，这是Meta迄今为止规模最大的AI数据中心。扎克伯格在财报电话会议中提到，为了训练下一代Llama4模型，所需的计算能力将是Llama3的10倍。Meta目前已采购超过10万个Nvidia GPU集群，与xAI等竞争对手的资源相匹敌。

随着生成式AI模型训练的成本不断攀升，Meta的资本支出也呈现增长趋势，2024年第二季度的资本支出增长了近33%，达到了85亿美元。这一增长主要得益于Meta在服务器、数据中心和网络基础设施上的持续投资。