法庭文件揭示:Meta高管内部痴迷于击败OpenAI的GPT-4

在Meta正在进行的一起AI版权案件Kadrey v. Meta中解封的内部消息显示,Meta的高层和研究人员在开发Llama 3时,对击败OpenAI的GPT-4模型表现出了极大的热情和决心。这些信息揭示了科技巨头之间激烈的竞争环境以及他们为了保持领先地位所采取的一些策略。

内部沟通透露的竞争心态

Meta生成式AI副总裁艾哈迈德·阿尔-达勒(Ahmad Al-Dahle)在2023年10月给研究员雨果·图夫龙(Hugo Touvron)的消息中明确表示,“我们的目标必须是GPT-4”。他提到公司即将拥有64,000个GPU,并强调了学习构建前沿技术的重要性,以期在这场竞赛中取得胜利。

尽管Meta倾向于发布开源AI模型,但其AI领导者更关注如何超越那些不公开模型权重的竞争对手,如Anthropic和OpenAI。他们将Anthropic的Claude和OpenAI的GPT-4视为需要追赶的标准。对于同为开源领域的竞争对手Mistral,Meta的态度则显得较为轻视。

数据使用与法律风险

值得注意的是,在追求技术突破的过程中,Meta似乎有时会采取所谓的“捷径”,包括使用受版权保护的内容进行训练。例如,图夫龙指出Llama 2的数据集组合“很糟糕”,并讨论了通过整合更好的数据来源来改进Llama 3的可能性。此外,有迹象表明,公司考虑使用包含大量受版权保护作品的LibGen数据集进行训练。

这导致了目前面临的多项诉讼,其中检察官指控Meta在快速推进AI模型的过程中可能侵犯了版权。马克·扎克伯格曾表示,他致力于缩小Meta的Llama模型与其他领先闭源模型之间的性能差距,而这些内部消息则揭示了这一过程中存在的巨大压力和挑战。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注