文章目录[隐藏]
一家专注于开发用于评估AI数学能力基准的非营利组织Epoch AI,由于直到最近才公开其接受了来自OpenAI的资金支持,而在AI社区内引发了争议。
背景介绍
Epoch AI主要由Open Philanthropy(一个研究和赠款基金会)资助,致力于开发名为FrontierMath的测试工具。此工具包含专家级别的问题,旨在衡量AI系统的数学技能,并被OpenAI选为展示其即将推出的旗舰模型o3性能的基准之一。然而,在最初发布时,Epoch AI并未完全透明地公开OpenAI对其的支持情况。
社区反应
在LessWrong论坛上,一位名为“Meemi”的Epoch AI承包商指出,许多参与FrontierMath开发的人是在项目公开后才得知OpenAI的参与。“关于这一点的沟通是不透明的,”Meemi写道,“在我看来,Epoch AI应当提前披露OpenAI的资助,确保承包商能够基于充分的信息决定是否参与。”
社交媒体上的讨论进一步揭示了这种保密性可能损害FrontierMath作为公正评估标准声誉的担忧。此外,斯坦福大学数学博士生Carina Hong提到,一些贡献者对OpenAI拥有对FrontierMath的特权访问权感到不满,并表示如果早知此事,他们可能会重新考虑自己的参与。
Epoch AI回应
面对批评,Epoch AI副主任兼联合创始人Tamay Besiroglu承认组织在透明度方面存在不足:“我们确实犯了一个错误,没有更早地向贡献者提供完全透明的信息。”Besiroglu解释说,尽管出于合同限制未能立即公开合作伙伴关系,但事后看来,他们应该更加努力争取尽早实现信息透明化。
Besiroglu还强调,虽然OpenAI可以获得FrontierMath的数据,但双方达成了口头协议,即OpenAI不会利用这些数据来训练其AI系统。为了保证结果的客观性,Epoch AI还保留了一个独立的验证集,用以进行额外的结果核实。(来源)
发表回复