Moondream是一家专注于小型、高效AI模型的初创公司,今天获得了450万美元的种子前融资。投资者包括Felicis Ventures、微软的M12 GitHub基金和Ascend。这家公司的目标是开发小型但高效的视觉语言模型,以解决企业AI采用中的关键问题,如云计算成本和隐私担忧。
- 官网:https://www.moondream.ai
- GitHub:https://github.com/vikhyat/moondream
- 模型:https://huggingface.co/vikhyatk/moondream2
- Demo:https://huggingface.co/spaces/vikhyatk/moondream2
小模型的优势
Moondream的开源模型已经引起了广泛关注,下载量超过200万次,GitHub星标数达到5100个。这些模型的特点是精度高、运行速度快,且可以在各种设备上本地运行,包括智能手机和工业设备。
CEO Jay Allen(前AWS技术总监)表示:“我们的模型特别之处在于,它是精度极高的小型模型之一,而且运行得非常好。它可以非常容易和快速地在任何地方运行。它甚至可以在iOS和手机上运行。”
解决云成本危机
Moondream的方法解决了企业AI采用中的一个日益严重的问题:云计算的巨大成本和隐私担忧。通过在设备上本地运行AI模型,Moondream帮助企业节省了云资源费用,同时保护了用户隐私。
Allen指出:“随着AI进入越来越多的应用,我们认为我们处于一种矛盾之中,既想要AI的所有好处,又不一定想把我们的生活广播到云端。我更倾向于在边缘附近做尽可能多的事情,这样我就能控制自己的隐私。”
实际应用
早期采用者已经为Moondream的技术找到了多种应用:
- 零售业:通过移动扫描进行自动库存管理。
- 运输业:进行车辆检查。
- 制造业:在本地实施AI进行质量控制,特别是在空气隔离系统中。
技术成就
Moondream的模型在多个基准测试中表现出色:
- VQAv2:达到80.3%的准确率。
- GQA:达到64.3%的准确率。
系统的能源效率也非常高,每令牌消耗大约是每十亿参数0.6焦耳。
大卫与歌利亚:小团队挑战科技巨头
当主要科技公司专注于需要大量计算资源的大型模型时,Moondream则专注于实际实施。CTO Vik Korrapati表示:“这个领域的许多公司都专注于AGI,这最终成为一个巨大的干扰。我们专注于感知问题,以及如何在开发者需要的尺寸和形式因素中提供前沿的多模态能力。”
混合云服务
为了简化开发,Moondream推出了Moondream云服务,旨在提供类似于云的服务,同时保持边缘部署的灵活性。Allen说:“他们想要的是最简单的路径,从类似云的提供开始,这样他们就可以随意使用,但一旦他们做到了这一点,他们就不想感觉被锁定了。”
这种混合方法已经吸引了开发者的广泛兴趣,Allen将其归功于公司的“黑客、开源精神”和透明的开发过程。
未来展望
有了新的资金,Moondream计划扩大团队,包括在其西雅图总部招聘全栈工程师。公司的下一个挑战是扩大技术规模,同时保持定义其早期成功的效率和可访问性。
Korrapati警告说:“谈论AI的时间表是一个危险的游戏。”不过,Moondream预计,视觉语言模型将在未来12个月内被广泛采用。
总之,Moondream通过开发小型、高效的AI模型,为企业提供了新的解决方案,解决了云计算成本和隐私问题,同时保持了高性能和灵活性。