Sapient Intelligence：新加坡首家基础模型AI初创公司，引领新一代AI架构

文章目录[隐藏]

超越传统Transformer的新架构
基准测试中的卓越表现
高效的训练方法
实际应用：从代码到机器人
全球视野与多元化团队
面向个人和企业的长期愿景

新加坡的Sapient Intelligence近期宣布成功完成2200万美元的种子轮融资，估值达到2亿美元。此次融资由Vertex Ventures、Sumitomo Group和JAFCO等知名投资者支持。Sapient的目标是在AI开发中开辟一条独特的道路，解决当前大语言模型（LLM）尤其是GPT风格模型难以处理的复杂和长期推理任务。

官网：https://www.sapient.inc

超越传统Transformer的新架构

联合创始人兼首席执行官Austin Zheng在最近的一次采访中表示，Sapient的创新之处在于开发了一种受神经科学和数学启发的新模型架构，将Transformer组件与循环神经网络（RNN）结构相结合，模仿人脑的工作方式。这种设计使得Sapient的模型能够更有效地处理多步骤推理和复杂问题。

自回归方法的局限性：传统的GPT风格模型依赖于自回归方法，通过在先前输出上逐步构建来生成预测。虽然这种方法在一般任务中表现良好，但在多步骤推理和复杂问题解决方面存在困难，容易出现“幻觉”现象。
Sapient的解决方案：Sapient的模型通过持续评估解决方案、计算选项并根据这些选项提供奖励，能够在企业或生产环境中部署，并通过试错不断学习和改进。这种设计使得模型可以灵活地处理广泛的任务，精确且可靠。

基准测试中的卓越表现

Sapient的模型在多个基准测试中表现出色，尤其是在解决数独、二维导航和复杂数学问题等任务中。Zheng指出，Sapient的模型在解决数独方面的准确率达到了95%，无需使用中间工具和数据，这是目前市场上表现最好的神经网络之一。

数独基准测试：其他领先模型需要通过中间步骤进行训练才能解决数独谜题，而Sapient的模型只需提供未完成的数独棋盘、规则和最终解决方案，便能通过试错自行推断如何解决。
其他任务：Sapient的模型在二维导航和复杂数学问题解决等任务中也表现出色，始终优于竞争方法。

高效的训练方法

Sapient的训练方法显著降低了训练复杂模型的门槛。Zheng解释说，与传统模型不同，Sapient的模型只需要问答对进行训练，而不需要大量的高质量、逐步数据。此外，通过利用合成数据，Sapient减少了对外部数据集的依赖，创建了可扩展且高效的训练管道。

实际应用：从代码到机器人

Sapient的初始重点是现实世界的应用，主要集中在企业编码和机器人技术领域。

自主编码代理：Sapient已经在Sumitomo的企业环境中部署了一个自主AI编码代理，该代理能够学习公司的代码库，并最终开始维护和贡献代码。Zheng将其描述为“智能且定制的AI员工和AI软件工程师”，可以帮助企业维护、更新并扩展现有的技术栈。
具身AI：Sapient还在推进具身AI的研究，设计使机器人能够实时交互、学习和适应的模型。这将使机器人能够在理解环境、问题和用例方面持续改进，成为未来1-2年的主要研发方向。

全球视野与多元化团队

Sapient不仅通过技术创新，还通过其全球化和包容性的方法使自己与众不同。公司希望成为首批解决真正具有挑战性问题的亚洲领导国际研究组织之一。Sapient在新加坡设有办事处，并计划在湾区设立办事处，建立一个AI研究实验室，汇集多元化的观点和人才。

团队背景：Sapient的团队由来自DeepMind、Anthropic和微软AI等领先机构的科学家和工程师组成，反映了其国际化和多样化的理念。
合作伙伴关系：Sapient与Sumitomo Group等日本投资者建立了强大的合作伙伴关系，进一步增强了其在全球AI生态系统中的地位。

面向个人和企业的长期愿景

Sapient的长期目标是开发能够为个人和企业带来同样有用结果的技术。Zheng表示，最终目标是构建一个真正通用的代理，能够为用户解决日常任务，成为“全能代理解决方案”。这包括未来的面向公众的产品，如自主编码代理和通用个人助理。

定价模式：目前，Sapient专注于完善其技术和提供企业级解决方案。定价模式仍在探索中，可能包括许可、订阅费或与成功完成任务相关的收费。

Sapient Intelligence 通过其创新的AI架构和实际应用，正在快速崛起为全球AI领域中值得关注的公司。随着其技术的不断进步和全球布局的扩展，Sapient有望在未来几年内成为AI领域的领导者。