文章目录[隐藏]
上个月网信办等七部门联合公布《生成式人工智能服务管理暂行办法》,在今天凌晨百度旗下 AI 大模型产品文心一言和王小川创办的百川智能率先宣布通过《生成式人工智能服务管理暂行办法》备案,成为首批通过备案的 8 家公司,可以发布正式版为大家提供服务,目前文心一言的 APP 已经能公开使用,无需排队领取内测资格。(参考:国产AI大语言模型盘点,你看好哪家的产品?)
目前通过《生成式人工智能服务管理暂行办法》备案的具体企业机构包括:
- 五家北京企业机构:百度(文心一言)、抖音(云雀大模型)、智谱 AI(GLM 大模型)、中科院(紫东太初大模型)、百川智能(百川大模型)
- 三家上海企业机构:商汤(日日新大模型)、MiniMax(ABAB 大模型)、上海人工智能实验室(书生通用大模型)
以下为首批获批上线的大模型企业具体介绍:
百度-文心一言大模型
百度旗下“文心一言”是在ChatGPT推出后,于2023年3月16日开启邀请测试,它是国内首个、全球大厂中首个生成式AI产品。
抖音集团-云雀大模型
字节跳动在8月17日正式开始对外测试AI对话产品“豆包”,“豆包”是基于抖音云雀模型开发,提供聊天机器人、写作助手以及英语学习助手等功能。目前支持网页Web平台、iOS 以及安卓平台,用户可通过手机号、抖音或者Apple ID登录使用。(参考:抖音子公司推出 AI 聊天机器人“豆包”)
智谱AI-GLM大模型
智谱AI是由清华大学知识工程实验室(KEG)技术成果转化,目前已经发布包括双语千亿级超大规模预训练模型GLM-130B,中英双语对话模型ChatGLM、认知大模型平台Bigmodel.ai,包括CodeGeeX和CogView等产品。基于ChatGLM,智谱已于今年推出To C聊天对话应用“智谱清言”。而在To B层面,智谱也已经与多家国内互联网巨头,政企达成合作。
百川智能-百川大模型
百川智能由搜狗创始人王小川创立,百川智能于今年6月15日推出70亿参数量的中英文语言模型Baichuan-7B,一个月后又接连发布了参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及INT4/INT8两个量化版本。前不久,百川智能刚刚宣布推出新一代大模型Baichuan-53B。
中科院自动化研究所-紫东太初大模型
中国科学院自动化研究所于6月份在上海发布了该所研制的新一代人工智能大模型——紫东太初 2.0。全新大模型相比第一代着力提升了决策与判断能力,实现了从感知、认知到决策的跨越,未来将在医疗、交通、工业生产等领域发挥更大作用。目前,紫东太初已在文本创作、医疗、物流、政务等多个行业实现应用落地。
商汤-日日新大模型
“商量 SenseChat”于今年 4 月正式推出,是国内最早的基于千亿参数大语言模型之一。“商量 SenseChat”不断快速迭代更新,目前,基模型为商汤联合多家国内顶级科研机构发布的书生・浦语 InternLM-123B。日日新大模型拥有提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种能力,其中还包括商量SenseChat、秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings、明眸等功能强大且易用的内容生成平台产品。目前,商汤最新版大模型“商量SenseChat 2.0版本”已发布,其参数达千亿级规模。
Minimax-ABAB大模型
Minimax由前商汤科技副总裁、通用智能技术负责人闫俊杰于2021年成立。Minimax已经发布了包括文本到视觉/语音/文本三个基础模型架构,推出自研通用大模型“ABAB”,以及虚拟聊天软件Glow、生成式对话AI产品Inspo等。
上海人工智能实验室-书生大模型
上海人工智能实验室成立于2020年,由上海人工智能创新中心发起设立。2021年,浦江实验室联合商汤、香港中文大学、上海交通大学发布通用视觉技术体系“书生”(INTERN)。到如今,书生大模型体系参数已达千亿级别,包括“书生·多模态”、“书生·浦语”和“书生·天际”等三大基础模型,以及面向大模型研发与应用的开源体系。