文章目录[隐藏]
ChatGPT出圈以后,已经将元宇宙这个热门IP彻底打入冷宫,而国内的公司也纷纷跟进发布类似大模型产品,像是百度的“文心一言”,阿里巴巴的“通义千问”等,目前也都开启了小范围内测,基本的对话、数学、编程都能完成,但与ChatGPT相比差距还是有点远,今天就来看看国内都有哪些公司已经发布或者将要发布大模型产品!
[t-primary icon='']通用型[/t-primary]
1、百度 文心一言
百度旗下的“文心一言”是国内最早发布的知识增强大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色。能够与人对话互动,回答问题,协助创作,支持多语言。目前在个性化和创造力方面存在局限性,AI绘图方面更是可以用糟糕来形容。
2、阿里巴巴 通义千问
通义千问是一个专门响应人类指令的大模型,是效率助手,也是点子生成机。其训练资料来自阿里巴巴达摩院,截止到 2023 年 2 月,训练资料包括大量语言和文本数据,包括中英日法西班牙语多语种文本数据。功能包含效率类、生活类和娱乐类,其中效率类能够写提纲、进行 SWOT 分析、生成商品描述;生活类提供根据菜名写菜谱、模仿小学生写作等功能;娱乐类则能够写情书、写诗以及吹“彩虹屁”等。在自由交谈过程中,通义千问对答流畅,具备一定的中文理解和文学创作能力。缺点方面:内测太吝啬,申请已有一个多月至今没拿到邀请码。
3、腾讯 混元大模型
相对于百度和阿里已经发布产品,去年就发布消息的混元大模型至今尚未正式公开。腾讯声称混元提供答案的能力与英语或中文无关。与传统的聊天机器人相比,将能够生成更逼真的自然语言文本。混元大模型目标是「通过性能稳定的强化学习算法训练,完善腾讯智能助手工具,打造腾讯智能大助手,并能成为国内的业界标杆」。
4、昆仑万维 天工AI助手
“天工”由昆仑万维与国内领先的 AI 团队奇点智源联合研发,是国内首个对标 ChatGPT 的双千亿级大语言模型。天工作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。虽然已经宣传很久,但尚未开启内测。
5、网易 玉言
"玉言“是网易伏羲自主研发的中文文本预训练大模型系列,结构由深层Encoder和浅层Decoder组成,这种结构可以使得大模型具有优秀理解能力的同时,也有着较为优秀的生成能力。其预训练数据包括网易自有高质量数据、各类百科、新闻、社区问答、wiki、小说等等;网易伏羲对收集到的数据进行去重,清洗,产出了大量高质量数据,并采用这些数据训练模型,使得模型具有良好的泛化性,在各类任务上都有着出色的性能。
6、知乎知海图AI
知乎方面与面壁智能共建的大模型产品“知海图AI”,而“知海图AI”是基于清华NLP实验室和面壁智能CPM-Bee(10B)模型的技术支撑。按照官方的说法,针对知乎热榜问题中的所有回答,在“热榜摘要”这个特定场景中将“知海图AI”大模型的效果与GPT-4进行比较发现,两个模型的表现几乎持平。
7、TigerBot
虎博科技于6月7日正式发布并开源其自研大模型TigerBot。同时,虎博科技还发布了大模型应用开发所需的全套API,以及多领域专业数据。虎博科技在大模型研发上选择走开源路线。此次开源内容包含模型、代码、数据三部分,包含TigerBot-7B-sft、 TigerBot-7B-base、TigerBot-180B-research等多个模型版本;基本训练且覆盖双卡推理 180B 模型的量化和推理代码;以及达100G的预训练数据、监督微调1G/100万条数据。
[t-danger icon='']面向企业型[/t-danger]
1、京东 言犀
与其他企业相比,京东的AI大模型主要面向企业服务方面,“言犀” 京东智能人机交互平台,助力企业服务数智化转型,以AI技术驱动,从文字、语音到多模态交互,从对话智能到情感智能,聚焦体验、效率与转化,旨在打造新一代智能人机交互平台,面向不同行业和客户场景助力企业服务和营销实现数智化转型升级。
2、中国科学院自动化研究所 紫东.太初
OPT(Omni-Perception Pre-Trainer)是全场景感知预训练模型的简称,是中科院自动化和华为在探索通用人工智能道路上的重要成果,并在2021年9月发布了全球首个图文音三模态千亿大模型,中文名字叫紫东.太初;支持文本、视觉、语音不同模态间的高效协同,可支撑影视创作、工业质检、智能驾驶等产业应用。
“紫东太初”2.0全模态大模型可实现文本、图片、语音、视频、3D点云、传感信号等不同模态的统一表征和学习,并优化语音、视频和文本的融合认知以及常识计算等功能,进一步突破感知、认知和决策的交互屏障。
3、华为 盘古大模型
华为即将上线的“盘古系列 AI 大模型”分别为 NLP 大模型、CV 大模型、科学计算大模型(气象大模型)。其中 NLP 大模型是被认为最接近人类中文理解能力的 AI 大模型,而 CV 大模型首次兼顾了图像判别与生成能力。
4、达观数据 曹植GPT大语言模型
达观数据积极探索大语言模型LLM的实践,研发国产版GPT“曹植”系统,作为垂直、专用、自主可控的国产版ChatGPT模型,不仅实现专业领域的AIGC智能化应用,且可内置在客户各类业务系统中提供专用服务。可以生成贷后管理报告、投行申报文档、法律文书等各类文本,也可以与用户对话。
5、澜舟科技 孟子对话大模型(MChat)
孟子预训练模型是基于澜舟科技自研的大规模预训练语言模型。可处理多语言、多模态数据,同时支持多种理解和生成任务,能快速满足不同领域、不同应用场景的需求。
6、出门问问 序列猴子
出门问问公司的“序列猴子”是一款具备多模态生成能力的大语言模型。序列猴子支持文字生成、图片生成、3D 内容生成、语音生成和语音识别等不同任务。提供一站式API,包括文本生成、语音生成、图片生成、视频生成等生成式人工智能服务,大大提高了你的生产效率。
7、360 360 智脑
基于 360GPT 大模型开发的人工智能产品矩阵“360 智脑”率先落地搜索场景, 将面向企业用户开放内测。据了解,企业用户在 PC 端 360 搜索首页申请并获得测试资格后,可通过企业安全云体验使用。未来,360 智脑将与浏览器、数字助理、苏打办公、智能营销等场景应用深度结合,全面提升用户生产力和创造力。
[t-success icon='']专业领域型[/t-success]
1、网易有道 子曰
网易有道自研的教育场景下类ChatGPT模型“子曰”,基于“子曰”研发的AI口语老师和中文作文批改DEMO已完成,已经开放内测,这也是国内企业推出的首个教育场景下类ChatGPT模型。
2、科大讯飞 星火认知大模型
星火认知大模型(SparkDesk)支持多风格多任务长文本生成、多层次跨语种语言理解,泛领域开放式知识问答,情景式思维链逻辑推理,多题型可解析数学能力,多功能多语言代码能力。科大讯飞已经在发布会上演示了星火认知大模型的写发言稿、邮件、营销方案、英文写作效果,结果相当出色,可实现语音一句话生成,还能中英文互译,甚至能用小红书的文风来写作。目前讯飞星火已经推出了体验申请,大家可以去申请体验看看。(参考:科大讯飞旗下AI讯飞星火认知大模型正式发布)
3、毫末智行 DriveGPT(雪湖·海若)
毫末智行正式发布自动驾驶生成式大模型 DriveGPT,中文名“雪湖·海若”。基于该大模型的智能驾驶能力将在长城汽车即将量产上市的新摩卡 DHT-PHEV 车型落地。毫末智行表示,其城市 NOH 将在北京、保定、上海等城市落地,并开启泛化测试,到 2024 年有序落地 100 城。
[t-warning icon='']开源型[/t-warning]
1、智谱AI ChatGLM
由清华大学计算机系知识工程实验室技术成果转化而成的清华系公司「智谱AI」,推出开源版中英双语对话模型 ChatGLM-6B,该模型支持在消费级显卡上使用,为 AI 聊天机械人的应用提供了更加便捷的工具。ChatGLM-6B 是一个开源、支持中英双语问答的对话语言模型,并对中文进行了改进。该模型基于 General Language Model (GLM) 架构,拥有 62 亿参数。结合模型量化技术,用户可在消费级显示卡上进行本地部署(以 INT4 量化级别计算,最低只需 6GB显存)。
2、复旦大学自然语言处理实验室 MOSS
MOSS 是一个支持中英双语和多种插件的开源对话语言模型,moss-moon
系列模型具有 160 亿参数,在 FP16 精度下可在单张 A100/A800 或两张 3090 显卡运行,在 INT4/ 8 精度下可在单张 3090 显卡运行。MOSS 基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。(参考:复旦大学MOSS正式开源)
官方地址:https://moss.fastnlp.top (可参与内测)
3、商汤科技 书生2.5
"书生2.5"是商汤科技与上海人工智能实验室联合发布的多模态多任务通用大模型。"书生2.5"包括大规模视觉基础模型"InternImage",预训练算法"M3I-Pretraining",通用解码器"Uni-Perceiver"系列,以及自动驾驶感知通用编码器"BEVFormer"系列。