THANOS:通过融入“技能心智”增强对话代理的大语言模型

韩国科学技术研究院计算机学院和KT 公司的研究人员通过将“技能心智”(skill-of-mind)的概念融入大语言模型(LLM)来增强对话代理的能力。技能心智是指在特定情境下,人类能够根据对话的社交动态(如人口统计学特征、个性等)来选择最合适的对话技能以优化社交互动的能力。

研究团队提出了一个名为MULTIFACETED SKILL-OF-MIND的数据集,以及一个名为THANOS的新型大语言模型家族,旨在通过模拟人类的技能心智过程来提高对话代理的响应质量和社交行为。

主要功能:

  1. 技能心智数据集(MULTIFACETED SKILL-OF-MIND): 包含约100K个对话,这些对话被标注了多方面的技能心智,覆盖了各种互动场景(如长期对话、咨询、任务导向对话)。
  2. THANOS模型: 一系列不同大小(1B、3B、8B参数)的技能心智注入型LLM,能够生成解释和最合适的对话技能。

主要特点:

  • 多技能标注: 数据集不仅包含对话,还包含解释和对话技能的标注。
  • 广泛的适用性: 能够跨多个领域推断多方面的技能。
  • 模型多样性: 提供不同大小的模型以适应不同的应用需求。

工作原理: THANOS模型通过以下步骤工作:

  1. 输入: 接收社交上下文信息和对话作为输入提示。
  2. 技能选择: 根据对话内容和社交上下文,模型内部推理并选择最合适的对话技能。
  3. 解释生成: 生成一个解释,说明为什么选择特定的技能。
  4. 技能输出: 输出选定的对话技能,并在对话中应用。

具体应用场景:

  • 长期对话系统: 如客户服务或伴侣聊天机器人,需要理解和记忆对话历史。
  • 咨询和支持: 提供情感支持和建议的对话代理,如心理健康咨询。
  • 任务导向对话: 执行特定任务,如预订酒店或提供信息的对话代理。
  • 多模态交互: 结合图像分享的对话场景,如社交网络中的对话。

总的来说,这项工作通过引入技能心智的概念,提高了LLM在社交对话中的表现,使其能够更自然、更贴切地模拟人类的对话行为。

我们将24小时内回复。
取消