AI·新世界

THANOS：通过融入“技能心智”增强对话代理的大语言模型

韩国科学技术研究院计算机学院和KT 公司的研究人员通过将“技能心智”（skill-of-mind）的概念融入大语言模型（LLM）来增强对话代理的能力。技能心智是指在特定情境下，人类能够根据对话的社交动态（如人口统计学特征、个性等）来选择最合适的对话技能以优化社交互动的能力。

GitHub：https://github.com/passing2961/Thanos
模型：https://huggingface.co/collections/passing2961/thanos-6711f7a74227c6088d5d88f8

研究团队提出了一个名为MULTIFACETED SKILL-OF-MIND的数据集，以及一个名为THANOS的新型大语言模型家族，旨在通过模拟人类的技能心智过程来提高对话代理的响应质量和社交行为。

主要功能：

技能心智数据集（MULTIFACETED SKILL-OF-MIND）： 包含约100K个对话，这些对话被标注了多方面的技能心智，覆盖了各种互动场景（如长期对话、咨询、任务导向对话）。
THANOS模型： 一系列不同大小（1B、3B、8B参数）的技能心智注入型LLM，能够生成解释和最合适的对话技能。

主要特点：

工作原理： THANOS模型通过以下步骤工作：

具体应用场景：

总的来说，这项工作通过引入技能心智的概念，提高了LLM在社交对话中的表现，使其能够更自然、更贴切地模拟人类的对话行为。