当前位置：首页>郑州>郑州大学徐明亮团队 | 具身智能与多元行为协同的集群控制方法

郑州大学徐明亮团队 | 具身智能与多元行为协同的集群控制方法

2026-06-12 20:51:59

#具身智能，#多智能体系统，#强化学习，#行为多样性，#协同控制

引用本文: 胡亚洲, 秦明辉, 巫英才, 等. 具身智能与多元行为协同的集群控制方法. 中国科学: 信息科学, 2026, 56: 327–344, doi: 10.1360/SSI-2025-0308

研究意义

在航空装备保障、工业物流、仓储配送等任务密集、空间受限的场景中，多智能体系统在协同效率、冲突规避和动态响应方面仍存在明显短板。传统方法往往依赖静态规则，难以适应环境扰动，例如路径拥堵、空间冲突或突发障碍等。具身智能提供了一种新的思路：让智能体真正与物理环境紧密结合，通过实时感知与决策闭环增强其适应性；同时，引入适度的行为多样性，使得智能体既能有效协同，又能保持必要的差异性。这项研究正是基于这一理念，探索多智能体系统在复杂条件下协作的最佳方式。

本文工作

本研究提出一种具身智能与多元行为协同的集群控制方法（Embodied dual-policy fusion with behavioral diversity regulation, EDPF-BDR），构建了从感知到决策再到协作的完整闭环框架，使多智能体系统能够在动态、受限的环境中更高效地完成任务。论文设计了一个包含具身感知、双策略协同、多样性评估与策略融合的多模块系统。智能体不仅能实时感知局部环境，还能在群体协同策略与个体自适应策略之间动态切换，实现灵活性与协同性的平衡。

在动态、高密度的多智能体调度场景中，仅依赖单一策略往往难以兼顾个体的灵活应对与群体的高效协同。为此，本文提出了一种双策略协同架构，由异质策略网络与同质策略网络共同构成，旨在提升智能体的自主适应能力和全局协调效率。异质网络为每个智能体独立建模，网络参数不共享，使智能体能够根据其局部环境、历史轨迹和状态进行个性化决策。同质网络在全体智能体间共享参数，以全局状态作为输入，学习适用于整个多智能体系统的统一协作策略。