一、网络环境下基于Agent的多机器人协调与路径规划(论文文献综述)
陈昕叶[1](2020)在《动态环境下多机器人协同搜救任务分配方法研究》文中研究说明随着国家工业化和智能化的发展,无人车、无人机等智能机器人凭借着高性能、高灵活性、高精度、在危险区域执行任务不造成人员伤亡等特点,被广泛应用于各种抢险救灾现场、侦查打击等现场、以及日常的危险监视领域。其中,自主决策、协同任务分配技术作为机器人系统中至关重要的部分,吸引着众多学者展开大量的研究。灾后工作中最主要的任务是搜索任务与救援任务,二者的执行需要不同的资源类型,一般由不同的团队各自完成,而救援任务的分配与执行依赖于搜索任务对其的发现。首先,搜救工作的最终目标为提升救援效率,对两种任务的分配进行整体统筹优化是提升救援效率的关键,需要对二者根据统一的目标建模,并设计可以对整体统筹优化的任务分配模式;其次,真实环境的任务分配问题往往需要对多个优化目标进行优化,需要考虑如何高效的求解多目标优化问题;再次,灾后搜索与救援普遍在通信不稳定以及动态的环境下进行,其任务具有动态性和不确定性的特点,因此提高机器人系统的自主决策能力、适应环境变化的能力尤为重要。本文考虑以多机器人协同执行灾后的搜索与救援任务为背景,围绕其中涉及的任务分配问题的数学建模、体系结构构建和算法设计开展研究,主要研究内容如下:1)研究多机器人搜索与救援的任务模式。建立了多机器人搜索和救援任务分配的组合优化数学模型,设计了多机器人协同搜索与救援的任务分配模式,并建立了多机器人协同搜索与救援任务分配的分布式体系结构。针对现有的对搜索与救援场景下的多机器人任务分配的研究大多数仅单独考虑搜索任务分配或救援任务分配的问题,基于搜救行动的统一目标,对救援任务分配及搜索任务分配问题进行分析与建模。根据所做的分析与建模,设计了一种多机器人协同搜索与救援的任务分配模式,联合采用集中式的多机器人搜索任务分配方法、分布式的在线搜索任务分配方法与分布式的在线救援任务分配方法,进行搜索与救援的任务分配。最后,根据该任务分配模式建立了多机器人协同搜索与救援任务分配的分布式体系结构。2)研究集中式的多机器人搜索任务分配问题,提出了一种新算法:基于双目标多蚁群优化的文化基因算法。针对现有的对集中式的多机器人任务分配的研究大部分只对单目标(机器人行驶总距离或任务完成时间等)进行优化,以及现有的多目标优化方法计算复杂求解效率低的问题,所提出的算法对多蚁群优化算法进行了简化,降低了其计算复杂度;集成序列变邻域下降过程对多蚁群优化得到的最优解进行局部搜索,提高了算法的求解质量;设计了一种新颖的限制邻域的局部优化方法,提高了局部搜索的计算效率。仿真实验结果表明:所提出的算法与其它求解集中式的机器人搜索任务分配问题的算法相比,对双目标的优化提升了约20%,相比其他多目标优化方法的运算时间减少了约60%。3)研究动态环境下分布式的多机器人在线搜索任务分配问题,提出了一种新策略:基于动态图划分的贝叶斯学习策略。针对传统的为多机器人搜索路线规划的算法中容易陷入局部最优、难以适应动态环境下机器人状态变化、通信环境不稳定等问题,设计了一种新颖的分布式的动态图划分方法,利用图划分约束机器人的决策范围,克服了在线算法全局优化能力低、对通信环境稳定性要求高的问题;利用基于奖励的学习方法动态调整图划分,克服了传统基于图划分的方法无法适应动态环境变化的能力;利用改进的贝叶斯模型根据当前系统状态优化机器人的具体搜索路线,提高了算法的持续优化能力。仿真实验结果表明:所提出的能够在动态环境中为机器人规划稳定、高效的搜索路线,使机器人计算搜索路线的收敛速度相比其它在线算法提升约30%,在不同通信丢包率下机器人之间的冲突相比其它算法显着降低,获得的搜索路线质量相比其它算法显着提升。4)研究动态环境下分布式的多机器人救援任务分配问题,提出了一种新方法:基于集群优先的机器人动态分组的任务分配的方法。针对现有的分布式任务分配方法易于陷入局部最优,难以快速响应任务信息、机器人状态、通信网络状态等动态变化,从而无法及时获得高质量的解的问题,对当前常用于求解分布式任务分配问题的基于共识的拍卖算法进行改进。对算法的任务选择阶段进行改进,设计了一个集群优先策略,将任务对应机器人划分任务集群,区分不同机器人的对任务选择的优先级,通过减少机器人之间的选择冲突,提高了算法的收敛效率。基于该策略,设计了一个基于概率选择的任务选择方法,克服了该类算法容易陷入局部最优的问题。对共识阶段进行改进,设计了一种机器人动态分组的方法,解决了当前算法难以快速响应任务动态变化和无法避免在通信不稳定时在机器人之间产生任务冲突的问题。仿真实验结果表明:所提出的改进方法求解有截止时间的任务分配问题,相比原算法提升了约50%的收敛速度,及约20%的任务分配数量,并可以满足在机器人损毁、新增、新任务频繁新增等动态环境变化的情况对算法快速适应动态环境的能力的要求。5)基于所设计的多机器人协同搜索与救援的任务分配模式,及分布式体系结构,搭建了基于无人机的多机器人搜索与救援任务分配应用原型系统。在真实环境中对本文研究的多机器人协同搜索与救援任务分配模式及任务分配算法进行了实际的测试,实验结果验证了系统设计的可行性与正确性,表明本文研究满足实际搜救现场非确定性、动态环境的任务需求,具有一定应用价值。
徐东方[2](2020)在《多移动机器人系统协调规划与控制研究》文中指出当前我国的生产制造、物流运输等众多产业都在向现代化和智能化方向迅猛发展,对多移动机器人系统的应用需求也在不断攀升。与单移动机器人相比,多移动机器人系统具备更高的鲁棒性和执行能力,但相应的协调规划与控制方法也更加复杂。本文设计并改进了多移动机器人协调规划与控制方案,进一步增强了系统灵活性、稳定性和协调能力,对提升多移动机器人系统的工作性能和应用价值具有重要意义。根据多移动机器人系统应用需求,建立了混合式控制体系,并对移动机器人个体功能结构和整体通信体系进行了设计与搭建。采用栅格法构建环境地图坐标系,对机器人和目标任务间的空间属性与能力属性进行了分析,获得了系统路径代价、执行代价以及任务之间的耦合关系信息,根据执行能力和任务耦合关系改进蚁群算法,并基于代价损耗实现整体效能评价,由此建立了多移动机器人任务分配方案,在保证任务可执行性的同时提高了分配效率与均衡性。设计了全局与局部双层协调路径规划体系,并分析了全局路径规划的性能要求,结合路径组亲和度评价方法提出了改进的免疫协同进化算法,增强了规划过程中各机器人全局路径的协同性能,实现了更加高效、优质的多移动机器人全局协同路径规划。针对系统运行过程中出现的局部碰撞情况,采用动态窗口法及时进行规划调整,建立了移动机器人正、逆运动学模型,使局部路径规划能够准确进行,并基于优先级机制对局部路径协调方案进行了设计,利用全局路径信息改进了局部协调规划过程,根据优先级设定路径协调的次序和范围,在尽量维护全局路径质量的同时,实现了移动机器人灵活有序的局部协调避碰。根据混合式体系运行流程完成了协调规划控制系统的设计与开发,并搭建了硬件工作环境,依托软硬件试验平台实现了多移动机器人系统的协调规划与控制过程。结果表明,多移动机器人系统协调规划与控制方案具有良好的可行性,能够进行更加快速、均衡且合理的任务分配,在取得全局最优路径质量的同时,实现了移动机器人个体灵活有序地局部协调避碰,有效增强了系统的整体稳定性和灵活协调能力。
刘丽霞[3](2020)在《网络约束环境下非完整机器人系统一致性问题研究》文中认为随着近二十多年以来网络科学理论及其应用研究的迅速发展,网络环境下多机器人协调作为一种新的机器人应用形式日益引起国内外科学和工程许多领域专家学者的兴趣与关注,其中由非完整Lagrange动力学所描述多机器人系统的协调控制已成为十分活跃的研究课题之一。这主要是由于它能描述在复杂集成化生产进程中,诸如移动机器人,柔性机械臂和自动车辆等一大类物理及力学对象,其中灵活性、机动性、可靠性和可操作性是可期待甚至是必要的特征,因而所获结果有可能应用到诸如自动车辆制造,探月工程与载人航天和水下勘测与深空探测等实际工程问题关键技术的设计和实现。另一方面,网络约束环境下轮式移动机器人系统是一个呈现多层次、多结构和多尺度等高度非线性以及强耦合高维复杂动态系统,同时又具有明显的非完整和欠驱动动力学特性。相对于单轮式机器人诸如定点调节(Set-point regulation)、轨迹跟踪(Trajectory tracking)和路径规划(Path planning)等传统精准运动控制问题,在复杂网络约束环境下大规模协作非完整轮式机器人集群协调控制具有更大的挑战性。因此,研究以轮式移动机器人为载体的非完整Lagrange系统协调控制不仅从理论上具有非常重要的科学意义,而且从工程实践上也具有十分重要的应用价值。本文主要以网络约束环境下协作多机器人系统个体间通信交互的网络拓扑构型与信息融合过程中时滞和噪声两个核心要素为驱动,综合运用经典分析动力学和现代网络科学相结合的研究模式和技术手段,从多智能体分布式控制理论的角度出发,研究由非完整Lagrange系统所描述的轮式移动机器人系统协调分布式一致性跟踪的动力学与控制问题,主要内容可以概括为以下三个方面:一、网络化非完整移动机器人系统自适应一致性以表征代表性非完整和欠驱动特性通用两轮驱动小车(Two-wheel driven car)为对象,基于反步法(Back-stepping)与滑模控制法(Sliding mode con-trol)提出 了一个运动学控制器与动力学控制器相集成的协同一致性跟踪控制算法,并利用Lyapunov函数方法给出了此算法闭环系统稳定性的一个系统性分析框架。提出的自适应一致性算法一个显着特征是在控制策略中引入描述机器人个体间通信交互的网络拓扑结构,这与协作多机器人系统的实际结构和特征是一致的。最后对提出的自适应一致性算法进行数值模拟来验证控制方案的有效性,并进一步分析了不同的网络拓扑,网络耦合强度和网络连通度对非完整移动机器人系统在自适应一致性协调进程中非线性动力学响应。二、网络化非完整移动机器人系统实用一致性针对极坐标情形下具有输入扰动的轮式移动机器人系统,基于滑模控制法提出了一个由位置控制器与航向控制器相集成的实用一致性跟踪控制算法。发展的实用一致性跟踪控制方案充分利用了轮式机器人非完整与欠驱动特性来消除所设计滑模面的几何约束,从而实现了运动学和动力学两个层面控制器的有机整合。所获结果表明:发展的实用一致性跟踪控制策略即使退化到单个轮式机器人系统的情形,其跟踪控制性能仍然展示更好的稳定性,鲁棒性和有效性。最后通过具有典型网络拓扑和不同扰动输入情形的对比数值仿真实例进一步验证了提出实用一致性控制算法正确性。三、网络化非完整移动机器人系统随机一致性针对多机器人个体间通信交互过程中不可避免产生的时滞和噪声现象,通过适当引入描述机器人个体间局部通信交互网络拓扑的一个时变参考跟踪速度,使得在移动机器人运动学控制器能够合理地引入通讯时滞和输入时滞,提出了一个运动学与动力学相集成的均方一致性跟踪算法,并应用扩展随机时滞的Halanay不等式分别导出了确保相应控制算法稳定性通讯时滞和输入时滞上界的分析表达式。最后通过数值模拟证实了所获理论结果的正确性,并进一步讨论了所提出的随机一致性跟踪控制策略中通讯时滞和输入时滞的非线性效应。
李世维[4](2020)在《基于无线传感器网络的移动机器人编队关键技术研究》文中认为复杂工作环境下将移动多机器人控制方法与传感器网络技术相结合是移动多机器人控制研究中的一项前沿技术,这项技术对移动多机器人控制中的定位、路径规划、队形控制等方面具有重要意义。传统方法下移动多机器人与外部导航设备分离时,通常使用惯性导航方式继续跟踪机器人,然而在惯性导航工作方式下,随着时间推移,所积累的导航误差、里程计误差均会限制惯性导航方法在移动多机器人控制中的使用。基于无线传感器网络的多机器人控制方法可以充分利用传感器网络的自组织、智能化、多源等特性,对移动多机器人的工作位置、障碍物进行感知与识别,进而提高移动多机器人系统在封闭、强噪声等复杂工作条件下的鲁棒性、普适性及抗干扰能力。本文基于传统移动多机器人控制理论,对现阶段移动多机器人控制系统的导航、路径规划及编队控制理论进行了深入研究,系统分析了现阶段移动多机器人控制方法存在的问题,提出了将无线传感器网络与移动多机器人控制方法相结合的新方向。本文围绕基于无线传感器网络的移动机器人控制关键技术展开了以下三个方面的研究:(1)剖析了现有全球定位系统/惯性导航定位系统存在的外部信号更新速度慢、易丢失、无全球定位系统时惯性导航积分计算累积误差大的问题,提出了一种基于噪声平滑矫正的改进加权质心定位/惯性导航松散组合位置解算方法。在所提解算方法中,提出利用自身噪声功率较小的改进加权质心定位信息平滑噪声较大的惯性导航航向信息,通过预测加矫正的方法实现上一时刻位置解算状态对当前位置解算状态进行估计;当前位置解算状态的观测与上一时刻位置解算状态进行比较;迭代出组合位置解算系统的最优状态值。在所提算法中,惯性导航与改进加权质心位置解算方法以松散组合方式独立工作,通过卡尔曼滤波算法将不同来源的传感器信息进行融合来实现组合定位的最优估计,实现了无线传感器网络为惯性导航系统提供绝对位置信息的设计目标。实验结果表明,无论是在定位精度、还是噪声方面,采用网络环境下改进加权质心定位/惯性导航方式都要优于改进加权质心定位或惯性导航方法,体现了绝对定位和相对定位的优势互补并在静态工作环境下提供高精度坐标的能力。(2)针对传统基于空间知识模型路径规划算法难以在大范围、静态、无地图工作环境下做出综合性、正确决策;并由此带来路径规划结果易收敛到局部极小值进而导致运动死锁状况发生的问题,提出了一种网络环境下基于全连接前馈神经网络的跨域迁移寻优路径规划算法。该算法首先在无线传感器网络环境下建立全局工作区域坐标系;其次,借助全连接前馈神经网络的快速分类能力,建立起基于全连接前馈神经网络的避碰感知器,将障碍约束问题跨域迁移为一个碰撞惩罚函数解算问题;再其次,通过建立路径能量函数,将路径约束问题转化为路径解算问题并进行求解;最后,采用改进粒子群优化方法对所建立路径能量函数进行寻优,通过迭代方法计算出机器人能够逃离陷阱状态的最优路径。实验结果表明,与传统基于空间知识模型的路径规划方法相比较,所提出跨域迁移路径规划算法在大范围、静态工作环境下,缩小搜索路径、提高生成路径平滑度、提高收敛速度方面有显着效果。(3)针对标准Leader-Follower编队控制方法存在的控制方法单一、抗干扰能力差、构形速度慢等问题,提出了一种网络环境下基于信息反馈方法的改进Leader-Follower编队算法。该算法首先在基于无线传感器网络信息拓扑与通信拓扑一致的条件下建立起非线性增量移动机器人运动学模型,将编队坐标位置属性解耦为二阶模型;其次,算法对控制器和跟踪算法重新设计来保证队形控制方程在网络环境下正常工作;最后,通过Lyapunov方法建立起编队控制稳定验证模型并验证了所提出算法的稳定性。所提出基于信息反馈的LeaderFollower算法相比标准Leader-Follower算法在机器人计算任务分配上更加灵活;克服了传统Leader-Follower算法依靠距离传感器获取数据方式单一性所带来的弊端,在队形控制方面表现出更高的一致性和灵活性。实验结果表明,与标准LeaderFollower编队控制方法相比较,所提算法稳定性更高、抗扰动能力更强、构形时间更短,方法切实可行。
邰若晨[5](2019)在《仓储物流环境中的多机器人路径规划算法》文中指出随着电商的逐渐发展与成熟,仓储物流成为人们日益关注的重要环节。为了提高拣选效率以及节省人力和物力,使用多机器人进行仓库中的货物搬运工作明显比人工搬运具有更大优势。因此,高效的多机器人路径规划算法对于提高仓储物流系统的工作效率起到了至关重要的作用。本文首先针对仓储物流系统中多机器人路径规划问题提出了基于时间窗的动态k最短路径规划算法,解决了传统基于时间窗的路径规划算法中实时性以及系统效率不高的问题;在此基础上,本文又考虑了机器人存在运动延迟等扰动因素,提出了基于动态优先级的局部路径规划算法,相比于前人算法,本文的算法达到了提高系统效率和保证计算实时性的效果。针对传统多机器人路径规划算法效率、实时性不高的问题,本文设计了一种基于时间窗的动态k最短路径规划算法。首先,从仓储环境出发,建立了仓储系统的数学模型,并结合仓储系统的结构化特点,设计了仓储环境中的新型地图元素。针对传统基于时间窗的方法中实时性不高的问题,本文利用设计的新型地图元素的空间分布关系,提出了一种高效的时间窗插入方法来提高多机器人路径规划算法的实时性。针对前人路径规划算法中会出现的死锁问题,本文设计了五种时间窗操作算子以保证多机器人的路径之间无死锁与冲突。进一步地,针对前人基于时间窗的方法中系统效率不高的问题,本文利用k最短路径规划算法和基于时间窗的多机器人动态路径规划算法对路径进行优化求解。仿真结果验证了所提算法的有效性、实时性与可扩展性,且相比于前人方法,系统的效率得到了提升。针对仓储系统中多机器人的运动延迟现象会导致系统崩溃的问题以及前人方法无法解决提高系统效率和保证算法实时性之间矛盾的问题,本文设计了一种当机器人出现运动延迟情况时的基于动态优先级的局部路径规划算法。该算法采用基于动态优先级的算法框架,针对前人算法中多机器人路径之间会出现的死锁问题,本文通过判别受影响机器人以及引入局部延迟区域,结合最短路径规划算法生成局部可调整路径,并利用基于时间窗的局部路径规划算法为多机器人生成无死锁无冲突的路径。其中,针对前人基于同伦空间的路径规划算法中系统效率降低的问题,本文通过引入局部延迟区域并规划局部可调整路径保证了多机器人系统的效率。针对重规划算法中高计算复杂度的问题,本文设计了基于时间窗的局部路径规划算法并引入首末时间窗规划原则保证了算法的实时性。仿真结果验证了系统的效率相较于前人方法得到了提高,且算法的实时性得到了保证。
李国梁[6](2017)在《通信约束下分布式对地观测卫星系统在线协同任务调度模型与算法》文中研究说明当前对地观测需求大幅度增加,对地观测任务越来越复杂,随时会面对突发应急情况和观测环境变化,分布式对地观测卫星系统的在线协同以其星上处理、星上调度规划、星上协同为特征,充分利用系统自身的分布性和自主性,实现针对突发应急情况的快速响应、精细调度和协同观测,以提升整个系统的观测效能。论文针对通信约束下分布式对地观测卫星系统在线协同任务调度问题,主要研究了在线协同架构的设计、单星在线任务调度机制以及通信约束下的多星协同任务调度模型与算法,以满足实际应用的需求。全文主要研究成果概括如下:(1)分析并设计了面向分布式对地观测卫星系统在线协同的集中-分布式架构和分散式架构。在梳理多Agent系统协同架构与多星通用架构的基础上,明确多星在线协同所面临的实际约束、应用需求以及架构设计要点,分别设计了集中-分布式协同架构和分散式协同架构,并对架构内各Agent的智能水平与其自主功能配置,以及各Agent之间的信息流交互进行详细设计,从而为后续相应的算法机制设计奠定了基础。(2)构建了基于修订式和渐进式方法的单星在线任务调度机制。面向通信约束、计算能力约束以及动态应急任务到达,卫星网络环境下的单星在线调度问题求解分为两个决策子问题:一是何时调度,二是如何调度。针对何时调度,提出基于时域滚动与应急任务累积阈值的调度时刻混合决策机制,而针对如何调度,构建混合整数线性规划(MILP)模型,根据已提出的调度时刻混合决策机制,分别采用渐进式方法中的完全重调度策略和修订式方法中的调度计划修复策略,提出两种启发式算法。实验结果而言,对于何时调度,从进入调度求解的应急任务比例和总任务收益等性能指标上,调度时刻混合决策机制明显优于完全周期性调度机制;对于如何调度,所提出的两种算法均优于近期公开发表的多种方法。(3)针对通信约束下不同的在线协同架构,提出了多种在线协同算法。分析描述了通信约束下的同构多星在线协同调度问题,特别是对通信约束进行表述,定义了通信时间窗口、批次任务的时间可用性和应急任务的时间可用性等概念,进而构建每批应急任务到达时的子问题MILP模型;面向集中-分布式协同架构,提出了两种基于市场机制的在线协同算法:单项任务下的合同网协议算法SI-CNP和批次任务下的合同网协议算法BA-CNP;面向分散式协同架构,提出了基于同步通信的改进一致性束算法m-CBBA和基于异步通信的改进异步一致性束算法m-ACBBA。实验结果表明,当系统中的通信成本代价高时,m-CBBA算法可在系统总收益和通信次数之间取得平衡,而当系统的通信成本低时,m-ACBBA算法是获得高系统总收益和高应急任务调度成功比例的最佳选择。(4)系统地研究并求解了通信约束下面向复合任务的异构多星在线协同调度问题。首先对复合任务及其子任务约束进行分析描述,具体分为可一次性调度的前摄复合任务和需渐次性调度的渐次复合任务;然后对子问题划分,分别构建MILP模型;最后针对分散式协同架构,构建了基于通用部分全局规划GPGP的异构多星在线协同机制,对已提出的在线协同调度算法进行相应的改进。实验结果表明当通信成本高时,尽可能多搭载成像载荷更有利;要提高复合任务的任务完成度,需保证足够高的收益系数。
金露[7](2013)在《基于社区感知网络的多机器人系统Q-学习与运动控制研究》文中研究指明近年来,基于网络的多机器人系统领域研究取得了很好的成果,但从整体来看基于网络环境下的多机器人系统研究仍然面临许多亟需解决的问题,主要包括:如何应对实际环境复杂性所带来的静态节点无法全部连通问题;如何处理网络信息传输带来的时延、噪声、数据包丢失等困扰;如何增强网络化环境下机器人的环境理解能力;在网络化系统的框架下,如何高效的实现多机器人之间的运动控制等。增强学习是多机器人系统通过与外界环境交互的一类有效的机器学习方法。Q-学习作为增强学习的一种典型算法,由于其不用建立环境模型,通过试错法与环境的不断交互获得策略的改进和完善,最终实现对机器人的运动控制。通过在环境中部署静态节点,构建可相互连通的静态节点群组形成一个社区,通过无线通信方式形成多跳的社区感知网络。针对维数灾和学习不充分等问题,本硕士论文采用ε-半径近邻分类方法对机器人的历史状态进行分类和降维,同时将信息交互与共享等方法有机结合,提高机器人的Q-学习效率。最后,考虑学习信息在静态节点社区感知网络传输存在时滞特性,将拓扑网络的时滞假设为等时滞和异时滞两种情况,分别讨论多机器人系统在两种时滞社区感知网络环境下的Q-学习算法与运动控制。主要研究工作如下:第一,针对基于网络的多机器人系统存在的不足,给出了社区感知网络架构。利用静态智能节点提供社区内其他机器人的历史学习信息进行综合决策进而加快自身学习,提出了一种改进的多机器人Q-学习算法实现对机器人的运动控制。第二,针对社区感知网络环境下的多机器人强化学习中存在的维数灾和对社区网络内智能节点提供的其他机器人的历史信息学习不充分等问题,提出一种在线ε-半径近邻状态分类方法,对机器人历史状态进行实时的降维分类;同时利用社区近邻集更充分的学习其他机器人的历史信息;最后分析了Q值矩阵收敛性问题。第三,针对社区网络感知环境下机器人之间的信息交互的问题,通过融合社区网络内的机器人的学习信息,提出社区信息共享机制及社区Q值表更新规则,从而减小网络计算量和复杂度。同时考虑到学习信息在社区网络内的传输存在时滞特性,给出基于等时延的社区网络Q-学习算法更新规则,最后通过实验实现了对机器人实时的运动控制。第四,在社区感知网络环境下,考虑信息在静态感知节点间传输的异时滞特性,定义且计算社区拓扑网络的时延矩阵,针对多机器人编队行为的一致性任务要求,设计基于行为一致性的奖赏函数,提出基于异时滞社区网络的多机器人行为一致性Q-学习算法,实现多机器人在异时滞社区网络感知环境下的行为一致性控制。
赵利辉[8](2008)在《基于多Agent机器人系统合作与协调技术研究》文中提出本文从多机器人系统的研究现状出发,研究了多机器人系统的特点及其体系结构,详细介绍了当前多机器人研究领域的众多令人瞩目的创新研究成果,并重点分析了基于MAS的多机器人系统协调与合作领域的多机器人的障碍规避和路径规划方案,主要工作包括:(1)提出并实现了多机器人系统任务级的协作与运动级的协调。对于任务级的协作,首先针对静态任务分配问题提出了一种解决小规模任务分配问题的方法,然后针对动态任务分配问题设计了一种适用于多机器人系统的分布式任务分配机制。对于运动级的协调,采用了“全局规划——局部修正”的路径规划结构,设计了一种基于预测的冲突消解策略作为了局部规划方法。(2)使用Visual C++6.0对单个机器人和多机器人静态障碍环境路径规划和障碍规避进行了仿真实验研究。(3)实验结果表明,任务分配方法能够满足静态任务分配的实时性与最优性要求,以及动态任务分配的自主性与鲁棒性要求,冲突消解方法具有较高的协调性,基于强化学习的避碰策略能够有效地实现机器人的自主规划并提高了其对环境的适应能力。
殷炳叶[9](2007)在《基于MAS的多机器人路径规划研究》文中进行了进一步梳理由于路径规划问题是多机器人合理高效地执行任务的前提,它对提高机器人的工作效率至关重要。如何选择合理甚至最佳的路径是非常重要的研究课题。多机器人路径规划是以多机器人系统为对象,在同一工作空间中为每一个机器人找到一条路径,并保证每一时刻机器人与机器人之间无碰撞,机器人与环境障碍物无碰撞。本文的研究正是基于多智能体理论(MAS)的多机器人路径规划技术。本文首先深入分析和研究了多机器人系统、多智能体理论的特点及其发展现状,在此基础上改进了MAS路径规划模型,并详细说明了每一模块的内容。之后又对机器人的几种热点路径规划方法做了分析研究,总结和归纳它们的优缺点。最后,在针对多机器人系统的特点上,对基于行为的多机器人避碰规划与基于协商和意愿强度的避碰规划方法进行了分析研究,并给予实验分析说明。在躲避障碍物行为设计中提出了基于改进人工势场法的避碰方法。该方法首先突出运动方向上正前方的障碍物,改变机器人对左右两边障碍物的逼近程度,然后在传统的单一固定人工势场的基础上对机器人增加旋转力,使有碰撞危险的机器人左转(或右转),避免了避障死锁和浪费路径等问题。并在IR-SDS系统上进行单个机器人和多个机器人的路径规划的仿真实验和分析,证明了该方法的有效性。
唐秋华[10](2005)在《分布式虚拟环境建模研究》文中进行了进一步梳理虚拟环境(VE,Virtual Environment),又称为灵境,是以计算机技术为核心、利用现代高科技技术生成的集视觉、听觉、触觉于一体的,具有空间和时间特性的数字化多维信息空间,是虚拟现实(VR,Virtual Reality)技术的具体体现。虚拟环境,可以是当前并不存在的环境,是对人们实际工作的计算机预演;可以是人们由于时间、空间和体力、能力所限不能到达的环境,便于人们对客观事物生动、直观、形象、具体地进行研究;还能替代耗资巨大的现实环境,节约时间或空间,降低成本。总之,在虚拟环境中,人们可以自然地和虚拟环境中的客体进行交互,相互影响,从而产生亲临现场的感受和体验。故虚拟现实基于现实,又可超越现实、智能现实、预测将来。 本文侧重于分布式虚拟环境建模的研究,系统性研究了面向分布式虚拟支撑环境的物理建模机制、通讯机制、时间同步机制等方面的关键技术、理论和方法,实现了建模工具、资源的互操作能力和可重用性,体现出了分布、交互、并发、协同的性能,并在此基础上,针对特定应用建立虚拟环境分析模型,开发了应用系统,在公司和企业进行了实际应用。主要成果和创新点有: (1)本文研究了将三维CAD模型转换为虚拟环境中兼具几何准确性、形象真实性的静态模型和可操作动态模型的策略和理论,并用渐开线圆柱齿轮的虚拟设计实例加以说明和验证。对于CAD/CAPP/CAM走向虚拟现实研究方法,大量存在的三维模型向虚拟环境的转换是必然的一步,本文中将CAD模型转换成虚拟环境模型的工作具有显明的实用价值。 (2)本文在基于图像和基于几何的虚拟环境建模方法基础上,以室内设计为对象,解决了根据已有实物图片拟实以虚、构造可虚拟浏览的二维实物全景和根据未知实物建模拟虚以实、生成可漫游的三维虚拟环境两种室内虚拟环境生成技术。 (3)基于虚拟环境的需求,本文研究了虚拟环境中所需的分布式处理技术,包含分布式虚拟环境的网络体系和通讯协议,并着重说明了数据传输机制和智能化虚拟环境所需Agent的结构,最后基于VRML和Java实现了一个分布式虚拟装饰实例。
二、网络环境下基于Agent的多机器人协调与路径规划(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、网络环境下基于Agent的多机器人协调与路径规划(论文提纲范文)
(1)动态环境下多机器人协同搜救任务分配方法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究意义 |
1.2 国内外研究现状 |
1.2.1 灾后搜救工作部署方法研究现状 |
1.2.2 多机器人任务分配方法研究现状 |
1.2.3 多机器人巡逻方法研究现状 |
1.3 相关研究存在的问题 |
1.4 研究内容和主要创新工作 |
1.5 论文组织架构 |
第二章 多机器人协同搜索与救援任务分配分析与建模 |
2.1 引言 |
2.2 多机器人任务分配分析 |
2.2.1 多机器人任务分配类型研究 |
2.2.2 搜索与救援任务场景分析 |
2.2.3 任务约束条件分析 |
2.3 搜索与救援场景下多机器人任务分配建模 |
2.3.1 多机器人救援任务分配模型 |
2.3.2 多机器人搜索任务分配模型 |
2.4 多机器人协同搜索与救援的任务分配模式与体系结构 |
2.4.1 多机器人系统控制的体系结构分析 |
2.4.2 多机器人协同搜索与救援的分布式任务分配模式与体系结构 |
2.5 本章小结 |
第三章 双优化目标的多机器人搜索任务分配 |
3.1 引言 |
3.2 多目标优化问题相关定义 |
3.3 多机器人搜索任务分配的蚁群优化算法改进 |
3.3.1 搜索任务分配方案的构建 |
3.3.2 信息素更新规则 |
3.4 基于双目标多蚁群优化的文化基因算法 |
3.4.1 简化的多蚁群优化算法 |
3.4.2 Pareto最优解在限制邻域的局部优化 |
3.4.3 序列变邻域下降与蚁群优化的集成 |
3.4.4 计算复杂度分析 |
3.5 仿真实验结果与分析 |
3.5.1 实验一:机器人从同一地点出发 |
3.5.2 实验二:机器人从不同地点出发 |
3.6 本章小结 |
第四章 动态环境下多机器人巡逻的在线搜索任务分配方法 |
4.1 引言 |
4.2 基于图论的多机器人巡逻问题 |
4.3 基于动态图划分的贝叶斯学习策略 |
4.3.1 策略的基本框架 |
4.3.2 基于奖励机制的动态图划分 |
4.3.3 多机器人巡逻的贝叶斯模型改进 |
4.3.4 计算复杂度分析 |
4.4 仿真实验结果与分析 |
4.4.1 参数σ和mc对算法性能的影响 |
4.4.2 不同算法性能的比较 |
4.4.3 随时间变化的算法效果分析 |
4.4.4 不同机器人初始位置对算法性能的影响 |
4.4.5 动态环境仿真–不可靠的通信环境对算法性能的影响 |
4.4.6 动态环境仿真–机器人数量变化对算法性能的影响 |
4.5 本章小结 |
第五章 动态环境下有截止时间的多机器人救援任务分配 |
5.1 引言 |
5.2 基于共识的拍卖算法的任务分配方法介绍 |
5.3 基于共识的拍卖算法的任务选择阶段改进 |
5.3.1 分解任务选择阶段的集群优先策略 |
5.3.2 基于概率选择的任务选择方法 |
5.3.3 收敛性分析 |
5.3.4 计算复杂度分析 |
5.4 基于共识的拍卖算法的共识阶段改进 |
5.4.1 块共享策略 |
5.4.2 基于集群优先的机器人动态分组的任务分配 |
5.4.3 动态环境下的任务分配 |
5.4.4 机器人之间的通信与信息同步 |
5.5 仿真实验结果与分析 |
5.5.1 较小规模(任务数量)问题的仿真结果与分析 |
5.5.2 较大规模(任务数量)问题的仿真结果与分析 |
5.5.3 动态环境下问题的仿真结果与分析 |
5.6 本章小结 |
第六章 多机器人协同搜索与救援任务分配应用原型系统构建及验证 |
6.1 基于无人机的多机器人协同搜索与救援任务分配应用原型系统 |
6.1.1 无人机的运动控制 |
6.1.2 多无人机的地面监控 |
6.2 基于多无人机的现场搜索与救援实验设计 |
6.3 基于多无人机的现场搜索与救援实验与分析 |
6.4 本章小结 |
结论与展望 |
参考文献 |
攻读博士学位期间取得的研究成果 |
致谢 |
附件 |
(2)多移动机器人系统协调规划与控制研究(论文提纲范文)
摘要 |
Abstract |
变量注释表 |
1 绪论 |
1.1 课题研究背景 |
1.2 研究目的与意义 |
1.3 国内外研究现状 |
1.4 存在的主要问题 |
1.5 主要研究内容 |
2 协调控制总体方案设计 |
2.1 引言 |
2.2 协调控制体系的搭建 |
2.3 移动机器人个体结构设计 |
2.4 系统网络通信的实现 |
2.5 本章小结 |
3 均衡协调任务分配研究 |
3.1 引言 |
3.2 建立环境地图坐标系 |
3.3 基于属性的任务代价描述 |
3.4 均衡任务分配方案设计 |
3.5 任务分配规划效果分析 |
3.6 本章小结 |
4 全局协同路径规划研究 |
4.1 引言 |
4.2 全局路径规划方法研究 |
4.3 建立免疫协同进化机制 |
4.4 协同路径规划方案改进 |
4.5 全局协同路径规划分析 |
4.6 本章小结 |
5 局部协调规划控制研究 |
5.1 引言 |
5.2 局部路径规划方法选择 |
5.3 移动机器人运动学分析 |
5.4 协调规划控制机制设计 |
5.5 局部协调规划仿真分析 |
5.6 本章小结 |
6 协调规划与控制系统实现 |
6.1 引言 |
6.2 搭建系统工作环境 |
6.3 任务分配规划验证 |
6.4 双层协调控制实现 |
6.5 本章小结 |
7 总结与展望 |
7.1 全文内容总结 |
7.2 研究工作展望 |
参考文献 |
作者简历 |
致谢 |
学位论文数据集 |
(3)网络约束环境下非完整机器人系统一致性问题研究(论文提纲范文)
摘要 |
ABSTRACT |
符号及释义对照表 |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 本文研究工作 |
第二章 预备知识 |
2.1 代数图论 |
2.2 动力系统稳定性理论 |
2.2.1 基本定理 |
2.2.2 实用稳定性 |
2.2.3 随机稳定性 |
2.3 轮式移动机器人系统 |
2.3.1 非完整系统 |
2.3.2 运动学模型 |
2.3.3 动力学模型 |
2.4 本章小结 |
第三章 网络化非完整移动机器人系统自适应一致性 |
3.1 引言 |
3.2 问题描述 |
3.3 控制目标 |
3.4 自适应一致性算法 |
3.4.1 控制器设计 |
3.4.2 收敛性分析 |
3.5 仿真实例 |
3.5.1 一致性切换跟踪 |
3.5.2 网络拓扑效应 |
3.6 本章小结 |
第四章 网络化非完整移动机器人系统实用一致性 |
4.1 引言 |
4.2 问题描述 |
4.3 控制目标 |
4.4 实用一致性跟踪策略 |
4.4.1 控制器设计 |
4.4.2 收敛性分析 |
4.5 数值仿真 |
4.5.1 实用一致性跟踪 |
4.5.2 网络拓扑效应 |
4.5.3 不同输入扰动情形 |
4.6 本章小结 |
第五章 网络化非完整移动机器人系统随机一致性 |
5.1 引言 |
5.2 问题描述 |
5.3 控制目标 |
5.4 随机一致性 |
5.4.1 输入时滞情形 |
5.4.2 通讯时滞情形 |
5.5 仿真实例 |
5.5.1 输入时滞效应 |
5.5.2 通讯时滞效应 |
5.5.3 控制方案的随机效应 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读博士学位期间完成的工作 |
致谢 |
(4)基于无线传感器网络的移动机器人编队关键技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究的意义与背景 |
1.2 研究现状 |
1.2.1 网络环境下移动机器人定位研究现状 |
1.2.2 网络环境下移动机器人路径规划研究现状 |
1.2.3 网络环境下多机器人编队控制研究现状 |
1.3 网络环境下移动多机器人控制方法存在的主要问题 |
1.4 主要研究内容与组织结构 |
第2章 网络环境下移动机器人组合定位算法研究 |
2.1 引言 |
2.2 网络环境下移动机器人控制框架 |
2.3 松散耦合方式下WSN/INS组合定位方法 |
2.3.1 网络环境下ICOG位置解算方法的建立 |
2.3.2 惯性导航系统坐标系的建立 |
2.3.3 基于噪声平滑矫正算法的组合位置解算方法的建立 |
2.4 组合定位算法仿真分析 |
2.4.1 无线传感器网络定位方法误差分析 |
2.4.2 无线传感器网络定位方法连通度分析 |
2.4.3 组合定位系统定位仿真误差分析 |
2.4.4 工作区域变化对定位精度影响比较分析 |
2.5 本章小结 |
第3章 网络环境下移动机器人路径规划算法研究 |
3.1 引言 |
3.2 基于粒子群优化FNN神经网络的机器人路径规划方法 |
3.2.1 网络环境下路径规划工作环境建模 |
3.2.2 全连接前馈神经网络感知器结构模型的建立 |
3.2.3 粒子群算法寻优机理分析 |
3.2.4 碰撞罚函数与能量函数的建立 |
3.2.5 网络环境下二维路径规划算法模型 |
3.3 实验结果与性能分析 |
3.3.1 粒子群算法对目标函数路径寻优实验分析 |
3.3.2 网络环境下所提出路径规划算法软件环境下对比分析 |
3.3.3 网络环境下所提出路径规划算法实物环境下对比分析 |
3.4 本章小结 |
第4章 网络环境下移动机器人编队控制算法研究 |
4.1 引言 |
4.2 建立多移动机器人运动学模型 |
4.2.1 非线性增量移动机器人运动学模型的建立 |
4.2.2 基于Lyapunov方法的稳定验证模型的建立 |
4.3 基于网络的Leader-Follower控制器设计 |
4.3.1 Leader-Follower编队算法分析 |
4.3.2 改进的Leader-Follower编队模型设计 |
4.3.3 全局框架下队形保持算法设计 |
4.3.4 改进的Leader-Follower控制方程的建立 |
4.4 改进的Leader-Follower编队控制算法仿真及实验分析 |
4.4.1 锚节点数量与编队队形形成的关系 |
4.4.2 改进的Leader-Follower编队控制算法软件仿真与分析 |
4.4.3 改进的Leader-Follower编队控制编队算法实物仿真分析 |
4.5 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文及其它成果 |
致谢 |
个人简历 |
(5)仓储物流环境中的多机器人路径规划算法(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 仓储物流系统中多机器人路径规划算法研究现状与挑战 |
1.3 本文研究内容 |
1.4 论文结构 |
第二章 多机器人系统建模与路径规划算法框架 |
2.1 问题描述与建模 |
2.1.1 研究问题与假设条件 |
2.1.2 环境地图及地图元素建模 |
2.1.3 任务建模 |
2.1.4 搬运机器人运动建模 |
2.2 多机器人路径规划算法框架 |
2.2.1 多机器人调度系统简介 |
2.2.2 基于时间窗的路径规划算法 |
2.2.3 存在运动延迟下的多机器人路径规划算法框架 |
2.3 本章小结 |
第三章 基于时间窗的动态k最短路径规划算法 |
3.1 算法介绍 |
3.1.1 时间窗初始化 |
3.1.2 时间窗插入 |
3.1.3 时间窗连接 |
3.1.4 时间窗重叠检测 |
3.1.5 时间窗重插入 |
3.2 算法性能分析 |
3.2.1 规划路径分析 |
3.2.2 总任务完成时间分析 |
3.2.3 计算时间分析 |
3.3 仿真与结果分析 |
3.3.1 参数设置 |
3.3.2 仿真与结果分析 |
3.4 本章小结 |
第四章 基于动态优先级的局部路径规划算法 |
4.1 算法介绍 |
4.1.1 受影响机器人判别 |
4.1.2 受影响机器人优先级计算 |
4.1.3 延迟区域生成 |
4.1.4 局部可调整路径搜索 |
4.1.5 带有时间窗限制的局部路径规划 |
4.1.6 临时停靠站点规划 |
4.1.7 规划结果评估 |
4.2 算法性能分析 |
4.2.1 规划路径分析 |
4.2.2 总任务完成时间分析 |
4.2.3 计算时间分析 |
4.3 仿真与结果分析 |
4.3.1 参数设置 |
4.3.2 仿真与结果分析 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 全文总结 |
5.2 研究展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
攻读学位期间参与的项目 |
攻读学位期间申请的专利 |
(6)通信约束下分布式对地观测卫星系统在线协同任务调度模型与算法(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 分布式对地观测卫星系统 |
1.2.2 单星自主任务调度规划研究现状 |
1.2.3 多星协同任务调度规划研究现状 |
1.2.4 多机器人系统协同任务分配研究现状 |
1.2.5 当前研究存在的问题与解决思路 |
1.3 论文组织结构与创新点 |
1.3.1 论文主要内容与组织结构 |
1.3.2 论文创新点 |
第二章 基于多Agent系统的分布式对地观测卫星系统在线协同架构设计 |
2.1 Agent与多Agent系统 |
2.1.1 Agent |
2.1.2 多Agent系统 |
2.1.3 多Agent系统协同架构 |
2.2 通信约束下基于多Agent系统的在线协同架构分析与设计 |
2.2.1 约束与需求分析 |
2.2.2 协同架构设计要点分析 |
2.2.3 集中-分布式多星协同架构 |
2.2.4 分散式多星协同架构 |
2.3 本章小结 |
第三章 基于修订式和渐进式方法的单星在线任务调度机制 |
3.1 问题描述 |
3.2 调度时刻混合决策机制 |
3.3 调度模型与算法设计 |
3.3.1 模型构建 |
3.3.2 求解策略 |
3.3.3 启发式算法 |
3.4 实验设计与结果 |
3.4.1 实验设计 |
3.4.2 针对何时调度的结果分析 |
3.4.3 针对如何调度的结果分析 |
3.5 本章小结 |
第四章 通信约束下面向简单任务的同构多星在线协同 |
4.1 问题描述与数学模型 |
4.1.1 问题描述 |
4.1.2 数学模型 |
4.2 面向集中-分布式架构的在线协同算法 |
4.2.1 单项任务下的合同网协议算法 |
4.2.2 批次任务下的合同网协议算法 |
4.3 面向分散式架构的在线协同算法 |
4.3.1 基于同步通信的改进一致性束算法 |
4.3.2 基于异步通信的改进异步一致性束算法 |
4.4 应用实例 |
4.4.1 实例设计 |
4.4.2 结果分析 |
4.5 本章小结 |
第五章 通信约束下面向复合任务的异构多星在线协同 |
5.1 问题描述 |
5.1.1 前摄复合任务 |
5.1.2 渐次复合任务 |
5.2 数学模型 |
5.3 基于GPGP的异构多星在线协同机制 |
5.4 应用实例 |
5.4.1 实例设计 |
5.4.2 面向前摄复合任务的实例结果分析 |
5.4.3 面向渐次复合任务的实例结果分析 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 论文工作总结 |
6.2 进一步工作展望 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
作者在学期间参加的科研项目 |
(7)基于社区感知网络的多机器人系统Q-学习与运动控制研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 引言 |
1.2 网络机器人的研究现状 |
1.3 社区感知网络的提出 |
1.4 信息交互 |
1.5 机器人强化学习算法研究现状 |
1.5.1 增强学习基本思想 |
1.5.2 相关算法介绍 |
1.5.3 增强学习在多机器人系统中的应用 |
1.5.4 小结 |
1.6 本文的主要工作 |
1.7 本文的组织结构 |
第二章 基于社区感知网络的多机器人Q-学习与运动控制 |
2.1 引言 |
2.2 社区网络架构 |
2.3 社区网络多机器人的运动控制研究 |
2.3.1 基于社区网络的多机器人Q-学习 |
2.3.2 动作选择策略 |
2.3.3 算法步骤 |
2.4 仿真实验及结果分析 |
2.4.1 实验场景和机器人参数设置 |
2.4.2 两种算法比较及运动控制实验 |
2.5 结论 |
第三章 基于社区网络的多机器人在线ε-半径近邻Q-学习 |
3.1 引言 |
3.2 社区环境感知描述 |
3.3 基于社区感知网络的多机器人ε-半径近邻Q-学习 |
3.3.1 在线ε-半径近邻的状态分类方法 |
3.3.2 算法描述 |
3.4 实验验证 |
3.4.1 实验环境及参数设置 |
3.4.2 矩阵范数分析 |
3.4.3 三种算法比较及运动控制实验 |
3.5 结论 |
第四章 基于等时延社区感知网络的多机器人Q-学习与运动控制 |
4.1 引言 |
4.2 等时滞社区网络架构描述 |
4.3 基于等时滞社区信息共享机制的实现 |
4.3.1 社区信息共享机制架构 |
4.3.2 社区Q值表动态更新规则 |
4.4 基于等时滞社区网络的Q-学习 |
4.5 仿真实验 |
4.5.1 机器人及社区网络参数设置 |
4.5.2 三种算法的比较实验 |
4.5.3 算法收敛速度验证实验 |
4.6 结论 |
第五章 基于异时滞社区感知网络的多机器人行为一致性Q-学习与运动控制 |
5.1 引言 |
5.2 异时滞网络架构 |
5.2.1 社区网络描述 |
5.2.2 拓扑网络的形成 |
5.2.3 拓扑网络的时滞描述 |
5.3 编队控制策略 |
5.3.1 领航机器人动态切换策略 |
5.3.2 基于行为一致性的奖赏函数的设计 |
5.4 基于异时滞拓扑网络的多机器人行为一致性Q-学习 |
5.5 仿真实验 |
5.5.1 多机器人系统的社区参数介绍 |
5.5.2 算法仿真实验的实现 |
5.5.3 实验结果分析 |
5.6 结论 |
第六章 总结和展望 |
6.1 总结 |
6.2 进一步的研究工作 |
参考文献 |
致谢 |
附录 |
(8)基于多Agent机器人系统合作与协调技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 引言 |
1.2 基于MAS 的多机器人系统 |
1.2.1 多机器人系统的特点与优势 |
1.2.2 多机器人系统的主要研究内容 |
1.2.3 多机器人系统的研究现状 |
1.3 多机器人的运动路径规划研究现状 |
1.4 多机器人系统仿真平台的研究现状 |
1.5 课题来源和研究内容 |
第二章 Agent 与基于MAS 的多机器人系统基本理论的研究 |
2.1 Agent 的概念 |
2.2 Agent 的分类 |
2.3 基于MAS 的多机器人系统及其任务模型 |
2.3.1 机器人Agent 的任务模型 |
2.3.2 机器人Agent 的结构模型 |
2.4 基于MAS 的大中型多机器人体系结构建模 |
2.4.1 分层式的面向多机器人系统任务级协作的机器人组织模型 |
2.4.2 分层式的面向多机器人系统任务级协作的机器人控制模型 |
2.5 多机器人系统的协调协作机制 |
2.5.1 基于合同网的协作策略研究 |
2.5.2 对合同网协议的改进与扩充 |
2.6 基于改进合同网协议的Agent 协作策略 |
2.7 系统通信问题和学习问题 |
2.8 本章小结 |
第三章 多机器人避碰及运动路径规划 |
3.1 路径规划方法概述 |
3.1.1 环境模型表示 |
3.1.2 全局路径搜索方法 |
3.1.3 局部路径规划方法 |
3.1.4 路径规划研究存在的问题 |
3.2 移动机器人的控制结构及其传感器模型 |
3.3 avoid_obstacle 行为设计 |
3.3.1 基于人工势场的方法 |
3.3.2 改进的人工势场法 |
3.4 follow_wall 行为设计 |
3.4.1 基本的follow_wall 行为 |
3.4.2 改进的follow_wall 行为 |
3.5 机器人之间的避碰行为设计 |
3.5.1 无通讯的避碰方法 |
3.5.2 基于通讯的方法 |
3.6 本章小结 |
第四章 多机器人路径规划与仿真 |
4.1 问题描述 |
4.2 任务描述 |
4.3 基于预测的冲突消解策略 |
4.4 控制策略设计 |
4.5 系统仿真实验 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 本文研究总结和结论 |
5.2 需要继续研究的问题 |
参考文献 |
攻读硕士期间发表的论文及取得的研究成果 |
致谢 |
(9)基于MAS的多机器人路径规划研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 问题背景 |
1.2 当前国内外的研究动态 |
1.3 基于MAS的多机器人系统 |
1.3.1 Agent理论 |
1.3.2 多智能体理论MAS技术 |
1.3.3 基于MAS的多机器人系统的研究现状 |
1.3.4 总结 |
1.4 论文的目标及结构 |
1.5 本章小结 |
第二章 多机器人路径规划 |
2.1 移动机器人路径规划研究现状 |
2.2 路径规划的典型算法研究 |
2.2.1 栅格法 |
2.2.2 拓扑法 |
2.2.3 可视图法 |
2.2.4 神经网络法 |
2.2.5 人工势场法 |
2.2.6 遗传算法 |
2.2.7 模糊逻辑算法 |
2.3 机器人运动规划的控制结构 |
2.4 本章小节 |
第三章 基于行为的多机器人避碰规划研究 |
3.1 Avoid_obstacle行为设计 |
3.1.1 人工势场法简述 |
3.1.2 利用人工势场法来执行Avoid_obstacle行为 |
3.1.3 实验分析 |
3.2 Avoid_robot行为设计 |
3.2.1 问题的提出 |
3.2.2 Avoid_robot行为设计方法 |
3.3 本章小结 |
第四章 基于协商和意愿强度的避碰规划研究 |
4.1 三种行为结构的设计 |
4.1.1 奔向目标(move_to_goal) |
4.1.2 避免碰撞(avoid_collision) |
4.1.3 协商行为(consult) |
4.2 意愿强度与协商策略 |
4.2.1 传感信息集合与行为决策集合 |
4.2.2 意愿强度 |
4.2.3 期望速度的调整 |
4.3 move_to_goal行为与avoid_collision行为相结合 |
4.4 实验分析 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 结论 |
5.2 今后的工作 |
5.2.1 对路径规划方法的改进 |
5.2.2 拓展路径规划方法的研究范围 |
参考文献 |
攻读硕士期间所发表的论文及所取得的研究成果 |
致谢 |
(10)分布式虚拟环境建模研究(论文提纲范文)
第1章 绪论 |
1.1 概述 |
1.1.1 课题的来源 |
1.1.2 课题的提出 |
1.2 国内外研究综述 |
1.2.1 虚拟现实研究和应用现状 |
1.2.2 基于图像的虚拟建模研究 |
1.2.3 基于几何建模的虚拟环境研究 |
1.2.4 虚拟环境的动态建模关键技术 |
1.2.5 分布式环境的网络支撑技术 |
1.3 本文的主要工作 |
1.3.1 主要研究内容 |
1.3.2 研究的目的和意义 |
1.3.3 全文的组织和结构 |
第2章 基于CAD法的动态虚拟环境建模 |
2.1 基于CAD法的几何建模 |
2.1.1 对象形状 |
2.1.2 数据传递机制 |
2.1.3 层次结构建模 |
2.1.4 属主建模方法 |
2.2 表面属性建模 |
2.2.1 纹理映射 |
2.2.2 表面反射 |
2.2.3 环境映照 |
2.3 运动建模和可操作模型生成 |
2.3.1 约束运动建模 |
2.3.2 可操作模型的生成 |
2.4 渐开线斜齿圆柱齿轮的虚拟设计实例 |
2.4.1 几何建模 |
2.4.2 表面属性真实感建模 |
2.4.3 运动建模 |
2.4.4 齿轮齿面接触虚拟试验 |
2.5 本章小结 |
第3章 基于几何与图像的室内虚拟环境建模 |
3.1 拟实以虚——实物全景浏览研究 |
3.1.1 序列化图像获取 |
3.1.2 重叠区域提取 |
3.1.3 基于投影特征的特征匹配技术 |
3.1.4 基于加权算法的平滑处理 |
3.1.5 生成全景图 |
3.1.6 构建图象纹理映射空间形成虚拟环境 |
3.2 拟虚以实——虚拟浏览房间研究 |
3.2.1 VRML语言结构 |
3.2.2 基于凸包围盒的避碰 |
3.2.3 基于3DMAX的虚拟房间漫游 |
3.3 本章小结 |
第4章 面向虚拟环境的分布式处理技术 |
4.1 分布式协议模型结构研究 |
4.1.1 系统目标 |
4.1.2 分布式虚拟环境体系结构 |
4.1.3 基于WEB的分布式虚拟现实系统多协议模型 |
4.2 分布式数据流传输研究 |
4.2.1 DVR系统的扩展性 |
4.2.2 兴趣管理技术 |
4.2.3 多阀值DR技术 |
4.2.4 实现 |
4.3 分布式处理系统中的Agent |
4.3.1 基于Agent的虚拟现实体系结构 |
4.3.2 多种Agent的合作的虚拟现实系统 |
4.3.3 基于Agent的产品数据管理 |
4.4 基于Agent的分布式室内虚拟装饰设计实例 |
4.4.1 基于虚拟现实的Agent实现 |
4.4.2 基于VRML的Java接口和实现 |
4.5 本章小结 |
第5章 基于WEB的交互式虚拟产品设计环境 |
5.1 研究内容与系统体系结构 |
5.2 基于三维CAD软件二次开发的服务器端工具 |
5.3 Web系统及CORBA服务器 |
5.3.1 Web系统的设计与实现 |
5.3.2 CORBA服务器的设计与实现 |
5.4 基于Web的交互式工作环境 |
5.4.1 讨论组模式的协商交流机制 |
5.4.2 ERCP协议 |
5.4.3 即时通报机制 |
5.5 本章小结 |
第6章 双级圆柱齿轮减速器虚拟装配系统 |
6.1 虚拟装配内涵研究 |
6.1.1 虚拟装配的定义 |
6.1.2 虚拟装配的内容 |
6.2 虚拟装配系统平台研究 |
6.2.1 虚拟环境的软件硬件配置 |
6.2.2 虚拟装配系统结构研究 |
6.3 层次树装配模型 |
6.3.1 装配对象描述 |
6.3.2 装配关系分类 |
6.3.3 装配层次树 |
6.4 自动装配顺序规划 |
6.4.1 装配规划的几何推理 |
6.4.2 基于拆卸法的装配序列求解 |
6.5 装配路径规划算法及实现 |
6.5.1 装配过程运动规划 |
6.5.2 基于拆卸的装配路径规划算法 |
6.6 双级渐开线圆柱减速器虚拟装配 |
6.6.1 减速器装配设计 |
6.6.2 开发平台介绍 |
6.6.3 WTK场景图 |
6.6.4 双级渐开线齿轮减速器虚拟环境的五层结构 |
6.7 本章小结 |
第7章 多机器人装配操作的层次驱动控制策略 |
7.1 面向装配的多机器人分布式平台体系结构 |
7.2 基于层次混合结构的协同操作策略 |
7.2.1 三层任务分级 |
7.2.2 递阶结构策略 |
7.3 基于Petri网的信息同步控制策略 |
7.3.1 信息的时间同步问题 |
7.3.2 信息同步模型 |
7.3.3 同步控制策略 |
7.4 混合式通讯模型 |
7.5 多机器人虚拟装配建模策略 |
7.5.1 几何建模 |
7.5.2 运动学建模 |
7.5.3 运动学计算 |
7.5.4 装配机器人轨迹规划 |
7.5.5 虚拟环境中机器人与作业对象之间的定位技术 |
7.6 多机器人装配操作实例 |
7.7 本章小结 |
第8章 总结与展望 |
8.1 全文总结 |
8.2 研究展望 |
参考文献 |
致谢 |
攻读博士学位期间主持和参加的科研项目及发表的论文 |
附件 |
四、网络环境下基于Agent的多机器人协调与路径规划(论文参考文献)
- [1]动态环境下多机器人协同搜救任务分配方法研究[D]. 陈昕叶. 华南理工大学, 2020(05)
- [2]多移动机器人系统协调规划与控制研究[D]. 徐东方. 山东科技大学, 2020(06)
- [3]网络约束环境下非完整机器人系统一致性问题研究[D]. 刘丽霞. 上海大学, 2020(03)
- [4]基于无线传感器网络的移动机器人编队关键技术研究[D]. 李世维. 哈尔滨工业大学, 2020(01)
- [5]仓储物流环境中的多机器人路径规划算法[D]. 邰若晨. 上海交通大学, 2019(06)
- [6]通信约束下分布式对地观测卫星系统在线协同任务调度模型与算法[D]. 李国梁. 国防科技大学, 2017(02)
- [7]基于社区感知网络的多机器人系统Q-学习与运动控制研究[D]. 金露. 扬州大学, 2013(04)
- [8]基于多Agent机器人系统合作与协调技术研究[D]. 赵利辉. 中北大学, 2008(11)
- [9]基于MAS的多机器人路径规划研究[D]. 殷炳叶. 中北大学, 2007(05)
- [10]分布式虚拟环境建模研究[D]. 唐秋华. 武汉理工大学, 2005(08)