一种无需在线学习过程的记忆控制方法和装置的利记博彩app

文档序号:6323308阅读:115来源:国知局
专利名称:一种无需在线学习过程的记忆控制方法和装置的利记博彩app
技术领域
本发明涉及智能控制技术领域,特别是涉及一种无需在线学习过程的记忆控制 方法和装置。
背景技术
实际工程中被控系统不仅具有复杂快变的非线性动力学特性,而且还涉及不确 定参数和结构、不可测外界扰动、甚至子系统故障,其控制问题具有极大的挑战性。
众所周知,传统的控制理论对线性问题有较成熟的理论,但对高度非线性的被 控系统,虽然有一些非线性方法可以利用,但不尽人意。而智能控制利用人脑的智慧和 经验来设计控制器,具有实时推理、决策、学习和记忆等功能,能适应各种复杂的控制 环境,这些特性为解决上述复杂的非线性问题找到了一个出路,成为解决这类问题行之 有效的途径。
目前在智能控制方法应用中,主要有专家系统、模糊逻辑、神经网络、遗传算 法以及迭代学习控制等方法。专家系统是利用专家知识对专门的或困难的问题进行描 述,它在解决复杂的高级推理中获得较为成功的应用,自动地获取知识困难、无自学能 力、知识面太窄;模糊逻辑用模糊语言描述系统,但是随着输入输出变量的增加,模 糊逻辑的推理将变得非常复杂;遗传算法是一种模拟自然进化过程的方法,具有并行 计算、寻找全局最优解等特点,但是其计算量较大,收敛性问题也很难在理论上得到保 证;神经网络是利用大量的神经元按一定的拓扑结构和学习调整的方法,具有并行计 算、分布存储、可变结构、高度容错、非线性运算、自组织、自学习等特性,但是随着 神经网络的隐含层的递增,其计算复杂度和数据存储递增,同时也存在其收敛性问题; 迭代学习控制是通过反复应用先前试验得到的信息来获得能够产生期望输出轨迹的控制 输入,以改善控制质量,具有需要较少的先验知识和计算量,同时适应性强,易于实现, 但是它必须对被控系统进行反复在线学习,而这对安全苛求系统来说,这是不容许的。
综上,可以看到,目前具有记忆特征的上述智能控制算法,要么计算复杂度 大、要么数据存储量大,要么存在收敛性问题,都具有片面性,更重要的它们几乎都需 要在线学习以及动态响应较慢,而实际工业控制系统除具有上述几个特点外,还有另外 一些特点,如被控对象往往是动态的,而且控制系统在线运动,一般要求有较高的实时 响应速度,如移动机器人系统、航空航天控制系统、交通运输控制系统等,上述方法就 更难满足控制需求了。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是如何能够创新 地提出一种设计简单的记忆控制方法和装置,以解决现有技术中存在的问题,有效保证 良好的控制性能。发明内容
本发明所要解决的技术问题是提供一种无需在线学习过程的记忆控制方法和装置,用以保证非线性控制系统良好的控制性能。
为了解决上述问题,本发明公开了一种无需在线学习过程的记忆控制方法,所 述方法包括
按照预设周期获取被控对象的目标参考输入;
按照预设周期获取被控对象的状态输出;
计算各个周期内被控对象的状态误差;
按照当前周期被控对象的状态误差以及上一周期被控对象的状态误差和控制信 号输出,计算当前周期的控制信号输出。
优选的,对于第一周期来讲,其上一周期为初始状态,所对应的被控对象的状 态误差和控制信号输出为零。
优选的,所获取被控对象的目标参考输入为人为设定或计算所得。
优选的,所述方法还包括
将被控对象的控制信号输出和状态误差存储到记忆存储器。
优选的,在所述记忆存储器中,新存入的控制信号和状态误差将分别覆盖上一 时刻的控制信号和状态误差。
本发明还公布了一种无需在线学习过程的记忆控制装置,所述装置包括
第一获取模块,用于按照预设周期获取被控对象的目标参考输入;
第二获取模块,用于按照预设周期获取被控对象的状态输出;
第一处理模块,用于计算各个周期内被控对象的状态误差;
第二处理模块,用于按照当前周期被控对象的状态误差以及上一周期被控对象 的状态误差和控制信号输出,计算当前周期的控制信号输出。
优选的,在所述第二处理模块中,对于第一周期来讲,其上一周期为初始状 态,所对应的被控对象的状态误差和控制信号输出为零。
优选的,所述第一获取模块所获取被控对象的目标参考输入为人为设定或计算 所得。
优选的,所述装置还包括
第三处理模块,用于将被控对象的控制信号输出和状态误差存储到记忆存储器。
优选的,所述第三处理模块进行数据存储时,新存入的控制信号和状态误差将 分别覆盖上一时刻的控制信号和状态误差。
与现有技术相比,本发明具有以下优点
本发明通过按照预设周期获取被控对象的目标参考输入,按照预设周期获取被 控对象的状态输出,计算各个周期内被控对象的状态误差,按照当前周期被控对象的状 态误差以及上一周期被控对象的状态误差和控制信号输出,计算当前周期的控制信号输 出,所述方法集计算量小、数据存储量小、控制器参数选择容易、无需在线学习并能够 在数学上严格保证稳定性等优点,有效保证了良好的控制性能。


图1是本发明实施例一所述的一种无需在线学习过程的记忆控制方法流程图2是本发明实施例一所述的记忆存储器的示意图3是本发明实施例一所述的计算当前周期的控制信号输出的示意图4是本发明实施例二所述的一种无需在线学习过程的记忆控制装置结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体 实施方式对本发明作进一步详细的说明。
实施例一
参照图1,示出了本发明的一种无需在线学习过程的记忆控制方法的流程图,所 述方法具体包括
步骤S101,按照预设周期获取被控对象的目标参考输入;
优选的,所获取被控对象的目标参考输入为人为设定或计算所得。
本实施例所述的无需在线学习过程的记忆控制方法可广泛应用于航空航天、风 力发电、移动机器人等诸多控制系统中,不同的控制系统对应的被控对象也不尽相同, 具体的如机器人、风机变桨等等。
通过获取被控对象的目标参考输入,明确被控对象目标状态。在实际应用中, 目标参考输入通常是人为设定的参考输入信号,比如设定移动机器人路径跟踪控制 中,让机器人从A点移动到B点,移动机器人在B点的位置和姿态就是目标参考输入。 此外,目标参考输入还可以通过计算、检测等多种方式给出。
其中,预设周期可根据实际的应用环境进行设定,如设定1小时、1分钟、1秒 或者1毫秒等等的具体时间段,通常可以通过设定相应的周期来调整实际的控制精度, 预设周期也可以通俗点理解为控制周期。
步骤S102,按照预设周期获取被控对象的状态输出;
在实际应用中,被控对象的状态输出通常是通过传感器进行检测的。
步骤S103,计算各个周期内被控对象的状态误差;
借助步骤SlOl和步骤S102所获取的数据,可以计算出各个周期内被控对象 的状态误差,这里为了清楚说明,以其中某一周期为例进行具体的介绍,假设该周期中所获取的被控对象的目标参考输入为&,状态输出为<则该周期内被控对象的状态误差 *ek~Xk~~ XkO
步骤S104,按照当前周期被控对象的状态误差以及上一周期被控对象的状态误 差和控制信号输出,计算当前周期的控制信号输出。
对于控制周期(k+Ι)到来时,根据(k+Ι)周期的状态误差第k控制周期状 态误差A与控制信号输出uk,可以计算出(k+Ι)周期控制控制信号输出uk+1。
这里以实际应用中的某种情形为例进行介绍,(k+Ι)周期控制控制信号输出uk+1 可用如下表达式进行表述
uk+1 = WoUk+Wiek+Wae,,+!;1 2
其中wQ,W1, W2为算法中的权重参数,Wtl= 1,W1=〒,W2=-〒,T为控制算法的控制周期;uk,&为被控对象k+1控制周期是上一控制周期的控制信号输出和状态误差;ek+1是当前控制周期(第k+Ι控制周期)的状态误差;uk+1是当前控制周期(第 k+Ι控制周期)的控制信号输出。
通过被控对象的目标参考输入以及被控对象的状态输出,经过变换、计算、处 理等步骤获取到当前的控制信号输出,基于该部分在现有技术中已是成熟技术,其本发 明的核心思想在于通过对其进行记忆,从而有效避免在线学习过程,有效保证控制性 能,这里不再对其进行赘述。
控制信号输出后,被控系统会做出相应的动作,比如被控系统移动机器人得 到左右轮的转速信号后,会驱动左右轮的电机进行相应的运动。
优选的,对于第一周期来讲,其上一周期为初始状态,所对应的被控对象的状 态误差和控制信号输出为零。
优选的,所述方法将被控对象的控制信号输出和状态误差存储到记忆存储器。
更为优选的,在所述记忆存储器中,新存入的控制信号和状态误差将分别覆盖 上一时刻的控制信号和状态误差。
每个控制周期(比如第k控制周期),记忆存储器中存储上一控制周期(第k_l 控制周期)中的记忆信息uk_i,ek_1 在下一控制周期(第k+1控制周期),覆盖上一控制 周期存储的记忆信息uk_1; ek_1 存储第k控制周期的信息uk,ek, uk_1 知工是第k-1控制 周期的控制输出信号和状态误差,uk,&是第k控制周期的控制输出信号和状态误差,具 体的记忆存储器可参见图2,记忆存储器的信息存储容量不会随着控制周期递推而增长。
结合上述记忆存储器介绍,计算当前周期的控制信号输出的示意图可参照图3。
上述本实施例中所述的方法,有效避免了传统方法对模型的过度依赖,无需重 复或在线学习过程,无需对未知参数进行在线估计,无需人工确定或估计有关未知量的 边界,无需频繁切换控制器结构,且运算量和对内存要求极低,在有效保证良好的控制 性能的同时极大的降低了控制成本。
实施例二
参照图4,示出了本发明的一种无需在线学习过程的记忆控制装置,所述装置包 括
第一获取模块401,用于按照预设周期获取被控对象的目标参考输入;
第二获取模块402,用于按照预设周期获取被控对象的状态输出;
第一处理模块403,用于计算各个周期内被控对象的状态误差;
第二处理模块404,用于按照当前周期被控对象的状态误差以及上一周期被控对 象的状态误差和控制信号输出,计算当前周期的控制信号输出。
优选的,在所述第二处理模块中,对于第一周期来讲,其上一周期为初始状 态,所对应的被控对象的状态误差和控制信号输出为零。
优选的,所述第一获取模块所获取被控对象的目标参考输入为人为设定或计算 所得。
优选的,所述装置还包括
第三处理模块,用于将被控对象的控制信号输出和状态误差存储到记忆存储器ο
优选的,所述第三处理模块进行数据存储时,新存入的控制信号和状态误差将分别覆盖上一时刻的控制信号和状态误差。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是 与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实 施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实 施例的部分说明即可。
以上对本发明所提供的一种无需在线学习过程的记忆控制方法和装置进行了详 细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的 说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人 员,依据本发明的思想,在具体实施方式
及应用范围上均会有改变之处,综上所述,本 说明书内容不应理解为对本发明的限制。
权利要求
1.一种无需在线学习过程的记忆控制方法,其特征在于,所述方法包括 按照预设周期获取被控对象的目标参考输入;按照预设周期获取被控对象的状态输出; 计算各个周期内被控对象的状态误差;按照当前周期被控对象的状态误差以及上一周期被控对象的状态误差和控制信号输 出,计算当前周期的控制信号输出。
2.根据权利要求1所述的方法,其特征在于对于第一周期来讲,其上一周期为初始状态,所对应的被控对象的状态误差和控制 信号输出为零。
3.根据权利要求1所述的方法,其特征在于所获取被控对象的目标参考输入为人为设定或计算所得。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括 将被控对象的控制信号输出和状态误差存储到记忆存储器。
5.根据权利要求4所述的方法,其特征在于在所述记忆存储器中,新存入的控制信号和状态误差将分别覆盖上一时刻的控制信 号和状态误差。
6.—种无需在线学习过程的记忆控制装置,其特征在于,所述装置包括 第一获取模块,用于按照预设周期获取被控对象的目标参考输入;第二获取模块,用于按照预设周期获取被控对象的状态输出; 第一处理模块,用于计算各个周期内被控对象的状态误差;第二处理模块,用于按照当前周期被控对象的状态误差以及上一周期被控对象的状 态误差和控制信号输出,计算当前周期的控制信号输出。
7.根据权利要求6所述的装置,其特征在于在所述第二处理模块中,对于第一周期来讲,其上一周期为初始状态,所对应的被 控对象的状态误差和控制信号输出为零。
8.根据权利要求6所述的装置,其特征在于所述第一获取模块所获取被控对象的目标参考输入为人为设定或计算所得。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括第三处理模块,用于将被控对象的控制信号输出和状态误差存储到记忆存储器。
10.根据权利要求9所述的装置,其特征在于所述第三处理模块进行数据存储时,新存入的控制信号和状态误差将分别覆盖上一 时刻的控制信号和状态误差。
全文摘要
本发明提供了一种无需在线学习过程的记忆控制方法和装置,通过按照预设周期获取被控对象的目标参考输入,按照预设周期获取被控对象的状态输出,计算各个周期内被控对象的状态误差,按照当前周期被控对象的状态误差以及上一周期被控对象的状态误差和控制信号输出,计算当前周期的控制信号输出,所述方法集计算量小、数据存储量小、控制器参数选择容易、无需在线学习并能够在数学上严格保证稳定性等优点,有效保证了良好的控制性能。
文档编号G05B13/00GK102023568SQ201010586268
公开日2011年4月20日 申请日期2010年12月8日 优先权日2010年12月8日
发明者宋永端, 李丹勇, 蔡文川 申请人:北京交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1