手机知网 App
24小时专家级知识服务
打 开
武器工业与军事技术
基于Policy Gradient的自动驾驶仪控制参数设计
针对目前工程上通过在弹道上选取特征点,利用系数冻结法去研究和设计,这样一系列的假设会使设计的导弹模型与实际的弹体模型存在一定的差异,因此,提出了基于强化学习的过载自动驾驶仪在线调整PID参数,研究飞行器的控制问题,该方法将导弹作为智能体,读取飞行状态信息并建立动作策略和奖惩机制;其次,智能体根据算法给出的随机动作指令执行,执行完动作之后反馈状态信息,算法根据反馈的状态信息给出新动作。最终,通过多回合训练实现了过载指令的跟踪,证明了该方法的有效性。
格 式:
PDF原版;EPUB自适应版(需下载客户端)
0 36
手机阅读本文
下载APP 手机查看本文
自动化与仪器仪表
2021年02期
相似文献
图书推荐
相关工具书

搜 索