手机知网 App
24小时专家级知识服务
打 开
自动化技术
一类值函数激励学习的遗忘算法
大状态空间值函数的激励学习是当今国际激励学习领域的一个热点和难点问题 .将记忆心理学中有关遗忘的基本原理引入值函数的激励学习 ,形成了一类适合于值函数激励学习的遗忘算法 .首先简要介绍了解决马尔可夫决策问题的基本概念 ,比较了离策略和在策略激励学习算法的差别 ,概述了标准的 SARSA(λ)算法 .在分析了人类记忆和遗忘的一些特征后 ,提出了一个智能体遗忘准则 ,进而将 SARSA(λ)算法改进为具有遗忘功能的 Forget-SARSA(λ)算法 ,最后给出了实验结果
手机阅读本文
下载APP 手机查看本文
计算机研究与发展
2001年04期
相似文献
图书推荐
相关工具书

搜 索