×
模态框(Modal)标题
在这里添加一些文本
关闭
关闭
提交更改
取消
确定并提交
×
模态框(Modal)标题
×
Toggle navigation
首页
关于本刊
编委阵容
过刊浏览
投稿须知
出版伦理
联系我们
English
一种基于动作采样的 Q 学习算法
赵德京 , 马洪聪 , 廖登宇 , 崔浩岩
An Action-sampling Based Q-learning Algorithm
ZHAO Dejing , MA Hongcong , LIAO Dengyu , CUI Haoyan
控制工程 . 2024, (
1
): 70 -79 .