扫一扫,随时随地
文集编号: 20131226008553
在本文中,我们以智能机器人NAO为基础研究和开发真实世界的强化学习方法。使用有监督的强化学习方法,并结合高斯分布状态激活,我们可以教机器人导航,并且通过充电延长持续时间。控制的概念基于NAO六个基本动作提供的视觉信息。在家庭环境中利用NAO机器人进行不涉及模型的测试与开发。这种方法有望成为实现真实世界的强化学习的一条有效的途径,比传统Q学习或SARSA更快。
王宝宝新来的