强化学习（Reinforcement Learning, RL），又称再励学习、评价学习或增强学习，是机器学习的范式和方法论之一

18 次浏览 2024-10-14 0 条评论

docx

机器学习强化学习算法分类

强化学习（Reinforcement Learning, RL），又称再励学习、评价学习或增强学习，是机器学习的范式和方法论之一，用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题[1]。强化学习的常见模型是标准的马尔可夫决策过程（Markov Decision Process, MDP）。按给定条件，强化学习可分为基于模式的强化学习（model-based RL）和无模式强化学习（model-free RL） [1]，以及主动强化学习（active RL）和被动强化学习（passive RL） [2]。强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求解强化学习问题所使用的算法可分为策略搜索算法和值函数（value function）算法两类。深度学习模型可以在强化学习中得到使用，形成深度强化学习[1]。强化学习理论受到行为主义心理学启发，侧重在线学习并试图在探索-利用（exploration-exploitation）间保持平衡。不同于监督学习和非监督学习，强化学习不要求预先给定任何数据，而

文件大小：14.39KB

相关推荐

基于机器学习的房价预测模型

RLTest：强化学习算法测试利器

实用机器学习Practical-Machine-Learning-master

机器学习技术

内农大机器学习课件

机器学习中的Python应用

未知样本检测中的机器学习方法

知识领域:机器学习技术关键词: TensorFlow、PyTorch、机器学习算法

个人学习笔记：斯坦福大学的机器学习

深度学习与机器学习系统学习路径

机器学习-KNN算法实现

Python机器学习实战

使用强化学习创建自动探索迷宫的机器人

Python编程与机器学习实战

Python机器学习

RHFS模型研究与强化学习

机器学习驱动的经验资产定价

深度学习与机器学习实践指南

AI 2023.6深度强化学习单机器人行为控制方法

机器学习-python-LDA-算法的一个实现-比较适合学习.zip

评论区