![]() |
独立的火龙果 · 国家金融监督管理总局· 6 月前 · |
![]() |
聪明伶俐的肉夹馍 · 陈凯歌与杜可风亲密照曝光 ...· 7 月前 · |
![]() |
活泼的棒棒糖 · VB.NET开发人员必备参考10本书目_vi ...· 9 月前 · |
![]() |
骑白马的开水瓶 · 买苹果新品也想要优惠?Apple ...· 9 月前 · |
![]() |
严肃的熊猫 · 三年贬值8万,花10万买台二手嘉际PHEV亏 ...· 1 年前 · |
Auto Byte
专注未来出行及智能汽车科技
微信扫一扫获取更多资讯
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
微信扫一扫获取更多资讯
这些书籍涉及基础知识、编程技能、实践、理论等多个方面。经典的《深度学习》花书也在书单之中。
强化学习(Reinforcement Learning)是主体(agent)通过与周围环境的交互来进行学习。强化学习主体(RL agent)每采取一次动作(action)就会得到一个相应的数值奖励(numerical reward),这个奖励表示此次动作的好坏。通过与环境的交互,综合考虑过去的经验(exploitation)和未知的探索(exploration),强化学习主体通过试错的方式(trial and error)学会如何采取下一步的动作,而无需人类显性地告诉它该采取哪个动作。强化学习主体的目标是学习通过执行一系列的动作来最大化累积的奖励(accumulated reward)。 一般来说,真实世界中的强化学习问题包括巨大的状态空间(state spaces)和动作空间(action spaces),传统的强化学习方法会受限于维数灾难(curse of dimensionality)。借助于深度学习中的神经网络,强化学习主体可以直接从原始输入数据(如游戏图像)中提取和学习特征知识,然后根据提取出的特征信息再利用传统的强化学习算法(如TD Learning,SARSA,Q-Learnin)学习控制策略(如游戏策略),而无需人工提取或启发式学习特征。这种结合了深度学习的强化学习方法称为深度强化学习。
深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。
![]() |
独立的火龙果 · 国家金融监督管理总局 6 月前 |