3、手动搭建强化学习的环境reinforcement learning

一、概述

强化学习(Reinforcement Learning)的研究领域,并没有一些很好的模块可以使用。不像Deep Learning一样,有很多的框架,比如说tensorflow,pytorch,cafe等。应对这不同环境下的RL,可能编写的代码就会不一样,所以我们需要能够学会使用基础框架自己搭建一个属于自己的模型,更加好的理解底层原理,以后不管遇到什么样的环境,也能够应付。

  • Numpy,pandas:用于数据处理;
  • Matplotlib:展示误差曲线等,数据可视化;
  • Tkinter:编写模拟环境;
  • Tensorflow:实现神经网络和强化学习的结合;
  • OpenAI gym:提供许多现成的游戏环境;

二、怎么搭建

(1)python

python可以在官网下载,下载安装好之后,可以将python加入到环境变量中,这样在命令行就可以方便运行python脚本;

python官网下载链接:https://www.python.org/downloads/
Anaconda官网下载链接:https://www.anaconda.com/
Python加入环境变量教程:https://www.jianshu.com/p/e75bb5d7f83a

(2)安装上述模块

在安装好了python之后。
查看python和tensorflow和pytorch相对应的版本,版本不对会报错的,关于cpu的版本和gpu版本安装是不一样的

easy_install.exe pip
pip install pip --upgrade
pip install numpy
pip install pandas
# 由于Tkinter 是内置到 python 的安装包中、只要安装好 Python 之后就能使用import导入Tkinter 库

# 对于TensorFlow 1.X,可以统一使用Tensorflow 1.15.0,对应的python版本为3.5-3.7。
pip install tensorflow==1.15.0 # CPU版本
pip install tensorflow_gpu==1.15.0 # GPU版本

# 对于TensorFlow 2.X,统一使用最新版本即可。
pip install tensorflow # tensorflow的CPU最新版本
pip install tensorflow_gpu # tensorflow的GPU最新版本

# torch 的安装看官网https://pytorch.org/get-started/locally/
pip3 install torch torchvision torchaudio

下面是python和tensorflow、pytorch 相对应的版本:

版权声明:
作者:congcong
链接:https://www.techfm.club/p/48821.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>