您的位置:首页 > 编程语言 > Python开发

Python import theano 运行LSTM官方例子

2016-12-02 17:31 369 查看
LSTM网络进行情感分析
本教程旨在 Theano 中实现 循环神经网络(RNN)的 长短时记忆模型(LSTM)。 

在本教程中,此模型用于对来自电影评论大数据集(有时称为IMDB数据集)的电影评论执行情绪分析。

在这个任务中,给定电影评论,模型尝试预测它是正面还是负面。 

这是一个二进制分类任务。

1、本文目的: win8.1 64bit 下 运行LSTM官方例子

2、官方例程  LSTM Networks for Sentiment Analysis :http://deeplearning.net/tutorial/lstm.html

下载 :lstm.py :http://deeplearning.net/tutorial/code/lstm.py

imdb.py :http://deeplearning.net/tutorial/code/imdb.py

3、下载数据集

本次测试事先下载 电影评论数据集 Large
Movie Review Dataset 

如果嫌官方数据太大,也可以用这个数据集 http://download.csdn.net/detail/moses1994/9700107

4、运行环境:1)win8.1 64bit

     2)Anaconda2-4.1.1-Windows-x86_64 建议用 Python 2.7 版本 

下载链接 :https://www.continuum.io/downloads

先安装 Anaconda2,然后打开 Spyder,如果直接运行lstm.py,会出现错误。

提示需要“ Import theano”,错误的原因是因为 Anaconda 中缺少mingw
和 libpython。

有了 mingw 和 libpython 后,我们才可以安装 theano。

(Theano:基于Python的面向对象,它认为,浅层网络的中分类器,深度网络中的每个层,都是一个对象。

在这个对象里,你被指定了输入格式,你只需要做两件事:定义参数、定义输出。)

(安装完Anaconda ,我们可以打开anaconda
prompt,输入conda list,会显示现在的已经安装好的开源包。)



5、打开后,可以看到并没有 mingw包和libpython包,所以需要自己进行配置。

用 win + R 在运行框中输入 cmd , 输入 conda install mingw libpython 。

(会自动安装mingw和libpython)

6、添加环境变量。

1)在 计算机 上右击,选择 属性;

2)选择 高级系统设置;

3)选择 高级 ,选择低下的 环境变量;

4)下面的 系统变量 ,选择 Path , 点击 编辑;

5)环境变量中的系统变量path中加入

D:\Anaconda2;

D:\Anaconda2\Library\bin;

D:\Anaconda2\MinGW\bin;

D:\Anaconda2\MinGW\x86_64-w64-mingw32\lib;

D:\Anaconda2\Scripts;

(注意:我的anaconda装在D盘)

7、在 cmd 的 home目录 中新建 .theanorc.txt 文件(注意是两个点)



如图, cmd 的 home目录 在 C 盘--->用户--->Moses

8、(由于我的笔记本是集成显卡,没有 GPU,所以这次不配置 GPU)

在 .theanorc.txt 文件中输入

[global] 

openmp=False 

[blas] 

ldflags= 

[gcc] 

cxxflags=-ID:\Anaconda2\MinGW

我的anaconda装在D盘,所以最后是:D:\Anaconda2\MinGW。这个根据自己的设置。

9、关机重启,使得环境变量设置生效。

10、开始安装theano

我们可以:1)进入cmd,输入 pip install theano ,开始安装;或者

  2)打开anaconda prompt,输入  pip
install theano ,开始安装。

11、测试

1)打开 anaconda
自带的 IPython ,输入import theano ,如果安装正确,会像下图一样:



2)输入theano.test() ,如下图:



12、至此,anaconda 中的 theano 就安装成功了。

在测试 例程 之前,我们还需要修改一下 imdb.py中的get_dataset_file函数。

该函数return dataset,这里dataset指的是下载的数据集的路径。

我们把这一句注释掉,然后return 自己放数据集的路径。

 return "D:\data\imdb.pkl" 

或者,我们可以把函数主题全部注释掉,只留下  return "D:\data\imdb.pkl" 



13、然后,就可以运行测试了。



Good  Lucky !
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息