福利: 安卓上运行Python爬虫
2018-01-24 16:56
471 查看
1. 安装Termux
在软件市场搜索下载安装即可, 这个软件可以让你把手机当Linux电脑使用, 除了屏幕小点儿.为了敲命令方便, 建议安装输入法: CodeBoard, 功能键几乎都有了
参考自 安卓手机运行python程序的软件:Termux
注: py是因为用了别名 alias py=’python’
2. 安装环境
2.1 安装Python
pkg update pkg upgrade apt update apt upgrade apt install python pip install bs4 requests
2.2 安装lxml
apt install clang apt install libxml2 libxml2-dev libxslt libxslt-dev pip install lxml
下载对应脚本
apt install git git clone https://github.com/Kuangcp/PythonLearn.git cd PythonLearn/learning/Spider/scrpy_learn/55156
配置好一个用来存URL的redis数据库
可以是自己远程服务器上
也可以是本地
apt install redis
执行
redis-server即可开启服务
运行这两个脚本前先确定redis以及下载目录配置正确, 只有这两个是需要配置的
然后就可以直接
py simple.py或者先
py simple.py -h先看一下参数说明
就会提示 起始爬取的URL, 例如
http://www.55156.com/gaoqingtaotu/xiuren/204409_22.html
就开始爬取URL了
打开 同目录下 的 download.py 配置好下载目录 然后
py download.py, 或者直接
py download.py `pwd`
就在脚本旁的目录下不停的下载图片了
为了使用方便, 建议配置别名
vi ~/.bashrc
alias py='python' alias img='py simple_path ' # 替换为simple绝对路径 alias down='py download_path' # 替换为down绝对路径
或者
cd 到脚本所在目录然后: echo "alias img='python `pwd`/simple.py' " >> ~/.bashrc echo "alias down='python `pwd`/download.py `pwd` '" >> ~/.bashrc
以后就只要启动termux 然后 img 下载图片url down 下载图片了
又发现一个问题, 因为这个软件的数据是在/data/data/目录下, 而这个目录访问是要 root的, 所以上诉脚本生成别名后, 手动修改为安卓可访问的目录即可
我的手机是 /storge/emulate/0/ 就是存储的根目录
相关文章推荐
- 福利: 安卓上运行Python爬虫
- 自学Python十 爬虫实战三(美女福利续)
- python实现顺序结构基本爬虫,爬取福利图片
- 【教程】记录:python基础爬虫代码(下载妹子福利图片)
- 自学Python九 爬虫实战二(美图福利)
- Win7 Eclipse 运行 Python Scrapy爬虫项目
- 第三百五十二节,Python分布式爬虫打造搜索引擎Scrapy精讲—chrome谷歌浏览器无界面运行、scrapy-splash、splinter
- 精通Python爬虫从Scrapy到移动应用(文末福利)
- python爬虫--scrapy 框架 之 项目外运行爬虫(用脚本运行爬虫)
- 【Python3.6爬虫学习记录】(十三)在阿里云服务器上运行爬虫
- 用python 2运行爬虫
- python_慕课\Python开发简单爬虫\7-7 开始运行爬虫和爬取结果展.py
- Python Scrapy运行爬虫时出现ModuleNotFoundError(win32api)
- windows下运行python爬虫脚本乱码问题,IOError: [Errno 22] Invalid argument
- 一些常用的python爬虫技巧总结【文末彩蛋福利】
- Python爬虫入门学习例子之煎蛋网(福利哦)
- python爬虫scrapy运行ImportError: No module named win32api错误
- python3.6爬虫案例:爬取顶点小说(爱看小说同学的福利)
- 【python爬虫】游民星空福利和壁纸帖图片爬虫
- Python练手爬虫系列No.1 知乎福利收藏夹图片批量下载