python 网络爬虫-批量打包下载小说
2019-06-15 21:39
501 查看
import urllib.request import re import os import time
mulu='https://www.9dxs.com/2/2308/index.html' response = urllib.request.urlopen(mulu) html=response.read().decode('gbk')
def get_zhang(lianjie,biaoti): zhang ='https://www.9dxs.com/2/2308/'+lianjie response = urllib.request.urlopen(zhang) html=response.read().decode('gbk') pattern=re.compile(u'(<div id="content" class="content">)(.*?)(</div>.*<div class="chapterpage">)',re.S) zhang_html=pattern.findall(html) for zhengwen in zhang_html: text=re.sub( '<.*?>', '', zhengwen[1]) text=re.sub( ' ', ' ', text) return text
def baocun(biaoti,zhengwen): fo = open('帝临鸿蒙.txt', "a+") #打开小说文件 fo.write('\r\n' + biaoti + '\r\n'+zhengwen) fo.close()
pattern=re.compile(u'<li><a href="(.*?)">(.*?)</a></li>') mulu=pattern.findall(html) for zhang in mulu: biaoti=zhang[1] zhengwen=get_zhang(zhang[0],zhang[1]) baocun(biaoti,zhengwen) time.sleep(5) #不要太快防止给人家造成负担
相关文章推荐
- 利用python批量下载起点中文网的小说
- 从零开始写Python爬虫 --- 1.7 爬虫实践: 排行榜小说批量下载
- 批量下载小说网站上的小说(python爬虫)
- java文件批量打包下载
- ASP.NET多文件批量打包下载
- python之使用 wkhtmltopdf 和 pdfkit 批量加载html生成pdf,适用于博客备份和官网文档打包
- python获取Stanford AI课程的批量下载地址
- 批量下载,多文件压缩打包zip下载
- 利用python从www.yousheng8.com批量下载小说
- python批量下载网站马拉松照片的完整步骤
- 使用pyinstaller将python开发的youtube下载程序打包成exe
- [Python]_[批量下载网站文件]
- Python 批量下载文件
- Python批量下载电视剧电影--自己动手丰衣足食
- python: android批量多渠道打包
- texturepacker使用python调用命令行对批量图片进行打包
- python爬虫-批量下载qq音乐
- python 高能库 wget 批量下载
- Java 批量生成二维码图片,并打包成可直接下载的zip包(spring boot)
- 还在花钱看小说?Python抓取全网小说,一键打包