基于Python实现的爬虫源码(1)
2016-02-19 17:41
696 查看
# -*- coding: utf-8 -*- import string,urllib2 import os import shutil #os.rmdir("baidu_file") path = os.getcwd() #os.removedirs(path + '//baidu_file') #shutil.copytree(ResDir,DesDir)#拷贝 Dir = path + '//baidu_file' #如果有这个文件夹先删除 if os.path.exists(Dir) == True : shutil.rmtree(Dir)#删除文件夹 os.mkdir("baidu_file")#新建文件夹 os.chdir("baidu_file")#改变当前目录 def baidu(url,start_page,end_page): for i in range(start_page,end_page + 1): sName = string.zfill(i,5) + ".html" f = open(sName,'w+') m = urllib2.urlopen(url+str(i)).read() f.write(m)#将字符串写入文件,没有返回值。 f.close() print("请输入贴吧地址") bdurl = "http://tieba.baidu.com/p/2296017831?pn=" start_page = 1; end_page = 5 baidu(bdurl,start_page,end_page)
相关文章推荐
- Python基础学习笔记(二)语法简介
- windows系统下Python环境的搭建
- python开发_常用的python模块及安装方法
- python设置环境变量
- Using python-keystoneclient.v3 API
- Python程序员必知必会的开发者工具
- 机器学习实战学习1:python实现KNN
- Python对商品属性进行二次分类并输出多层嵌套字典
- 《笨办法学Python》 第41课手记
- Python包管理--pip方法
- 利用python进行数据分析之pandas库的应用(二)
- Python文件夹与文件的操作
- Python编辑器UliPad安装
- 学习python实战:年会抽奖程序的实现.md
- python常见的模块
- Python中类和对象
- python常见的12个自建函数
- Python—符串和数值的相互转换.md
- Python—函数和模块
- Python可执行对象——exec、eval、compile