python 从姐脱吧下载妹子图片
2013-08-06 18:00
417 查看
http://www.oschina.net/code/snippet_1026739_23103
我看好多人写着玩,下载下来没执行成功(我没看代码不知原因),然后自己写个玩玩 -_#
请自行在代码目录下 创建 teba文件夹。。
当然了 口味重的 可以把 贴吧地址 改成 LES 吧 或者 同志吧 之类的
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import urllib2
import re
import sys
from threading import Thread
import time
import random
import hashlib
class tieba(object):
url = None
dirPath = None
__md5 = None
def __init__(self):
self.url = "http://tieba.baidu.com/f?kw=%BD%E3%CD%D1&tp=0&pn="
self.dirPath = sys.path[0] + "/tieba/"
self.__md5 = hashlib.md5()
def getImages(self, page):
url = self.url + str(page*50)
req = urllib2.Request(url)
res = urllib2.urlopen(url)
html = res.read()
rc = '<img src="[^"]*" original="[^"]*" bpic="([^"]*)"[^>]*\/>'
html = re.findall(rc, html, re.MULTILINE | re.DOTALL)
return html
def saveImg(self, images):
for i in images:
rand = str(random.randint(1, 10000)) + i
self.__md5.update(rand)
fname = self.__md5.hexdigest()
fname = self.dirPath + fname + ".jpg"
req = urllib2.Request(i)
res = urllib2.urlopen(i)
pic = res.read()
f = open(fname, "wb");
f.write(pic);
f.close()
class catch(Thread):
startPage = None
endPage = None
def __init__(self, start, end):
Thread.__init__(self)
self.startPage = start
self.endPage = end
def run(self):
loop = range(self.startPage, self.endPage + 1)
for i in loop:
t = tieba()
imgs = t.getImages(i)
t.saveImg(imgs)
print "get page %d success" % i
sys.stdout.flush()
if __name__ == '__main__':
maxPage = 500
threadSum = 50
if threadSum > maxPage:
threadSum = maxPage
urlCount = maxPage / threadSum
for i in range(0, threadSum):
c = catch(i * urlCount, (i + 1)* urlCount - 1)
c.start()
我看好多人写着玩,下载下来没执行成功(我没看代码不知原因),然后自己写个玩玩 -_#
请自行在代码目录下 创建 teba文件夹。。
当然了 口味重的 可以把 贴吧地址 改成 LES 吧 或者 同志吧 之类的
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import urllib2
import re
import sys
from threading import Thread
import time
import random
import hashlib
class tieba(object):
url = None
dirPath = None
__md5 = None
def __init__(self):
self.url = "http://tieba.baidu.com/f?kw=%BD%E3%CD%D1&tp=0&pn="
self.dirPath = sys.path[0] + "/tieba/"
self.__md5 = hashlib.md5()
def getImages(self, page):
url = self.url + str(page*50)
req = urllib2.Request(url)
res = urllib2.urlopen(url)
html = res.read()
rc = '<img src="[^"]*" original="[^"]*" bpic="([^"]*)"[^>]*\/>'
html = re.findall(rc, html, re.MULTILINE | re.DOTALL)
return html
def saveImg(self, images):
for i in images:
rand = str(random.randint(1, 10000)) + i
self.__md5.update(rand)
fname = self.__md5.hexdigest()
fname = self.dirPath + fname + ".jpg"
req = urllib2.Request(i)
res = urllib2.urlopen(i)
pic = res.read()
f = open(fname, "wb");
f.write(pic);
f.close()
class catch(Thread):
startPage = None
endPage = None
def __init__(self, start, end):
Thread.__init__(self)
self.startPage = start
self.endPage = end
def run(self):
loop = range(self.startPage, self.endPage + 1)
for i in loop:
t = tieba()
imgs = t.getImages(i)
t.saveImg(imgs)
print "get page %d success" % i
sys.stdout.flush()
if __name__ == '__main__':
maxPage = 500
threadSum = 50
if threadSum > maxPage:
threadSum = maxPage
urlCount = maxPage / threadSum
for i in range(0, threadSum):
c = catch(i * urlCount, (i + 1)* urlCount - 1)
c.start()
相关文章推荐
- 第 0013 题: 用 Python 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :-) Python3 图片 爬取 下载 到 本地
- python在多玩图片上下载妹子图的实现代码
- 【教程】记录:python基础爬虫代码(下载妹子福利图片)
- Python爬虫小实践:下载妹子图www.mzitu.com网站上所有的妹子图片,并按相册名字建立文件夹分好文件名
- Python3爬取妹子图——爬虫&下载网络图片
- 使用Python自动下载妹子图的图片到本地
- python在多玩图片上下载妹子图的实现代码
- python在多玩图片上下载妹子图的实现代码
- 【python】下载51blog的所有文章(包括图片)
- python 简单爬虫下载图片
- 用python的cookielib模拟登录虎扑下载相册图片
- Python3.x爬虫下载网页图片的实例讲解
- python学习笔记(8)--爬虫下载占位图片
- Web Scraping with Python: 使用 Python 下载 CSDN 博客图片
- Python的scrapy之爬取妹子图片
- python︱批量操作文件(os)、图片操作技巧(下载网络图片、skimage.io)
- python的N个小功能(连接数据库并下载相应位置的图片)
- python爬取妹子图片2
- python爬虫框架scrapy学习图片下载
- Python Show-Me-the-Code 第 0013 题 抓取妹子图片 使用scrapy