您的位置：首页 > 编程语言 > Python开发

python基于BeautifulSoup实现抓取网页指定内容的方法

2015-07-09 00:00 981 查看

本文实例讲述了python基于BeautifulSoup实现抓取网页指定内容的方法。分享给大家供大家参考。具体实现方法如下：

# _*_ coding:utf-8 _*_
#xiaohei.python.seo.call.me:)
#win+python2.7.x
import urllib2
from bs4 import BeautifulSoup
def jd(url):
  page = urllib2.urlopen(url)
  html_doc = page.read()
  soup = BeautifulSoup(html_doc.decode('gb2312','ignore'))
  for i in soup.find_all('div', id="sortlist"):
    one = i.find_all('a')
    two = i.find_all('li')
    print ("%s %s" % (one,two))
jd("http://channel.jd.com/computer.html")

希望本文所述对大家的Python程序设计有所帮助。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

python冒泡排序简单实现方法
Python中的anydbm模版和shelve模版使用指南
Python中的fileinput模块的简单实用示例
python文件随机读写例子
python
python
python
python 3.x和2.x区别
python实现的websocket总结 —— wspy
Python笔记：multiprocessing模块详解
python编程之环绕卫星轨道
Python字符整数类型转换
karloop介绍－－hello world大家好，今天为大家介绍一款非常轻量级的的web开发框架，karloop框架。使用python开发首先我们下载karloop源码进行安装。源码地址下载成
adb connection python 一键 wifi 连接
python基础（1）
python装饰器
epoll 简单用法
tornado 源码初识
python_queue多线程
提供给开发者 10 款最好的 Python IDE(转)

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航