您的位置：首页 > 编程语言 > Python开发

python 使用lxml解析html（xpath）

2016-07-11 11:25 856 查看

举个栗子好了：#coding:utf-8
import urllib2
from lxml import etree

f = urllib2.urlopen("http://www.ydylcn.com/skwx_ydyl/sublibrary?ID=8724&SiteID=1&showDetail=true&RootFlag=Y")
conent = f.read()
article_name = etree.HTML(conent)
print article_name.xpath("//div[@class='zt_list'][1]/h2/a/text()")[0]

重点就是，使用lxml.etree.HTML

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

python中json对象转换出错解决方法
saltstack学习汇总
python2.0_s12_day12_css样式详解
使用python测试你的电脑开启最大线程数
Python爬虫实战（3）：安居客房产经纪人信息采集
Python获取当前时间的前(后)N天，前(后)N周，前（后）N月
Python新手学习基础之数据类型——变量
深入Python(2): __init__.py 用法
TensorFlow实战— —K-Means聚类
Celery 踩坑笔记
DAY7：leetcode #14 Longest Common Prefix
Python中关于字符串问题
关于python urlopen 一个类似radio流的timeout方法
python平行（3）：【parallel python】与【sklearn joblib的parallel和delayed】性能对比
[Jenkins] Use python requests to programatically get and set Jenkins job configuration
python安装第三方插件出现的错误
爬虫笔记
一个程序学会python的流程控制
mac 安装robotFramwork环境以及wxPython 无法安装问题解决（非常有用）
Python collections模块实例讲解

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航