您的位置:首页 > 编程语言 > Python开发

python学习:使用xml.dom.minidom读取xml文档内容

2016-03-21 10:35 489 查看

总结一下自己学习minidom模块的过程:

1 简要了解一下xml文档:

  - DOM是 Document Object Model的简称,它以对象树来表示一个XML文档,使用它的好处是你可以非常灵活的遍历xml文档对象

 - xml文档是由树状元素组成,有一个唯一的根元素,也叫文档元素。其他的元素和内容都包含在根元素中

 - 元素: 

    --元素就是标记,元素与元素之间可以有文本,元素的内容也是文本

    --元素是节点的一种,但不是叶子节点,元素下面有子节点

    --每个节点有nodeName,nodeValue, nodeType属性, nodeValue 是节点的值,只对textNode有效

    --叶子节点,如文本节点,下面不再有子节点

    --两个节点之间的内容被视为文本节点

2  xml文档的读取

 -生成dom对象:

>>>from xml.dom.minidom import parse, parseString    #导入parse, parseString function

>>>dom1 = parse("D:\xmlpath.xml")        #parse解析XML文档生成dom 对象

>>>dom2 = parseString("<tc>     #parseString解析xml字符串生成dom对象
<prod>Adv</prod>

<version>14</version>

</tc>")

  - 读取文档元素对象(根节点:tc)

>>>root1 = dom1.documentElement

>>>root2 = dom2.documentElement

  -读取节点属性

>>>root1.nodeName

u'tc'

  -子元素、子节点的访问

--使用getElementsByTagName方法: 可以搜索已知元素名的所有子元素

>>>verNum = dom.getElementsByTagName("version")

>>>print verNum

[<DOM Element: verNum at 0x10a5ee6c8>]


内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: