命名空间
时间:2019-11-13
本文章向大家介绍命名空间,主要包括命名空间使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
ElementTree API尽可能避免使用前缀,而是使用命名空间(URI)
创建带前缀和命名空间的xml树
# coding:utf-8 from lxml import etree #当使用命名空间http://www.w3.org/1999/xhtml时,会自动创建前缀html,并让其与之关联, #如果URL错误,如http://www.w3.org/1999/xhtml33333,则会创建前缀ns0,即<ns0:html....... xhtml = etree.Element("{http://www.w3.org/1999/xhtml}html") body = etree.SubElement(xhtml, "{http://www.w3.org/1999/xhtml}body") body.text = "Hello World" print(etree.tostring(xhtml, pretty_print=True)) ''' 输出: <html:html xmlns:html="http://www.w3.org/1999/xhtml"> <html:body>Hello World</html:body> </html:html> '''
ElementTree使用的符号最初是由James Clark提出的
其主要优点就是,它提供了一种不管文档是否使用或定义了哪些前缀,都可以锁定树中任何一个Tag的方式
这样就可以无需使用前缀,使得代码更加清晰和准确
从示例中可以看到,前缀仅在序列化结果时才变得重要
如果命名空间名称过长,比如:http://www.w3.org/1999/xhtml......,
这样代码在变得冗长同时,代码中反复地重新键入或复制字符串也很容易出错
因此,常见的做法是将命名空间存储在全局变量中
要调整命名空间前缀以进行序列化,还可向Element factory函数传递映射,例如定义默认命名空间
# coding:utf-8 from lxml import etree XHTML_NAMESPACE = "http://www.w3.org/1999/xhtml" XHTML = "{%s}" % XHTML_NAMESPACE NSMAP = {'prefix_test' : XHTML_NAMESPACE} # the default namespace (no prefix) xhtml = etree.Element(XHTML + "html", nsmap=NSMAP) # lxml only! body = etree.SubElement(xhtml, XHTML + "body") body.text = "Hello World" print(etree.tostring(xhtml, pretty_print=True)) ''' 输出: <prefix_test:html xmlns:prefix_test="http://www.w3.org/1999/xhtml"> <prefix_test:body>Hello World</prefix_test:body> </prefix_test:html> '''
使用QName助手类生成或拆分限定tag名
# coding:utf-8 from lxml import etree tag = etree.QName('http://www.w3.org/1999/xhtml', 'html') print(tag.localname) #输出:html print(tag.namespace) #输出:http://www.w3.org/1999/xhtml print(tag.text) #输出:{http://www.w3.org/1999/xhtml}html tag = etree.QName('{http://www.w3.org/1999/xhtml}html') print(tag.localname) #输出:html print(tag.namespace) #输出:http://www.w3.org/1999/xhtml root = etree.Element('{http://www.w3.org/1999/xhtml}html') tag = etree.QName(root) print(tag.localname) #输出:html tag = etree.QName(root, 'script') print(tag.text) #输出:{http://www.w3.org/1999/xhtml}script tag = etree.QName('{http://www.w3.org/1999/xhtml}html', 'script') print(tag.text) #输出:{http://www.w3.org/1999/xhtml}script
nsmap属性
etree允许通过.nsmap属性查找为节点定义的当前命名空间
请注意,这包括在元素上下文中已知的所有前缀,而不仅仅是它自己定义的那些前缀
# coding:utf-8 from lxml import etree root = etree.Element('root', nsmap={'a': 'http://a.b/c'}) child = etree.SubElement(root, 'child',nsmap={'b': 'http://b.c/d'}) print(root.nsmap) #输出:{'a': 'http://a.b/c'} print(child.nsmap) #输出:{'b': 'http://b.c/d'} print(len(root.nsmap)) #输出:1 print(len(child.nsmap)) #输出:2 print(child.nsmap['a']) #输出:'http://a.b/c' print(child.nsmap['b']) #输出:'http://b.c/d'
修改返回的dict不会对元素产生任何有意义的影响,对它的任何更改都将被忽略
属性上的命名空间工作原理类似,但从2.3版开始,lxml.etree将确保属性使用带前缀的命名空间声明
这是因为XML名称空间规范(第6.2节)不认为未固定的属性名在名称空间中
所以它们最终可能会在序列化解析往返过程中丢失名称空间,即使它们出现在名称空间元素中
# coding:utf-8 from lxml import etree XHTML_NAMESPACE = "http://www.w3.org/1999/xhtml" XHTML = "{%s}" % XHTML_NAMESPACE NSMAP = {'prefix_test' : XHTML_NAMESPACE} # the default namespace (no prefix) xhtml = etree.Element(XHTML + "html", nsmap=NSMAP) # lxml only! body = etree.SubElement(xhtml, XHTML + "body") body.text = "Hello World" body.set(XHTML + "bgcolor", "#CCFFAA") print(etree.tostring(xhtml, pretty_print=True)) ''' 输出: <prefix_test:html xmlns:prefix_test="http://www.w3.org/1999/xhtml"> <prefix_test:body prefix_test:bgcolor="#CCFFAA">Hello World</prefix_test:body> </prefix_test:html> ''' print(body.get("bgcolor")) #输出:None print(body.get(XHTML + "bgcolor")) #输出:'#CCFFAA' #还可将XPath与完全限定名一起使用 find_xhtml_body = etree.ETXPath("//{%s}body" % XHTML_NAMESPACE) results = find_xhtml_body(xhtml) print(results[0].tag) #输出:{http://www.w3.org/1999/xhtml}body #为了方便起见,可在lxml.etree的所有迭代器中使用“*”通配符,包括标记名和名称空间 for el in xhtml.iter('*'): print(el.tag) # any element ''' 输出: {http://www.w3.org/1999/xhtml}html {http://www.w3.org/1999/xhtml}body ''' for el in xhtml.iter('{http://www.w3.org/1999/xhtml}*'): print(el.tag) ''' 输出: {http://www.w3.org/1999/xhtml}html {http://www.w3.org/1999/xhtml}body ''' for el in xhtml.iter('{*}body'): print(el.tag) ''' 输出: {http://www.w3.org/1999/xhtml}body ''' #若要查找没有命名空间的元素,请使用纯标记名或显式提供空命名空间 print([ el.tag for el in xhtml.iter('{http://www.w3.org/1999/xhtml}body') ]) #输出:['{http://www.w3.org/1999/xhtml}body'] print([ el.tag for el in xhtml.iter('body') ]) #输出:[] print([ el.tag for el in xhtml.iter('{}body') ]) #输出:[] print([ el.tag for el in xhtml.iter('{}*') ]) #输出:[]
原文地址:https://www.cnblogs.com/shiliye/p/11850010.html
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 数学--数论--欧拉降幂--P5091 欧拉定理
- 重学巩固你的Vuejs知识(上)
- js原生模态登录框
- 客户决策 | 我的代码没有else
- LeetCode 1595 Minimum Cost to Connect Two Groups of Points (动态规划)
- js DOM系统
- css的radial-gradient大详解
- 你想知道的优惠券业务,SkrShop告诉你
- js汇率计算器系统
- 数学--数论--欧拉降幂和广义欧拉降幂(实用好理解)
- JS逐步教你做(自己版本)的视频播放器(我先声明,step我不懂是什么意思,所以没用)
- 【mysql系列】细谈“explain”之理论Part
- 如果用java swing编写一个五子棋(人人对战)
- 【mysql系列】细谈explain执行计划之“谜”
- 洛谷 P1352 没有上司的舞会(树形 DP)