微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

PyQuery Python 的 HTML/XML 解析库

程序名称:PyQuery

授权协议: BSD

操作系统: 跨平台

开发语言: Python

PyQuery 介绍

PyQuery 让你使用 jQuery 的风格来遍历 XML 文档,它使用了 lxml 来处理 XML 乃至 HTML 文档。

你可以直接从字符串、URL或者文件中加载文档:

>>> from pyquery import PyQuery as pq
>>> from lxml import etree
>>> import urllib
>>> d = pq("<html></html>")
>>> d = pq(etree.fromstring("<html></html>"))
>>> d = pq(url='http://google.com/')
>>> # d = pq(url='http://google.com/', opener=lambda url: urllib.urlopen(url).read())
>>> d = pq(filename=path_to_html_file)

然后使用 $ 进行遍历:

>>> d("#hello")
[<p#hello.hello>]
>>> p = d("#hello")
>>> print(p.html())
Hello world !
>>> p.html("you kNow <a href='http://python.org/'>Python</a> rocks")
[<p#hello.hello>]
>>> print(p.html())
you kNow <a href="http://python.org/">Python</a> rocks
>>> print(p.text())
you kNow Python rocks

PyQuery 官网

http://pyquery.rtfd.org/

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐