微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用Windows中的BeautifulSoup4,Chardet和Python 3.3parsing页面时出错

当我尝试调用BeautifulSoup(页面)时出现以下错误

Traceback (most recent call last): File "error.py",line 10,in <module> soup = BeautifulSoup(page) File "C:python33libsite-packagesbs4__init__.py",line 169,in __init__ self.builder.prepare_markup(markup,from_encoding)) File "C:python33libsite-packagesbs4builder_htmlparser.py",line 136,in prepare_markup dammit = Unicodedammit(markup,try_encodings,is_html=True) File "C:python33libsite-packagesbs4dammit.py",line 223,in __init__ u = self._convert_from(chardet_dammit(self.markup)) File "C:python33libsite-packagesbs4dammit.py",line 30,in chardet_dammit return chardet.detect(s)['encoding'] File "C:python33libsite-packageschardet__init__.py",line 21,in detect import universaldetector ImportError: No module named 'universaldetector'

我在Windows 7中运行Python 3.3,我通过下载.tar.gz从setup.py安装了bs4。 我已经安装了pip,然后通过执行pip.exe安装chardet来安装chardet。 我的chardet版本是2.2.1。 Bs4适用于其他url。

这是代码

import sys from urllib.request import urlopen from bs4 import BeautifulSoup import re import chardet url = "http://www.edgar-online.com/brand/yahoo/search/?cik=1400810" page = urlopen(url).read() #print(page) soup = BeautifulSoup(page)

我期待着你的回答

Windows Server 2008上的PHP exec

是否有可能由Windowspipe理的2个窗口具有相同的窗口句柄值?

login到远程机器并访问networking资源

SocketServer导致错误10053

jenkinsWindows奴隶失败的戏剧! 框架构build

WP8networking状态 – 应用程序崩溃,当它没有networking

rubygem家在Windows上

C中的指针vs句柄(是用来传达单独事物的术语?)

在Windows中如何设置Python2的sys.path?

如何使电脑从待机模式返回

我刚才遇到这种情况。

不要导入chardet,我也卸载chardet。

然后构建会通过。

下面的代码是beautifulsoup中的dammit.py lib的一部分。

也许你导入一个chardet不适合python 3.3,所以发生错误

try: # First try the fast C implementation. # PyPI package: cchardet import cchardet def chardet_dammit(s): return cchardet.detect(s)['encoding'] except ImportError: try: # Fall back to the pure Python implementation # Debian package: python-chardet # PyPI package: chardet import chardet def chardet_dammit(s): return chardet.detect(s)['encoding'] #import chardet.constants #chardet.constants._debug = 1 except ImportError: # No chardet available. def chardet_dammit(s): return None

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐