当我尝试调用BeautifulSoup(页面)时出现以下错误
Traceback (most recent call last): File "error.py",line 10,in <module> soup = BeautifulSoup(page) File "C:python33libsite-packagesbs4__init__.py",line 169,in __init__ self.builder.prepare_markup(markup,from_encoding)) File "C:python33libsite-packagesbs4builder_htmlparser.py",line 136,in prepare_markup dammit = Unicodedammit(markup,try_encodings,is_html=True) File "C:python33libsite-packagesbs4dammit.py",line 223,in __init__ u = self._convert_from(chardet_dammit(self.markup)) File "C:python33libsite-packagesbs4dammit.py",line 30,in chardet_dammit return chardet.detect(s)['encoding'] File "C:python33libsite-packageschardet__init__.py",line 21,in detect import universaldetector ImportError: No module named 'universaldetector'
我在Windows 7中运行Python 3.3,我通过下载.tar.gz从setup.py安装了bs4。 我已经安装了pip,然后通过执行pip.exe安装chardet来安装chardet。 我的chardet版本是2.2.1。 Bs4适用于其他url。
这是代码
import sys from urllib.request import urlopen from bs4 import BeautifulSoup import re import chardet url = "http://www.edgar-online.com/brand/yahoo/search/?cik=1400810" page = urlopen(url).read() #print(page) soup = BeautifulSoup(page)
我期待着你的回答
Windows Server 2008上的PHP exec
是否有可能由Windowspipe理的2个窗口具有相同的窗口句柄值?
login到远程机器并访问networking资源
SocketServer导致错误10053
jenkinsWindows奴隶失败的戏剧! 框架构build
WP8networking状态 – 应用程序崩溃,当它没有networking
rubygem家在Windows上
C中的指针vs句柄(是用来传达单独事物的术语?)
在Windows中如何设置Python2的sys.path?
如何使电脑从待机模式返回
我刚才遇到这种情况。
不要导入chardet,我也卸载chardet。
然后构建会通过。
下面的代码是beautifulsoup中的dammit.py lib的一部分。
也许你导入一个chardet不适合python 3.3,所以发生错误。
try: # First try the fast C implementation. # PyPI package: cchardet import cchardet def chardet_dammit(s): return cchardet.detect(s)['encoding'] except ImportError: try: # Fall back to the pure Python implementation # Debian package: python-chardet # PyPI package: chardet import chardet def chardet_dammit(s): return chardet.detect(s)['encoding'] #import chardet.constants #chardet.constants._debug = 1 except ImportError: # No chardet available. def chardet_dammit(s): return None
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。