正则表达式
re模块 关于字符串的匹配 正则表达式是客观存在的 书籍《正则指引》爬虫方面‘‘‘字符组:[字符组] 一个字符组只能匹配一个字符 [0-9] [a-z] [A-Z] [0-9a-z]A 65 a 97 [A-z]可以但是中间还有其他的字符 不推荐这种写法元字符 只匹配一个字符 . 匹配除了换行符以外的所有字符 \w 匹配字母或数字或下划线 word \s 匹配任意的空白符 space 比如:空格 tab \d 匹配数字 digit \W 匹配非字母或数字或下划线 \D 匹配非数字 \S 匹配非空白符 \n 匹配一个换行符 \t 匹配一个制表符 tab \b 匹配一个单词的结尾 ^ 匹配字符串的开始 ^[a-z]以a-z中的一个字母开头 $ 匹配字符串的结尾 a|b 匹配字符a或字符b ab|abc 从左到右匹配 如果匹配到ab就不往后匹配了 abc|ab () 匹配括号内的表达式,也表示一个组 [...] 匹配字符组中的字符 [^...] 匹配除了字符组中字符的所有字符 [^abc]除了abc不匹配 量词: 量词 用法说明 * 重复零次或更多次 + 重复一次或更多次 ? 重复零次或一次 {n} 重复n次 \d{11} {n,} 重复n次或更多次 {n,m} 重复n到m次‘‘‘
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。