首页 > IT技术笔记 > 查看笔记

python常用正则表达式

2021-01-14 22:28:35 asdqwe python 274 0

使用selenium爬取html网页内容，

1.获取tr标签之间内容

该部分主要是通过正则表达式获取两个标签之间的内容，通常这种标签都是成对出现的。开始标签如：

后缀标签如：

核心代码：

2.获取超链接

之间内容

通常在使用正则表达式时，需要分析网页链接，获取URL或网页内容。核心代码如下：

3.爬取网页中所有URL链接

4.抓取title标签间的内容

标签：修复优化

相关推荐

评论