Python爬虫中正则表达式的用法,只讲如何应用,不讲原理
Python爬虫:正则的用法(非原理)。
大家好,这节课给大家讲正则的实际用法,不讲原理,通俗易懂的讲如何用正则抓取内容。
·导入re库,这里是需要从html这段字符串中提取出中间的那几个文字。实例一个对象obj,通过它提取需要的内容。
·这里将需要的取得文字替换成(。*?),然后同re.findall对html进行解析提取。
·输出结果赋值给result,打印输出一下,可以看到输出结果成功且输出的是列表,说明如果匹配到了多个结果,那么这多个结果都将会存放在这个列表当中。
这是对匹配同一种内容进行的讲解,通过这样就可以提取出想要的单一结果。
下一节我们讲如何用正则从一段话中提取出多个需要的值。