淺談Python采集網(wǎng)頁時正則表達式匹配換行符的問題

更新時間：2018年12月20日 10:10:43 作者：lmb20056127

今天小編就為大家分享一篇淺談Python采集網(wǎng)頁時正則表達式匹配換行符的問題，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

如下所示：

p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #這樣采集html時出錯，采集不到數(shù)據(jù)，正則中 . 是不能匹配換行符，改成如下：
p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 這是我們寫的正則表達式規(guī)則，你現(xiàn)在可以不理解啥意思

[\s\S]

\s

匹配任何空白字符，包括空格、制表符、換頁符等等。等價于[ \f\n\r\t\v]。

\S

匹配任何非空白字符。等價于[^ \f\n\r\t\v]。

以上這篇淺談Python采集網(wǎng)頁時正則表達式匹配換行符的問題就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

Python入門篇之字典
在元組和列表中，都是通過編號進行元素的訪問，但有的時候我們按名字進行數(shù)據(jù)甚至數(shù)據(jù)結構的訪問，在python中也提供了內置的映射類型--字典。映射其實就是一組key和value以及之間的映射函數(shù)，其特點是：key的唯一性、key與value的一對多的映射。
2014-10-10
使用Python進行數(shù)據(jù)清洗和預處理的實現(xiàn)代碼
Python作為數(shù)據(jù)科學領域的熱門編程語言,提供了豐富的庫和工具來處理和清洗數(shù)據(jù),本文將介紹如何使用Python進行數(shù)據(jù)清洗和預處理,并提供相應的代碼示例,需要的朋友可以參考下
2024-05-05
實時獲取Python的print輸出流方法
今天小編就為大家分享一篇實時獲取Python的print輸出流方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-01-01
python 圖片驗證碼代碼
在網(wǎng)絡應用中，驗證碼常常作為一個必備的手段，用來避免機器人惡意注冊，保證坐在瀏覽器前的是一個人。
2008-12-12
解決Python 寫文件報錯TypeError的問題
這篇文章主要介紹了解決Python 寫文件報錯TypeError的問題，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-10-10
5分鐘教會你用Docker部署一個Python應用
Docker是一個開源項目,為開發(fā)人員和系統(tǒng)管理員提供了一個開放平臺,可以將應用程序構建、打包為一個輕量級容器,并在任何地方運行,下面這篇文章主要給大家介紹了關于如何通過5分鐘教會你用Docker部署一個Python應用,需要的朋友可以參考下
2022-06-06
關于Python網(wǎng)絡爬蟲requests庫的介紹
這篇文章主要介紹了關于Python網(wǎng)絡爬蟲requests庫,而很多時候這些數(shù)據(jù)存儲在網(wǎng)頁中，手動下載需要花費的時間太長，這時候我們就需要網(wǎng)絡爬蟲幫助我們自動爬取這些數(shù)據(jù),需要的朋友可以參考下
2023-04-04
python實現(xiàn)趣味圖片字符化
這篇文章主要為大家詳細介紹了python實現(xiàn)趣味圖片字符化，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2019-04-04
深入分析python 排序
這篇文章主要介紹了python 排序的相關資料，幫助大家更好的理解和學習python排序的知識，感興趣的朋友可以了解下
2020-08-08
Python 數(shù)據(jù)結構之隊列的實現(xiàn)
這篇文章主要介紹了Python 數(shù)據(jù)結構之隊列的實現(xiàn)的相關資料,需要的朋友可以參考下
2017-01-01