Python實(shí)現(xiàn)推送百度鏈接的示例代碼
通過(guò)代碼實(shí)現(xiàn)抓取個(gè)人博客中某一頁(yè)指定文章鏈接,并批量將該鏈接推送到百度站長(zhǎng)平臺(tái),起到快速收錄的目的。?
import sys import requests from bs4 import BeautifulSoup # 推送百度爬蟲(chóng) def push_page(url): headers = { 'User-Agent': 'curl/7.12.1', 'Host': 'data.zz.baidu.com', 'Content-Type': 'text/plain', 'Content-Length': '83' } urls = "http://data.zz.baidu.com/urls?site=https://www.lyshark.com&token=xxxxxxx" try: html = requests.post(urls, headers=headers, data=url, timeout=5).text push_status = eval(html)['success'] if push_status == 1: return 1 else: return 0 except: return 0 # 獲取路徑 def get_page(page): html = requests.get(page,timeout=5).text try: bs = BeautifulSoup(html,"html.parser") ret = bs.select('div[class="container"] div[class="row"] h2[class="post-title"] a') for item in ret: push_url = item.get('href') push_ref = push_page(push_url) print("推送: {} --> 狀態(tài): {}".format(push_url,push_ref)) return 1 except: return 0 if __name__ == "__main__": arg = sys.argv get_page(arg[1])
補(bǔ)充
在百度的站長(zhǎng)平臺(tái)上介紹了鏈接提交方法,目前有這四種:
主動(dòng)推送:最快的提交方式,推薦將站點(diǎn)當(dāng)天新產(chǎn)出鏈接立即通過(guò)此方式推送給百度,以保證新鏈接可以及時(shí)被百度收錄。
自動(dòng)推送:最為便捷的提交方式,將自動(dòng)推送的JS代碼部署在站點(diǎn)的每一個(gè)頁(yè)面源代碼中,部署代碼的頁(yè)面在每次被瀏覽時(shí),鏈接會(huì)被自動(dòng)推送給百度??梢耘c主動(dòng)推送配合使用。
sitemap:將網(wǎng)站鏈接放到sitemap中,然后將sitemap的地址提交給百度。百度會(huì)周期性的抓取檢查您提交的sitemap,對(duì)其中的鏈接進(jìn)行處理,但收錄速度慢于主動(dòng)推送。
手動(dòng)提交:操作起來(lái)麻煩。
為了讓網(wǎng)站最新的內(nèi)容更加及時(shí)的提交給百度,使用主動(dòng)推送就很必要,百度給的例子中沒(méi)有 Python 的。根據(jù) Google 了一下,還真找到了不錯(cuò)的腳本,分享收藏一下。
以下腳本使用 Python3,未在 Python2 環(huán)境下測(cè)試過(guò)。
讀取本地生成的 sitemap.txt 文件
另外,可嘗試以下腳本。
到此這篇關(guān)于Python實(shí)現(xiàn)推送百度鏈接的示例代碼的文章就介紹到這了,更多相關(guān)Python推送百度鏈接內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python使用threading獲取線程函數(shù)返回值的實(shí)現(xiàn)方法
這篇文章主要介紹了python使用threading獲取線程函數(shù)返回值的實(shí)現(xiàn)方法,需要的朋友可以參考下2017-11-11簡(jiǎn)單談?wù)凱ython中的反轉(zhuǎn)字符串問(wèn)題
本文給大家總結(jié)了5種可以實(shí)現(xiàn)python中反轉(zhuǎn)字符串的方法,非常的實(shí)用,有需要的小伙伴可以參考下2016-10-10Python讀取Word文檔中的Excel嵌入文件的方法詳解
這篇文章主要為大家詳細(xì)介紹了Python讀取Word文檔中的Excel嵌入文件的方法,文中的示例代碼講解詳細(xì),具有一定的借鑒價(jià)值,需要的可以參考一下2022-12-12python求numpy中array按列非零元素的平均值案例
這篇文章主要介紹了python求numpy中array按列非零元素的平均值案例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-06-06python實(shí)現(xiàn)拉普拉斯特征圖降維示例
今天小編就為大家分享一篇python實(shí)現(xiàn)拉普拉斯特征圖降維示例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-11-11解決pytorch讀取自制數(shù)據(jù)集出現(xiàn)過(guò)的問(wèn)題
這篇文章主要介紹了解決pytorch讀取自制數(shù)據(jù)集出現(xiàn)過(guò)的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-05-05Django如何利用uwsgi和nginx修改代碼自動(dòng)重啟
這篇文章主要介紹了Django如何利用uwsgi和nginx修改代碼自動(dòng)重啟問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-05-05python實(shí)現(xiàn)windows倒計(jì)時(shí)鎖屏功能
這篇文章主要介紹了python實(shí)現(xiàn)windows倒計(jì)時(shí)鎖屏功能,代碼簡(jiǎn)單易懂,非常不錯(cuò),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-07-07