亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

總結(jié)幾個非常實用的Python庫

 更新時間:2021年06月25日 10:50:10   作者:程序員唐丁  
Python一直被自稱“batteries included”,就是因為內(nèi)置了許多非常有用的模塊,無需額外安裝和配置,即可直接使用. 除了內(nèi)建的模塊外,Python還有大量的第三方模塊,直接使用pip安裝即可使用.下面給大家簡單介紹幾個Python非常實用的自帶庫和第三方庫,需要的朋友可以參考下

自帶庫

一、datetime

datetime是Python處理日期和時間的標準庫。

1、獲取當前日期和時間

>>> from datetime import datetime

>>> now = datetime.now()

>>> print(now)

2021-06-14 09:33:10.460192

>>> print(type(now))

<class 'datetime.datetime'>

2、獲取指定日期和時間

>>> from datetime import datetime

>>> dt = datetime(2021,6,10,12,0)

>>> print(dt)

2021-06-10 12:00:00

3、datetime轉(zhuǎn)換為timestamp

在計算機中,時間實際上是用數(shù)字表示的。我們把1970年1月1日 00:00:00 UTC+00:00時區(qū)的時刻稱為epoch time,記為0(1970年以前的時間timestamp為負數(shù)),當前時間就是相對于epoch time的秒數(shù),稱為timestamp(時間戳)。

>>> from datetime import datetime

>>> now = datetime.now()

>>> now

datetime.datetime(2021, 6, 14, 9, 38, 34, 969006)

>>> now.timestamp()	#把datetime轉(zhuǎn)換為timestamp

1623634714.969006

4、timestamp轉(zhuǎn)換為datetime

>>> from datetime import datetime

>>> timestamp = 1623634714.969006

>>> print(datetime.fromtimestamp(timestamp))

2021-06-14 09:38:34.969006

5、str轉(zhuǎn)換為datetime

>>> from datetime import datetime

>>> day = datetime.strptime('2021-6-10 12:12:12','%Y-%m-%d %H:%M:%S')

>>> print(day)

2021-06-10 12:12:12

6、datetime轉(zhuǎn)換為str

>>> from datetime import datetime

>>> now = datetime.now()

>>> print(now)

2021-06-14 09:49:02.281820

>>> print(type(now))

<class 'datetime.datetime'>

>>> str_day = now.strftime('%Y-%m-%d %H:%M:%S')

>>> print(str_day)

2021-06-14 09:49:02

>>> print(type(str_day))

<class 'str'>

二、collections

collections是Python內(nèi)建的一個集合模塊,提供了許多有用的集合類,其中統(tǒng)計功能非常實用。

Counter

Counter是一個簡單的計數(shù)器,例如,統(tǒng)計字符出現(xiàn)的個數(shù)

>>> from collections import Counter

>>> c = Counter()

>>> str = 'jdkjefwnewnfjqbefbqbefqbferbb28934`83278784727'

>>> c.update(str)

>>> c

Counter({'b': 6, 'e': 5, 'f': 5, '8': 4, '7': 4, 'j': 3, 'q': 3, '2': 3, 'w': 2, 'n': 2, '3': 2, '4': 2, 'd': 1, 'k': 1, 'r': 1, '9': 1, '`': 1})

三、base64

Base64是一種用64個字符來表示任意二進制數(shù)據(jù)的方法。

用記事本打開exe、jpg、pdf這些文件時,我們都會看到一大堆亂碼,因為二進制文件包含很多無法顯示和打印的字符,所以,如果要讓記事本這樣的文本處理軟件能處理二進制數(shù)據(jù),就需要一個二進制到字符串的轉(zhuǎn)換方法。Base64是一種最常見的二進制編碼方法。

>>> import base64
>>> base64.b64encode(b'binary\x00string')
b'YmluYXJ5AHN0cmluZw=='
>>> base64.b64decode(b'YmluYXJ5AHN0cmluZw==')
b'binary\x00string'

四、hashlib

Python的hashlib提供了常見的摘要算法,如MD5,SHA1等等。

什么是摘要算法呢?摘要算法又稱哈希算法、散列算法。它通過一個函數(shù),把任意長度的數(shù)據(jù)轉(zhuǎn)換為一個長度固定的數(shù)據(jù)串(通常用16進制的字符串表示)。

我們以常見的摘要算法MD5為例,計算出一個字符串的MD5值:

>>> import hashlib

>>> md5 = hashlib.md5()

>>> md5.update("程序員唐丁".encode('utf-8'))

>>> print(md5.hexdigest())

05eb21a61d2cf0cf84e474d859c4c055

摘要算法能應用到什么地方?舉個常用例子:

任何允許用戶登錄的網(wǎng)站都會存儲用戶登錄的用戶名和口令。如何存儲用戶名和口令呢?方法是存到數(shù)據(jù)庫表中。如果以明文保存用戶口令,如果數(shù)據(jù)庫泄露,所有用戶的口令就落入黑客的手里。此外,網(wǎng)站運維人員是可以訪問數(shù)據(jù)庫的,也就是能獲取到所有用戶的口令。正確的保存口令的方式是不存儲用戶的明文口令,而是存儲用戶口令的摘要,比如MD5,當用戶登錄時,首先計算用戶輸入的明文口令的MD5,然后和數(shù)據(jù)庫存儲的MD5對比,如果一致,說明口令輸入正確,如果不一致,口令肯定錯誤。

第三方庫

一、requests

requests是一個Python第三方庫,處理URL資源特別方便。在之前的”爬蟲簡介“文章中我們已經(jīng)初步認識了它。

1、安裝requests

如果安裝了Anaconda,requests就已經(jīng)可用了。否則,需要在命令行下通過pip安裝:

$ pip install requests

如果遇到Permission denied安裝失敗,請加上sudo重試。

2、通過GET訪問豆瓣首頁,只需要幾行代碼:

>>> import requests
>>> r = requests.get('https://www.douban.com/') # 豆瓣首頁
>>> r.status_code
200
>>> r.text
r.text
'<!DOCTYPE HTML>\n<html>\n<head>\n<meta name="description" content="提供圖書、電影、音樂唱片的推薦、評論和...'

3、對于帶參數(shù)的URL,傳入一個dict作為params參數(shù):

>>> r = requests.get('https://www.douban.com/search', params={'q': 'python', 'cat': '1001'})
>>> r.url # 實際請求的URL
'https://www.douban.com/search?q=python&cat=1001'

4、requests自動檢測編碼,可以使用encoding屬性查看:

>>> r.encoding
'utf-8'

5、無論響應是文本還是二進制內(nèi)容,我們都可以用content屬性獲得bytes對象:

>>> r.content
b'<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv="Content-Type" content="text/html; charset=utf-8">\n...'

6、requests的方便之處還在于,對于特定類型的響應,例如JSON,可以直接獲?。?/p>

>>> r = requests.get('https://query.yahooapis.com/v1/public/yql?q=select%20*%20from%20weather.forecast%20where%20woeid%20%3D%202151330&format=json')
>>> r.json()
{'query': {'count': 1, 'created': '2017-11-17T07:14:12Z', ...

7、需要傳入HTTP Header時,我們傳入一個dict作為headers參數(shù):

>>> r = requests.get('https://www.douban.com/', headers={'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit'})
>>> r.text
'<!DOCTYPE html>\n<html>\n<head>\n<meta charset="UTF-8">\n <title>豆瓣(手機版)</title>...'

8、要發(fā)送POST請求,只需要把get()方法變成post(),然后傳入data參數(shù)作為POST請求的數(shù)據(jù):

>>> r = requests.post('https://accounts.douban.com/login', data={'form_email': 'abc@example.com', 'form_password': '123456'})

9、requests默認使用application/x-www-form-urlencoded對POST數(shù)據(jù)編碼。如果要傳遞JSON數(shù)據(jù),可以直接傳入json參數(shù):

params = {'key': 'value'}
r = requests.post(url, json=params) # 內(nèi)部自動序列化為JSON

10、類似的,上傳文件需要更復雜的編碼格式,但是requests把它簡化成files參數(shù):

>>> upload_files = {'file': open('report.xls', 'rb')}
>>> r = requests.post(url, files=upload_files)

在讀取文件時,注意務必使用'rb'即二進制模式讀取,這樣獲取的bytes長度才是文件的長度。

post()方法替換為put()delete()等,就可以以PUT或DELETE方式請求資源。

11、除了能輕松獲取響應內(nèi)容外,requests對獲取HTTP響應的其他信息也非常簡單。例如,獲取響應頭:

>>> r.headers
{Content-Type': 'text/html; charset=utf-8', 'Transfer-Encoding': 'chunked', 'Content-Encoding': 'gzip', ...}
>>> r.headers['Content-Type']
'text/html; charset=utf-8'

12、requests對Cookie做了特殊處理,使得我們不必解析Cookie就可以輕松獲取指定的Cookie:

>>> r.cookies['ts']
'example_cookie_12345'

13、要在請求中傳入Cookie,只需準備一個dict傳入cookies參數(shù):

>>> cs = {'token': '12345', 'status': 'working'}
>>> r = requests.get(url, cookies=cs)

14、最后,要指定超時,傳入以秒為單位的timeout參數(shù):

>>> r = requests.get(url, timeout=2.5) # 2.5秒后超時

二、chardet

字符串編碼一直是令人非常頭疼的問題,尤其是我們在處理一些不規(guī)范的第三方網(wǎng)頁的時候。雖然Python提供了Unicode表示的strbytes兩種數(shù)據(jù)類型,并且可以通過encode()decode()方法轉(zhuǎn)換,但是,在不知道編碼的情況下,對bytesdecode()不好做。

對于未知編碼的bytes,要把它轉(zhuǎn)換成str,需要先“猜測”編碼。猜測的方式是先收集各種編碼的特征字符,根據(jù)特征字符判斷,就能有很大概率“猜對”。

當然,我們肯定不能從頭自己寫這個檢測編碼的功能,這樣做費時費力。chardet這個第三方庫正好就派上了用場。用它來檢測編碼,簡單易用。

1、安裝chardet

如果安裝了Anaconda,chardet就已經(jīng)可用了。否則,需要在命令行下通過pip安裝:

$ pip install chardet

如果遇到Permission denied安裝失敗,請加上sudo重試。

2、當我們拿到一個bytes時,就可以對其檢測編碼。用chardet檢測編碼,只需要一行代碼:

>>> chardet.detect(b'Hello, world!')
{'encoding': 'ascii', 'confidence': 1.0, 'language': ''}

三、psutil

用Python來編寫腳本簡化日常的運維工作是Python的一個重要用途。在Linux下,有許多系統(tǒng)命令可以讓我們時刻監(jiān)控系統(tǒng)運行的狀態(tài),如ps,top,free等等。要獲取這些系統(tǒng)信息,Python可以通過subprocess模塊調(diào)用并獲取結(jié)果。但這樣做顯得很麻煩,尤其是要寫很多解析代碼。

在Python中獲取系統(tǒng)信息的另一個好辦法是使用psutil這個第三方模塊,它不僅可以通過一兩行代碼實現(xiàn)系統(tǒng)監(jiān)控,還可以跨平臺使用,支持Linux/UNIX/OSX/Windows等,是系統(tǒng)管理員和運維小伙伴不可或缺的必備模塊。

1、安裝psutil

如果安裝了Anaconda,psutil就已經(jīng)可用了。否則,需要在命令行下通過pip安裝:

$ pip install psutil

如果遇到Permission denied安裝失敗,請加上sudo重試。

2、獲取CPU信息

我們先來獲取CPU的信息:

>>> import psutil
>>> psutil.cpu_count() # CPU邏輯數(shù)量
4
>>> psutil.cpu_count(logical=False) # CPU物理核心
2
# 2說明是雙核超線程, 4則是4核非超線程

3、統(tǒng)計CPU的用戶/系統(tǒng)/空閑時間:

>>> psutil.cpu_times()
scputimes(user=10963.31, nice=0.0, system=5138.67, idle=356102.45)

4、獲取內(nèi)存信息

使用psutil獲取物理內(nèi)存和交換內(nèi)存信息,分別使用:

>>> psutil.virtual_memory()
svmem(total=8589934592, available=2866520064, percent=66.6, used=7201386496, free=216178688, active=3342192640, inactive=2650341376, wired=1208852480)
>>> psutil.swap_memory()
sswap(total=1073741824, used=150732800, free=923009024, percent=14.0, sin=10705981440, sout=40353792)

返回的是字節(jié)為單位的整數(shù),可以看到,總內(nèi)存大小是8589934592 = 8 GB,已用7201386496 = 6.7 GB,使用了66.6%。

而交換區(qū)大小是1073741824 = 1 GB。

5、獲取磁盤信息

可以通過psutil獲取磁盤分區(qū)、磁盤使用率和磁盤IO信息:

>>> psutil.disk_partitions() # 磁盤分區(qū)信息
[sdiskpart(device='/dev/disk1', mountpoint='/', fstype='hfs', opts='rw,local,rootfs,dovolfs,journaled,multilabel')]
>>> psutil.disk_usage('/') # 磁盤使用情況
sdiskusage(total=998982549504, used=390880133120, free=607840272384, percent=39.1)
>>> psutil.disk_io_counters() # 磁盤IO
sdiskio(read_count=988513, write_count=274457, read_bytes=14856830464, write_bytes=17509420032, read_time=2228966, write_time=1618405)

好了,就先介紹這么多吧,更多實用的Python庫后面唐丁再給大家一一介紹

到此這篇關于總結(jié)幾個非常實用的Python庫的文章就介紹到這了,更多相關Python庫內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • Python數(shù)據(jù)結(jié)構之棧詳解

    Python數(shù)據(jù)結(jié)構之棧詳解

    棧和隊列是在程序設計中常見的數(shù)據(jù)類型,從數(shù)據(jù)結(jié)構的角度來講,棧和隊列也是線性表,是操作受限的線性表。本文將詳細介紹一下Python中的棧,感興趣的可以了解一下
    2022-03-03
  • Python Numpy實現(xiàn)計算矩陣的均值和標準差詳解

    Python Numpy實現(xiàn)計算矩陣的均值和標準差詳解

    NumPy(Numerical Python)是Python的一種開源的數(shù)值計算擴展。這種工具可用來存儲和處理大型矩陣,比Python自身的嵌套列表結(jié)構要高效的多。本文主要介紹用NumPy實現(xiàn)計算矩陣的均值和標準差,感興趣的小伙伴可以了解一下
    2021-11-11
  • python部署chineseocr_lite的實現(xiàn)示例

    python部署chineseocr_lite的實現(xiàn)示例

    本文主要介紹了python部署chineseocr_lite的實現(xiàn)示例,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2023-07-07
  • python如何對鏈表操作

    python如何對鏈表操作

    這篇文章主要介紹了python如何對鏈表操作,幫助大家更好的理解和使用python,感興趣的朋友可以了解下
    2020-10-10
  • Python:一行代碼,導入Python所有庫

    Python:一行代碼,導入Python所有庫

    在本篇內(nèi)容里小編給大家分享如何用一行代碼,導入Python所有庫,有需要的朋友們可以學習下,希望能夠給你帶來幫助
    2021-10-10
  • 多場景下的Pandas使用技巧分享

    多場景下的Pandas使用技巧分享

    這篇文章主要介紹了多場景下的Pandas使用技巧,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2024-02-02
  • 在Python中COM口的調(diào)用方法

    在Python中COM口的調(diào)用方法

    今天小編就為大家分享一篇在Python中COM口的調(diào)用方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-07-07
  • Django ORM判斷查詢結(jié)果是否為空,判斷django中的orm為空實例

    Django ORM判斷查詢結(jié)果是否為空,判斷django中的orm為空實例

    這篇文章主要介紹了Django ORM判斷查詢結(jié)果是否為空,判斷django中的orm為空實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-07-07
  • Python利用雪花算法實現(xiàn)生成唯一ID

    Python利用雪花算法實現(xiàn)生成唯一ID

    雪花算法是在一個項目體系中生成全局唯一ID標識的一種方式,偶然間看到了Python使用雪花算法不盡感嘆真的是太便捷了。本文就來聊聊這具體的實現(xiàn)方法,感興趣的可以了解一下
    2022-11-11
  • Python抓取框架 Scrapy的架構

    Python抓取框架 Scrapy的架構

    這篇文章主要為大家詳細介紹了Python抓取框架,針對Scrapy的架構進行分析,感興趣的小伙伴們可以參考一下
    2016-08-08

最新評論