Python處理PDF與CDF實例
在拿到數(shù)據(jù)后,最需要做的工作之一就是查看一下自己的數(shù)據(jù)分布情況。而針對數(shù)據(jù)的分布,又包括pdf和cdf兩類。
下面介紹使用python生成pdf的方法:
使用matplotlib的畫圖接口hist(),直接畫出pdf分布;
使用numpy的數(shù)據(jù)處理函數(shù)histogram(),可以生成pdf分布數(shù)據(jù),方便進(jìn)行后續(xù)的數(shù)據(jù)處理,比如進(jìn)一步生成cdf;
使用seaborn的distplot(),好處是可以進(jìn)行pdf分布的擬合,查看自己數(shù)據(jù)的分布類型;
上圖所示為采用3種算法生成的pdf圖。下面是源代碼。
from scipy import stats import matplotlib.pyplot as plt import numpy as np import seaborn as sns arr = np.random.normal(size=100) # plot histogram plt.subplot(221) plt.hist(arr) # obtain histogram data plt.subplot(222) hist, bin_edges = np.histogram(arr) plt.plot(hist) # fit histogram curve plt.subplot(223) sns.distplot(arr, kde=False, fit=stats.gamma, rug=True) plt.show()
下面介紹使用python生成cdf的方法:
使用numpy的數(shù)據(jù)處理函數(shù)histogram(),生成pdf分布數(shù)據(jù),進(jìn)一步生成cdf;
使用seaborn的cumfreq(),直接畫出cdf;
上圖所示為采用2種算法生成的cdf圖。下面是源代碼。
from scipy import stats import matplotlib.pyplot as plt import numpy as np import seaborn as sns arr = np.random.normal(size=100) plt.subplot(121) hist, bin_edges = np.histogram(arr) cdf = np.cumsum(hist) plt.plot(cdf) plt.subplot(122) cdf = stats.cumfreq(arr) plt.plot(cdf[0]) plt.show()
在更多時候,需要把pdf和cdf放在一起,可以更好的顯示數(shù)據(jù)分布。這個實現(xiàn)需要把pdf和cdf分別進(jìn)行歸一化。
上圖所示為歸一化的pdf和cdf。下面是源代碼。
from scipy import stats import matplotlib.pyplot as plt import numpy as np import seaborn as sns arr = np.random.normal(size=100) hist, bin_edges = np.histogram(arr) width = (bin_edges[1] - bin_edges[0]) * 0.8 plt.bar(bin_edges[1:], hist/max(hist), width=width, color='#5B9BD5') cdf = np.cumsum(hist/sum(hist)) plt.plot(bin_edges[1:], cdf, '-*', color='#ED7D31') plt.xlim([-2, 2]) plt.ylim([0, 1]) plt.grid() plt.show()
以上這篇Python處理PDF與CDF實例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python使用pyforms實現(xiàn)輕松構(gòu)建GUI
pyforms是一個基于Python的GUI框架,它提供了一種簡單而強(qiáng)大的方式來構(gòu)建圖形用戶界面,本文將介紹pyforms的使用場景、優(yōu)勢以及常用的Python代碼案例,需要的小伙伴可以了解下2024-01-01Django調(diào)用百度AI接口實現(xiàn)人臉注冊登錄代碼實例
這篇文章主要介紹了Django調(diào)用百度AI接口實現(xiàn)人臉注冊登錄,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-04-04python讓圖片按照exif信息里的創(chuàng)建時間進(jìn)行排序的方法
這篇文章主要介紹了python讓圖片按照exif信息里的創(chuàng)建時間進(jìn)行排序的方法,涉及Python操作圖片exif獲取信息的技巧,需要的朋友可以參考下2015-03-03python基于物品協(xié)同過濾算法實現(xiàn)代碼
這篇文章主要為大家詳細(xì)介紹了python基于物品協(xié)同過濾算法實現(xiàn)代碼,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-05-05Python一行代碼識別發(fā)票并保存Excel示例詳解
這篇文章主要為大家介紹了Python一行代碼識別發(fā)票并保存Excel示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-03-03詳解如何在Python中使用Jinja2進(jìn)行模板渲染
Jinja2 是一個現(xiàn)代的、設(shè)計精美的 Python 模板引擎,它使用類似于 Django 的模板語言來渲染文本文件,下面我將通過幾個例子展示如何在 Python 中使用 Jinja2 進(jìn)行模板渲染,文中有詳細(xì)的代碼供大家參考,需要的朋友可以參考下2024-08-08關(guān)于python pygame游戲進(jìn)行聲音添加的技巧
這篇文章主要給大家分享的是pygame游戲進(jìn)行聲音添加的方法,這文中介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們一定要看完!2021-10-10Python實現(xiàn)Tracert追蹤TTL值的方法詳解
Tracert命令跟蹤路由原理是IP路由每經(jīng)過一個路由節(jié)點TTL值會減一。本文我們將通過scapy構(gòu)造一個路由追蹤工具并實現(xiàn)一次追蹤,感興趣的小伙伴可以了解一下2022-10-10