亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python 線性回歸分析以及評(píng)價(jià)指標(biāo)詳解

 更新時(shí)間:2020年04月02日 08:59:07   作者:偏執(zhí)灬  
這篇文章主要介紹了Python 線性回歸分析以及評(píng)價(jià)指標(biāo)詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

廢話不多說(shuō),直接上代碼吧!

"""
# 利用 diabetes數(shù)據(jù)集來(lái)學(xué)習(xí)線性回歸 
# diabetes 是一個(gè)關(guān)于糖尿病的數(shù)據(jù)集, 該數(shù)據(jù)集包括442個(gè)病人的生理數(shù)據(jù)及一年以后的病情發(fā)展情況。 
# 數(shù)據(jù)集中的特征值總共10項(xiàng), 如下: 
 # 年齡 
 # 性別 
 #體質(zhì)指數(shù) 
 #血壓 
 #s1,s2,s3,s4,s4,s6 (六種血清的化驗(yàn)數(shù)據(jù)) 
 #但請(qǐng)注意,以上的數(shù)據(jù)是經(jīng)過(guò)特殊處理, 10個(gè)數(shù)據(jù)中的每個(gè)都做了均值中心化處理,然后又用標(biāo)準(zhǔn)差乘以個(gè)體數(shù)量調(diào)整了數(shù)值范圍。
 #驗(yàn)證就會(huì)發(fā)現(xiàn)任何一列的所有數(shù)值平方和為1. 
"""
 
import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets, linear_model
from sklearn.metrics import mean_squared_error, r2_score
 
# Load the diabetes dataset
diabetes = datasets.load_diabetes() 
 
# Use only one feature 
# 增加一個(gè)維度,得到一個(gè)體質(zhì)指數(shù)數(shù)組[[1],[2],...[442]]
diabetes_X = diabetes.data[:, np.newaxis,2]
print(diabetes_X)
 
# Split the data into training/testing sets
diabetes_X_train = diabetes_X[:-20]
diabetes_X_test = diabetes_X[-20:]
 
# Split the targets into training/testing sets
diabetes_y_train = diabetes.target[:-20]
diabetes_y_test = diabetes.target[-20:]
 
# Create linear regression object
regr = linear_model.LinearRegression()
 
# Train the model using the training sets
regr.fit(diabetes_X_train, diabetes_y_train)
 
# Make predictions using the testing set
diabetes_y_pred = regr.predict(diabetes_X_test)
 
# The coefficients 
# 查看相關(guān)系數(shù) 
print('Coefficients: \n', regr.coef_)
 
 
# The mean squared error 
# 均方差
# 查看殘差平方的均值(mean square error,MSE) 
print("Mean squared error: %.2f"
  % mean_squared_error(diabetes_y_test, diabetes_y_pred))
 
 
# Explained variance score: 1 is perfect prediction 
# R2 決定系數(shù)(擬合優(yōu)度)
# 模型越好:r2→1
# 模型越差:r2→0
print('Variance score: %.2f' % r2_score(diabetes_y_test, diabetes_y_pred))
 
 
# Plot outputs
plt.scatter(diabetes_X_test, diabetes_y_test, color='black')
plt.plot(diabetes_X_test, diabetes_y_pred, color='blue', linewidth=3)
 
plt.xticks(())
plt.yticks(())
 
plt.show()

對(duì)于回歸模型效果的判斷指標(biāo)經(jīng)過(guò)了幾個(gè)過(guò)程,從SSE到R-square再到Ajusted R-square, 是一個(gè)完善的過(guò)程:

SSE(誤差平方和):The sum of squares due to error

R-square(決定系數(shù)):Coefficient of determination

Adjusted R-square:Degree-of-freedom adjusted coefficient of determination

下面我對(duì)以上幾個(gè)名詞進(jìn)行詳細(xì)的解釋下,相信能給大家?guī)?lái)一定的幫助?。?/p>

一、SSE(誤差平方和)

計(jì)算公式如下:

同樣的數(shù)據(jù)集的情況下,SSE越小,誤差越小,模型效果越好

缺點(diǎn):

SSE數(shù)值大小本身沒(méi)有意義,隨著樣本增加,SSE必然增加,也就是說(shuō),不同的數(shù)據(jù)集的情況下,SSE比較沒(méi)有意義

二、R-square(決定系數(shù))

數(shù)學(xué)理解: 分母理解為原始數(shù)據(jù)的離散程度,分子為預(yù)測(cè)數(shù)據(jù)和原始數(shù)據(jù)的誤差,二者相除可以消除原始數(shù)據(jù)離散程度的影響

其實(shí)“決定系數(shù)”是通過(guò)數(shù)據(jù)的變化來(lái)表征一個(gè)擬合的好壞。

理論上取值范圍(-∞,1], 正常取值范圍為[0 1] ------實(shí)際操作中通常會(huì)選擇擬合較好的曲線計(jì)算R²,因此很少出現(xiàn)-∞

越接近1,表明方程的變量對(duì)y的解釋能力越強(qiáng),這個(gè)模型對(duì)數(shù)據(jù)擬合的也較好

越接近0,表明模型擬合的越差

經(jīng)驗(yàn)值:>0.4, 擬合效果好

缺點(diǎn):

數(shù)據(jù)集的樣本越大,R²越大,因此,不同數(shù)據(jù)集的模型結(jié)果比較會(huì)有一定的誤差

三、Adjusted R-Square (校正決定系數(shù))

n為樣本數(shù)量,p為特征數(shù)量

消除了樣本數(shù)量和特征數(shù)量的影響

以上這篇Python 線性回歸分析以及評(píng)價(jià)指標(biāo)詳解就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • 如何利用pytesseract識(shí)別圖片中的數(shù)字

    如何利用pytesseract識(shí)別圖片中的數(shù)字

    這篇文章主要介紹了如何利用pytesseract識(shí)別圖片中的數(shù)字問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-05-05
  • python實(shí)現(xiàn)web郵箱掃描的示例(附源碼)

    python實(shí)現(xiàn)web郵箱掃描的示例(附源碼)

    這篇文章主要介紹了python實(shí)現(xiàn)web郵箱掃描的示例(附源碼),幫助大家更好的理解和學(xué)習(xí)使用python,感興趣的朋友可以了解下
    2021-03-03
  • pytorch之ImageFolder使用詳解

    pytorch之ImageFolder使用詳解

    今天小編就為大家分享一篇pytorch之ImageFolder使用詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-01-01
  • pycharm 2019 最新激活方式(pycharm破解、激活)

    pycharm 2019 最新激活方式(pycharm破解、激活)

    這篇文章主要介紹了最新2019pycharm激活方式(pycharm破解、激活),本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-01-01
  • AI生成圖片Stable?Diffusion環(huán)境搭建與運(yùn)行方法

    AI生成圖片Stable?Diffusion環(huán)境搭建與運(yùn)行方法

    Stable?Diffusion是一種基于擴(kuò)散過(guò)程的生成模型,由Ge?et?al.在2021年提出,該模型利用了隨機(jī)變量的穩(wěn)定分布,通過(guò)遞歸地應(yīng)用擴(kuò)散過(guò)程來(lái)生成高質(zhì)量的圖像,這篇文章主要介紹了AI圖片生成Stable?Diffusion環(huán)境搭建與運(yùn)行,需要的朋友可以參考下
    2023-05-05
  • Python反射操作對(duì)象屬性方法詳解

    Python反射操作對(duì)象屬性方法詳解

    這篇文章主要介紹了Python反射操作對(duì)象屬性方法詳解,在Python面對(duì)對(duì)象中,通過(guò)字符串的形式去操作對(duì)象的屬性方法就稱之為反射(在Python中一切事物都是可以為對(duì)象),需要的朋友可以參考下
    2023-08-08
  • Python中的Cookie模塊如何使用

    Python中的Cookie模塊如何使用

    在本篇文章中小編給大家整理的是一篇關(guān)于Python中的Cookie模塊用法的相關(guān)知識(shí)點(diǎn)文章,需要的朋友們可以參考下。
    2020-06-06
  • python3編寫(xiě)ThinkPHP命令執(zhí)行Getshell的方法

    python3編寫(xiě)ThinkPHP命令執(zhí)行Getshell的方法

    這篇文章主要介紹了python3編寫(xiě)ThinkPHP命令執(zhí)行Getshell的方法,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧
    2019-02-02
  • python3.6.5基于kerberos認(rèn)證的hive和hdfs連接調(diào)用方式

    python3.6.5基于kerberos認(rèn)證的hive和hdfs連接調(diào)用方式

    這篇文章主要介紹了python3.6.5基于kerberos認(rèn)證的hive和hdfs連接調(diào)用方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-06-06
  • pandas DataFrame運(yùn)算的實(shí)現(xiàn)

    pandas DataFrame運(yùn)算的實(shí)現(xiàn)

    這篇文章主要介紹了pandas DataFrame運(yùn)算的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-06-06

最新評(píng)論