亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

簡單且有用的Python數(shù)據(jù)分析和機(jī)器學(xué)習(xí)代碼

 更新時間:2021年07月02日 09:50:07   作者:heshuuqqq  
Python編程是一種通用的編程語言,開源、靈活、功能強(qiáng)大且易于使用,python最重要的特性之一是其用于數(shù)據(jù)處理和分析任務(wù)的豐富實用程序和庫集,這篇文章主要給大家介紹了一些簡單且有用的Python數(shù)據(jù)分析和機(jī)器學(xué)習(xí)代碼,需要的朋友可以參考下

為什么選擇Python進(jìn)行數(shù)據(jù)分析?

Python是一門動態(tài)的、面向?qū)ο蟮哪_本語言,同時也是一門簡約,通俗易懂的編程語言。Python入門簡單,代碼可讀性強(qiáng),一段好的Python代碼,閱讀起來像是在讀一篇外語文章。Python這種特性稱為“偽代碼”,它可以使你只關(guān)心完成什么樣的工作任務(wù),而不是糾結(jié)于Python的語法。

另外,Python是開源的,它擁有非常多優(yōu)秀的庫,可以用于數(shù)據(jù)分析及其他領(lǐng)域。更重要的是,Python與最受歡迎的開源大數(shù)據(jù)平臺Hadoop具有很好的兼容性。因此,學(xué)習(xí)Python對于有志于向大數(shù)據(jù)分析崗位發(fā)展的數(shù)據(jù)分析師來說,是一件非常節(jié)省學(xué)習(xí)成本的事。

Python的眾多優(yōu)點讓它成為最受歡迎的程序設(shè)計語言之一,國內(nèi)外許多公司也已經(jīng)在使用Python,例YouTube,Google,阿里云等等。

簡單且有用的Python數(shù)據(jù)分析和機(jī)器學(xué)習(xí)代碼

經(jīng)過這個月的python數(shù)據(jù)分析和機(jī)器學(xué)習(xí),總結(jié)了一些經(jīng)驗,同時也收獲了一些大佬的優(yōu)秀博客,感興趣的可以觀看我的收藏夾,廢話不多說,直接進(jìn)入正題。

數(shù)據(jù)分析大致分為數(shù)據(jù)處理,模型建立,模型測試這3部,這篇文章主要是講解對數(shù)據(jù)進(jìn)行處理

為了對數(shù)據(jù)進(jìn)行分析,首先要了解學(xué)習(xí)python的熊貓庫pandas,下面是一些基礎(chǔ)簡單的操作方法,python調(diào)用方法如下

import pandas as pd

python通過pandas讀取csv文件的方法

df= pd.read_csv("xxx.csv")
#輸出文件內(nèi)容前五列
print(df.head())
#輸出csv所有內(nèi)容
print(df)

查看csv某列數(shù)據(jù)的方法

pandas.read_csv(‘file_name.csv', usecols = [0,1,2,3]) 
#簡單方法
df["屬性列名稱"]

pandas刪除csv數(shù)據(jù)某些列的方法

droplabels= ['x_cat4','x_cat5','x_cat8','x_cat9']
data=df.drop(droplabels,axis=1)

pandas對NAN數(shù)據(jù)清洗的方法

#將表格中含有nan數(shù)值的列進(jìn)行刪除,返回非空數(shù)據(jù)和索引值的Series
df.dropna()
'''
dropna(axis=0,how='any',thresh=None),how參數(shù)可選的值為any或者all.all僅在切片元素全為NA時才拋棄該行(列)。thresh為整數(shù)類型,eg:thresh=3,那么一行當(dāng)中至少有三個NA值時才將其保留。
'''
data.fillna(0)                      #將nan替換為0
print(data.fillna(data.mean()))     ### 用每列特征的均值填充缺失數(shù)據(jù)
print(data.fillna(data.median()))    ### 用每列特征的中位數(shù)填充缺失數(shù)據(jù)
print(data.fillna(method='bfill'))   ### 用相鄰后面(back)特征填充前面空值
print(data.fillna(method='pad'))     ### 用相鄰前面特征填充后面空值
#參考博客:https://blog.csdn.net/qq_21840201/article/details/81008566

pandas對csv文件數(shù)據(jù)的更改的方法

#更改某列屬性數(shù)值和類型
df = df[df['漲跌幅']!='None']
df['漲跌幅'] = df['漲跌幅'].astype(np.float64)
df = pd.DataFrame(a, dtype='float') #數(shù)據(jù)類型轉(zhuǎn)化
#參考鏈接:http://www.45fan.com/article.php?aid=19070771581800099094144284
#對數(shù)據(jù)全部遍歷讀取并更改,參考如下
for i in df.index:
    df["id1"][i]=1

pandas的iloc的使用方法和作用

X = df.iloc[:, data.columns != 'label']  # 取出不包括 label其他的列

df.iloc[:3, :2]           #使用.iloc ,我們只選擇了.iloc的前3行和2列

計算某列元素數(shù)量的方法

sum= len(data[data.label == 'BENIGN']) #計算BENIGN的數(shù)量
len(df)       

pandas對文件進(jìn)行保存的方法

#df為要保存的數(shù)據(jù),xxx.csv為保存的文件
df.to_csv('xxx.csv', index=False, sep=',')

以上是pandas對數(shù)據(jù)進(jìn)行處理的簡單功能,其中含有一些參考學(xué)習(xí)的博客,感興趣的同學(xué)可以觀看學(xué)習(xí)。有了這些基礎(chǔ)知識,我們才能對數(shù)據(jù)集進(jìn)行處理,接下來就是如何使用的問題了,下面講解簡單的套路。

1.首先觀察數(shù)據(jù),通過代碼檢測每一列的數(shù)據(jù)類型再進(jìn)行考察,檢測是否存在NAN值,可以刪除該列,也可根據(jù)情況進(jìn)行數(shù)值的變動。

2.數(shù)據(jù)集中可能存在部分列屬性為time屬性,一般不要直接將該列刪除,可通過將其轉(zhuǎn)化為浮點類型

3.字符串類型向數(shù)值類型的轉(zhuǎn)換,部分字符串需要進(jìn)行轉(zhuǎn)換,這個就視情況而定了。

總結(jié)

到此這篇關(guān)于Python數(shù)據(jù)分析和機(jī)器學(xué)習(xí)代碼的文章就介紹到這了,更多相關(guān)Python數(shù)據(jù)分析代碼內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 使用pycharm創(chuàng)建Django項目失敗的解決方案

    使用pycharm創(chuàng)建Django項目失敗的解決方案

    使用PyCharm創(chuàng)建Django項目時遇到無法運行的問題,可以檢查Python的安裝路徑設(shè)置是否正確,在PyCharm的設(shè)置中找到項目解釋器的位置,確保路徑正確,如果不確定Python的安裝位置,可以在命令提示符中使用“where Python”命令查詢
    2024-09-09
  • Python 畫出來六維圖

    Python 畫出來六維圖

    這篇文章主要介紹了Python 畫出來六維圖,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-07-07
  • Pytorch反向求導(dǎo)更新網(wǎng)絡(luò)參數(shù)的方法

    Pytorch反向求導(dǎo)更新網(wǎng)絡(luò)參數(shù)的方法

    今天小編就為大家分享一篇Pytorch反向求導(dǎo)更新網(wǎng)絡(luò)參數(shù)的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-08-08
  • 利用Psyco提升Python運行速度

    利用Psyco提升Python運行速度

    這篇文章主要介紹了利用Psyco提升Python運行速度,需要的朋友可以參考下
    2014-12-12
  • Python文件基本操作open函數(shù)應(yīng)用與示例詳解

    Python文件基本操作open函數(shù)應(yīng)用與示例詳解

    這篇文章主要為大家介紹了Python文件基本操作open函數(shù)應(yīng)用與示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-12-12
  • Python實現(xiàn)冒泡排序的簡單應(yīng)用示例

    Python實現(xiàn)冒泡排序的簡單應(yīng)用示例

    這篇文章主要介紹了Python實現(xiàn)冒泡排序的簡單應(yīng)用,結(jié)合實例形式分析了Python基于冒泡排序?qū)崿F(xiàn)的輸入字符串?dāng)?shù)字排序與運算操作,需要的朋友可以參考下
    2017-12-12
  • 用python爬取電腦壁紙實例代碼

    用python爬取電腦壁紙實例代碼

    大家好,本篇文章主要講的是用python爬取電腦壁紙實例代碼,感興趣的同學(xué)趕快來看一看吧,對你有幫助的話記得收藏一下
    2022-02-02
  • Python?colorama?彩色打印實現(xiàn)代碼

    Python?colorama?彩色打印實現(xiàn)代碼

    這篇文章主要介紹了Python?colorama?彩色打印實現(xiàn)代碼,將介紹的類為Back,?它實現(xiàn)了與?Fore?類相同的九個關(guān)鍵字:BLACK、RED、GREEN、YELLOW、BLUE、MAGENTA、CYAN、WHITE、RESET,感興趣的朋友一起看看吧
    2022-04-04
  • Linux 修改Python命令的方法示例

    Linux 修改Python命令的方法示例

    這篇文章主要介紹了Linux 修改Python命令的方法示例,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-12-12
  • Python類裝飾器實現(xiàn)方法詳解

    Python類裝飾器實現(xiàn)方法詳解

    這篇文章主要介紹了Python類裝飾器實現(xiàn)方法,結(jié)合實例形式較為詳細(xì)的分析了Python類裝飾器的相關(guān)概念、原理、實現(xiàn)方法與使用技巧,需要的朋友可以參考下
    2018-12-12

最新評論