亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python實現(xiàn)從多表格中隨機抽取數(shù)據(jù)

 更新時間:2023年05月24日 08:36:30   作者:瘋狂學(xué)習(xí)GIS  
這篇文章主要介紹了如何基于Python語言實現(xiàn)隨機從大量的Excel表格文件中選取一部分數(shù)據(jù),并將全部文件中隨機獲取的數(shù)據(jù)合并為一個新的Excel表格文件的方法,希望對大家有所幫助

本文介紹基于Python語言,針對一個文件夾下大量的Excel表格文件,基于其中每一個文件,隨機從其中選取一部分數(shù)據(jù),并將全部文件中隨機獲取的數(shù)據(jù)合并為一個新的Excel表格文件的方法。

首先,我們來明確一下本文的具體需求?,F(xiàn)有一個文件夾,其中有大量的Excel表格文件(在本文中我們就以.csv格式的文件為例);如下圖所示。

其中,每一個Excel表格文件都有著如下圖所示的數(shù)據(jù)格式;其中的第1行表示每一列的名稱,第1列則表示時間。

我們希望實現(xiàn)的,就是從每一個Excel表格文件中,隨機選取10行數(shù)據(jù)(第1行數(shù)據(jù)肯定不能被選進去,因為其為列名;第1列數(shù)據(jù)也不希望被選進去,因為這個是表示時間的數(shù)據(jù),我們后期不需要),并將這一文件夾中全部的Excel表格文件中每一個隨機選出的10行數(shù)據(jù)合并到一起,作為一個新的Excel表格文件。

明白了需求,我們即可開始代碼的撰寫;本文用到的具體代碼如下所示。

# -*- coding: utf-8 -*-
"""
Created on Fri May 19 01:47:06 2023

@author: fkxxgis
"""

import os
import pandas as pd

original_path = "E:/01_Reflectivity/99_Model_Training/00_Data/02_Extract_Data/19_2022Data"
result_path = "E:/01_Reflectivity/99_Model_Training/00_Data/02_Extract_Data/20_Train_Model"

result_df = pd.DataFrame()

for file in os.listdir(original_path):
    if file.endswith(".csv"):
        
        df = pd.read_csv(os.path.join(original_path, file))
        sample_df = df.sample(n = 10, axis = 0)
        sample_df = sample_df.iloc[ : , 1 : ]
        result_df = pd.concat([result_df, sample_df])
        
result_df.to_csv(os.path.join(result_path, "Train_Model_1.csv"), index = False)

代碼中首先定義了原始數(shù)據(jù)文件夾(也就是有大量Excel表格文件的文件夾)路徑和結(jié)果數(shù)據(jù)文件夾路徑。然后,創(chuàng)建了一個空的DataFrame,用于存儲抽樣后的數(shù)據(jù)。

接下來是一個for循環(huán),遍歷了原始數(shù)據(jù)文件夾中的所有.csv文件,如果文件名以.csv結(jié)尾,則讀取該文件。然后,使用Pandas中的sample()函數(shù)隨機抽取了該文件中的10行數(shù)據(jù),并使用iloc[]函數(shù)刪除了10行數(shù)據(jù)中的第1列(為了防止第1列表示時間的列被選中,因此需要刪除)。最后,使用Pandas中的concat()函數(shù)將抽樣后的數(shù)據(jù)添加到結(jié)果DataFrame中。

最后,使用Pandas中的to_csv()函數(shù)將結(jié)果DataFrame保存到結(jié)果數(shù)據(jù)文件夾中,文件名為Train_Model_1.csv,并設(shè)置index = False表示不保存索引。

運行上述代碼,我們即可獲得數(shù)據(jù)合并后的文件,且第1列數(shù)據(jù)也已經(jīng)被剔除了。

到此這篇關(guān)于Python實現(xiàn)從多表格中隨機抽取數(shù)據(jù)的文章就介紹到這了,更多相關(guān)Python隨機抽取數(shù)據(jù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python實現(xiàn)壓縮文件夾與解壓縮zip文件的方法

    Python實現(xiàn)壓縮文件夾與解壓縮zip文件的方法

    這篇文章主要介紹了Python實現(xiàn)壓縮文件夾與解壓縮zip文件的方法,涉及Python使用zipfile模塊進行zip文件壓縮與解壓縮相關(guān)操作技巧,需要的朋友可以參考下
    2018-09-09
  • 使用Python編寫一個瀏覽器集群框架

    使用Python編寫一個瀏覽器集群框架

    這篇文章主要為大家詳細介紹了如何使用Python編寫一個瀏覽器集群框架,文中的示例代碼講解詳細,具有一定的學(xué)習(xí)價值,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2023-10-10
  • Python+selenium破解拼圖驗證碼的腳本

    Python+selenium破解拼圖驗證碼的腳本

    很多網(wǎng)站在登錄或者注冊時都會遇到拼圖驗證碼,這種拼圖驗證碼實際上是多個小碎片經(jīng)過重新組合成的一張整體。本文將和大家分享一個基于Python selenium的破解拼圖驗證碼的腳本,需要的可以參考一下
    2022-02-02
  • Python中的各個多線程模塊之間的區(qū)別解析

    Python中的各個多線程模塊之間的區(qū)別解析

    Python中涉及多線程的主要模塊包括threading、thread和concurrent.futures,現(xiàn)代Python編程推薦使用threading和concurrent.futures,以提供更高層次的抽象和可用性,感興趣的朋友跟隨小編一起看看吧
    2024-09-09
  • Python基礎(chǔ)教程之利用期物處理并發(fā)

    Python基礎(chǔ)教程之利用期物處理并發(fā)

    這篇文章主要給大家介紹了關(guān)于Python基礎(chǔ)教程之利用期物處理并發(fā)的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧。
    2018-03-03
  • Python循環(huán)實現(xiàn)n的全排列功能

    Python循環(huán)實現(xiàn)n的全排列功能

    這篇文章主要介紹了Python循環(huán)實現(xiàn)n的全排列功能,本文給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下
    2019-09-09
  • Python列表生成器的循環(huán)技巧分享

    Python列表生成器的循環(huán)技巧分享

    這篇文章主要介紹了Python列表生成器的循環(huán)技巧分享,本文講解了列表生成器中一個循環(huán)和二個循環(huán)的不同寫法,需要的朋友可以參考下
    2015-03-03
  • python3實現(xiàn)跳一跳點擊跳躍

    python3實現(xiàn)跳一跳點擊跳躍

    這篇文章主要為大家詳細介紹了python3實現(xiàn)跳一跳點擊跳躍,玩跳一跳小游戲的思路,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2018-01-01
  • pandas數(shù)據(jù)分組和聚合操作方法

    pandas數(shù)據(jù)分組和聚合操作方法

    下面小編就為大家分享一篇pandas數(shù)據(jù)分組和聚合操作方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-04-04
  • Selenium+Python 自動化操控登錄界面實例(有簡單驗證碼圖片校驗)

    Selenium+Python 自動化操控登錄界面實例(有簡單驗證碼圖片校驗)

    今天小編就為大家分享一篇Selenium+Python 自動化操控登錄界面實例(有簡單驗證碼圖片校驗),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-06-06

最新評論