亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python批量生成Excel案例數(shù)據(jù)集的方法詳解

 更新時(shí)間:2024年12月04日 08:45:08   作者:大話數(shù)據(jù)分析  
在數(shù)據(jù)分析的世界里,數(shù)據(jù)是核心,而如何高效地生成和處理數(shù)據(jù)則成為每位數(shù)據(jù)分析師必備的技能之一,今天,我們要探討一個(gè)有趣的話題——“造數(shù)”,所以本文給大家介紹了Python辦公自動(dòng)化,批量生成Excel案例數(shù)據(jù)集,需要的朋友可以參考下

在數(shù)據(jù)分析的世界里,數(shù)據(jù)是核心,而如何高效地生成和處理數(shù)據(jù)則成為每位數(shù)據(jù)分析師必備的技能之一。今天,我們要探討一個(gè)有趣的話題——“造數(shù)”。

但這里的“造數(shù)”并非意味著編造數(shù)據(jù),而是指在確保數(shù)據(jù)安全的前提下,模擬生成一些用于測(cè)試的數(shù)據(jù)。在眾多工具中,Faker庫(kù)以其強(qiáng)大的功能和易用性脫穎而出,成為數(shù)據(jù)分析師們手中的得力助手。

接下來(lái),讓我們一起走進(jìn)Faker庫(kù)的世界,看看它是如何幫助數(shù)據(jù)分析師們輕松“造數(shù)”的?

1.常規(guī)數(shù)據(jù)模擬

常規(guī)數(shù)據(jù)模擬,比如我們生成一組范圍在100到1000的31個(gè)數(shù)字,就可以使用一行代碼np.random.randint(100,1000,31),如下使用隨機(jī)數(shù)字生成sale隨日期變化的折線圖。

import pandas as pd 
import numpy as np 
import datetime  
 
df=pd.DataFrame(data=np.random.randint(100,1000,31),
                 index=pd.date_range(datetime.datetime(2022,12,1),periods=31),
                 columns=['sale']).plot(figsize=(9,6))

2.Faker模擬數(shù)據(jù)

使用Faker模擬數(shù)據(jù)需要提前下載Faker庫(kù),在命令行使用pip install Faker命令即可下載,當(dāng)出現(xiàn)Successfully installed的字樣時(shí)表明庫(kù)已經(jīng)安裝完成。

!pip install Faker -i https://pypi.tuna.tsinghua.edu.cn/simple

導(dǎo)入Faker庫(kù)可以用來(lái)模擬生成數(shù)據(jù),其中,locale="zh_CN"用來(lái)顯示中文,如下生成包含姓名、手機(jī)號(hào)、身份證號(hào)、出生年月日、郵箱、地址、公司、職位這幾個(gè)字段的數(shù)據(jù)。

#多行顯示運(yùn)行結(jié)果 
from IPython.core.interactiveshell 
import InteractiveShell InteractiveShell.ast_node_interactivity = "all" 
from faker import Faker 
faker=Faker(locale="zh_CN")
 
#模擬生成數(shù)據(jù)  
faker.name() 
faker.phone_number() 
faker.ssn() 
faker.ssn()[6:14] 
faker.email() 
faker.address() 
faker.company() 
faker.job()

除了上面的字段,F(xiàn)aker庫(kù)還可以生成如下幾類常用的數(shù)據(jù),地址類、人物類、公司類、信用卡類、時(shí)間日期類、文件類、互聯(lián)網(wǎng)類、工作類、亂數(shù)假文類、電話號(hào)碼類、身份證號(hào)類。

#address 地址 
faker.country()  # 國(guó)家 
faker.city()  # 城市 
faker.city_suffix()  # 城市的后綴,中文是:市或縣 
faker.address()  # 地址 
faker.street_address()  # 街道 
faker.street_name()  # 街道名 
faker.postcode()  # 郵編 
faker.latitude()  # 維度 
faker.longitude()  # 經(jīng)度

#person 人物 
faker.name() # 姓名 
faker.last_name() # 姓 
faker.first_name() # 名 
faker.name_male() # 男性姓名 
faker.last_name_male() # 男性姓 
faker.first_name_male() # 男性名 
faker.name_female() # 女性姓名

#company 公司 
faker.company() # 公司名 
faker.company_suffix() # 公司名后綴

#credit_card 銀行信用卡 
faker.credit_card_number(card_type=None) # 卡號(hào)

#date_time 時(shí)間日期 
faker.date_time(tzinfo=None) # 隨機(jī)日期時(shí)間 
faker.date_time_this_month(before_now=True, after_now=False, tzinfo=None) # 本月的某個(gè)日期 
faker.date_time_this_year(before_now=True, after_now=False, tzinfo=None) # 本年的某個(gè)日期 
faker.date_time_this_decade(before_now=True, after_now=False, tzinfo=None)  # 本年代內(nèi)的一個(gè)日期 
faker.date_time_this_century(before_now=True, after_now=False, tzinfo=None)  # 本世紀(jì)一個(gè)日期 
faker.date_time_between(start_date="-30y", end_date="now", tzinfo=None)  # 兩個(gè)時(shí)間間的一個(gè)隨機(jī)時(shí)間 
faker.time(pattern="%H:%M:%S") # 時(shí)間(可自定義格式) 
faker.date(pattern="%Y-%m-%d") # 隨機(jī)日期(可自定義格式)

#file 文件 
faker.file_name(category="image", extension="png") # 文件名(指定文件類型和后綴名) 
faker.file_name() # 隨機(jī)生成各類型文件 
faker.file_extension(category=None) # 文件后綴

#internet 互聯(lián)網(wǎng) 
faker.safe_email() # 安全郵箱 
faker.free_email() # 免費(fèi)郵箱 
faker.company_email()  # 公司郵箱 
faker.email() # 郵箱

#job 工作 
faker.job()#工作職位

#lorem 亂數(shù)假文 
faker.text(max_nb_chars=200) # 隨機(jī)生成一篇文章 
faker.word() # 隨機(jī)單詞 
faker.words(nb=10)  # 隨機(jī)生成幾個(gè)字 
faker.sentence(nb_words=6, variable_nb_words=True)  # 隨機(jī)生成一個(gè)句子 
faker.sentences(nb=3) # 隨機(jī)生成幾個(gè)句子 
faker.paragraph(nb_sentences=3, variable_nb_sentences=True)  # 隨機(jī)生成一段文字(字符串) 
faker.paragraphs(nb=3)  # 隨機(jī)生成成幾段文字(列表)

#phone_number 
電話號(hào)碼 faker.phone_number() # 手機(jī)號(hào)碼 
faker.phonenumber_prefix() # 運(yùn)營(yíng)商號(hào)段,手機(jī)號(hào)碼前三位

#ssn 身份證 faker.ssn() # 隨機(jī)生成身份證號(hào)(18位)

3.模擬數(shù)據(jù)并導(dǎo)出Excel

使用Faker庫(kù)模擬一組數(shù)據(jù),并導(dǎo)出到Excel中,包含姓名、手機(jī)號(hào)、身份證號(hào)、出生日期、郵箱、詳細(xì)地址等字段,先生成一個(gè)帶有表頭的空sheet表,使用Faker庫(kù)生成對(duì)應(yīng)字段,并用append命令逐一添加至sheet表中,最后進(jìn)行保存導(dǎo)出。

from faker import Faker 
from openpyxl import Workbook  
wb=Workbook()#生成workbook 和工作表 
sheet=wb.active  
 
title_list=["姓名","手機(jī)號(hào)","身份證號(hào)","出生日期","郵箱","詳細(xì)地址","公司名稱","從事行業(yè)"]#設(shè)置excel的表頭 
sheet.append(title_list)  
faker=Faker(locale="zh_CN")#模擬生成數(shù)據(jù) 
for i in range(100):
       sheet.append([faker.name(),#生成姓名
                      faker.phone_number(),#生成手機(jī)號(hào)
                      faker.ssn(), #生成身份證號(hào)
                      faker.ssn()[6:14],#出生日期
                      faker.email(), #生成郵箱
                      faker.address(), #生成詳細(xì)地址
                      faker.company(), #生成所在公司名稱
                      faker.job(), #生成從事行業(yè)
                     ])                      
 
wb.save(r'D:\系統(tǒng)桌面(勿刪)\Desktop\模擬數(shù)據(jù).xlsx')

4.添加數(shù)值型數(shù)據(jù)

如果要生成一些可計(jì)算的隨機(jī)數(shù)據(jù),可以使用pandas、numpy這兩個(gè)庫(kù),以上面的數(shù)據(jù)為例,添加可計(jì)算數(shù)據(jù)。

import pandas as pd   
import numpy as np    # 讀取Excel文件   
df = pd.read_excel(r'D:\系統(tǒng)桌面(勿刪)\Desktop\模擬數(shù)據(jù).xlsx')   
df.head()  # 設(shè)置隨機(jī)數(shù)種子以確保結(jié)果可重復(fù)   
 
np.random.seed(0)    # 隨機(jī)生成新字段的數(shù)據(jù)   
df['銷售數(shù)量'] = np.random.randint(1, 100, size=len(df))   
df['銷售單價(jià)'] = np.random.uniform(5, 50, size=len(df)).round(2)   
df['銷售收入'] = df['銷售數(shù)量'] * df['銷售單價(jià)']   
df['銷售成本'] = np.random.uniform(5, 50, size=len(df)).round(2)   
df['銷售利潤(rùn)'] = df['銷售收入'] - df['銷售成本']   
df['利潤(rùn)率'] = (df['銷售利潤(rùn)'] / df['銷售收入']).round(4)    
 
df.to_excel(r'D:\系統(tǒng)桌面(勿刪)\Desktop\Faker模擬數(shù)據(jù).xlsx')

通過(guò)本節(jié)的分享,我們不難發(fā)現(xiàn),F(xiàn)aker庫(kù)在數(shù)據(jù)分析中扮演著舉足輕重的角色。它不僅能夠模擬生成各種類型的數(shù)據(jù),還能幫助我們快速構(gòu)建測(cè)試數(shù)據(jù)集,從而提高數(shù)據(jù)分析的效率和準(zhǔn)確性。更重要的是,F(xiàn)aker庫(kù)的使用也非常簡(jiǎn)單,只需幾行代碼,就能生成我們所需的數(shù)據(jù)。

以上就是Python批量生成Excel案例數(shù)據(jù)集的方法詳解的詳細(xì)內(nèi)容,更多關(guān)于Python生成Excel數(shù)據(jù)集的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • python實(shí)現(xiàn)文件路徑和url相互轉(zhuǎn)換的方法

    python實(shí)現(xiàn)文件路徑和url相互轉(zhuǎn)換的方法

    這篇文章主要介紹了python實(shí)現(xiàn)文件路徑和url相互轉(zhuǎn)換的方法,以URL轉(zhuǎn)換成文件路徑為例分析了Python實(shí)現(xiàn)地址轉(zhuǎn)換的技巧,需要的朋友可以參考下
    2015-07-07
  • 詳解Python下載圖片并保存本地的兩種方式

    詳解Python下載圖片并保存本地的兩種方式

    這篇文章主要介紹了Python下載圖片并保存本地的兩種方式,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-05-05
  • python集合的創(chuàng)建、添加及刪除操作示例

    python集合的創(chuàng)建、添加及刪除操作示例

    這篇文章主要介紹了python集合的創(chuàng)建、添加及刪除操作,結(jié)合實(shí)例形式分析了Python集合的概念、功能及針對(duì)集合的創(chuàng)建、添加與刪除等相關(guān)操作實(shí)現(xiàn)技巧,需要的朋友可以參考下
    2019-10-10
  • 使用Python高效獲取網(wǎng)絡(luò)數(shù)據(jù)的操作指南

    使用Python高效獲取網(wǎng)絡(luò)數(shù)據(jù)的操作指南

    網(wǎng)絡(luò)爬蟲是一種自動(dòng)化程序,用于訪問和提取網(wǎng)站上的數(shù)據(jù),Python是進(jìn)行網(wǎng)絡(luò)爬蟲開發(fā)的理想語(yǔ)言,擁有豐富的庫(kù)和工具,使得編寫和維護(hù)爬蟲變得簡(jiǎn)單高效,本文將詳細(xì)介紹如何使用Python進(jìn)行網(wǎng)絡(luò)爬蟲開發(fā),包括基本概念、常用庫(kù)、數(shù)據(jù)提取方法、反爬措施應(yīng)對(duì)以及實(shí)際案例
    2025-03-03
  • python 瀑布線指標(biāo)編寫實(shí)例

    python 瀑布線指標(biāo)編寫實(shí)例

    這篇文章主要介紹了python 瀑布線指標(biāo)編寫實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-06-06
  • 拒絕盜圖!教你怎么用python給圖片加水印

    拒絕盜圖!教你怎么用python給圖片加水印

    你是不是擔(dān)心,辛辛苦苦做的圖表被盜用? 試試用python加上你的專屬水印,讓盜版無(wú)所遁形. 只需幾行代碼,比用ps軟件操作更簡(jiǎn)單、更快捷,需要的朋友可以參考下
    2021-06-06
  • python中通過(guò)selenium簡(jiǎn)單操作及元素定位知識(shí)點(diǎn)總結(jié)

    python中通過(guò)selenium簡(jiǎn)單操作及元素定位知識(shí)點(diǎn)總結(jié)

    在本篇文章里小編給大家整理的是關(guān)于python中通過(guò)selenium簡(jiǎn)單操作及元素定位的知識(shí)點(diǎn),有需要的朋友們可以學(xué)習(xí)下。
    2019-09-09
  • git查看、創(chuàng)建、刪除、本地、遠(yuǎn)程分支方法詳解

    git查看、創(chuàng)建、刪除、本地、遠(yuǎn)程分支方法詳解

    這篇文章主要介紹了git查看、創(chuàng)建、刪除、本地、遠(yuǎn)程分支方法詳解,需要的朋友可以參考下
    2020-02-02
  • Python單元測(cè)試的9個(gè)技巧技巧

    Python單元測(cè)試的9個(gè)技巧技巧

    這篇文章主要給大家分享的是Python單元測(cè)試常見的幾個(gè)技巧,文章會(huì)講解requests的一些細(xì)節(jié)實(shí)現(xiàn)以及pytest的使用等,感興趣的小伙伴不妨和小編一起閱讀下面文章 的具體內(nèi)容吧
    2021-09-09
  • 解決django無(wú)法訪問本地static文件(js,css,img)網(wǎng)頁(yè)里js,cs都加載不了

    解決django無(wú)法訪問本地static文件(js,css,img)網(wǎng)頁(yè)里js,cs都加載不了

    這篇文章主要介紹了解決django無(wú)法訪問本地static文件(js,css,img)網(wǎng)頁(yè)里js,cs都加載不了的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-04-04

最新評(píng)論