R語(yǔ)言如何將大型Excel文件轉(zhuǎn)為dta格式詳解
本文以2000年度我國(guó)工業(yè)企業(yè)數(shù)據(jù)庫(kù)為例,該文件后綴名為xlsx,包含約16萬(wàn)條記錄,文件有88M這么大。直接使用Excel打開都費(fèi)勁:等待時(shí)間久,電腦風(fēng)扇呼呼呼作響。如果嘗試用Stata打開該xlsx文件,則會(huì)出現(xiàn)提示報(bào)錯(cuò)。
報(bào)錯(cuò)原因在于,Stata無(wú)法讀取超過(guò)40M的Excel文件。
這就好比瓜迪奧拉的傳控足球固然美麗,但是面對(duì)擺大巴的球隊(duì)無(wú)能為力。

破大巴需要攻城錘,這把錘子的名字就是R語(yǔ)言。萬(wàn)事開頭難啊,正憧憬著數(shù)據(jù)清洗和花式選取變量建模呢,可不能連數(shù)據(jù)們長(zhǎng)啥模樣都沒(méi)見(jiàn)著啊。R語(yǔ)言適時(shí)挺身而出,幫助Stata叩開大型Excel文件之門。
在RStudio中運(yùn)行如下代碼,過(guò)程較為淺顯,首先引入兩個(gè)R包,然后輸入xlsx后綴名文件,最后便可輸出dta后綴名文件。等待2分鐘,誰(shuí)讓文件那么龐大呢,接下來(lái)便是見(jiàn)證奇跡的時(shí)刻。
library(openxlsx)
library(foreign)
x = read.xlsx('2000.xlsx',1) # 讀取 Excel 的 Sheet1
# View(x)
write.dta(x, '2000.dta') # 輸出為 Stata 能讀取的格式
在Stata中打開該文件,屏幕會(huì)顯示這份文件是在R中轉(zhuǎn)化而來(lái)。

也許你有更好的轉(zhuǎn)化方法,歡迎賜教。
總結(jié)
到此這篇關(guān)于R語(yǔ)言如何將大型Excel文件轉(zhuǎn)為dta格式的文章就介紹到這了,更多相關(guān)R語(yǔ)言大型Excel為dta內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
解決R語(yǔ)言報(bào)錯(cuò):Error?in?y?+?1:non-numeric?argument?to?binary
R語(yǔ)言編程中的常見(jiàn)錯(cuò)誤有一些錯(cuò)誤是R的初學(xué)者和經(jīng)驗(yàn)豐富的R程序員都可能常犯的,下面這篇文章主要給大家介紹了關(guān)于解決R語(yǔ)言報(bào)錯(cuò):Error?in?y?+?1:non-numeric?argument?to?binary?operator的相關(guān)資料,需要的朋友可以參考下2022-11-11
R語(yǔ)言數(shù)據(jù)可視化分析天貓雙十一銷售額增長(zhǎng)率
這篇文章主要為大家介紹了R語(yǔ)言數(shù)據(jù)可視化來(lái)分析天貓雙十一銷售額增長(zhǎng)率,來(lái)一探多年來(lái)歷年雙十一銷售額數(shù)據(jù)是否有造假,有需要的朋友可以借鑒參考下,希望能夠有所幫助2021-11-11
R語(yǔ)言中邏輯回歸知識(shí)點(diǎn)總結(jié)
在本篇文章里小編給大家總結(jié)了關(guān)于R語(yǔ)言中邏輯回歸知識(shí)點(diǎn)相關(guān)內(nèi)容,有需要的朋友們跟著學(xué)習(xí)下。2021-05-05
R語(yǔ)言wilcoxon秩和檢驗(yàn)及wilcoxon符號(hào)秩檢驗(yàn)的操作
這篇文章主要介紹了R語(yǔ)言wilcoxon秩和檢驗(yàn)及wilcoxon符號(hào)秩檢驗(yàn)的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04
R語(yǔ)言-計(jì)算平均值不同函數(shù)的區(qū)別說(shuō)明
這篇文章主要介紹了R語(yǔ)言-計(jì)算平均值不同函數(shù)的區(qū)別說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04
R語(yǔ)言 實(shí)現(xiàn)兩表連接且輸出不重復(fù)數(shù)據(jù)
這篇文章主要介紹了R語(yǔ)言 實(shí)現(xiàn)兩表連接且輸出不重復(fù)數(shù)據(jù)的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-03-03

