亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

關(guān)于python處理大型json文件的方法

 更新時(shí)間:2022年03月08日 09:52:58   作者:人生天天快樂(lè)  
這篇文章主要介紹了python處理大型json文件的方法,本文通過(guò)示例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下

如圖所示,要處理的數(shù)據(jù)是一個(gè)json數(shù)組,而且非常大

下圖為電腦配置,使用 json.load() 方法加載上述json文件電腦直接卡死

解決思路:

    先用python進(jìn)行預(yù)處理,即一整個(gè)json數(shù)據(jù)加載慢,那就分開(kāi)加載,每次加載一個(gè)json對(duì)象,然后使用 json.dumps()方法 存儲(chǔ)到txt中,方便讀取。當(dāng)然也可以存儲(chǔ)到內(nèi)存中,根據(jù)情況而定。

    算法思想:因?yàn)?json 是一種結(jié)構(gòu)化的數(shù)據(jù),所以 {} 是成對(duì)存在的。因?yàn)槭褂弥鹦凶x取的方法讀入json文件,所以根據(jù) {} 的數(shù)量來(lái)判斷是否讀取了一個(gè)完整的json對(duì)象,如果是完整的,則使用 json.dumps()方法 存儲(chǔ)到txt中。

    getUsefullData(temp + line,id)這個(gè)方法是提取自己需要的數(shù)據(jù)

def jsonProcess(fileName,round):
    id = 1
    with open(fileName, 'r', encoding='utf-8') as f,open('../tempData/tempFile'+str(round)+'.txt','w') as tempFile:
        line = f.readline()
        line = f.readline()
        temp = ''
        khNum = 0
        id = 1
        while line:
            # print(line)
            if line.find('{') != -1:
                khNum += 1
    
            if line.find('}') != -1:
                khNum -= 1
    
            if khNum == 0:
                line = line.replace(',','')
                data = getUsefullData(temp + line,id)
                id += 1
                if len(data) > 1:
                    # print(data)
                    try:
                        tempFile.write(json.dumps(data)+'\n')
                    except 'json.decoder.JSONDecodeError':
                        break
                temp = ''
                line = f.readline()
                continue
            temp += line
            line = f.readline()

      讀取方法:

with open('../tempData/tempFile'+str(round)+'.txt') as f:
        dataList = f.readlines()
        # 解析保存好的list
        for data in dataList:
            data = json.loads(data)

到此這篇關(guān)于python處理大型json文件的方法的文章就介紹到這了,更多相關(guān)python處理大型json文件內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python快速進(jìn)修指南之向量數(shù)據(jù)庫(kù)文本搜索

    Python快速進(jìn)修指南之向量數(shù)據(jù)庫(kù)文本搜索

    這篇文章主要為大家介紹了Java開(kāi)發(fā)快速進(jìn)修Python指南之向量數(shù)據(jù)庫(kù)文本搜索,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2024-01-01
  • python如何實(shí)現(xiàn)API的調(diào)用詳解

    python如何實(shí)現(xiàn)API的調(diào)用詳解

    Web?API是網(wǎng)站的一部分,用于與使用非常具體的URL請(qǐng)求特定信息的程序交互,下面這篇文章主要給大家介紹了關(guān)于python實(shí)現(xiàn)API的快速調(diào)用指南,文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2022-05-05
  • kafka-python 獲取topic lag值方式

    kafka-python 獲取topic lag值方式

    今天小編就為大家分享一篇kafka-python 獲取topic lag值方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2019-12-12
  • Python蒙特卡洛算法實(shí)現(xiàn)排列組合

    Python蒙特卡洛算法實(shí)現(xiàn)排列組合

    排列組合是數(shù)學(xué)中的基本概念,也是編程中常見(jiàn)的問(wèn)題之一,本文主要介紹了Python蒙特卡洛算法實(shí)現(xiàn)排列組合,具有一定的參考價(jià)值,感興趣的可以了解一下
    2024-03-03
  • pytorch DataLoader的num_workers參數(shù)與設(shè)置大小詳解

    pytorch DataLoader的num_workers參數(shù)與設(shè)置大小詳解

    這篇文章主要介紹了pytorch DataLoader的num_workers參數(shù)與設(shè)置大小詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2021-05-05
  • python print出共軛復(fù)數(shù)的方法詳解

    python print出共軛復(fù)數(shù)的方法詳解

    在本篇內(nèi)容里小編給大家分享的是關(guān)于python print出共軛復(fù)數(shù)的方法總結(jié)內(nèi)容,有需要的讀者們可以學(xué)習(xí)下。
    2019-06-06
  • python列表推導(dǎo)式實(shí)現(xiàn)找出列表中長(zhǎng)度大于5的名字

    python列表推導(dǎo)式實(shí)現(xiàn)找出列表中長(zhǎng)度大于5的名字

    這篇文章主要介紹了python列表推導(dǎo)式實(shí)現(xiàn)找出列表中長(zhǎng)度大于5的名字,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2022-02-02
  • Python中三維坐標(biāo)空間繪制的實(shí)現(xiàn)

    Python中三維坐標(biāo)空間繪制的實(shí)現(xiàn)

    這篇文章主要介紹了Python中三維坐標(biāo)空間繪制的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-09-09
  • Python變量定義的簡(jiǎn)單使用介紹

    Python變量定義的簡(jiǎn)單使用介紹

    這篇文章主要介紹了Python變量定義的簡(jiǎn)單使用介紹,文章圍繞主題展開(kāi)詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以參考一下
    2022-08-08
  • Django日志logging的配置和自定義添加方式

    Django日志logging的配置和自定義添加方式

    這篇文章主要介紹了Django日志logging的配置和自定義添加方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-05-05

最新評(píng)論