亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

對python數(shù)據(jù)切割歸并算法的實例講解

 更新時間:2018年12月12日 08:43:07   作者:body_builder  
今天小編就為大家分享一篇對python數(shù)據(jù)切割歸并算法的實例講解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

當一個 .txt 文件的數(shù)據(jù)過于龐大,此時想要對數(shù)據(jù)進行排序就需要先將數(shù)據(jù)進行切割,然后通過歸并排序,最終實現(xiàn)對整體數(shù)據(jù)的排序。要實現(xiàn)這個過程我們需要進行以下幾步:獲取總數(shù)據(jù)行數(shù);根據(jù)行數(shù)按照自己的需要對數(shù)據(jù)進行切割;對每組數(shù)據(jù)進行排序 最后對所有數(shù)據(jù)進行歸并排序。

下面我們就來實現(xiàn)這整個過程:

一:獲取總數(shù)據(jù)的行

def get_file_lines(file_path):
 # 目標文件的路徑
 file_path = str(file_path)
 with open(file_path, 'rb') as file:
  # 定義行數(shù)
  i = 0
  while True:
   # 一次讀取一行數(shù)據(jù)
   line = file.readline()
   if not line :
    break
   else:
    # 每讀一行,行數(shù)加一
    i += 1
   #設(shè)置進度條,每當i讀取1000000行時打印一次i
   # 每當讀取1000000的整數(shù)倍行時,打印行數(shù)(進度條)
   if i % 1000000 == 0:
    print(i)
  # 打印總行數(shù)
  print(i)
  return i

二:對數(shù)據(jù)進行切割

# 定義均等切割函數(shù),num是待切割的文件的行數(shù)的值,n為切割份數(shù),file_path是待切割的文件,file_dir是切割好的文件寫入的目錄
def evg_split(num, n, file_path, file_dir):
 last_list = []
 # 如果樣本剛好可以整除為n份
 if num % n == 0:
  for i in range(n):
   # 則直接將樣本分為n分沒份對應(yīng)num/n個
   last_list.append(num / n)
 # 如果不能整除
 if num % n != 0:
  # 如果不能整除,則先將num整除n-1并取n-1份,余下的單獨做一份
  evg = (num - num % n) // (n - 1)
  for i in range(n):
   last_list.append(evg)
  last_list.append(num % (n - 1))
 print(last_list)
 # return last_list
 # 對應(yīng)于切割后的每一份數(shù)據(jù)
 with open(file_path, 'rb') as path:
  for i in range(n):
   # 創(chuàng)建臨時文件
   tmp_file = file_dir + str(i) + '.txt'
   # 打開臨時文件,將內(nèi)容一條一條的寫入
   file = open(tmp_file, 'wb')
   for j in range(int(last_list[i])):
    line = path.readline()
    file.write(line)
    print(line)
   print('------------')
   file.close()

三:對每組數(shù)據(jù)進行排序的內(nèi)容由讀者根據(jù)自身數(shù)據(jù)需要進行排序,下面直接介紹歸并排序

四:歸并排序

def merge( mylist1, mylist2, file1):
 while len(mylist1) > 0 and len(mylist2) > 0:
  if mylist1[0]<mylist2[0]:
   with open(file1,'a') as file:
    file.write(str(mylist1[0]))
    del mylist1[0]
  elif mylist1[0] > mylist2[0]:
   with open(file1,'a') as file:
    file.write(str(mylist2[0]))
    del mylist2[0]
  else:
   with open(file1,'a') as file:
    file.write(str(mylist1[0]))
    file.write(str(mylist2[0]))
    del mylist1[0]
    del mylist2[0]
 with open(file1, 'a') as file:
  for i in mylist1:
   file.write(str(i))
  for i in mylist2:
   file.write(str(i))

總結(jié):對于一個大型數(shù)據(jù)文件,我們可以將其切割成若干個小型的數(shù)據(jù)文件,然后分別的這些小型的數(shù)據(jù)文件進行排序,最后使用歸并排序?qū)⑦@些數(shù)據(jù)文件寫入到一個總體文件中,從而實現(xiàn)了對這個大型數(shù)據(jù)文件的排序。

以上這篇對python數(shù)據(jù)切割歸并算法的實例講解就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • Python常用基礎(chǔ)模塊之os.path模塊詳解

    Python常用基礎(chǔ)模塊之os.path模塊詳解

    這篇文章主要介紹了Python常用基礎(chǔ)模塊之os.path模塊詳解,os模塊的子模塊os.path 是專門用于進行路徑操作的模塊,常用的路徑操作主要有判斷目錄是否存在、創(chuàng)建目錄、刪除目錄和遍歷目錄等,需要的朋友可以參考下
    2023-08-08
  • python3 判斷列表是一個空列表的方法

    python3 判斷列表是一個空列表的方法

    今天小編就為大家分享一篇python3 判斷列表是一個空列表的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-05-05
  • Python Loguru輕松靈活的日志管理庫基本用法探索

    Python Loguru輕松靈活的日志管理庫基本用法探索

    Loguru是一個用于Python的高性能、簡潔且靈活的日志庫,它的目標是提供一種簡單的方式來記錄應(yīng)用程序的運行情況,同時保持代碼的簡潔性和可讀性,本文將探索loguru的基本用法
    2024-01-01
  • CoordConv實現(xiàn)卷積加上坐標實例詳解

    CoordConv實現(xiàn)卷積加上坐標實例詳解

    這篇文章主要介紹了CoordConv實現(xiàn)卷積加上坐標實例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-03-03
  • python多個模塊py文件的數(shù)據(jù)共享實例

    python多個模塊py文件的數(shù)據(jù)共享實例

    今天小編就為大家分享一篇python多個模塊py文件的數(shù)據(jù)共享實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-01-01
  • python3 實現(xiàn)一行輸入,空格隔開的示例

    python3 實現(xiàn)一行輸入,空格隔開的示例

    今天小編就為大家分享一篇python3 實現(xiàn)一行輸入,空格隔開的示例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-11-11
  • 利用Tkinter(python3.6)實現(xiàn)一個簡單計算器

    利用Tkinter(python3.6)實現(xiàn)一個簡單計算器

    這篇文章主要給大家介紹了關(guān)于利用Tkinter(python3.6)實現(xiàn)一個簡單計算器的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧。
    2017-12-12
  • numpy.meshgrid()理解(小結(jié))

    numpy.meshgrid()理解(小結(jié))

    這篇文章主要介紹了numpy.meshgrid()理解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2019-08-08
  • python操作mongodb根據(jù)_id查詢數(shù)據(jù)的實現(xiàn)方法

    python操作mongodb根據(jù)_id查詢數(shù)據(jù)的實現(xiàn)方法

    這篇文章主要介紹了python操作mongodb根據(jù)_id查詢數(shù)據(jù)的實現(xiàn)方法,實例分析了Python根據(jù)pymongo不同版本操作ObjectId的技巧,需要的朋友可以參考下
    2015-05-05
  • PyTorch中apex安裝方式和避免踩坑

    PyTorch中apex安裝方式和避免踩坑

    本文主要介紹了PyTorch中apex安裝方式和避免踩坑,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2022-07-07

最新評論