python如何讀取.mtx文件

更新時間：2021年04月22日 12:23:30 作者：努力干活還不粘人的小妖精

這篇文章主要介紹了python讀取.mtx文件的操作，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

mtx文件是按照稀疏矩陣格式存儲的矩陣數(shù)據(jù)，可以按照以下步驟讀?。?/p>

1、安裝scanpy包

pip install scanpy

2、文件讀取

import scanpy as sc 
adata = sc.read(filename)
data = adata.X

第一行read之后返回的是annData，第二行通過.X操作得到的是矩陣數(shù)據(jù)

3、轉(zhuǎn)換為稠密矩陣

data = data.todense()

直接得到的矩陣是稀疏形式的，通過todense函數(shù)可轉(zhuǎn)換為稠密矩陣

補充：python讀取各種文件方式

Json：

use_time=[]
with open(address,'r') as f: #ubuntu
    mobile = json.load(f)
    calls = mobile["transactions"][0]["calls"]
for call in calls: 
  use_time.append(str(call['use_time']))

Excel：

rawdata1=open_workbook(address)
rawdata=rawdata1.sheet_by_index(0)
for i in range(1,rawdata.nrows):
    if rawdata.cell(i,date_index).value=="": #跳過空行
        continue
    else:
        if ctype==3:  #若為3，則用datetime模塊處理日期
            date1=rawdata.cell(i,date_index).value
            date2 = xldate_as_tuple(date1,0) 
            date3=datetime(*date2)
            if "." in str(rawdata.cell(i,phone_index).value):
                phone1=str(rawdata.cell(i,phone_index).value)[:-2]  
            else:
                phone1=str(rawdata.cell(i,phone_index).value)

寫EXCEL：

Excel_file = xlwt.Workbook() 
sheet = Excel_file.add_sheet('sheet0')
header=[u'號碼','日期top1','日期top2','日期top3']
#寫入標題行：
for i in range(len(header)):
    sheet.write(0,i,header[i])
#開始按行寫入數(shù)據(jù)：
for i in range(len(phonelist)):
    sheet.write(i+1,0,phonelist[i])
    sheet.write(i+1,1,dic[str(phonelist[i])])
#保存EXCEL：
Excel_file.save("C:/Users/Desktop/100個文件輸出xls/"+str(fileName)+".xls")

CSV：

rawdata=pd.read_csv(address,skip_blank_lines=True) #參數(shù)為去除空行
if 'start_time' or 'begin_time'  in rawdata.columns:
    if 'start_time' in rawdata.columns:
        start_time=rawdata['start_time']
    elif 'begin_time' in rawdata.columns:
            start_time=rawdata['begin_time']

txt：

rawdata=open(address,'r')
i=0
a=[] #c存放第一行的列名
for line in rawdata:
    if i==1: #默認第二行開始存儲通話數(shù)據(jù)
        a=line.split(',') #逗號作為分隔符
        for j in range(len(a)): #查找指定列名所在的列下標
            if (('-' in str(a[j]))or('/' in str(a[j]))): #判斷日期所在列數(shù)
                date_index=j #保存日期的列下標
            elif  str(a[j]).isdigit() and len(str(a[j]))>5: #默認全為數(shù)字組成的字符串為電話號碼
                phone_index=j
            else:
                pass
        break
    else:
        i+=1
i=0
for line in rawdata:#開始轉(zhuǎn)存數(shù)據(jù)：
    if len(line)<10: #跳過空行
        continue
    data_line=line.split(',') #txt默認以','分隔數(shù)據(jù)
    if i==0:
        pass #第一行為列名，跳過
        i+=1
    else: #從第二行開始保存數(shù)據(jù)
        start_time.append(data_line[date_index])

以上為個人經(jīng)驗，希望能給大家一個參考，也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方，望不吝賜教。