亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python處理文本文件中控制字符的方法

 更新時間:2017年02月07日 10:18:23   投稿:daisy  
最近在使用Python的時候遇到過文檔中出現(xiàn)控制字符報錯的問題。想著總結一下,方便以后需要或這同樣遇到問題的朋友,下面這篇文章主要介紹了Python處理文本文件中控制字符的解決方法,需要的朋友可以參考借鑒。

控制字符

控制字符(Control Character),或者說非打印字符,出現(xiàn)于特定的信息文本中,表示某一控制功能的字符,如控制符:LF(換行)、CR(回車)、FF(換頁)、DEL(刪除)、BS(退格)、BEL(振鈴)等;通訊專用字符:SOH(文頭)、EOT(文尾)、ACK(確認)等。

具體控制字符一共有下面兩個集合:

七位ASCII定義了33個代碼作為控制字符,它們是0到31、以及127,(位于0x00-0x1F及0x7F)。

兼容的八位ISO/IEC 8859-1加上了從ISO/IEC 6429定義的從128到159的32個代碼,位于0x80-0x9F。

控制字符列表:http://ascii-table.com/control-chars.php

Python解決控制字符的方案:(未一一驗證)

方案一:

strip_control_characters = lambda s:"".join(i for i in s if 31<ord(i)<127)

方案二:

def strip_control_characters(str_input): 
 if str_input: 
 import re 
 # unicode invalid characters 
 RE_XML_ILLEGAL = u'([\u0000-\u0008\u000b-\u000c\u000e-\u001f\ufffe-\uffff])' + \
   u'|' + \
   u'([%s-%s][^%s-%s])|([^%s-%s][%s-%s])|([%s-%s]$)|(^[%s-%s])' % \
   (unichr(0xd800),unichr(0xdbff),unichr(0xdc00),unichr(0xdfff), 
    unichr(0xd800),unichr(0xdbff),unichr(0xdc00),unichr(0xdfff), 
    unichr(0xd800),unichr(0xdbff),unichr(0xdc00),unichr(0xdfff), 
    ) 
 str_input = re.sub(RE_XML_ILLEGAL, "", input) 
 # ascii control characters 
 str_input = re.sub(r"[\x01-\x1F\x7F]", "", input) 
 return str_input

方案三:

import re
 
def remove_control_chars(s):
 control_chars = ''.join(map(unichr, range(0,32) + range(127,160)))
 control_char_re = re.compile('[%s]' % re.escape(control_chars))
 
 return control_char_re.sub('', s)
 
cleaned_json = remove_control_chars(original_json)
obj = simplejson.loads(cleaned_json)

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家學習或者使用python能帶來一定的幫助,如果有疑問大家可以留言交流。

相關文章

  • Python如何將一個EXCEL表拆分多個excel表

    Python如何將一個EXCEL表拆分多個excel表

    在Python中,你可以使用pandas庫來讀取Excel文件,并將一個大的Excel表格(工作表)拆分成多個單獨的Excel文件,這篇文章主要介紹了Python如何將一個EXCEL表拆分多個excel表,需要的朋友可以參考下
    2024-06-06
  • python虛擬環(huán)境的安裝配置圖文教程

    python虛擬環(huán)境的安裝配置圖文教程

    下面小編就為大家?guī)硪黄猵ython虛擬環(huán)境的安裝配置圖文教程。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-10-10
  • Python使用itchat 功能分析微信好友性別和位置

    Python使用itchat 功能分析微信好友性別和位置

    這篇文章主要介紹了 Python使用itchat 功能分析微信好友性別和位置 的相關資料,需要的朋友可以參考下
    2019-08-08
  • django下創(chuàng)建多個app并設置urls方法

    django下創(chuàng)建多個app并設置urls方法

    在本篇文章里小編給大家分享的是一篇關于django下創(chuàng)建多個app并設置urls方法,需要的朋友們可以參考學習下。
    2020-08-08
  • 寫一個Python腳本自動爬取Bilibili小視頻

    寫一個Python腳本自動爬取Bilibili小視頻

    這篇文章主要介紹了寫一個 Python 腳本自動爬取 Bilibili 小視頻的示例代碼,幫助大家更好的理解和學習使用python,感興趣的朋友可以了解下
    2021-04-04
  • 基于注解實現(xiàn) SpringBoot 接口防刷的方法

    基于注解實現(xiàn) SpringBoot 接口防刷的方法

    這篇文章主要介紹了基于注解實現(xiàn) SpringBoot 接口防刷的方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2021-03-03
  • 如何通過Python實現(xiàn)定時打卡小程序

    如何通過Python實現(xiàn)定時打卡小程序

    這篇文章主要為大家詳細介紹了python實現(xiàn)定時打卡小程序,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2021-11-11
  • Python實現(xiàn)RSA加密解密

    Python實現(xiàn)RSA加密解密

    這篇文章主要介紹了Python實現(xiàn)RSA加密解密,加密技術在數(shù)據(jù)安全存儲,數(shù)據(jù)傳輸中發(fā)揮著重要作用,能夠保護用戶隱私數(shù)據(jù)安全,防止信息竊取。RSA是一種非對稱加密技術,在軟件、網(wǎng)頁中已得到廣泛應用,下面文章更多相關內容需要的小伙伴可以參考一下
    2022-04-04
  • 結合OpenCV與TensorFlow進行人臉識別的實現(xiàn)

    結合OpenCV與TensorFlow進行人臉識別的實現(xiàn)

    這篇文章主要介紹了結合OpenCV與TensorFlow進行人臉識別的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2019-10-10
  • numpy自動生成數(shù)組詳解

    numpy自動生成數(shù)組詳解

    這篇文章主要介紹了numpy自動生成數(shù)組詳解,具有一定借鑒價值,需要的朋友可以參考下。
    2017-12-12

最新評論