Python使用moviepy讀取字幕srt文件報錯的解決方法詳解
前言
最近研究moviepy,使用其給視頻添加字幕,卻發(fā)現(xiàn)一個很久不會碰到的問題----文件編碼問題。這在python3.x很少發(fā)生了。不成想,moviepy還是有bug。
debug也是編程樂趣之一。不過寫到這里,希望以后官方升級可以修復這個問題。
一、SubtitlesClip讀取srt文件報錯
報錯信息如下:
subtitles = SubtitlesClip(srt_path, generator)
File "d:\ProgramData\anaconda3\envs\python38\lib\site-packages\moviepy\video\tools\subtitles.py", line 42, in __init__
subtitles = file_to_subtitles(subtitles)
File "d:\ProgramData\anaconda3\envs\python38\lib\site-packages\moviepy\video\tools\subtitles.py", line 154, in file_to_subtitles
for line in f:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 54: illegal multibyte sequence
二、問題剖析
打開d:\ProgramData\anaconda3\envs\python38\lib\site-packages\moviepy\video\tools\subtitles.py
我這里是虛擬了一個python3.8的環(huán)境(每個人不一樣),看報錯信息即可知道文件在哪里。
根據(jù)以上報錯信息,可以知道:
def __init__(self, subtitles, make_textclip=None):
VideoClip.__init__(self, has_constant_size=False)
if isinstance(subtitles, str):
subtitles = file_to_subtitles(subtitles)
42行,也就是最后一樣,調(diào)用了154行。
with open(filename,'r') as f:
for line in f:
因為153行,with open(filename,‘r’) as f: 沒有添加打開文件使用的編碼,所以UTF-8格式的srt文件被Windows系統(tǒng)默認使用GBK模式打開,就出現(xiàn)了文章開通的報錯提示了。
三、解決辦法(2種)
這個問題很好解決,就是打開文件時增加編碼格式就行。
(唉,這么low的bug)
如果srt文件都是utf-8編碼格式,使用1方法即可解決。如果還有其它格式,可通過2方法完美解決。
1. 增加encoding='utf-8’的臨時解決辦法
with open(filename,'r') as f:
for line in f:
將以上修改如下,增加encoding='utf-8’即可。
with open(filename,'r', encoding='utf-8') as f:
for line in f:
2. 通過類初始化傳遞參數(shù)的終極解決辦法
上面的方法,如果srt文件不是utf-8則也會報錯,是否可以將其改為參數(shù)運行呢?
那當然可以啦!
不過,需要修改多個地方,分別在class定義的 init()參數(shù)里增加encoding=‘utf-8’,然后在調(diào)用函數(shù)將encoding進行傳遞;file_to_subtitles(filename)參數(shù)增加encoding,打開文件也增加。至此完成修改。目的就是在class初始化時就傳遞encoding參數(shù),并層層調(diào)用后增加到with open(filename,‘r’, encoding=encoding) as f:這一行。
修改后的代碼如下:
class SubtitlesClip(VideoClip):
""" A Clip that serves as "subtitle track" in videos.
One particularity of this class is that the images of the
subtitle texts are not generated beforehand, but only if
needed.
Parameters
==========
subtitles
Either the name of a file, or a list
Examples
=========
>>> from moviepy.video.tools.subtitles import SubtitlesClip
>>> from moviepy.video.io.VideoFileClip import VideoFileClip
>>> generator = lambda txt: TextClip(txt, font='Georgia-Regular', fontsize=24, color='white')
>>> sub = SubtitlesClip("subtitles.srt", generator)
>>> myvideo = VideoFileClip("myvideo.avi")
>>> final = CompositeVideoClip([clip, subtitles])
>>> final.write_videofile("final.mp4", fps=myvideo.fps)
"""
def __init__(self, subtitles, make_textclip=None,encoding='utf-8'):
VideoClip.__init__(self, has_constant_size=False)
if isinstance(subtitles, str):
subtitles = file_to_subtitles(subtitles,encoding=encoding)
def file_to_subtitles(filename,encoding):
""" Converts a srt file into subtitles.
The returned list is of the form ``[((ta,tb),'some text'),...]``
and can be fed to SubtitlesClip.
Only works for '.srt' format for the moment.
"""
times_texts = []
current_times = None
current_text = ""
with open(filename,'r', encoding=encoding) as f:
因為這里給類初始化賦值了encoding=‘utf-8’,所以默認是此格式的話,調(diào)用方法不加此參數(shù)一樣可以使用,不會報錯。如下:
sub = SubtitlesClip("subtitles.srt", generator)
如果是gbk的格式,才需要在類初始化時增加encoding參數(shù),如下:
sub = SubtitlesClip("subtitles.srt", generator, encoding='gbk')
總結(jié)
以前python2.x文字編碼老是各種出錯,改用python3.x后,編碼及中文問題都得到了解決。不曾想還是會應為編碼問題倒是文件打不開或者亂碼。
UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 54: illegal multibyte sequence
以后看到這個提示,先檢查字符編碼。然后就是打開方式,通常都可以解決。
到此這篇關(guān)于Python使用moviepy讀取字幕srt文件報錯的解決方法詳解的文章就介紹到這了,更多相關(guān)Python解決moviepy讀取字幕srt報錯內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python3.12安裝jupyter環(huán)境的實現(xiàn)
本文主要介紹了編譯安裝Python3.12(需OpenSSL1.1.1以上避免SSL錯誤)并配置Jupyter環(huán)境的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2025-05-05
實例詳解Python中的numpy.abs和abs函數(shù)
Numpy是python中最有用的工具之一,它可以有效地處理大容量數(shù)據(jù),下面這篇文章主要給大家介紹了關(guān)于Python中numpy.abs和abs函數(shù)的相關(guān)資料,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下2022-08-08
python?sns.countplot()?繪畫條形圖詳情
這篇文章主要介紹了python?sns.countplot()繪畫條形圖詳情,sns.countplot()用于畫類別特征的頻數(shù)條形圖,更多相關(guān)內(nèi)容需要的朋友可以參考一下2022-06-06
Python控制自己的手機攝像頭拍照并自動發(fā)送到郵箱案例講解
這篇文章主要介紹了Python控制自己的手機攝像頭拍照,并把照片自動發(fā)送到郵箱,大概思路是通過opencv調(diào)用攝像頭拍照保存圖像本地用email庫構(gòu)造郵件內(nèi)容,保存的圖像以附件形式插入郵件內(nèi)容用smtplib庫發(fā)送郵件到指定郵箱,需要的朋友可以參考下2022-04-04

