快捷導(dǎo)航

Python3 掃描庫文件并獲取版本號(hào)信息的操作方法

更新時(shí)間：2023年05月19日 14:26:03 作者：baiyu33

在 C/C++ 開發(fā)中使用了第三方庫，具體說是 .a, .lib, .dll 等文件，想通過 Python 查詢出這些文件中的版本號(hào)信息，下面小編給大家?guī)砹薖ython3中掃描庫文件并獲取版本號(hào)信息的知識(shí),需要的朋友可以參考下

1. 目的

在 C/C++ 開發(fā)中使用了第三方庫，具體說是 .a, .lib, .dll 等文件，想通過 Python 查詢出這些文件中的版本號(hào)信息。

有人可能好奇，這里簡單消除可能得疑慮：

為什么不用源代碼，而用庫？

因?yàn)閹煳募峁┝肆己玫?strong>隔離性，避免了繁雜的編譯選項(xiàng)指定，避免了潛在的不小心改了代碼導(dǎo)致的不一致

為什么不用包管理工具來設(shè)定和查詢庫文件的版本？

因?yàn)?C/C++ 歷史包袱較多，不像 Java 的 Mavan，更不像 Rust 的 Cargo + Crates。雖然有 vcpkg， conan 和 xmake 等，但是公司自研的庫并不能很好的用這些工具管理起來

于是乎，實(shí)際工作中不少人的工程里，把若干個(gè) .a 文件放在 lib 目錄下，每個(gè)庫文件名字中并沒有包含版本號(hào)信息；而項(xiàng)目的運(yùn)行結(jié)果不符合預(yù)期、展開排查時(shí)，或者遞交版本時(shí)，需要清晰的列出這些依賴庫文件的版本信息。

使用 Python 的原因：跨平臺(tái)， 開發(fā)速度快。

2. 原理

查詢庫文件的版本號(hào)，其實(shí)是另一個(gè)通用問題的特定版本。

通用的問題是：在一個(gè)二進(jìn)制文件中，查找所有的字符串，找出符合預(yù)設(shè)規(guī)則的那些字符串。

查詢版本號(hào)，無非是對(duì)于公司的版本號(hào)有自己的規(guī)定，可以從所有的字符串結(jié)果中進(jìn)行過濾。由于不同公司、不同項(xiàng)目可能有不同的版本號(hào)規(guī)則，我們重點(diǎn)關(guān)注兩點(diǎn)：

怎樣從二進(jìn)制文件獲取字符串
怎樣從若干字符串中獲取想要的那個(gè)

Linux: strings 命令

在 Linux 下可以使用自帶的 strings 命令，來列出一個(gè)二進(jìn)制文件中的所有字符串。以常用的 ls 命令為例，我們進(jìn)行查詢:

zz@Legion-R7000P% which strings  
/usr/bin/strings
zz@Legion-R7000P% strings /bin/ls | more

Windows: strings 命令

Windows 并不默認(rèn)帶有 strings 命令，不過微軟官方提供了一個(gè)版本：

https://docs.microsoft.com/zh-cn/sysinternals/downloads/strings

3. 基于 Python 實(shí)現(xiàn) strings 命令

對(duì)于 Windows 用戶，如果安裝有 Python，則可以基于 Python 實(shí)現(xiàn) strings 命令等同的函數(shù)；由于 strings 的結(jié)果是非常多的字符串，往往還需要按版本號(hào)字符串特點(diǎn)進(jìn)行過濾（正則匹配），繼續(xù)使用 Python 的正則模塊進(jìn)行匹配是比較容易的。

def strings(fname):
    """
    Remake `strings` command in Python
    This function behaves like `strings` command in linux/windows.
    If no desired result returned, you may just tweak the regular expression pattern.
    ref: https://gist.github.com/berdario/114b2daf9b43fe924676
    Example:
    import arczip
    for word_bytes in arczip.strings(lib_pth):
        word = word_bytes.decode()
        if ('version' in word):
            print(word)
    """
    from mmap import mmap, ACCESS_READ
    import re
    pattern = '([\w/.\s(:)-]{10,200})'
    with open(fname, 'rb') as f, mmap(f.fileno(), 0, access=ACCESS_READ) as m:
        for match in re.finditer(pattern.encode(), m):
            yield match.group(0)

代碼短小精悍，簡單解釋下：

我們認(rèn)為“字符串”是可以用一個(gè)正則表達(dá)式表示的：英文字母、空格、短橫杠-、點(diǎn).、冒號(hào):

([\w/.\s(:)-]{10,200})'

我們認(rèn)為字符串的長度至少為10，至多為 200. 這個(gè)限制的目的是，如果允許的字符串長度太長，搜索時(shí)間會(huì)變慢，太短則很多單個(gè)字符不符合預(yù)期結(jié)果
使用 yield, 迭代方式返回結(jié)果
支持 Windows，支持 Linux，基于 Python3

4. 基于Python的版本號(hào)查找

調(diào)用剛剛實(shí)現(xiàn)的 strings() 函數(shù)，對(duì)得到的結(jié)果進(jìn)行正則匹配，例如需要以公司名字開頭，并且版本號(hào)是4位數(shù)字、用.分隔的，那么可以是這樣的實(shí)現(xiàn)：

# 匹配版本號(hào)
def containVersion(word):
    versionPattern = r"_\d{1,3}.\d{1,3}.\d{1,10}.\d{1,5}"
    match = re.search(versionPattern, word)
    if (match is not None):
        return True
    return False
# 給定庫文件， 打印匹配到的版本號(hào)
def print_module_version(lib_pth):
    for word_bytes in strings(lib_pth):
        word = word_bytes.decode()
        if (word.startswith('YourCompany') and containVersion(word)):
            print(word)
        elif (word.startswith('your_company') and containVersion(word)):
            print(word)

5. 最終調(diào)用：一句話使用

if __name__ == '__main__':
    print_module_version('D:/work/kaku-project/lib/windows-x64/libObjectDetection.lib')
    print_module_version('D:/work/kaku-project/lib/windows-x64/libObjectDetection.dll')
    print_module_version('D:/work/kaku-project/lib/linux-arm64/libObjectDetection.a')

到此這篇關(guān)于Python3: 掃描庫文件并獲取版本號(hào)信息的文章就介紹到這了,更多相關(guān)Python獲取版本號(hào)信息內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: