亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python構(gòu)建一個文檔掃描器的實現(xiàn)

 更新時間:2023年03月24日 09:14:12   作者:局外人一枚  
本文主要介紹了Python構(gòu)建一個文檔掃描器的實現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

您可能想要對文檔進行數(shù)字化處理,以節(jié)省物理空間或創(chuàng)建備份。無論怎樣,編寫一個程序?qū)⒓堎|(zhì)文件的照片轉(zhuǎn)換成準(zhǔn)格式正是Python所擅長的任務(wù)。

結(jié)合使用多個適當(dāng)?shù)膸?,您就可以?gòu)建一個小型應(yīng)用程序?qū)ξ臋n進行數(shù)字化處理。您的程序?qū)⒁晕锢砦臋n的圖像作為輸入,對其運用幾種圖像處理技術(shù),即可輸出輸入的掃描版。

準(zhǔn)備好環(huán)境

首先您應(yīng)該熟悉Python的基礎(chǔ)知識,還需要了解如何使用NumPy Python庫。

打開任何Python IDE,創(chuàng)建兩個Python文件。將一個命名為main.py,將另一個命名為transform.py。然后在終端上執(zhí)行以下命令,安裝所需的庫。

pip install OpenCV-Python imutils scikit-image NumPy

您將使用OpenCV-Python獲取圖像輸入并進行一些圖像處理,使用Imutils來調(diào)整輸入和輸出圖像的大小,并使用scikit-image對圖像施加閾值。NumPy將幫助您處理數(shù)組。

等待安裝完成,并等待IDE更新項目骨干內(nèi)容。骨干內(nèi)容更新完成后,您就可以開始編程了。完整的源代碼可以在GitHub代碼庫中找到。

導(dǎo)入已安裝的庫

打開main.py文件,導(dǎo)入所安裝的庫。這將使您能夠在必要時調(diào)用和使用它們的函數(shù)。

import cv2
import imutils
from skimage.filters import threshold_local
from transform import perspective_transform

忽略perspective_transform方面拋出的錯誤。您完成處理transform.py文件的工作后,錯誤會消失。

獲取并調(diào)整輸入的大小

為想要掃描的文檔拍攝一張清晰的圖像。確保文檔的四個角及其內(nèi)容都可見。將圖像復(fù)制到存儲程序文件的同一個文件夾中。

將輸入圖像路徑傳遞給OpenCV。制作原始圖像的副本,因為您在透視轉(zhuǎn)換期間需要它。將原始圖像的高度除以您想要調(diào)整到的高度。這將保持縱橫比。最后,輸出調(diào)整后的圖像。

# Passing the image path
original_img = cv2.imread('sample.jpg')
copy = original_img.copy()

# The resized height in hundreds
ratio = original_img.shape[0] / 500.0
img_resize = imutils.resize(original_img, height=500)

# Displaying output
cv2.imshow('Resized image', img_resize)

# Waiting for the user to press any key
cv2.waitKey(0)

上述代碼的輸出如下:

現(xiàn)在您已經(jīng)將原始圖像的高度調(diào)整為500像素。

將調(diào)整后的圖像轉(zhuǎn)換為灰度圖像

將調(diào)整后的RGB圖像轉(zhuǎn)換為灰度圖像。大多數(shù)圖像處理庫只處理灰度圖像,因為它們更容易處理。

gray_image = cv2.cvtColor(img_resize, cv2.COLOR_BGR2GRAY)
cv2.imshow('Grayed Image', gray_image)
cv2.waitKey(0)

注意原始圖像和灰度圖像之間的區(qū)別。

彩色桌變成了黑白桌。

運用邊緣檢測器

對灰度圖像運用高斯模糊濾鏡以去除噪聲。然后調(diào)用OpenCV canny函數(shù)來檢測圖像中存在的邊緣。

blurred_image = cv2.GaussianBlur(gray_image, (5, 5), 0)
edged_img = cv2.Canny(blurred_image, 75, 200)
cv2.imshow('Image edges', edged_img)
cv2.waitKey(0)

邊緣在輸出上是可見的。

您將處理的邊緣是文檔的邊緣。

尋找最大的輪廓

檢測邊緣圖像中的輪廓。按降序排序,只保留五個最大的輪廓。通過循環(huán)排序后的輪廓,近似獲取最大的四邊輪廓。

cnts, _ = cv2.findContours(edged_img, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
cnts = sorted(cnts, key=cv2.contourArea, reverse=True)[:5]

for c in cnts:
    peri = cv2.arcLength(c, True)
    approx = cv2.approxPolyDP(c, 0.02 * peri, True)

    if len(approx) == 4:
        doc = approx
        break

有四個邊的輪廓很可能含有文檔。

圈出文檔輪廓的四個角

圈出檢測到的文檔輪廓的幾個角。這將幫助您確定您的程序是否能夠檢測圖像中的文檔。

p = []

for d in doc:
    tuple_point = tuple(d[0])
    cv2.circle(img_resize, tuple_point, 3, (0, 0, 255), 4)
    p.append(tuple_point)

cv2.imshow('Circled corner points', img_resize)
cv2.waitKey(0)

對調(diào)整后的RGB圖像圈出幾個角。

檢測到文檔之后,現(xiàn)在需要從圖像中提取文檔。

使用扭曲透視獲得所需的圖像

扭曲透視(warp perspective)是一種計算機視覺技術(shù),用于轉(zhuǎn)換圖像以糾正失真。它將圖像轉(zhuǎn)換成不同的平面,讓您可以從不同的角度查看圖像。

warped_image = perspective_transform(copy, doc.reshape(4, 2) * ratio)
warped_image = cv2.cvtColor(warped_image, cv2.COLOR_BGR2GRAY)
cv2.imshow("Warped Image", imutils.resize(warped_image, height=650))
cv2.waitKey(0)

為了獲得扭曲后的圖像,您需要創(chuàng)建一個簡單的模塊來執(zhí)行透視轉(zhuǎn)換。

轉(zhuǎn)換模塊

該模塊將對文檔角的點進行排序。它還會將文檔圖像轉(zhuǎn)換成不同的平面,并將相機角度更改為俯拍。

打開之前創(chuàng)建的那個transform.py文件,導(dǎo)入OpenCV庫和NumPy庫。

import numpy as np
import cv2

這個模塊將含有兩個函數(shù)。創(chuàng)建一個對文檔角點的坐標(biāo)進行排序的函數(shù)。第一個坐標(biāo)將是左上角的坐標(biāo),第二個將是右上角的坐標(biāo),第三個將是右下角的坐標(biāo),第四個將是左下角的坐標(biāo)。

def order_points(pts):
   # initializing the list of coordinates to be ordered
   rect = np.zeros((4, 2), dtype = "float32")

   s = pts.sum(axis = 1)

   # top-left point will have the smallest sum
   rect[0] = pts[np.argmin(s)]

   # bottom-right point will have the largest sum
   rect[2] = pts[np.argmax(s)]

   '''computing the difference between the points, the
   top-right point will have the smallest difference,
   whereas the bottom-left will have the largest difference'''
   diff = np.diff(pts, axis = 1)
   rect[1] = pts[np.argmin(diff)]
   rect[3] = pts[np.argmax(diff)]

   # returns ordered coordinates
   return rect

創(chuàng)建將計算新圖像的角坐標(biāo),并獲得俯拍的第二個函數(shù)。然后,它將計算透視變換矩陣,并返回扭曲的圖像。

def perspective_transform(image, pts):
   # unpack the ordered coordinates individually
   rect = order_points(pts)
   (tl, tr, br, bl) = rect

   '''compute the width of the new image, which will be the
   maximum distance between bottom-right and bottom-left
   x-coordinates or the top-right and top-left x-coordinates'''
   widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))
   widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))
   maxWidth = max(int(widthA), int(widthB))

   '''compute the height of the new image, which will be the
   maximum distance between the top-left and bottom-left y-coordinates'''
   heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))
   heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))
   maxHeight = max(int(heightA), int(heightB))

   '''construct the set of destination points to obtain an overhead shot'''
   dst = np.array([
      [0, 0],
      [maxWidth - 1, 0],
      [maxWidth - 1, maxHeight - 1],
      [0, maxHeight - 1]], dtype = "float32")

   # compute the perspective transform matrix
   transform_matrix = cv2.getPerspectiveTransform(rect, dst)

   # Apply the transform matrix
   warped = cv2.warpPerspective(image, transform_matrix, (maxWidth, maxHeight))

   # return the warped image
   return warped

現(xiàn)在您已創(chuàng)建了轉(zhuǎn)換模塊。perspective_transform導(dǎo)入方面的錯誤現(xiàn)在將消失。

注意,顯示的圖像有俯拍。

運用自適應(yīng)閾值,保存掃描輸出

在main.py文件中,對扭曲的圖像運用高斯閾值。這將給扭曲的圖像一個掃描后的外觀。將掃描后的圖像輸出保存到含有程序文件的文件夾中。

T = threshold_local(warped_image, 11, offset=10, method="gaussian")
warped = (warped_image > T).astype("uint8") * 255
cv2.imwrite('./'+'scan'+'.png',warped)

以jpg格式保存掃描件可以保持文檔質(zhì)量。

顯示輸出

輸出掃描后文檔的圖像:

cv2.imshow("Final Scanned image", imutils.resize(warped, height=650))
cv2.waitKey(0)
cv2.destroyAllWindows()

下圖顯示了程序的輸出,即掃描后文檔的俯拍。

到此這篇關(guān)于Python構(gòu)建一個文檔掃描器的實現(xiàn)的文章就介紹到這了,更多相關(guān)Python 文檔掃描器內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Flask框架使用異常捕獲問題

    Flask框架使用異常捕獲問題

    這篇文章主要介紹了Flask框架使用異常捕獲問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-12-12
  • Python繪圖系統(tǒng)之散點圖和條形圖的實現(xiàn)代碼

    Python繪圖系統(tǒng)之散點圖和條形圖的實現(xiàn)代碼

    這篇文章主要為大家詳細(xì)介紹了如何使用Python繪制散點圖和條形圖,文中的示例代碼講解詳細(xì),對我們的學(xué)習(xí)或工作有一定的幫助,感興趣的可以了解一下
    2023-08-08
  • python fabric使用筆記

    python fabric使用筆記

    這篇文章主要介紹了python fabric使用筆記,fabric是一款實現(xiàn)遠(yuǎn)程操作和部署強大工具,本文就給出了它的多個使用實例,需要的朋友可以參考下
    2015-05-05
  • Python貪吃蛇游戲編寫代碼

    Python貪吃蛇游戲編寫代碼

    這篇文章主要為大家詳細(xì)介紹了Python貪吃蛇游戲的編寫代碼,文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2017-04-04
  • Pandas直接讀取sql腳本的方法

    Pandas直接讀取sql腳本的方法

    這篇文章主要介紹了Pandas直接讀取sql腳本的方法,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2021-01-01
  • python學(xué)習(xí)之plot函數(shù)的使用教程

    python學(xué)習(xí)之plot函數(shù)的使用教程

    這篇文章主要給大家介紹了關(guān)于python學(xué)習(xí)之plot函數(shù)的使用教程,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-04-04
  • 梅爾頻率倒譜系數(shù)(mfcc)及Python實現(xiàn)

    梅爾頻率倒譜系數(shù)(mfcc)及Python實現(xiàn)

    這篇文章主要為大家詳細(xì)介紹了語音識別之梅爾頻率倒譜系數(shù)及Python實現(xiàn),具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2019-06-06
  • Python應(yīng)用開發(fā)之實現(xiàn)串口通信

    Python應(yīng)用開發(fā)之實現(xiàn)串口通信

    在嵌入式開發(fā)中我們經(jīng)常會用到串口,串口通信簡單,使用起來方便,且適用場景多。本文為大家準(zhǔn)備了Python實現(xiàn)串口通信的示例代碼,需要的可以參考一下
    2022-11-11
  • 一文解密Python函數(shù)的實現(xiàn)原理

    一文解密Python函數(shù)的實現(xiàn)原理

    函數(shù)是任何一門編程語言都具備的基本元素,它可以將多個要執(zhí)行的操作組合起來,一個函數(shù)代表了一系列的操作。那就來看看Python函數(shù)的實現(xiàn)原理吧
    2023-03-03
  • windows python3安裝Jupyter Notebooks教程

    windows python3安裝Jupyter Notebooks教程

    這篇文章主要介紹了windows python3安裝Jupyter Notebooks教程,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-04-04

最新評論