如何使用pytesseract从图像的特定坐标中提取文本？

Jinu Joseph 发表于 Dev

43

吉努·约瑟夫（Jinu Joseph）

我有一幅图像，我需要从该图像中提取文本。我需要提取的文本来自指定的坐标位置。假设坐标= [ymin：ymax，xmin：xmax]。我尝试使用此坐标创建新图像并提取文本。但是由于新图像的质量低，因此精度非常低。因此，现在我正在研究如何在不创建新图像的情况下以坐标值提取文本。我正在使用OpenCv读取图像，并使用pytesseract提取文本。

import cv2
import pytesseract
import os
from PIL import Image
import sys
import numpy as np
# import textacy
config = ('-l eng --oem 2 --psm 1')

image = cv2.imread('C:/DocumentProcessing/IMAGE/2 (8).jpg')
gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv2.imwrite('gray.jpg',gray)

_,thresh = cv2.threshold(gray,150,255,cv2.THRESH_BINARY_INV) # threshold
kernel = cv2.getStructuringElement(cv2.MORPH_CROSS,(3,3))
dilated = cv2.dilate(thresh,kernel,iterations = 30)

_,contours, hierarchy = cv2.findContours(dilated,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_NONE)
my_list = []
for contour in contours:
    [x,y,w,h] = cv2.boundingRect(contour)
    cv2.rectangle(image,(x,y),(x+w,y+h),(127.5,0,255),1)
    new_image = image[y:y+h, x:x+w]
    cv2.imwrite(f"contoured-{y}-{x}.jpg", new_image)
    result = pytesseract.image_to_string(new_image,config=config)

Tesseract 4.0.0 pytesseract 0.3.0 OpenCv 3.4.3

吉努·约瑟夫（Jinu Joseph）

您可以使用OPENCV绘制坐标，然后使用tesseract提取每个部分

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-21

我来说两句

0 条评论

登录后参与评论

上一篇：python和pandas在两个日期索引值之间的绘图

相关文章

如何使用pytesseract从图像中提取文本？

无法在python中使用pytesseract从tif图像中提取文本

Pytesseract 或 Keras OCR 从图像中提取文本

如何准确地从图像中提取数据？使用PyTesseract

是否可以使用pytesseract从图像的特定部分提取文本

在Python3.7解释器中使用opencv和pytesseract从图像中提取文本的问题

pytesseract.image_to_string似乎无法从图像中提取文本

如何使用pytesseract从屏幕中提取单词

如何从图像中提取文本？

使用Python从图像中提取gps坐标

如何在 Swift 中使用 UITextField 从图像中提取特定文本？

从图像中提取特定的文本关联值

PHP - 如何使用 Google Cloud Vision 从图像中提取文本

如何使用python从图像中提取文本或数字

使用蒙版从特定坐标的图像（二维数组）中提取像素值

如何使用Linux终端从日志文件中提取特定文本？

从iframe中提取文本坐标

如何从图像中提取前景文本？

如何从PDF图像中提取文本

如何从图像中提取虚线文本？

如何从该图像中提取圆形文本？

Python pytesseract 从各种图像中提取数字

从图像中提取文本

如何从图像中提取 (x, y) 坐标并写入 CSV 文件？

如何从熊猫列中提取特定文本

如何从 gz 文件中提取特定文本？

Beautifulsoup 如何从特定类中提取文本

使用python从网页中提取特定文本

从具有特定高度和宽度的图像中提取文本

TOP 榜单

文章

热门标签

归档