我正在从python中的视频中提取字幕。我在python中使用过opencv来做到这一点。我已将其分为帧,并且每帧都将作为图像存储在磁盘中,我正在对它进行ocr。我想在整个图像上执行ocr。我只需要字幕部分。我以278:360的值手动裁剪了图像,因为我的图像大小是360:640。但是图像大小随不同的视频文件而有所不同。如何以编程方式单独裁剪字幕部分。请务必回答。
textImage = image[278:360,:]
如果确定字幕在那里,则可以采用图像高度的最后三分之一。
例如,对于以下图像:
进行如下:
在我的示例中,我使用imread
from skimage.io
,但是您可以使用opencv
:
from skimage.io import imread
img = imread('http://cdn.wccftech.com/wp-content/uploads/2017/05/subtitle-of-a-blu-ray-movie.jpg')
img.shape # >>> (383, 703, 3)
这个想法是将图像的高度除以3,然后取图像的底部三分之一:
crop_position = int(img.shape[0]/3)
subtitle_img = img[img.[0] - crop_position:,:,:]
结果subtitle_img
看起来像这样:
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句