我想使用 for 循环一张一张地打印我的图像的文本,这些文本存在于一个文件夹中

绍纳

从文件夹中一张一张的图片文本。这个只有一张图片。如何处理所有图片

public static String crackImage(String filepath) throws TesseractException {
        File imgfile = new File(filepath);
            ITesseract instance = new Tesseract();
            instance.setDatapath("C:\\selenium_work\\ScrappingText.PDF\\tessdata");

            String result = instance.doOCR(imgfile);
            return result;  
    }

    public static void main(String[] args) throws TesseractException {

         String textdata = ImageScrapping.crackImage("C:\\selenium_work\\ScrappingText.PDF\\image\\IMG_20190305_152800__01.jpg");
         System.out.println(textdata);
德米特里

您可以从给定的 URL 保存图像,例如:

  1. 找到所有的<img>标签,并提取它们的src属性,即使用XPath的定位器//img

    List<String> imagesUrls = driver.findElements(By.xpath("//img"))
            .stream()
            .map(img -> img.getAttribute("src"))
            .collect(Collectors.toList());
    
  2. 使用OkHTTP 客户端库将所有图像下载到您选择的文件夹中

    for (String imageUrl : imagesUrls) {
        Request request = new Request.Builder().url(imageUrl).build();
        Response response = client.newCall(request).execute();
        File downloadedLogo = new File("C:\\selenium_work\\ScrappingText.PDF\\image\\" + imageUrl.substring(imageUrl.lastIndexOf('/') + 1));
        BufferedSink sink = Okio.buffer(Okio.sink(downloadedLogo));
        sink.writeAll(Objects.requireNonNull(response.body()).source());
        sink.close();
    }
    
  3. 完成后,您应该能够crackImage通过 Files.walk() 方法为每个下载的文件调用您的函数:

    Files.walk(Paths.get("C:\\selenium_work\\ScrappingText.PDF\\image"))
            .forEach(file -> System.out.println(crackImage(file.toAbsolutePath().toString())));       
    

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

我可以在Redshift中从一张表复制到另一张吗

我可以仅使用一个标签“ tr”制作一张像这张照片的桌子吗?

使用一张图像阈值另一张

我无法在同一张表中正确打印2个REST API的值

想为一个用户上传多张图片,只允许我上传一张

使用按钮将图像从一张桌子移动到另一张桌子

如何使用按钮将图像一张一张地添加到网格的每个单元格中

我正在尝试将4个数据透视表的rowlabel一张一张地复制到另一张纸上

我想叠加两张图片,其中一张是透明的

使用一个脚本使用行中的图标将文本从行中的单元格复制到另一张工作表

上传文件时,我仅获得阵列中的第一张图像,我希望阵列中的所有图像。使用Codeigniter

我想使用VBA将包含特定文本的特定行复制到另一张纸上

我想打印一张图,但是我已经颠倒了打印。为什么?

我如何检测最后一张图片并禁用jQuery中的下一个按钮

我在Excel 2007中有一张桌子,我想要一张图表

我想帮忙制作一张可打印1-100的桌子

我可以在for循环内计算某些东西,然后在同一张图上绘制这些值吗?

我有一个存储过程,需要从同一张表中两次提取信息。如何使用相关名称?

我想根据正确或错误条件从一张表更新到另一张表

我想显示一张桌子上的记录

我想从Galary中挑选一张图片,并希望减小同一张图片的大小,并需要将其保存在单独的目录中?

我如何在同一张表上找到同时存在于两个条件的记录,并将它们显示在同一行的不同列名下

我想创建一个下拉列表,其中包含另一张工作表上的可用数据

我有一张地图,我想按值从中删除条目

使用一张表中的一列,等于 Laravel 中的一个输入

使用 VBA ActiveX 命令按钮打印到另一张纸的第一个空行

我如何在 Django 中插入一张表并更新另一张表

我想制作一张地图并用这张地图的数据填充一个数组,数组“行”将用于 material-ui 的 DataGrid 组件

MySQL 使用一个查询从至少一张表中删除行