我不熟悉使用Tess4J库。我已经将Tess4j作为依赖项包含在Maven中,如下所示:
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>4.5.1</version>
</dependency>
到目前为止,它运行良好,但是我无法弄清楚如何禁用日志记录。日志似乎来自Tess4j的依赖项PDFBox和Fontbox。以下是一些正在此处记录的内容:
19:54:46.712 [main] DEBUG org.apache.fontbox.util.autodetect.FontFileFinder - checkFontfile found C:\WINDOWS\FONTS\YuGothR.ttc
19:54:46.757 [main] DEBUG org.apache.pdfbox.pdmodel.font.FileSystemFontProvider - Loaded Arial-BoldMT from C:\WINDOWS\FONTS\arialbd.ttf
19:54:46.860 [main] DEBUG org.apache.pdfbox.pdmodel.font.FileSystemFontProvider - Loaded Arial-BoldItalicMT from C:\WINDOWS\FONTS\arialbi.ttf
19:54:46.899 [main] DEBUG org.apache.pdfbox.pdmodel.font.FileSystemFontProvider - Loaded ArialMT from C:\WINDOWS\FONTS\arial.ttf
19:54:46.955 [main] DEBUG org.apache.pdfbox.pdmodel.font.FileSystemFontProvider - Loaded Arial-ItalicMT from C:\WINDOWS\FONTS\ariali.ttf
19:54:47.477 [Finalizer] DEBUG org.apache.pdfbox.io.ScratchFileBuffer - ScratchFileBuffer not closed!
我尝试在调用doOCR的代码之前设置日志记录级别,但它似乎仍在记录此信息。这是我的代码段:
import java.io.File;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.util.logging.Logger;
import net.sourceforge.tess4j.*;
public static void main(String[] args) throws TesseractException, FileNotFoundException, IOException {
Tesseract tesseract = getTesseract("C:\\Program Files\\Tesseract-OCR\\tessdata");
// My attempts to disable logging
Logger.getLogger("org.apache.fontbox").setLevel(java.util.logging.Level.OFF);
Logger.getLogger("org.apache.pdfbox").setLevel(java.util.logging.Level.OFF);
// Example 1
File file = new File("test.pdf");
String result = tesseract.doOCR(file);
System.out.println(result);
}
tess4j
库依赖项包括logback。
因此,我假设日志是通过logback生成的,而不是通过标准的java logging(java.util.logging
软件包)生成的。
这意味着您应该配置logback以禁用不必要的日志记录。
在Maven项目中,创建一个src/main/resources/logback.xml
具有如下内容的文件就足够了:
<configuration>
<appender name="STDOUT" class="ch.qos.logback.core.ConsoleAppender">
<encoder>
<pattern>%d{HH:mm:ss.SSS} [%thread] %-5level %logger{36} - %msg%n</pattern>
</encoder>
</appender>
<logger name="org.apache.fontbox" level="ERROR"/>
<logger name="org.apache.pdfbox" level="ERROR"/>
<root level="INFO">
<appender-ref ref="STDOUT" />
</root>
</configuration>
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句