Existe-t-il un moyen de désactiver le mode OCR dans Tika sans désinstaller tesseract

Santhosh:

J'utilise tika-app jar pour mon projet et existe-t-il un moyen de désactiver Tesseract OCR dans tika. Il y a deux choses qui doivent être conservées comme telles:

1.tesseract ne peut pas être désinstallé

2.tika.xml ne peut pas être modifié, car tika-app.jar est utilisé dans le commerce

Existe-t-il un moyen de définir la configuration dans le code java en définissant la propriété context ou parser pour désactiver l'OCR?

J'ai essayé le code ci-dessous mais OCR extrait toujours le texte des fichiers image lors de l'analyse.

            PDFParserConfig pdfConfig = new PDFParserConfig();
            pdfConfig.setOcrStrategy(OCR_STRATEGY.NO_OCR);
            context.set(PDFParserConfig.class, pdfConfig);```
suraj huljute:
<?xml version="1.0" encoding="UTF-8"?>
<properties>
    <parsers>
        <parser class="org.apache.tika.parser.DefaultParser">
       <parser-exclude class="org.apache.tika.parser.ocr.TesseractOCRParser"/>
        </parser>
    </parsers>
</properties>

Cet article est collecté sur Internet, veuillez indiquer la source lors de la réimpression.

En cas d'infraction, veuillez [email protected] Supprimer.

modifier le
0

laisse moi dire quelques mots

0commentaires
connexionAprès avoir participé à la revue

Articles connexes

existe-t-il un moyen d'obtenir tous les pods dans le cluster sans RBAC?

Existe-t-il un moyen de désactiver les plantages javadoc dans Android Studio avec le plugin Maven?

Existe-t-il un moyen de désinstaller Eventfilter dans qt?

Existe-t-il un moyen de désactiver le volet d'environnement dans RStudio?

Existe-t-il un moyen de désactiver le mode silencieux dans DCC32 appelé par MSBuild?

Dans Android Studio, existe-t-il un moyen de désactiver un module sans le supprimer?

Existe-t-il un moyen d'obtenir le nombre de commits supplémentaires dans git sans awk?

Existe-t-il un moyen de désactiver le processus "Mise à jour des symboles ..." dans Android Studio?

Existe-t-il un moyen de dire à Sphinx de NE PAS exécuter le module sans désactiver autdoc?

Existe-t-il un moyen d'appliquer le format de cellule dans xlswriter sans définir de valeur?

Existe-t-il un moyen de désactiver l'élision de copie dans le compilateur C ++

Existe-t-il un moyen d'activer / de désactiver le mode sombre pour les applications individuelles dans MacOs Mojave?

Existe-t-il un moyen d'arrêter IIS au lieu de le désactiver?

Existe-t-il un moyen «d'amorcer» tesseract ou d'autres moteurs OCR pour certains mots

Existe-t-il un moyen de désactiver le curseur de la souris dans la fenêtre / widget Gtk?

Existe-t-il un moyen d'extraire une image d'un fichier Excel en utilisant R? Il pourrait ensuite être placé dans le tesseract ocr

Il existe un moyen de désactiver tous les points d'arrêt dans VS 2019?

Existe-t-il un moyen d'installer Tesseract OCR sur un serveur venv / web?

Existe-t-il un moyen de désactiver le bouton droit dans la barre supérieure?

Existe-t-il un moyen d'activer / de désactiver (grisé) le verrouillage de rotation dans le centre d'action par programme sur un appareil Windows 10 sans redémarrer?

Existe-t-il un moyen de désactiver le texte pour un menu déroulant?

Existe-t-il un moyen de démarrer l'EventStore servi dans Windows (sans utiliser le docker du tout)?

Existe-t-il un moyen d'obtenir le type de fichier d'un document dans une enveloppe (sans extension)?

Existe-t-il un moyen de sélectionner tout le texte d'une cellule dans un JTable sans CellEditor?

Existe-t-il un moyen de désactiver le minuteur d'initialisation dans Office.js ?

Existe-t-il un moyen de désactiver IdleState ?

Existe-t-il un moyen de désactiver les éléments d'entrée dans le fichier dactylographié

Existe-t-il un moyen de "désactiver" un contexte partagé dans un seul bloc ?

Existe-t-il un moyen de déployer le projet Strapi sans panneau d'administration ?

TOP liste

  1. 1

    comment afficher un bouton au-dessus d'un autre élément ?

  2. 2

    impossible d'obtenir l'image d'arrière-plan en plein écran dans reactjs

  3. 3

    Je continue à obtenir l'objet 'WSGIRequest' n'a pas d'attribut 'Get' sur django

  4. 4

    comment supprimer "compte de connexion google" à des fins de développement - actions sur google

  5. 5

    Conversion double en BigDecimal en Java

  6. 6

    Impossible d'accéder à la vue personnalisée pendant le test de l'interface utilisateur dans XCode

  7. 7

    Algorithme: diviser de manière optimale une chaîne en 3 sous-chaînes

  8. 8

    Passer la taille d'un tableau 2D à une fonction ?

  9. 9

    Comment obtenir l'intégration contextuelle d'une phrase dans une phrase à l'aide de BERT ?

  10. 10

    Comment changer le navigateur par défaut en Microsoft Edge pour Jupyter Notebook sous Windows 10 ?

  11. 11

    CSS: before ne fonctionne pas sur certains éléments,: after fonctionne très bien

  12. 12

    Comment créer un bot à compte à rebours dans Discord en utilisant Python

  13. 13

    Comment ajouter une entrée à une table de base de données pour une combinaison de deux tables

  14. 14

    Exporter la table de l'arborescence vers CSV avec mise en forme

  15. 15

    Comment activer le message Pylint "too-many-locals" dans VS Code?

  16. 16

    Créer un système Buzzer à l'aide de python

  17. 17

    Spring @RequestParam DateTime format comme ISO 8601 Date Heure facultative

  18. 18

    Empêcher l'allocation de mémoire dans la génération de combinaison récursive

  19. 19

    Déplacement des moindres carrés d'ajustement pour les déplacements de points ayant des problèmes

  20. 20

    Comment choisir le nombre de fragments et de répliques Elasticsearch

  21. 21

    Microsoft.WebApplication.targets

chaudétiquette

Archive