Paperless OCR et recherches


#1

Bonjour,

J’ai trouvé des logiciels sous Manjaro permettant de faire l’OCR assez facilement.

Ensuite, un logiciel nommé PaperWork, permettant de scanner, d’archiver et de faire des recherches dans les documents. Mais cela logiciel est relativement instable chez moi, et j’ai peur qu’il ne soit plus continué à l’avenir.

Savez-vous si il existe sous Manjaro un “moteur de recherche” dans les documents qui intègre l’OCR et qui permet donc de rechercher un mot dans un document ? Et éventuellement de gérer des Tags. Tout cela existe nativement sous Osx, mais je peine à trouver dans le libre.

Mon objectif, est de scanner et de pouvoir faire des recherches mots clefs dans les documents.

D’avance merci,


#2

Hello,

Sorry to reply in english. :slight_smile:
Here is an extensive answers post for what you are looking for, mostly CLI

GUI based search inside (some) documents applications are:

  • tracker is already installed in Gnome but doesn’t search inside documents (don’t know about tracker-miners if installed, as is supposed to extract data :thinking:
  • KFind works quite decent in KDE Plasma
  • Recoll from community repo + some goodies as optional dependencies
  • Searchmonkey from AUR
  • DocFetcher also from AUR

#3

I too am answering in English, excusez-moi.

You might want to try gimagereader. I haven’t used it for awhile and not sure it fits all your needs, but worth a try.

gimagereader


#4

Merci, j’ai testé tout cela.

Dommage que PaperWork soft est instable sur Linux. Il s’agit vraiment d’un génial logiciel. https://openpaper.work/en-us/


#5

If you mean the AUR package is unstable, you can also install the Flatpak version;
Paperwork Flatpak