pit234a
Well-Known Member
hier habe ich es ja schon angedeutet, dass ich dieses Thema am liebsten noch weiter beleuchten möchte.
Wie macht ihr das?
Was kann ich von euch lernen?
Welche Tips habt ihr so in Petto?
Ausgangslage: ich brauchte einen neuen Scanner, habe um Rat gefragt und diesen erhalten, den neuen Scanner gekauft und so eingesetzt, wie den alten Scanner auch und ich wäre damit glücklich und zufrieden gewesen und meiner Tage Licht hätte sich so dem Ende genähert, ohne dass ich jemals erfahren hätte, dass ja da noch mehr geht!
Wäre nicht @Andy_m4 gewesen, der mir weitere Erleuchtung zu Teil werden ließ.
Schon bei tesseract erkenne ich, dass diese Art der Texterkennung und der Erzeugung resultierender Dateien in txt, aber vor Allem als PDF ungleich besser ist, als alles, was ich bisher genutzt habe, nämlich: graphics/gocr und graphics/ocrad.
Das graphics/tesseract ist einfach meilenweit besser und erzeugt grandios gute und durchsuchbare PDF-Dateien, selbst aus meinen sehr alten und unzulänglichen Scans!
Dabei könnte ich nun alle möglichen veralteten Scans einfach einem Script vorwerfen, dass diese mit tessaract behandelt.
Bevor ich aber diesen verwegenen Weg gehe, frage ich lieber mal nach.
@Andy_m4 hat ja noch andere Möglichkeiten genannt und ich kann kaum glauben, dass die mich dann noch mehr begeistern können?
Bevor ich unsägliche Stunden mit Tests zubringe, deshalb lieber mal nachgefragt:
Wie macht ihr das?
Welche Programme nutzt ihr?
Nutzt ihr das zusätzlich zum Scann-Programm oder kann man das dann auch integrieren?
Oder doch lieber ein Script laufen lassen?
Wie macht ihr das?
Was kann ich von euch lernen?
Welche Tips habt ihr so in Petto?
Ausgangslage: ich brauchte einen neuen Scanner, habe um Rat gefragt und diesen erhalten, den neuen Scanner gekauft und so eingesetzt, wie den alten Scanner auch und ich wäre damit glücklich und zufrieden gewesen und meiner Tage Licht hätte sich so dem Ende genähert, ohne dass ich jemals erfahren hätte, dass ja da noch mehr geht!
Wäre nicht @Andy_m4 gewesen, der mir weitere Erleuchtung zu Teil werden ließ.
Du kannst auch Schrifterkennung drauf machen (um die Dokumente so durchsuchbar zu kriegen).
Eine gern genommene Lösung ist graphics/tesseract. bzw. eine integriertes Programm (mit GUI) wie graphics/gscan2pdf.
Wenns noch ein bisschen mehr sein soll, kann man zu OpenPaper.work (FreeBSD Pkg: py311-openpaperwork-*) greifen.
Schon bei tesseract erkenne ich, dass diese Art der Texterkennung und der Erzeugung resultierender Dateien in txt, aber vor Allem als PDF ungleich besser ist, als alles, was ich bisher genutzt habe, nämlich: graphics/gocr und graphics/ocrad.
Das graphics/tesseract ist einfach meilenweit besser und erzeugt grandios gute und durchsuchbare PDF-Dateien, selbst aus meinen sehr alten und unzulänglichen Scans!
Dabei könnte ich nun alle möglichen veralteten Scans einfach einem Script vorwerfen, dass diese mit tessaract behandelt.
Bevor ich aber diesen verwegenen Weg gehe, frage ich lieber mal nach.
@Andy_m4 hat ja noch andere Möglichkeiten genannt und ich kann kaum glauben, dass die mich dann noch mehr begeistern können?
Bevor ich unsägliche Stunden mit Tests zubringe, deshalb lieber mal nachgefragt:
Wie macht ihr das?
Welche Programme nutzt ihr?
Nutzt ihr das zusätzlich zum Scann-Programm oder kann man das dann auch integrieren?
Oder doch lieber ein Script laufen lassen?