Hinweis: Wenn PDFs gescannt sind (nur Bild), liefert pdftotext oft keinen Text → dann bräuchtest du OCR.
pdftotext