QuarkStar

QuarkStar

… bringt laufend Tipps zum produktiveren Arbeiten mit dem Mac, iOS
und dem Web


Kurztipp: Texterkennung in Google Docs

Im Juni vergangenen Jahres hat Google begonnen, beim Upload von Dokumenten in Google Docs, auch optische Zeichenerkennung (OCR) für englische Texte anzubieten. Google’s Server versuchen dabei in einer hochgeladenen Bild- oder PDF-Datei die Buchstaben zu erkennen und in einem Textdokument bearbeitbar zu machen.

Der Service steht seit heute für 34 weitere Sprachen, darunter auch Deutsch, zur Verfügung.

Beim Hochladen der Texte akzeptiert Google Scans in der Form von Bild- oder PDF-Dateien. Natürlich lassen sich auch Fotos von Dokumenten hochladen, die beispielsweise mit einer Handykamera gemacht wurden.

Im Upload Formular muss man in den Optionen ein Häkchen bei “Text … konvertieren” setzen und die entsprechende Sprache des Textes auswählen.

Google Docs OCR Upload Formular Screenshot

In meinen Versuchen mit einigen sehr unterschiedlichen Texten, funktionierte die Erkennung teilweise nur sehr begrenzt.

Beim Hochladen von Screenshots, erkennt Google den Text im Großen und Ganzen sehr zuverlässig. Selten treten Probleme auf wie  beispielsweise, dass “rn” (RN) als “m” (M) erkannt wird.

Mit PDF-Dateien, die mit einem Scanner erstellt wurden, hat Google ebenfalls nur wenig Probleme. Ein Nachteil  ist jedoch, dass sich keine dursuchbaren PDF-Dateien erstellen lassen, sondern der Text immer getrennt ausgegeben wird.

Größere Probleme hat Google beim Erkennen von Text aus Kamerabildern. Theoretisch wäre es ja sehr praktisch, wenn man unterwegs ein Dokument mit der Handykamera fotografieren und dann durch die Texterkennung von Google schicken kann.

Leider funktioniert die Texterkennung von Fotos in der Praxis nicht besonders gut. Wölbungen in Buchseiten oder eine schlechte Ausleuchtung stören die Texterkennung erheblich.

Anabasis Google Docs OCR

Die Texterkennung von Evernote lieferte in meinen Versuchen wesentlich bessere Ergebnisse. Leider kann man den erkannten Text in Evernote jedoch nur zum Durchsuchen verwenden und nicht extrahieren.

Fazit: Wenn man über keine lokale OCR-Software verfügt, ist die Texterkennung von Google Docs auf jeden Fall einen Versuch wert. Schneller als Abschreiben ist das Ausbessern einiger Fehler allemal.

via Google Docs Blog

Noch keine Kommentare, Kommentieren oder Pingen

“Kurztipp: Texterkennung in Google Docs”