Wie werden alte, digitalisierte Werke auf einem Reader dargestellt

Jar

New member
Auf verschiedenen Webseiten kann man alte, digitalisierte Werke, teils aus dem 19.ten Jahrhundert, unter anderem auch im Format ePub downloaden. Manchmal hat man sogar die Auswahl zwischen ePub ohne Bilder und ePub mit Bildern.
Eigentlich müssten die ja für einen Reader entsprechent aufbereitet und darstellbar sein.


Wie sieht es mit solchen Werken aus, wenn sie neben Text auch Bilder, Stiche und Grafiken und Formeln enthalten. Werden die auf einem Reader (wie dem Tolino Vision oder Kobo Aura) gut dargestellt?


Ich meine solche Bücher wie dieses Beispiel hier:
Um den Link zu sehen, bitte Anmelden oder Registrieren



Für mich wäre es wichtig, dass ich auch so etwas lesen und anschauen kann. Vor allem auf die Darstellbarkeit der Bilder und Zeichnungen kommt es mir an. Formeln sind nicht so wichtig.


Hat jemand damit schon Erfahrungen gemacht?


Das dumme ist, wenn man sich im Handel (Elektronikmarkt etc.) einen Reader anschaut, sind die entsprechenden Medien nicht drauf oder es geht nicht mal Internet im Laden, so dass man eigentlich solche Fragen nicht durch in Augenscheinnahme klären kann.


Gruß
Jar
 
Zuletzt bearbeitet von einem Moderator:

ingmar

New member
Für mich wäre es wichtig, dass ich auch so etwas lesen und anschauen kann. Vor allem auf die Darstellbarkeit der Bilder und Zeichnungen kommt es mir an. Formeln sind nicht so wichtig.

Der Reader ist meist nicht das Problem, dh die Auflösung und 16 Graustufen sollten ausreichen. Gerade die epubs von archive.org sind aber meist automatisch mit OCR erstellt und oft nicht von besonderer Qualität. Hier wären PDFs meist zu bevorzugen.


Das dumme ist, wenn man sich im Handel (Elektronikmarkt etc.) einen Reader anschaut, sind die entsprechenden Medien nicht drauf oder es geht nicht mal Internet im Laden, so dass man eigentlich solche Fragen nicht durch in Augenscheinnahme klären kann.

Auf einer SD-Karte mitnehmen? Oder eben im Fernabsatz zur Ansicht bestellen und ggf zurücksenden ...
 

Jar

New member
Danke, dass ich da nicht selber drauf gekommen bin:


ich ziehe ein paar Beispieldateien als ePub und als PDF mal auf eine MicroSD und hoffe, dass mich der Verkäufer diese in das Vorführteil einschieben lässt.


Gruß Jar
 

Jar

New member
Gut, einen Versuch mit der SD-Card war es wert.


Scheiterte aber daran, dass der Berater/Verkäufer im Elektronikfachmarkt die Karte zwar in mehrere Kobo Geräte einschob, aber es in gut 20 Minuten nicht schaffte, die SDCard oder deren Inhalt auf einem der Geräte sichtbar zu machen oder auf deren Inhalt zuzugreifen. Ich konnte ihm auch nicht helfen.


Ich hatte mir die heruntergeladenen Beispieldateien übrigens zu Hause einmal mittels eines ePub-Lese-Addons im Firefox angesehen und die selbe Datei auch in Calibre geöffnet. Dabei gab es erhebliche Unterschiede in der Ansicht:
Während die in den alten Büchern enthaltenen Zeichnungen und Bilder wie eingescannt dargestellt wurden versuchten die Betrachtungsprogramme den Text offensichtlich zu \"lesen\" und in modernere Schriften zu übersetzen und darzustellen.


Das klappte bei den alten Frakturschriften zum Teil nur sehr mäßig. Manchmal sind einzelne Worte oder ganze Zeilen zu lesen, andere sind bis zur Unkenntlichkeit mit Sonderzeichen zermetzelt worden.
Zum Beisiel so:


\"...Subtu fnr blc etntiaii murtt uiHntgcllli* 6«^ mtt\'n. unb Kc füc »i( »alinfiitcff im balftrn Sittifl 6i* (iä*ft(n( 50,000 gr. — Sic Btffllf*aft iS nurtcft im Etfliinq tinc» Oltfcifc« utrUfliitKC, lum jlDtifcn trau bicMbt Bfn btr HantonfrSHcgifning 50,000 gt, äiifiuS. — fCtr lacif »iirbt Vcn ttt SanlDna^üItflicirniifl füi tiefe Streife feRgeftetll. iinb ttt ttiitUidieft fccncc juc iBtbinflURa acniiAt, im ^dlflt bal ....\"


Damit kann man natürlich nichts anfangen.


Deutliche Unterschiede bei der Öffnung und betreffend der Lesbarkeit verschiedener Datein mittels ADE 3.0 und Calibre konnte ich am PC nicht feststellen.


Zur Zeit kann ich also nur ausprobieren und die ePub-Dateien öffnen. Manche sind am PC lesbar, manche nicht.
Ich vermute, das hängt damit zusammen, ob die Software des Digitalisierers (häufig ja der Betreiber einer grossen, bekannten Suchmachine mit dem OO in der Mitte) die alten Schrifttypen lesen und damit übersetzen kann oder nicht.


Aber damit weiß ich immer noch nicht, wie denn die Dateien auf einem eBook-Reader dargestellt werden.
Vielleicht können die ja aus dem \"zerhäxselten Buchstabensalat\" wieder was lesbares herstellen?
Ich vermute mal nein.


JAR
 

ingmar

New member
Das klappte bei den alten Frakturschriften zum Teil nur sehr mäßig. Manchmal sind einzelne Worte oder ganze Zeilen zu lesen, andere sind bis zur Unkenntlichkeit mit Sonderzeichen zermetzelt worden.

Das meinte ich. OCR = Optical Character Recognition = optische Zeichenerkennung, also der automationsunterstützte Versuch aus Bildernen computerlesbaren Text zu machen. Klappt bei \"normalem\" Text mittlerweile recht gut, bei gebrochenen Schriften eher weniger.


Vielleicht können die ja aus dem \"zerhäxselten Buchstabensalat\" wieder was lesbares herstellen?

Ganz sicher nicht; epub ist ein textbasiertes Format, das kann nur die Buchstaben und Bilder anzeigen, die da sind. Was Du mit dem Epub-Reader siehst ist das, was Du auch mit einem dedizierten Lesegerät erwarten kannst, von Nuancen in der Darsellung (Zeilenumbruch, -abstand, udgl.) vielleicht einmal abgesehen.
 

Jar

New member
Danke Ingmar,


dann muss ich mich allerdings fragen, warum der Digitalisierer (der mit dem OO im Namen) solche unleserlichen Ergebnisse eigentlich ins Netz stellt.


Ein solch großes Unternehmen sollte sich doch zumindest die Arbeit machen, eine OCR für Frakturschriften zu programmieren, wenn sie solche Bücher einscannen. Genug intelligente Köpfe haben die ja.


Die Bücher werden zwar von Automaten gescannt, aber von Menschen eingelegt.
(Ich habe eines dieser alten Bücher runtergeladen, wo eine menschliche Hand mit grünen Gummifingerlingen nicht schnell genug von der Scanfläche genommen wurde und nun mitfotografiert wurde.)
Also müsste solch ein Mensch auch sehen, dass das unscannbare Frakturschrift ist.


Ansonsten gibt es nur nur Masse aber keine Klasse.


Für mich heißt es also, wenn ich alte, interessante Bücher finde, diese erst einmal auf meinen Rechner holen und sehen, ob sie lesbar sind.


JAR
 
K

kbaerwald

Guest
Das Digitalisieren solcher Werke ist sehr aufwändig. Es gibt verschiedene Ansätze mit verschiedenen OCRs: im professionellen Bereich ist ABBYY Finereader ein Name, du kannst aber auch selbst scannen und mit dem Tesseract OCR arbeiten. Du wirst dann übrigens auch sehen, warum die meisten dieser \"Digitalisierungen\" lediglich ein Abbild (Faksimile) des Textes darstellen.


Bei der Darstellung als epub gibt es dann einen weiteren Satz von Problemen: welche Schrift soll bei der Ausgabe verwendet werden? Lateinische Buchstaben, oder wiederum eine der vielen Frakturschriften, die jedoch nicht auf jedem Lesegerät gleichgut darstellbar sind.


Ein weiteres \"Problem\": soll z.B. Text in Alhochdeutsch \"übersetzt\" werden, oder willst du ihn in einer Form belassen, dass er nur von Fachleuten gelesen werden kann.


Mit vielen alten Texten geht auch ein bestimmtes Layout einher, was bei Anpassung auf kleinformatiges epub zerstört wird. Imho ist die \"Faksimile\"-Aufbereitung im Ursprungformat mit Ausbesserung von altersbedingten Flecken und anderen Störstellen oder Verfärbungen noch die beste Form der Zurverfügungstellung von alten Büchern, wobei auch hier ein großer (restauratorischer) Aufwand getrieben werden muss.


Schau mal hier:\"http://www.mobileread.com/forums/showthread.php?t=31130\". Da findest du gelungene Beispiele von der Aufarbeitung alter Bücher (fast alle jedoch ohne Frakturschriften;)).


Übrigens: wenn du willst, kannst du dich an der Aufarbeitung alter Bücher (im Netz gibt es viele Beispiele) gerne beteiligen - du wirst dann auch sehr gut den Aufwand abschätzen können. Wenn du noch Fragen hast, will ich die gerne beantworten.
 

Jar

New member
Ich konnte jetzt meine Testdateien von archive.org auf der MicroSD Carte in einem Tolino Vision testen. Mit folgendem Ergebnis:


Die nicht lesbar aufgezeichneten und umgewandelten Frakturschriften waren natürlich wie weiter oben schon beschrieben, auf dem Tolino ebenfalls nicht lesbar.


Die PDF Versionen der Fachzeitschriften schon, was den Text betraf.
Auch die Grafiken wurden dargestellt, aber wenn sie soweit hochgezoomt wurden, dass ich was erkennen konnte, war es nur ein winziger Ausschnitt des gesamten Bildes.
Eigentlich unbrauchbar für flüssiges Anschauen und Lesen.


Nein, ein Tolino Vision ist für meine Zwecke eher nicht geeignet.


Tschüß Tolino....


JAR
 

JulesWDD

Active member
...


Auch die Grafiken wurden dargestellt, aber wenn sie soweit hochgezoomt wurden, dass ich was erkennen konnte, war es nur ein winziger Ausschnitt des gesamten Bildes.
Eigentlich unbrauchbar für flüssiges Anschauen und Lesen.


...

Was hatten Sie denn erwartet? Dass der Bildschirm durch das Zoomen größer wird?
 

Jar

New member
Was hatten Sie denn erwartet? Dass der Bildschirm durch das Zoomen größer wird?

Ich danke für diese qualifizierte Anmerkung!!!


Schön, dass das Prädikat \"Experte\" ein Hinweis darauf ist, dass der Schreiber obiger Zeilen sich offensichtlich schon sehr lange mit dem Thema befasst und hinreichend Erfahrung mit dieser Technik - und was man von ihr erwarten kann - hat, viel mehr als es mir als \"Neuling\" bekannt sein kann.
:mad:



Nein, ich hatte erwartet, dass die Auflösung des vorhandenen Bildschirmes ausreichend ist, ein PDF nicht erst mit dem Fakor 2000 oder mehr vergrößern zu müssen, um die im diesem PDF vorhandenen Grafiken (zB. Zeichnungen oder Fotos) in ausreichender Qualität erkennen zu können.
Das ist aber leider bei diesem Gerät für die von mir zu Testzwecken herangezogenen PDF-Dateien nicht möglich.


JAR
 

JulesWDD

Active member
Ich danke für diese qualifizierte Anmerkung!!!


Schön, dass das Prädikat \"Experte\" ein Hinweis darauf ist, dass der Schreiber obiger Zeilen sich offensichtlich schon sehr lange mit dem Thema befasst und hinreichend Erfahrung mit dieser Technik - und was man von ihr erwarten kann - hat, viel mehr als es mir als \"Neuling\" bekannt sein kann.
:mad:



Nein, ich hatte erwartet, dass die Auflösung des vorhandenen Bildschirmes ausreichend ist, ein PDF nicht erst mit dem Fakor 2000 oder mehr vergrößern zu müssen, um die im diesem PDF vorhandenen Grafiken (zB. Zeichnungen oder Fotos) in ausreichender Qualität erkennen zu können.
Das ist aber leider bei diesem Gerät für die von mir zu Testzwecken herangezogenen PDF-Dateien nicht möglich.


JAR

Das \"Prädikat Experte\" habe nicht ich mir verliehen, dass erfolgt wohl automatisiert; war mir persönlich noch gar nicht aufgefallen ... aber schön, ein weiterer Titel in meiner Sammlung ...
:cool:
... !!


In der Sache selbst:


Ich kenne bestimmt nicht alle eBook Reader, aber diejenigen, die ich kenne, eignen sich allesamt NICHT zur Darstellung von PDFs, wenn dort auch Graphiken und/ oder Bilder enthalten sind. Bei reinen Text PDFs gibt es welche, die man verwenden kann (!). Ich selbst lesen aber keine PDFs auf eInk Readern.
 

LightWriter

New member
Für solche Werke, wo es auch auf Grafiken und Bilder ankommt, würde ich mich für einen möglichst großen Reader umsehen.
Da wäre für mich der Kobo Aura H2O schon fast ein wenig zu klein. Wollen wir hoffen, das Pocketbook mit dem InkPad einen Erfolg erzielen kann, dann wäre ein Gerät am Markt, das sich eignen könnte.
 

JulesWDD

Active member
Für solche Werke, wo es auch auf Grafiken und Bilder ankommt, würde ich mich für einen möglichst großen Reader umsehen.
Da wäre für mich der Kobo Aura H2O schon fast ein wenig zu klein. Wollen wir hoffen, das Pocketbook mit dem InkPad einen Erfolg erzielen kann, dann wäre ein Gerät am Markt, das sich eignen könnte.

Oder eben ein \"ganz normales\" 10 Zoll Tablet dafür verwenden. Da hat man bei PDFs, bei denen Bilder, Grafiken etc dabei sind definitiv mehr Freude.
 

LightWriter

New member
Stimmt, ein Tablet ist auch eine Möglichkeit.
Sony bietet auf E-Ink-Basis noch das ziemlich teure DPT-S1 an, das ein 13,3\" Display hat.
Damit sind A4 PDFs in Originalgröße darstellbar.
Kenne ich bisher leider nur von Bildern, wobei ich das Gerät gerne mal in Händen hätte.
 
Oben