Würde <em> ohne CSS kursiv dargestellt werden?
„em“ steht für „emphasis“, eine Hervorhebung. Meistens wird eine solche fett dargestellt, da es sich aber um eine semantische Auszeichnung handelt, ist die optische Repräsentation undefiniert.
es gibt sowohl in Sigil, als auch Calibre nur <i> Schnellformat-Buttons
Wenn wirklich ein <i> ins EPUB geschrieben wird, wenn man den Schnellformat-Knopf drückt, dann macht dies ein EPUB2 ungültig und hat in EPUB3 nichts mehr mit „italic“, kursiv, zu tun. Bei Calibre ist genau das der Fall, und da Calibre kein EPUB3 unterstützt, ist Calibre eine weit verbreitete Quelle für ungültige EPUBs, die den Leuten das Leben schwer machen. Kovid Goyal, der Haupt-Entwickler von Calibre, hält nichts von Standards, sondern stattdessen soll lieber der Rest der Welt fehlertolerante Software schreiben.
Wäre meine Formatierung meines Ausgangs-ePubs überhaupt in gängigen ePub Readern lesbar oder brauchen die auch für jedes Format-Tag eine CSS-Definition?
Validier das EPUB doch einfach, und wenn es gültig ist, dann obliegt es dem Reader, es lesbar anzuzeigen (außer natürlich, wenn mit CSS so richtig kranker Kram angestellt wird).
Ich halte generell nichts von direkten Formatierungen in Ebooks. Alles gehört ins CSS
Richtig.
Hat man z.B. die Wörter mit man Kursiv machen will mit HTML-Tags ausgezeichnet und möchte die jetzt noch Fett oder unterstrichen?
Falsch, und zwar wegen
Am semantischen Sinn von (X)HTML geht das dann aber vorbei.
Im HTML einer Webseite wie im HTML eines EPUBs ist es wichtig, dass die verwendeten Elemente nicht das Aussehen deklarieren, sondern die Struktur und Bedeutung. Struktur und Bedeutung kann dann hinterher immer noch eine Gestaltung zugewiesen werden (per CSS), beide Komponenten sind aber völlig getrennt voneinander zu betrachten. Semantische Auszeichnung ist dafür gedacht, maschinenlesbar zu sein, also z.B. von Software. Ein Mensch kann vielleicht unter Berücksichtigung des Kontextes und der optischen Darstellung erraten, was die Bedeutung eines Gestaltungselements sein soll, ein Computer ist aber furchtbar schlecht im Raten und unintelligent, weshalb man ihm ausdrücklich die Bedeutung von Datenschnipseln mitteilen muss, damit er diese auch verarbeiten kann. So wird die optische Hochstellung von Text verwendet, um Fußnotennummern im Text unterzubringen, um die Dimension von Maßeinheiten anzugeben oder um die Auflage eines Buches zu spezifizieren. Wenn jetzt eine Verarbeitungssoftware aus einem nicht-semantischen Quell-Dokument ein Zielformat erzeugen soll, wo alle Fußnoten übergangen werden, weil das Zielformat die Anzeige von Fußnoten nicht unterstützt, gibt es keine Möglichkeit, die hochgestellten Fußnotennummern von den hochgestellten Exponenten an den Maßeinheiten zu unterscheiden, womit man das gesamte Dokument also doch wieder von Hand komplett überarbeiten muss (und dieses Mal dann hoffentlich richtig). Informationen, die man nicht encodiert, also nicht hinterlegt und abspeichert, stehen anschließend eben auch nicht zur Verfügung. Für normalen Fließtext wie den eines Buches halten sich die Vorteile der semantischen Auszeichnung noch etwas in Grenzen (wobei sehr viele Leute dann doch darüber stolpern, indem sie die Arbeit für E-Book-Erzeugung und Print-PDF-Erzeugung dann doppelt machen müssen, und zwar manuell), man kann mit dieser Methode aber auch sehr komplexe Datenbestände für computergestützte Verarbeitung abbilden, sodass es unzählig viele Encodierungs-Vokabular-Definitionen für die unterschiedlichsten Zwecke gibt (HTML ist eins davon), worauf die verarbeitenden Programme dann abgestimmt werden können.
Dementsprechend empfiehlt es sich, nur die XHTML-Elemente zu verwenden und diese mit id- und class-Attributen zu versehen, deren visuelle Gestaltung dann per CSS vorgenommen wird. Ziemlich witzlos ist dann aber trotzdem, einen Style „italic“ zu definieren und den dann kursiv zu machen, weil hier dann ganz genauso jeglicher Hinweis auf den Grund, weshalb man überhaupt zur kursiven Hervorhebung gegriffen hat und was man damit bezwecken möchte, als explizit encodierte Information verloren geht.