utf8x is dead?

Schriftbild, Absätze und Auflistungen einstellen


feuerwehr
Forum-Newbie
Forum-Newbie
Beiträge: 7
Registriert: Mo 1. Sep 2014, 11:46

Beitrag von feuerwehr »

u_fischer hat geschrieben:Unicode in code-listings funktioniert hier nicht.
ja, das hab ich dann auch geschnallt.. :)
u_fischer hat geschrieben:Aber ich gehe davon aus, dass du eine andere Schrift benutzen solltest, die die Zeichen, die du brauchst auch wirklich enthält.
ja, so ist es sehr wahrscheinlich. Erst dachte ich, Gentium funktioniert, vgl. diese hilfreichen Hinweise hier:

http://www.johanna-pink.de/wordpress/?p=191

Mit
 \documentclass{scrbook}
\usepackage{xunicode,fontspec,xltxtra}
\setmainfont{Gentium} 
\begin{document}
\end{document}
werden zwar alle Zeichen korrekt angezeigt. Aber es gibt folgende Warnung:

"LaTeX Font Warning: Font shape `OT1/Gentium(0)/m/n' undefined
(Font) using `OT1/cmr/m/n' instead on input line 11."

und im Gesamtdokument führt das dann zu den üblichen "text line contains an invalid character" meldungen. ich suche später noch weiter im netz rum, wollte das nur eben schon mal antworten. danke!

ulrike, zu deinen anderen anmerkungen
meine Probleme konzentrieren sich auf die Umschrift, nicht auf das Originalarabische.
u_fischer hat geschrieben:Schau dir nochmal deine erste Frage in diesem Thread (auch den Code) an und frage dich, ob jemand ohne Fachkenntnisse (und ohne den ganzen alten Thread nochmal zu lesen) wissen kann, was genau dein Problem ist.

Woher z.B. soll jemand wissen was "und das ain und hamza sind viel zu tief," bedeuten soll?

Deine andere Frage in mrunix war ähnlich: Viel zu langes Beispiel mit lauter Teilen, die Fachfremde nur verwirren.


kann ich nur sagen, dass diese elendigen anfänger_innen einfach wie hölle nerven müssen ;) jetz ganz unironisch: ich hab dieses überladene "minimalbeispiel" bei mrunix abgeliefert, weil ich zeigen wollte, dass im fließtext die umschrift korrekt dargestellt wird, nur die überschrift probleme machte, was mich sehr verwirrt hat. klar, die präambel war ebenso überladen, weil ich eben dachte, dass dort der fehler steckt, die pakete sich vielleicht nicht vertragen oder so etwas. ich hab halt wenig ahnung, weshalb ich mich auch lange gescheut hab, überhaupt etwas in foren fragen...

und bei dem minimalbsp. hier im thread wollte ich mit dem link auf die umschrifttabelle deutlich machen, dass die darstellung der unicode-zeichen 02BF und 02BE nicht korrekt ist, weil ich nicht

wie LaTeX funktioniert, ist für einen neuling verwirrend. deshalb sind die fragen manchmal auch verwirrend gestellt. sorry dafür, nächstes mal mach ichs besser.

Benutzeravatar
u_fischer
Forum-Meister
Forum-Meister
Beiträge: 4266
Registriert: Do 22. Nov 2012, 11:09
Kontaktdaten:

Beitrag von u_fischer »

feuerwehr hat geschrieben:
u_fischer hat geschrieben: Mit
 \documentclass{scrbook}
\usepackage{xunicode,fontspec,xltxtra}
\setmainfont{Gentium} 
\begin{document}
\end{document}
werden zwar alle Zeichen korrekt angezeigt.
Welche Zeichen? Das Dokument ist doch leer.

Abgesehen davon: lade weder xunicode noch xltxtra. fontspec reicht und kümmert sich um den Rest (unter der Annahme, dass dein System aktuell ist, was es sein sollte).

feuerwehr
Forum-Newbie
Forum-Newbie
Beiträge: 7
Registriert: Mo 1. Sep 2014, 11:46

Beitrag von feuerwehr »

hey, ich dachte, da die unicode-zeichen hier mit dieser oberfläche nicht dargestellt werden können, bringt es wenig, wenn ich sie eintrage. hier also das bsp. mit inhalt:
\documentclass{scrbook}
\usepackage{fontspec}
\setmainfont{Gentium}
\usepackage[ngerman]{babel}

\begin{document}
eine kleine Auswahl an benötigten Umschriftzeichen:

ʿ ʾ ā Ḫ ḫ ṯ ẕ ğ ǧ ñ č

\end{document} 
\documentclass{scrbook}
\usepackage{fontspec}
\setmainfont{Gentium}
\usepackage[ngerman]{babel}

\begin{document}
eine kleine Auswahl an benötigten Umschriftzeichen:

ʿ ʾ ā Ḫ ḫ ṯ ẕ ğ ǧ ñ č

\end{document}
ergebnis ist: keine fehler, keine warnungen, alles in ordnung.

im gesamtdokument aber ist das wiederum nicht der fall. hier tritt der erste fehler an dieser stelle auf, es geht um das unicode-zeichen 02BF, das zwar korrekt ausgegeben wird, aber einen Fehler verursacht:
\documentclass{scrbook}
\usepackage[ngerman]{babel}
\usepackage{fontspec}
\setmainfont{Gentium}

\begin{document}

Bl. 1b: Rechteckiger ʿUnwān, Viereck und Dreieck, Bl. 118b: Viereck in Dunkelblau mit goldener Rosette und verschiedenfarbigem Blumen- und Blattdekor. Bl. 147a: Yūsuf b. al-Marwī. 932/beg. 18.~Dez. 1525. Der Jahreszahl folgt die Gesamtzahl der Doppelverse des Būstān: 4050. 

Zahlreiche türkische Rand- und Interlinearglossen, teils in Bleistift, teils in Tinte im Rĭqʿa-Duktus, besonders im 2. Teil der Hs.
\end{document}


dazu wird gemeldet:
"! Text line contains an invalid character.
l.11 Bl. 1b: Rechteckiger ^^@
ʿUnwān, Viereck und Dreieck, Bl. 118b: Vierec..."

ich kann das textbeispiel nicht verkleinern, denn wenn ich das tue, wird kein fehler gemeldet.

feuerwehr
Forum-Newbie
Forum-Newbie
Beiträge: 7
Registriert: Mo 1. Sep 2014, 11:46

Beitrag von feuerwehr »

... das is doch wieder nur verwirrend: gibts keine möglichkeit, die unicode-zeichen einzubetten, der code, so wie er jetzt aussieht, ist doch gar nicht aussagekräftig?! warum geht das mrunix, aber nicht hier?

Benutzeravatar
Johannes_B
Moderator
Moderator
Beiträge: 5079
Registriert: Do 1. Nov 2012, 14:55
Kontaktdaten:

Beitrag von Johannes_B »

feuerwehr hat geschrieben:... das is doch wieder nur verwirrend: gibts keine möglichkeit, die unicode-zeichen einzubetten, der code, so wie er jetzt aussieht, ist doch gar nicht aussagekräftig?! warum geht das mrunix, aber nicht hier?
Weil die Forensoftware hier schon seit Jahren defekt ist.
Wahrscheinlicher ist aber, dass die Schrift die Zeichen schlicht nicht enthält und damit auf den codepoint ausweicht. Jeder aknn das aber kopieren, indem er auf Zitat drückt. Umständlich, aber es geht.

Übrigens, eine Seite mit duten Inhalten, kompetenten Nuter und netter Gemeinschaft ist TeXwelt. de. Schau doch mal vorbei.

Dein zweites Minimalbeispiel mit XeTeX: Kein Fehler
Bild
TeXwelt - Fragen und Antworten Schaut vorbei und stellt Fragen.
LaTeX-Vorlagen?

Der Weg zum Ziel: Ruhe bewahren und durchatmen, Beiträge und unterstützende Links aufmerksam lesen, Lösungsansätze verstehen und ggf. nachfragen.

Noch so einer

Beitrag von Noch so einer »

Sieht für mich so aus, als wäre zwischen Rechteck und ʿUnwān ein Steuerzeichen, das ein Problem verursacht. So etwas passiert gerne mal, wenn man Text aus einer Internet-Seite kopiert. Das steht aber im Widerspruch zu deiner Aussage, dass sich das Beispiel nicht weiter minimieren lässt. Der Fehler dürfte dann nämlich nur verschwinden, wenn genau diese Stelle entfernt wird, aber nicht, wenn andere – beispielsweise der zweite Absatz im Beispiel – entfernt werden. Also wird es das wohl doch nicht sein …

Was ich jedoch erwähnen wollte: Ich habe übrigens mit lualatex getestet, weil xelatex (im Gegensatz zu lualatex) bei mir Gentium nicht findet. So wie der Code in deinem Beispiel bei goLaTeX gespeichert ist wird mit lualatex genau das gleiche Ergebnis geliefert, das Johannes bereits für xelatex angegeben hat. Fehler werden nicht gemeldet.

Benutzeravatar
u_fischer
Forum-Meister
Forum-Meister
Beiträge: 4266
Registriert: Do 22. Nov 2012, 11:09
Kontaktdaten:

Beitrag von u_fischer »

hey, ich dachte, da die unicode-zeichen hier mit dieser oberfläche nicht dargestellt werden können, bringt es wenig, wenn ich sie eintrage.
Stimmt. Es bringt aber noch weniger nichts einzutragen und dann über Fehler mit diesen nicht-existenten Symbolen zu schreiben.

Also denke mal darüber nach, wie du uns den wirklichen, nicht durch copy&paste geänderten Inhalt deiner problematischen Dateien zeigen kannst.

Es gibt übrigens die Möglichkeit Zeichen mit reinem ASCII und der Angabe des Codepoints einzugeben:
\documentclass{scrbook}
\usepackage{fontspec}
\setmainfont{Gentium}
\begin{document}
^^^^00e4 ^^^^20ac 
\end{document}

Gesperrt