TYPO3 auf utf-8 Codierung umstellen
UTF-8 ist die am weitesten verbreitete Kodierung für Unicode-Zeichen. Sie umfasst die meisten Alphabete und Schriftzeichensysteme, die derzeit genutzt werden, also nicht nur die lateinischen Buchstaben und arabischen Zahlen, sondern zum Beispiel auch die arabische, griechische, kyrillische, koreanische oder thailändische Schrift.
Dabei wird jedem Unicode-Zeichen eine speziell kodierte Bytekette von variabler Länge zugeordnet. UTF-8 unterstützt bis zu 4 Byte, auf die sich wie bei allen UTF-Formaten alle 1.114.112 Unicode-Zeichen abbilden lassen.
- UTF-8 hat den Vorteil, dass sich mit dieser Kodierung alle in HTML erlaubten Zeichen direkt darstellen lassen (der Zeichensatz von HTML ist immer ISO 10646 und UTF-8 kann alle Unicode-Zeichen darstellen).
- Problemlose Darstellung von Sonderzeichen verschiedener Sprachen nebeneinander. Verschiedensprachige Webseiten können durchgehend und einheitlich in UTF-8 geschrieben werden.
- Die Zeichen werden selbst auf einem chinesischen Browser korrekt angezeigt, sofern die verwendete Schrift diese Zeichen, also den Unicode-Zeichenvorrat vollständig oder weitgehend enthält.
- UTF-8 hat den Nachteil, dass ganz alte Browser mit UTF-8 nicht zurecht kommen. Alle aktuellen tun dies jedoch.
Auch wenn Sie keine mehrsprachige Website betreiben, ist die Verwendung von utf-8 also empfehlenswert. Es sind nur wenige Schritte notwendig um eine TYPO3-Installation auf utf-8 umzustellen:
- Tragen Sie im Install-Tool von TYPO3 unter forceCharset den Wert utf-8 ein.
- Im Setup des Haupttemplates folgendes ergänzen:
- ...
- page.config.metaCharset = utf-8
- page.config.additionalHeaders = Content-Type:text/html;charset=utf-8
- ...
Bestehende Website konvertieren (utf-8)
Wurde die TYPO3-Website bereits mit einem anderen Zeichensatz erstellt, können Sie auch nachträglich auf utf-8 umstellen. Dazu können Sie die Extension convert2utf8 verwenden.
Nach der Installation der Extension klicken Sie bitte mit der linken Maustaste auf die Home-Seite und wählen im Kontextmenü den Menüpunkt Convert to utf-8 aus. Mit Select all können Sie dann alle darunterliegenden Seiten konvertieren.
Möglicherweise ist aber trotz dieser Extension anschließend noch Handarbeit gefordert. So berichtete ein Anwender im Forum, daß beispielweise News-Teaser nicht automatisch konvertiert werden. Stellen Sie bestehende Webs also bitte nur dann um, wenn hierzu ein Grund vorliegt und kontrollieren Sie anschließend jede Seite auf mögliche Fehler.
In allen HTML-Vorlagen im Verzeichnis fileadmin/template/ befindet sich bis zur Version 4.4.0 leider ein Fehler, der verhindert dass eine Webseite mit utf-8 Kodierung validiert werden kann. Es liegt an einem HTML-Kommentar, der sich ziemlich am Ende der Dateien befindet. In allen Folgeversionen der TYPO3-Templates und auch im YAML-Paket selbst, ist dieser Fehler behoben.