Vor der Einführung von HTML5 müssen Sie die Zeichencodierung für ein Dokument mit einem Element festlegen, um die etwas ausführliche Zeile zu schreiben, die unten angezeigt wird. Dies sind die Meta-Zeichensatz-Elemente, wenn Sie HTML4 in Ihrer Webseite verwenden:
Was in diesem Kodex wichtig ist, sind die Anführungszeichen, die Sie in der Nähe des anzeigen Inhalt Attribut: Inhalt = ' Text / HTML; Zeichensatz = ISO-8859-1 ' . Wie alle HTML-Attribute definieren diese Anführungszeichen den Wert des Attributs, der die gesamte Zeichenfolge angibt Text / HTML; Zeichensatz = ISO-8959-1 ist der Inhalt dieses Elements. Dies ist korrektes HTML und so sollte dieser String geschrieben werden. Es ist auch lang und hässlich unhandlich! Es ist auch nicht etwas, an das Sie sich wahrscheinlich aus dem Kopf erinnern würden! In den meisten Fällen müssten Webentwickler diesen Code von einer Site in eine neue kopieren und einfügen, da sie von Grund auf neu schreiben mussten.
HTML5 schneidet das zusätzliche "Zeug" aus
HTML5 hat der Sprache nicht nur eine Reihe neuer Elemente hinzugefügt, sondern auch die Syntax von HTML stark vereinfacht, einschließlich des Meta Charset-Elements. Mit HTML5 können Sie Ihre Zeichencodierung mit der viel einfacher zu merkenden Syntax für das HTML-Element hinzufügenMETA Element, das Sie unten sehen:
Vergleichen Sie diese vereinfachte Syntax mit dem, was wir zu Beginn dieses Artikels geschrieben haben, der alten für HTML4 verwendeten Syntax. Sie werden sehen, wie viel einfacher die HTML5-Version zu schreiben ist. Anstatt dies von einer vorhandenen Site in eine neue Website kopieren und einfügen zu müssen, ist dies absolut etwas, an das Sie sich als Front-End-Webentwickler erinnern könnten. Diese Zeitersparnis ist nicht viel, aber wenn Sie die anderen Syntaxbereiche betrachten, die durch HTML5 vereinfacht wurden, summieren sich die Einsparungen!
Schließen Sie immer die Zeichenkodierung ein
Sie sollten immer eine Zeichencodierung für Ihre Webseiten angeben, auch wenn Sie niemals beabsichtigen, Sonderzeichen zu verwenden. Wenn Sie keine Zeichenkodierung verwenden, wird Ihre Site für einen Cross-Site-Scripting-Angriff mit UTF-7 anfällig.
In diesem Szenario stellt ein Angreifer fest, dass für Ihre Site keine Zeichenkodierung definiert ist. Der Browser wird also darauf hingewiesen, dass die Zeichenkodierung der Seite tatsächlich UTF-7 ist. Als nächstes fügt der Angreifer UTF-7-codierte Skripts in die Webseite ein, und Ihre Website wird gehackt. Dies ist offensichtlich für alle Beteiligten problematisch, von Ihrem Unternehmen bis zu Ihren Besuchern. Die gute Nachricht ist, dass es ein einfaches Problem ist, das Sie vermeiden sollten. Stellen Sie einfach sicher, dass Sie allen Webseiten eine Zeichenkodierung hinzufügen.
Wo kann man die Zeichenkodierung hinzufügen?
Die Zeichencodierung für eine Webseite sollte die erste Zeile Ihres HTML-Codes sein
Dies stellt sicher, dass der Browser die Zeichencodierung kennt, bevor er auf der Seite etwas anderes tut, als den Doctype zu bestimmen und festzustellen, dass es sich um eine HTML-Seite handelt. Dein HTML sollte lesen:…
HTTP-Header für zusätzliche Sicherheit verwenden
Sie können die Zeichenkodierung auch in den HTTP-Headern angeben. Dies ist sogar sicherer als das Hinzufügen zur HTML-Seite. Sie benötigen jedoch Zugriff auf die Serverkonfigurationen oder .htaccess-Dateien. Dies bedeutet, dass Sie möglicherweise mit dem Hosting-Provider Ihrer Website zusammenarbeiten müssen, um diese Art von Zugriff zu erhalten oder sie erstellen zu lassen die Änderungen für Sie. Der Zugang ist hier wirklich die Herausforderung. Die Änderung selbst ist einfach, daher sollte jeder Hostinganbieter diese Änderung relativ einfach vornehmen können.
Wenn Sie mit Apache arbeiten, können Sie den Standardzeichensatz für Ihre gesamte Site festlegen, indem Sie Folgendes hinzufügen: AddDefaultCharset UTF-8 zu deiner Wurzel .zugang Datei. Der Standardzeichensatz von Apache ist ISO-8859-1.




