Meta Charset Tag a HTML5-ben

A karakterkódolás beállítása a HTML5-ben

A HTML5 bevezetése előtt a karakterkódolás beállítása egy dokumentumra egy elemre írva írja le az alább látható, némileg áttetsző sort. Ez a Meta Charset elem, ha HTML4-t használ a weboldalon:

Fontos megjegyezni ebben a kódban a tartalom attribútum körül megjelenő idézőjeleket: content = " text / html; charset = iso-8859-1 " . Mint minden HTML attribútum, ezek az idézőjelek definiálják az attribútum értékét, jelezve, hogy a teljes szövegszöveg / html; charset = iso-8959-1 az elem tartalma.Ez a megfelelő HTML, és ezt a sztringet kellett írni. Ez is nehézkes hosszú és csúnya! Nem is olyan dolog, amire valószínűleg emlékszel a fejedről! A legtöbb esetben a webes fejlesztőknek át kellene másolniuk és beilleszteniük ezt a kódot az egyik webhelyről az újakra, amelyeket azért fejlesztettek ki, mert a nulláról történő írást sokat kértek.

A HTML5 kivágja az Extra & # 34; cuccokat & # 34;

A HTML5 nemcsak számos új elemet adott a nyelvhez, hanem nagymértékben leegyszerűsítette a HTML szintaxisát is, beleértve a Meta Charset elemet is. A HTML5 segítségével hozzáadhatja a karakterkódolását a META elemek szintaxisának sokkal könnyebb megjegyezhetőségéhez az alábbiakban láthatja:

Hasonlítsa össze ezt az egyszerűsített szintaxist a cikk elején írt szöveggel, a régi HTML4 formátumú szintaxissal, és látni fogja, hogy mennyire könnyebben írható és emlékszik a HTML5 verzió valóban. Ahelyett, hogy át szeretné másolni és beilleszteni ezt a meglévő webhelyről olyan újakra, amelyeken dolgozni kezdtek, ez teljesen olyan, amire, mint egy front-end webfejlesztő, emlékszel. Ez az idő megtakarítás sok esetben nem sok, de ha figyelembe vesszük a HTML5 egyszerűbb szintaktikai területeit, a megtakarítások összeadódnak!

Mindig vegye fel a karakterkódolást

Mindig tartalmaznia kell a karakterkódolást weboldalaid számára, még akkor is, ha soha nem kívánsz speciális karaktereket használni . Ha nem tartalmaz karakterkódolást, a webhely sebezhetővé válik az UTF-7 használatával létrejövő kereszttelepítési parancsfájlokkal.

Ebben a forgatókönyvben az anattacker úgy látja, hogy webhelyén nincs karakterkódolás, ezért a böngésző úgy gondolja, hogy az oldal karakterkódolása ténylegesen UTF-7. Ezután a támadó beadja az UTF-7 kódolt parancsfájlokat a weboldalba, és webhelyét feltörik. Ez nyilvánvalóan problematikus mindazok számára, akik érintettek, a cégtől a látogatókig. A jó hír az, hogy ez egy egyszerű probléma, hogy elkerüljék - csak győződjön meg róla, hogy hozzá karakter kódolást minden weboldalán.

Hol kell hozzáadni a karakterkódolást?

A weboldalnak egy karakterkódolásnak kell lennie a HTML elemének első sorában. Ez biztosítja, hogy a böngésző tudja, mi a karakterkódolás, mielőtt bármi más az oldalon, nem pedig meghatározza a dokktípust, és azonosítja, hogy ez egy HTML oldal. A HTML-nek olvashatónak kell lennie:

...

A HTTP-fejlécek használata extra biztonsághoz

A karakterkódolást a HTTP fejlécekben is megadhatja. Ez még biztonságosabb, mint a HTML-oldalhoz való hozzáadás, de a kiszolgálókonfigurációkhoz vagy .htaccess fájlokhoz való hozzáféréshez nem szükséges volna, ami azt jelenti, hogy a webhelyének tárhely szolgáltatójával együtt kell dolgoznia ahhoz, hogy ilyen hozzáférést szerezzen a változások az Ön számára. A hozzáférés valóban a kihívás itt. A változás maga egyszerű, ezért minden tárhely szolgáltatónak képesnek kell lennie arra, hogy viszonylag könnyedén elvégezze ezt a változást.

Ha az Apát használod, megadhatod az egész webhely alapértelmezett karakterkészletét az AddDefaultCharset UTF-8 hozzáadásával a root.htaccess fájlhoz. Az Apache alapértelmezett karakterkészlete az ISO-8859-1 .