Hvordan bruke Meta Charset-tagger for tegnkoding i HTML5

click fraud protection

Før introduksjonen av HTML5, for å sette tegnkodingen på et dokument med et element, krevde du å skrive den litt detaljerte linjen vist nedenfor. Dette er Meta Charset-elementene hvis du brukte HTML4 på websiden din:


Det som er viktig å legge merke til i denne koden er anførselstegnene du ser rundt innhold Egenskap: innhold ="tekst / html; charset = iso-8859-1". Som alle HTML-attributter, definerer disse anførselstegnene verdien av attributtet, noe som indikerer at hele strengen tekst / html; charset = iso-8959-1 er den innhold av dette elementet. Dette er riktig HTML, og det er slik denne strengen var ment å bli skrevet. Det er også uhåndterlig langt og stygt! Det er heller ikke noe du sannsynligvis vil huske fra toppen av hodet!

I de fleste tilfeller må webutviklere kopiere og lime inn denne koden fra ett nettsted i et nytt de utviklet, fordi det var mye å skrive dette fra bunnen av.

HTML5 kutter ut ekstra "ting"

HTML5 la ikke bare til noen nye elementer i språket, men det forenklet også mye av syntaksen til HTML, inkludert Meta Charset-elementet. Med HTML5 kan du legge til karakterkodingen din med den mye lettere å huske syntaksen for 

instagram viewer
META element som du ser nedenfor:


Sammenlign den forenklede syntaksen med det vi skrev i begynnelsen av denne artikkelen, den gamle syntaksen som ble brukt for HTML4, og du vil se hvor mye lettere det er å skrive og huske HTML5-versjonen. I stedet for å trenge å kopiere og lime inn dette fra et eksisterende nettsted i et nytt du jobbet med, er dette absolutt noe som du som en front-end webutvikler kan huske. Denne tidsbesparelsen er kanskje ikke mye, men når du vurderer de andre syntaksområdene som HTML5 forenklet, blir besparelsene til sammen!

Inkluder alltid tegnkodingen

Du bør alltid inkludere tegnkoding for websidene dine, selv om du ikke noen gang har tenkt å bruke noen spesielle karakterer. Hvis du ikke inkluderer tegnkoding, blir nettstedet ditt sårbart for et skriptangrep på tvers av nettsteder ved bruk av UTF-7.

I dette scenariet ser en angriper at nettstedet ditt ikke har definert tegnkoding, så det lurer nettleseren til å tro at tegnkodingen på siden er UTF-7. Deretter injiserer angriperen UTF-7-kodede skript på websiden, og nettstedet ditt blir hacket. Dette er problematisk for alle involverte, fra firmaet ditt til de besøkende. Den gode nyheten er at det er et enkelt problem å unngå - sørg for å legge til tegnkoding på alle websidene dine.

Hvor skal man legge til tegnkoding

Tegnkodingen for en webside skal være den første linjen i HTML-ene

element. Dette sikrer at nettleseren vet hva tegnkodingen er før den gjør noe annet på siden enn å bestemme doktypen og identifisere at det er en HTML-side. HTML-en din skal lese:




...

Bruke HTTP-hoder for ekstra sikkerhet

Du kan også spesifisere tegnkodingen i HTTP-overskriftene. Dette er enda sikrere enn å legge det til HTML-siden, men du må ha tilgang til serverkonfigurasjonene eller .htaccess filer, noe som betyr at du kanskje trenger å samarbeide med nettstedets vertsleverandør for å få denne typen tilgang eller få dem til å gjøre endringene for du. Tilgang er utfordringen her. Endringen i seg selv er enkel, så enhver hosting-leverandør bør kunne gjøre denne endringen for deg relativt enkelt.

Hvis du bruker Apache, kan du angi standard tegnsett for hele nettstedet ditt ved å legge til: AddDefaultCharset UTF-8 til roten din .htaccess fil. Apaches standard tegnsett er ISO-8859-1.

instagram story viewer