Basiskennis informatica/Codering/Unicode: verschil tussen versies

Uit Wikibooks
Mattias.Campe (overleg | bijdragen)
Nieuwe pagina aangemaakt met '=== Unicode === Voor West-Europese talen was de ASCII-codering werkbaar, maar niet in een internationale context. Om dit op te lossen werd Unicode ontwikkeld: een i...'
 
Mattias.Campe (overleg | bijdragen)
k Mattias.Campe heeft pagina Basiskennis informatica/Unicode naar Basiskennis informatica/Codering/Unicode hernoemd: Onder verkeerde onderdeel geplaatst
(geen verschil)

Versie van 12 apr 2012 20:53

Unicode

Voor West-Europese talen was de ASCII-codering werkbaar, maar niet in een internationale context. Om dit op te lossen werd Unicode ontwikkeld: een internationale standaard voor de binaire codering van tekens en symbolen ("karakters") van alle geschreven talen. De standaard wordt onderhouden door het Unicode Consortium. De standaard bevat momenteel ruim 100.000 gestandaardiseerde tekens en ongeveer 900.000 voor toekomstig gebruik gereserveerde codes.

De Unicodestandaard kent aan elk teken een volgnummer toe, dat geschreven wordt als U+xxxx, waarin xxxx de 4- tot 6-cijferige hexadecimale waarde van het volgnummer is. Daarnaast biedt Unicode een aantal mogelijke coderingen hiervoor, dat wil zeggen hoe deze waarden gerepresenteerd kunnen worden:

  • UTF-32: voor de codering worden 32 bits gebruikt (dit zijn dus 2^32 = +- 4 miljard mogelijkheden). Een nadeel is dat ASCII-bestanden in Unicode daardoor 4 keer zo groot worden.
  • UTF-16: Tekens worden opgeslagen als een of twee 16-bits getallen, afhankelijk van de hun toegekende waarde.
  • UTF-8]: Tekens worden opgeslagen als een tot vier 8-bits getallen, afhankelijk van de hun toegekende waarde. In deze codering blijven ASCII-teksten onveranderd.
Informatie afkomstig van https://nl.wikibooks.org Wikibooks NL.
Wikibooks NL is onderdeel van de wikimediafoundation.