Basiskennis informatica/Capaciteit
De hoeveelheid informatie die opgeslagen of verwerkt kan worden, wordt gemeten in bits, of in de daarvan afgeleide eenheid byte.
Bit
[bewerken]De bit is de kleinste eenheid van informatie, namelijk een symbool of signaal dat twee waarden kan aannemen: aan of uit, ja of nee, hoog of laag, geladen of niet-geladen. Het binaire talstelsel stelt deze waarden voor met 1 en 0. Het woord bit is een portmanteau (samentrekking) van de Engelse woorden binary en digit. Er zit ook een woordspeling in, want bit betekent ook beetje.
M.b.t. de toestand "aan" of "uit" kan de analogie met een lamp gebruikt worden. De toestand waarin een lamp zich kan bevinden kan met behulp van 1 bit uitgedrukt/opgeslagen worden. Logisch is bv. '0 = uit' en '1 = aan' (maar indien gewenst kan men het ook andersom gebruiken).
Toestand lamp: Lamp uit (0) Lamp aan (1)
Eén bit bevat de informatie van de twee hierboven weergegeven lamp toestanden.
Informatie in één bit:
Bitreeks
[bewerken]Bits worden uiteraard met elkaar gecombineerd tot grotere gehelen - bitreeksen genaamd - om zo meer informatie te kunnen bevatten. Bijvoorbeeld:
0101110101 --> 10 bits = 10 b 0101110101111011 --> 16 bits = 16 b
Bitruimte
[bewerken]Het aantal bits die beschikbaar zijn om iets op te slaan, te verzenden of te adresseren, de bitruimte, ligt vaak vast. Dit aantal legt dus een beperking op aan de lengte van de bitreeks en dus het aantal gegevens die men kan behandelen. Met 1 bit (.) heeft men slechts twee mogelijkheden, nl. 0 of 1. Met 2 bits (..) zijn de mogelijkheden 00, 01, 10 en 11 (aantal = # = 4). Met 3 bits (...) zijn de mogelijkheden 000, 001, 010, 011, 100, 101, 110, 111 (#=8).
Voor een bitruimte van 16 bits (................) is het heel veel werk om alle mogelijkheden te noteren. Een berekening voor het aantal is wel eenvoudig: voor de eerste positie zijn er 2 mogelijkheden, evenals voor de tweede en elke volgende positie. Het totaal aantal mogelijkheden verkrijgen we door het aantal mogelijkheden voor elke positie met elkaar te vermenigvuldigen. Het aantal mogelijkheden bij een bitruimte van 16 bits is dus gelijk aan:
- 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 = 216 = 65536.
De bitruimte bepaalt ook het grootst mogelijke getal dat je nog kan voorstellen: het maximum. Binair betekent dit dat op iedere bitpositie een 1 staat. Een bitruimte van 3 bits (...) betekent 111 als grootste binaire getal. Als je leert over talstelsels, dan zal je leren dat 111(2)=7(10). Zonder kennis van talstelsels kan je het ook berekenen. Enkele voorbeelden:
Bitruimte | 3 | 16 | 32 |
---|---|---|---|
Aantal mogelijkheden | 8=23 | 65 536=216 | 4 294 967 296=232 |
Grootste, decimale getal | 7=23-1 | 65 535=216-1 | 4 294 967 295=232-1 |
De term bitruimte is een algemene term, die van toepassing is op verschillende soorten data. Voor sommige specifieke data bestaat een eigen term voor bitruimte. Zo spreekt men bij kleuren over kleurendiepte of kleurdiepte en bij geheugenadressen over adresruimte.
Hieronder drie hypothetische voorbeelden met een verschil in bitruimte (en dus in het aantal adressen dat kan worden gevormd) en/of hoeveel bytes er per cel in het RAM-geheugen kan worden opgeslagen. We merken dat we extra capaciteit kunnen verkrijgen door een grotere bitruimte (per bit extra, dubbel zoveel capaciteit) en/of door meer bytes per cel te bewaren.
De gekozen bitruimte is al enkele keren in de IT-geschiedenis te weinig gebleken. Niet alleen bij de adresruimte van het RAM-geheugen (32 bits)[1], maar bv. ook bij IPv4 (32 bits) [2]. Bij een te kleine kleurendiepte kan er bv. colour banding optreden.
Millenniumbug of Y2K-bug
De millenniumbug was een probleem dat in 20e eeuwse computersystemen ontstond doordat bij het opslaan van de datum alleen de laatste twee cijfers van het jaar werden gebruikt. Zo werd 29 december 1977 bijvoorbeeld opgeslagen als 29-12-77. In de beginperiode van de computer werd dat gedaan om te besparen op de toen erg dure geheugenruimte.
De millenniumbug zou problemen opleveren tijdens de overgang naar het jaar 2000, doordat de representatie van 1 januari 2000 gelijk is aan die van 1 januari 1900: 01-01-00. Voorraadsystemen zouden denken dat een product met vervaldatum 01-01-00 al een eeuw oud was. Of iemand die dan geboren was, zou a.h.w. 100 jaar oud zijn en als pasgeborene al recht hebben op een pensioen.
Op 1 januari 2020 waren er opnieuw problemen, omdat sommige programmeurs de Y2K-bug oplosten door 00 niet te herkennen als 1900, maar als een nieuw jaar (2000) en dat ze na 99 (dus 1999) zouden doortellen tot 20 (dus 2020). Eind 1999 dachten ze dat alle oude systemen tegen 2020 wel vervangen zouden zijn.
We zijn er trouwens nog niet vanaf, want in 2038 kunnen er opnieuw problemen zijn. Unix telt nl. het aantal dagen vanaf 1 januari 1970. En bij de oude systemen zou op 19 januari 2038 de bitruimte te klein kunnen zijn...
(nl) Twintig jaar oude millenniumbug sloeg op 1 januari opnieuw toe. VRT (2020-01-08). (nl) Millenniumbug doet met 20 jaar vertraging dan toch computers crashen. tweakers.net (2020-01-09).
Oude gps-systemen kunnen verkeerde informatie weergeven
In het GPS-signaal zit de actuele week en de hoeveelheid seconden sinds het begin van die week. De ontvanger kan dit signaal weer vertalen in een formaat op basis van dagen, maanden en jaren. Het probleem is dat die weekinformatie wordt verstuurd in een binair getal van 10bit. Dat betekent dat er in totaal 1024 weken via het signaal verstuurd kunnen worden. Week 0 begon op 21 augustus in 1999, dus op 6 april 2019 zijn de 1024 weken voorbij en beginnen de satellieten weer vanaf '0' te tellen.
(nl) Oude gps-systemen kunnen vanaf volgende maand verkeerde informatie weergeven. tweakers.net (2019-03-05).
Byte
[bewerken]Een byte is het kleinste adresseerbare deel van het computergeheugen. Hiermee bedoelt men dat het niet mogelijk is om minder dan één byte uit het geheugen te lezen of ernaar te schrijven. In de meeste technologieën bestaat een byte uit 8 bits, wat je kan onthouden door de samentrekking van by eight.[3]
0101110101 --> 10 bits kunnen we niet opgeven als byte, want het is geen veelvoud van 8 0101110101111011 --> 16 bits = 16 b = 2 bytes = 2 B
Merk het verschil in notering tussen de kleine b voor bits en de grote B voor bytes !
Veelvouden van bytes
[bewerken]Net als in andere wetenschappelijke domeinen definieert men veelvouden voor de basiseenheden. Zo kennen we de kilometer als 1000 meter of de megawatt als 1.000.000 watt. Analoog definieert men veelvouden voor bits of bytes. Maar hier wordt het wat ingewikkelder.
Alhoewel het prefix kilo-
1000 betekent, verwijst de term kilobyte met als symbool kB naar ofwel 1024 (210) bytes ofwel 1000 (103) bytes, al naargelang de context. In dit geval zijn er "slechts" 24 bytes verschil, maar bij grotere waarden zoals terabyte (TB) wordt het verschil wel heel groot: 240 - 1012 = 99.511.627.776 bytes! Dit kan tot verwarring leiden.
Vanwege deze verwarring heeft het IEC in 2003 een nieuwe eenheid bedacht, nl. de kibibyte. Het binaire prefix kibi staat voor 1024 en dus is een kibibyte 1024 bytes. Het eenheidsymbool voor de kibibyte is KiB. Hiermee wordt het verschil tussen kibi (1024) en kilo (1000) duidelijk.
Veelvouden van bytes met SI-voorvoegsel met IEC-voorvoegsel (binair) afwijking
tussen SI
en binairsymbool naam voor-
voegselwaarde symbool naam voor-
voegselwaarde kB kilobyte kilo 10001 = 103 KiB kibibyte kibi 10241 =210 2,4% MB megabyte mega 10002 = 106 MiB mebibyte mebi 10242 =220 4,9% GB gigabyte giga 10003 = 109 GiB gibibyte gibi 10243 =230 7,4% TB terabyte tera 10004 = 1012 TiB tebibyte tebi 10244 =240 10,0% PB petabyte peta 10005 = 1015 PiB pebibyte pebi 10245 =250 12,6% EB exabyte exa 10006 = 1018 EiB exbibyte exbi 10246 =260 15,3% ZB zettabyte zetta 10007 = 1021 ZiB zebibyte zebi 10247 =270 18,1% YB yottabyte yotta 10008 = 1024 YiB yobibyte yobi 10248 =280 20,9%
Western Digital aangeklaagd om verschil GB en GiB
In de Verenigde Staten was Western Digital aangeklaagd wegens 'te kleine' harde schijven. Het probleem van de advocaten was dat WD adverteerde met gigabytes van 1.000.000.000 bytes, terwijl de meeste besturingssystemen de schijfgrootte in gigabytes van 1.073.741.824 bytes weergeven, zodat de bruikbare capaciteit bijna 7,4% kleiner lijkt. Strikt gezien had Western Digital gelijk, maar vele eindgebruikers dachten anders.
(nl) Western Digital aangeklaagd om verschil GB en GiB. tweakers.net (2006-03-23).
Heel wat programma's van Microsoft gebruiken de kilo als 1024, oa. Windows Verkenner, computerbeheer en de systeemmonitor. Daarentegen maken heel wat programma's onder GNOME (en daarmee ook Ubuntu) een duidelijk onderscheid tussen kibi (1024) en kilo (1000), oa. de bestandsbeheerder Nautilus, GParted (om partities aan te maken) en hun systeemmonitor. Het gebruik van kibi is dus nog verre van ingeburgerd en zo blijft de verwarring bestaan bij programma's, besturingssystemen, reclamefolders en hardwarespecificaties.
-
SI vs IEC
-
GParted
-
Gnome System Monitor
-
Bittornado
De verschillende eenheden kunnen natuurlijk eenvoudig in elkaar omgerekend worden. Enkele voorbeelden van omzettingen:
- Bij een pc kan er 1 byte per geheugencel van het intern geheugen worden aangesproken. Stel dat hij een 32-bit adresruimte (bitruimte) heeft. Wat is de maximum capaciteit die kan worden aangesproken?
- Het aantal mogelijke adressen is 232=4 294 967 296
- In één geheugencel zit 1 byte, dus het geheel is 4 294 967 296 * 1 = 4 294 967 296 B = 4 294 967 296 / 230 = 4 GiB[4]
- De 32-bit adresruimte bleek te weinig te zijn, daar men na een tijd meer dan 4 GiB wou kunnen aanspreken/adresseren. Er kwam een uitbreiding tot 64 bits. Wat is nu de maximumcapaciteit?
- Het aantal mogelijke adressen is 264=18 446 744 073 709 551 616. Merk op dat dit niet 2 maal zo veel mogelijke adressen toelaat t.o.v. de 32 bit adresruimte, maar wel 232 keer meer!
- In één geheugencel zit 1 byte, dus het geheel is 18 446 744 073 709 551 616 * 1 = 18 446 744 073 709 551 616 B = 18 446 744 073 709 551 616 / 240 = 16 777 216 TiB. Dat is 16 EiB (exbibyte)! Merk op dat dit theoretisch maximum beperkt wordt door de chipset, waardoor een bepaald moederbord bv. "slechts" 8 GiB aankan.
- De systeemmonitor onder Ubuntu geeft aan dat er 1,4 GiB in gebruik is, en de vraag is hoeveel GB dat is. Dan wordt de omzetting:
- De systeemmonitor onder Ubuntu geeft aan dat de downloadsnelheid 1,2 MiB/s is. De vraagt is hoeveel Mbps dat is, om zo te weten of het maximum uit de netwerkkaart gehaald wordt. Dan wordt de omzetting:
- ↑ Deze superuser.com-vraag legt het verschil uit tussen geheugen- en adresruimte door een vergelijking met auto's en parkeerplaatsen.
- ↑ Groter adresbereik bij IPv6
- ↑ Er bestaan echter systemen (bv. bitslicers en microcontrollers) met een byte bestaande uit 5, 7, 9 of 12 of zelfs 14 bits. Voor deze cursus wordt er uitgegaan van een byte bestaande uit 8 bits, het meest gebruikelijke.
- ↑ De 4 GiB is een theoretische grens. Het is mogelijk om met 32 bit adresruimte voorbij de 4 GiB grens te gaan, maar dit bleek een nachtmerrie te zijn om te implementeren. Getuige dit interview met Linus Torvalds, die mee ontwikkelt aan de Linux-kernel.