Ifølge International Telecommunication Union, i2016 havde internettet med en vis regelmæssighed tre og en halv milliard mennesker. De fleste af dem ikke engang tænke på, at eventuelle meddelelser sendt til dem via en pc eller mobile gadgets, såvel som tekster, der vises på skærmene af alle slags, i virkeligheden, er en kombination af 0 og 1. Dette kaldes den kodede repræsentation af informationen. Det giver og i høj grad letter gennemførelsen af dens opbevaring, behandling og transmission. I 1963 blev den amerikanske kodning ASCII udviklet, som er genstand for denne artikel.
Ud fra et synspunkt for enhver elektronisk databehandlingMaskinteksten er et sæt individuelle tegn. De omfatter ikke kun bogstaver, herunder store bogstaver, men også tegnsæt, tal. Derudover anvendes specielle symboler "=", "&", "(" og mellemrum.
Sættet af tegn, der udgør teksten,hedder alfabetet, og deres tal er kraften (betegnet som N). For at bestemme det skal du bruge udtrykket N = 2 ^ b, hvor b er antallet af bits eller informationsvægten af et bestemt symbol.
Det er bevist, at et alfabet med en kapacitet på 256 tegn giver dig mulighed for at repræsentere alle de nødvendige symboler.
Siden 256 er den 8. kraft af to, er vægten af hvert symbol 8 bits.
En enhed på 8 bit kaldes en 1 byte, så det er sædvanligt at sige, at den binære kode for ethvert tegn i den tekst, der er gemt på computeren, optager en byte af hukommelse.
Eventuelle tekster er indtastet i minde om en personligcomputer ved hjælp af taster, som blev skrevet tal, bogstaver, skilletegn og andre symboler. Til minde de sendes i binær kode, det vil sige, er hvert symbol knyttet til det velkendte decimal kode for en person fra 0 til 255, hvilket svarer til en binær kode - .. Fra 00000000 til 11111111.
Byte-byte tegnkodning tilladerProcessoren, der udfører tekstbehandlingen, får adgang til hvert symbol separat. Samtidig er 256 tegn nok til at repræsentere enhver tegninformation.
Denne forkortelse på engelsk står for amerikansk standardkode til informationsudveksling.
I begyndelsen af computerisering blev det indlysende, atDu kan komme med en lang række forskellige måder at kode information på. For at overføre oplysninger fra en computer til en anden var det imidlertid nødvendigt at udvikle en enkelt standard. Så i 1963 i USA var der et ASCII-kodningstabell. I det er ethvert symbol på computeralfabetet tildelt sit serienummer i den binære repræsentation. I første omgang blev ASCII-kodningen kun brugt i USA, og blev derefter den internationale standard for pc'en.
ASCII-koderne er opdelt i 2 dele. Den internationale standard er kun den første halvdel af denne tabel. Den indeholder symboler med ordinære tal fra 0 (kodet som 00000000) til 127 (kode 01111111).
Sekvensnummer N | ASCII-tekstkodning | symbol |
0 - 31 | 0000 0000 - 0001 1111 | Symboler med N fra 0 til 31 kaldes ledere. Deres funktion er at "guide" processen med at udstede tekst til en skærm eller en printerenhed, hvilket giver et lydsignal mv. |
32 - 127 | 0010 0000 - 0111 1111 | Symboler med N fra 32 til 127 (standarddelentabeller) - store og små bogstaver i det latinske alfabet, 10 cifre, tegnsætningstegn, samt forskellige parenteser, kommercielle og andre symboler. Symbolet 32 betegner et mellemrum. |
128 - 255 | 1000 0000 - 1111 1111 | Symboler med N fra 128 til 255 (alternativ deltabeller eller kode side) kan have forskellige varianter, der hver har sit eget nummer. Kodeside bruges til at angive de nationale alfabeter, som adskiller sig fra latin. Især er det med sin hjælp, at ASCII er kodet for russiske tegn. |
I kodningstabellen følger store og små bogstaver hinanden i alfabetisk rækkefølge, og tallene er i stigende rækkefølge. Dette princip er også bevaret for det russiske alfabet.
ASCII-kodningstabellen blev oprindeligt oprettettil modtagelse og transmission af oplysninger på en enhed, der ikke har været brugt i lang tid, som en teletype. I den henseende blev ikke-trykning, der blev anvendt som kommandoer til styring af denne enhed, inkluderet i tegnsættet. Lignende kommandoer blev brugt i sådanne promputer-messaging-metoder som Morse-kode osv.
Det mest almindelige "teletype" symbol er NUL (00, "zero"). Den bruges stadig i de fleste programmeringssprog, der betegner slutningen af karakteren.
Amerikansk standard kode er ikke kun nødvendigfor at indtaste tekstoplysninger fra tastaturet. Det bruges også i grafik. Specielt i ASCII Art Maker-programmet repræsenterer billeder af forskellige udvidelser en række ASCII-tegnsymboler.
Lignende produkter kommer i to typer: Udføre funktionen af grafiske redaktører ved at konvertere billeder til tekst og konvertere "tegninger" til ASCII-grafik. For eksempel er et velkendt smiley et levende eksempel på et kodningssymbol.
ASCII kan også bruges, når du opretter et HTML-dokument. I dette tilfælde kan du indtaste et bestemt sæt tegn, og når du ser siden, vises et symbol på skærmen, der svarer til denne kode.
ASCII er også nødvendigt for at oprette flersprogede websteder, da tegn, der ikke er en del af en specifik national tabel, erstattes af ASCII-koder.
For at kode tekstinformation i ASCII-kodning blev 7 bits oprindeligt brugt (den ene var tom), men i dag fungerer den som en 8-bit en.
Bogstaverne i kolonnerne øverst og nederst adskiller sig kun fra hinanden med en enkelt bit. Dette reducerer i høj grad kontrolens kompleksitet.
Om nødvendigt denne type tekstkodningOplysninger kan bruges i Microsofts tekstredigerere, f.eks. Notesblok og Office Word. Men når du skriver, vil det i dette tilfælde være umuligt at bruge nogle funktioner. For eksempel vil du ikke kunne foretage et valg med fed skrift, da ASCII-kodningen kun bevare betydningen af oplysningerne, ignorerer dets generelle udseende og form.
ISO har vedtaget ISO 8859 standarder. Denne gruppe definerer otte-bit kodninger for forskellige sproggrupper. Især ISO 8859-1 er Extended ASCII, som er en tabel for USA og landene i Vesteuropa. Og ISO 8859-5 er en tabel, der anvendes til cyrillisk, herunder russisk.
Af en række historiske årsager blev ISO 8859-5-standarden ikke brugt meget lang.
For det russiske sprog i øjeblikket er kodning virkelig brugt:
Den største fordel ved den første standard CP866var bevaring af pseudo-grafiske symboler i samme positioner som i Extended ASCII. Dette tillod at køre uændrede tekstprogrammer, udenlandsk produktion, som den berømte Norton Commander. I øjeblikket bruges CP866 til programmer udviklet under Windows, der arbejder i fuldskærmstekst eller i tekstvinduer, herunder FAR Manager.
Computertekster, skrevet i CP866-kodningen, har for nylig været sjældne, men den bruges til russiske filnavne i "Vindous".
I øjeblikket er den mest udbredtemodtaget denne særlige kodning. Unicode-koder er opdelt i regioner. Den første (fra U + 0000 til U + 007F) indeholder tegnene i ASCII-sætet med koder. Følg derefter områderne af tegn på forskellige nationale scripts, samt tegnsæt og tekniske symboler. Derudover er en del af Unicode-koderne forbeholdt, hvis der er behov for at medtage nye symboler i fremtiden.
Nu ved du det i ASCII-kodningen, hversymbolet er repræsenteret som en kombination af 8 nul og en. Layman, denne information kan synes unødvendigt og uinteressant, men ønsker du ikke at vide, hvad der foregår "i hjernen" i computeren?!
</ p>