Według Międzynarodowego Związku Telekomunikacyjnego, wW 2016 roku Internet z pewną regularnością cieszył się trzy i pół miliarda ludzi. Większość z nich nawet nie myśleć o tym, że wszelkie wiadomości wysyłane do nich za pośrednictwem komputera lub gadżetów mobilnych, a także teksty, które są wyświetlane na monitorach wszystkich rodzajów, w rzeczywistości jest połączeniem 0 i 1. To się nazywa zakodowana reprezentacja informacji. Zapewnia i znacznie ułatwia wdrożenie jej przechowywania, przetwarzania i przesyłania. W 1963 roku opracowano amerykańskie kodowanie ASCII, które jest przedmiotem tego artykułu.
Z punktu widzenia elektronicznego przetwarzania danychTekst maszyny jest zbiorem pojedynczych znaków. Obejmują one nie tylko litery, w tym wielkie litery, ale także znaki interpunkcyjne, cyfry. Ponadto używane są specjalne symbole "=", "&", "(" i spacje.
Zestaw znaków, które składają się na tekst,nazywany jest alfabetem, a ich liczba to moc (oznaczona jako N). Aby to ustalić, użyj wyrażenia N = 2 ^ b, gdzie b to liczba bitów lub waga informacji określonego symbolu.
Udowodniono, że alfabet o pojemności 256 znaków pozwala przedstawić wszystkie niezbędne symbole.
Ponieważ 256 to ósma potęga dwóch, waga każdego symbolu wynosi 8 bitów.
Jednostka składająca się z 8 bitów nazywa się 1 bajtem, więc zwyczajowo mówi się, że kod binarny dowolnego znaku w tekście przechowywanym na komputerze zajmuje jeden bajt pamięci.
Wszelkie teksty są wprowadzane do pamięci osobistejkomputer za pomocą klawiszy klawiatury, na których zapisane są cyfry, litery, znaki interpunkcyjne i inne symbole. W pamięci RAM są one przesyłane w postaci kodu binarnego, tj. Każdy znak jest dopasowywany do zwyczajowego ludzkiego kodu dziesiętnego, od 0 do 255, co odpowiada kodowi binarnemu - od 00000000 do 11111111.
Kodowanie znaków bajtowych pozwalaprocesor wykonujący przetwarzanie tekstu, dostęp do każdego symbolu oddzielnie. Jednocześnie 256 znaków wystarcza, aby reprezentować dowolne informacje o postaci.
Skrót ten w języku angielskim oznacza amerykański standardowy kod wymiany informacji.
Na początku komputeryzacji stało się to oczywistemożesz wymyślić wiele różnych sposobów kodowania informacji. Aby jednak przesłać informacje z jednego komputera na drugi, konieczne było opracowanie jednego standardu. Tak więc w 1963 roku w USA istniał stół kodowania ASCII. W nim każdy symbol alfabetu komputerowego jest przypisany jego numer seryjny w reprezentacji binarnej. Początkowo kodowanie ASCII było używane tylko w Stanach Zjednoczonych, a następnie stało się międzynarodowym standardem na PC.
Kody ASCII są podzielone na 2 części. Międzynarodowy standard to tylko pierwsza połowa tej tabeli. Obejmuje symbole z numerami porządkowymi od 0 (zakodowane jako 00000000) do 127 (kod 01111111).
Numer kolejny N | Kodowanie tekstu ASCII | Symbol |
0 - 31 | 0000 0000 - 0001 1111 | Symbole z N od 0 do 31 nazywane są menedżerami. Ich zadaniem jest "kierowanie" procesem wyprowadzania tekstu na monitor lub urządzenie drukujące, dając sygnał dźwiękowy itp. |
32 - 127 | 0010 0000 - 0111 1111 | Symbole z N od 32 do 127 (część standardowatabele) - wielkie i małe litery alfabetu łacińskiego, 10 cyfr, znaków interpunkcyjnych, a także różne nawiasy, symbole handlowe i inne. Symbol 32 oznacza spację. |
128 - 255 | 1000 0000 - 1111 1111 | Symbole z N od 128 do 255 (część alternatywnatabele lub strona kodowa) mogą mieć różne warianty, z których każdy ma swój własny numer. Strona kodowa służy do określenia narodowych alfabetów, które różnią się od łaciny. W szczególności z jego pomocą kodowanie ASCII dla rosyjskich znaków. |
W tabeli kodowania wielkie i małe litery podążają za sobą w kolejności alfabetycznej, a liczby są w porządku rosnącym. Ta zasada jest również zachowana dla alfabetu rosyjskiego.
Tablica kodowania ASCII została pierwotnie utworzonado odbierania i przesyłania informacji na urządzeniu, które nie było używane przez długi czas, jak na przykład teletype. W związku z tym nie-drukowanie, używane jako polecenia do kontrolowania tego urządzenia, było zawarte w zestawie znaków. Podobne polecenia zostały użyte w takich metodach komunikacji przedkomputerowej, jak kod Morse'a itp.
Najczęstszym symbolem "teletype" jest NUL (00, "zero"). Nadal jest używany w większości języków programowania, oznaczając znak końca wiersza.
Amerykański standardowy kod jest potrzebny nie tylkodo wprowadzania informacji tekstowych z klawiatury. Jest również stosowany w grafice. W szczególności w programie ASCII Art Maker obrazy różnych rozszerzeń reprezentują zakres symboli znaków ASCII.
Podobne produkty występują w dwóch rodzajach: Wykonywanie funkcji edytorów graficznych poprzez konwersję obrazów na tekst i przekształcanie "rysunków" w grafikę ASCII. Na przykład dobrze znana buźka jest żywym przykładem symbolu kodowania.
ASCII może być również używany podczas tworzenia dokumentu HTML. W takim przypadku można wprowadzić określony zestaw znaków, a podczas przeglądania strony na ekranie pojawia się symbol odpowiadający temu kodowi.
ASCII jest również wymagany do tworzenia witryn wielojęzycznych, ponieważ znaki, które nie są częścią konkretnej tabeli narodowej, są zastępowane kodami ASCII.
Aby zakodować informacje tekstowe w kodowaniu ASCII, początkowo użyto 7 bitów (jeden był pusty), ale dziś działa jako 8-bitowy.
Litery znajdujące się w kolumnach u góry iu dołu różnią się od siebie tylko pojedynczym bitem. To znacznie zmniejsza złożoność weryfikacji.
Jeśli to konieczne, ten typ kodowania tekstuinformacje mogą być używane w edytorach tekstu firmy Microsoft, takich jak Notatnik i Office Word. Jednak przy pisaniu w tym przypadku niemożliwe będzie użycie niektórych funkcji. Na przykład zaznaczenie pogrubioną czcionką nie będzie możliwe, ponieważ kodowanie ASCII zachowuje tylko znaczenie informacji, ignorując jej ogólny wygląd i formę.
ISO przyjęło normy ISO 8859. Ta grupa definiuje ośmiobitowe kodowania dla różnych grup językowych. W szczególności ISO 8859-1 to Rozszerzony ASCII, który jest tabelą dla Stanów Zjednoczonych i krajów Europy Zachodniej. I ISO 8859-5 to tabela używana dla cyrylicy, w tym rosyjskiej.
Z kilku historycznych powodów norma ISO 8859-5 nie była używana bardzo długo.
W przypadku języka rosyjskiego kodowanie jest obecnie stosowane:
Główną zaletą pierwszego standardowego CP866było zachowanie symboli pseudo graficznych na tych samych pozycjach, co w rozszerzonym ASCII. Pozwoliło to na prowadzenie niezmienionych programów tekstowych, produkcji zagranicznej, takich jak słynny Norton Commander. W tej chwili CP866 jest używany do programów opracowanych pod Windows, które działają w trybie pełnoekranowym lub w oknach tekstowych, w tym FAR Manager.
Teksty komputerowe, zapisane w kodowaniu CP866, były ostatnio rzadkie, ale są używane w rosyjskich nazwach plików w "Vindous".
W tej chwili najbardziej rozpowszechnionyotrzymał to szczególne kodowanie. Kody Unicode są podzielone na regiony. Pierwsza (od U + 0000 do U + 007F) obejmuje znaki zestawu ASCII z kodami. Następnie postępuj zgodnie z obszarami znaków różnych krajowych skryptów, a także znaków interpunkcyjnych i symboli technicznych. Ponadto część kodów Unicode jest zarezerwowana na wypadek, gdyby w przyszłości pojawiły się nowe symbole.
Teraz wiesz, że w kodowaniu ASCII, każdysymbol jest reprezentowany jako kombinacja 8 zer i jedynek. Dla osób niebędących specjalistami ta informacja może wydawać się niepotrzebna i nieinteresująca, ale czy nie chcesz wiedzieć, co dzieje się w "mózgu" komputera?
</ p>