ASCII (amerykański standardowy kod wymiany informacji) - podstawowe kodowanie tekstu dla alfabetu łacińskiego

Według Międzynarodowego Związku Telekomunikacyjnego, wW 2016 roku Internet z pewną regularnością cieszył się trzy i pół miliarda ludzi. Większość z nich nawet nie myśleć o tym, że wszelkie wiadomości wysyłane do nich za pośrednictwem komputera lub gadżetów mobilnych, a także teksty, które są wyświetlane na monitorach wszystkich rodzajów, w rzeczywistości jest połączeniem 0 i 1. To się nazywa zakodowana reprezentacja informacji. Zapewnia i znacznie ułatwia wdrożenie jej przechowywania, przetwarzania i przesyłania. W 1963 roku opracowano amerykańskie kodowanie ASCII, które jest przedmiotem tego artykułu.

Prezentacja informacji w komputerze

Z punktu widzenia elektronicznego przetwarzania danychTekst maszyny jest zbiorem pojedynczych znaków. Obejmują one nie tylko litery, w tym wielkie litery, ale także znaki interpunkcyjne, cyfry. Ponadto używane są specjalne symbole "=", "&", "(" i spacje.

Zestaw znaków, które składają się na tekst,nazywany jest alfabetem, a ich liczba to moc (oznaczona jako N). Aby to ustalić, użyj wyrażenia N = 2 ^ b, gdzie b to liczba bitów lub waga informacji określonego symbolu.

Udowodniono, że alfabet o pojemności 256 znaków pozwala przedstawić wszystkie niezbędne symbole.

Ponieważ 256 to ósma potęga dwóch, waga każdego symbolu wynosi 8 bitów.

Jednostka składająca się z 8 bitów nazywa się 1 bajtem, więc zwyczajowo mówi się, że kod binarny dowolnego znaku w tekście przechowywanym na komputerze zajmuje jeden bajt pamięci.

Jak wykonywane jest kodowanie

Wszelkie teksty są wprowadzane do pamięci osobistejkomputer za pomocą klawiszy klawiatury, na których zapisane są cyfry, litery, znaki interpunkcyjne i inne symbole. W pamięci RAM są one przesyłane w postaci kodu binarnego, tj. Każdy znak jest dopasowywany do zwyczajowego ludzkiego kodu dziesiętnego, od 0 do 255, co odpowiada kodowi binarnemu - od 00000000 do 11111111.

Kodowanie znaków bajtowych pozwalaprocesor wykonujący przetwarzanie tekstu, dostęp do każdego symbolu oddzielnie. Jednocześnie 256 znaków wystarcza, aby reprezentować dowolne informacje o postaci.

Kodowanie znaków ASCII

Skrót ten w języku angielskim oznacza amerykański standardowy kod wymiany informacji.

Na początku komputeryzacji stało się to oczywistemożesz wymyślić wiele różnych sposobów kodowania informacji. Aby jednak przesłać informacje z jednego komputera na drugi, konieczne było opracowanie jednego standardu. Tak więc w 1963 roku w USA istniał stół kodowania ASCII. W nim każdy symbol alfabetu komputerowego jest przypisany jego numer seryjny w reprezentacji binarnej. Początkowo kodowanie ASCII było używane tylko w Stanach Zjednoczonych, a następnie stało się międzynarodowym standardem na PC.

Zawartość tabeli

Kody ASCII są podzielone na 2 części. Międzynarodowy standard to tylko pierwsza połowa tej tabeli. Obejmuje symbole z numerami porządkowymi od 0 (zakodowane jako 00000000) do 127 (kod 01111111).

Numer kolejny N	Kodowanie tekstu ASCII	Symbol
0 - 31	0000 0000 - 0001 1111	Symbole z N od 0 do 31 nazywane są menedżerami. Ich zadaniem jest "kierowanie" procesem wyprowadzania tekstu na monitor lub urządzenie drukujące, dając sygnał dźwiękowy itp.
32 - 127	0010 0000 - 0111 1111	Symbole z N od 32 do 127 (część standardowatabele) - wielkie i małe litery alfabetu łacińskiego, 10 cyfr, znaków interpunkcyjnych, a także różne nawiasy, symbole handlowe i inne. Symbol 32 oznacza spację.
128 - 255	1000 0000 - 1111 1111	Symbole z N od 128 do 255 (część alternatywnatabele lub strona kodowa) mogą mieć różne warianty, z których każdy ma swój własny numer. Strona kodowa służy do określenia narodowych alfabetów, które różnią się od łaciny. W szczególności z jego pomocą kodowanie ASCII dla rosyjskich znaków.

W tabeli kodowania wielkie i małe litery podążają za sobą w kolejności alfabetycznej, a liczby są w porządku rosnącym. Ta zasada jest również zachowana dla alfabetu rosyjskiego.

Kontroluj postacie

Tablica kodowania ASCII została pierwotnie utworzonado odbierania i przesyłania informacji na urządzeniu, które nie było używane przez długi czas, jak na przykład teletype. W związku z tym nie-drukowanie, używane jako polecenia do kontrolowania tego urządzenia, było zawarte w zestawie znaków. Podobne polecenia zostały użyte w takich metodach komunikacji przedkomputerowej, jak kod Morse'a itp.

Najczęstszym symbolem "teletype" jest NUL (00, "zero"). Nadal jest używany w większości języków programowania, oznaczając znak końca wiersza.

Gdzie jest używane kodowanie ASCII

Amerykański standardowy kod jest potrzebny nie tylkodo wprowadzania informacji tekstowych z klawiatury. Jest również stosowany w grafice. W szczególności w programie ASCII Art Maker obrazy różnych rozszerzeń reprezentują zakres symboli znaków ASCII.

Podobne produkty występują w dwóch rodzajach: Wykonywanie funkcji edytorów graficznych poprzez konwersję obrazów na tekst i przekształcanie "rysunków" w grafikę ASCII. Na przykład dobrze znana buźka jest żywym przykładem symbolu kodowania.

ASCII może być również używany podczas tworzenia dokumentu HTML. W takim przypadku można wprowadzić określony zestaw znaków, a podczas przeglądania strony na ekranie pojawia się symbol odpowiadający temu kodowi.

ASCII jest również wymagany do tworzenia witryn wielojęzycznych, ponieważ znaki, które nie są częścią konkretnej tabeli narodowej, są zastępowane kodami ASCII.

do kodowania informacji tekstowych w kodowaniu ASCII

Niektóre funkcje

Aby zakodować informacje tekstowe w kodowaniu ASCII, początkowo użyto 7 bitów (jeden był pusty), ale dziś działa jako 8-bitowy.

Litery znajdujące się w kolumnach u góry iu dołu różnią się od siebie tylko pojedynczym bitem. To znacznie zmniejsza złożoność weryfikacji.

Używanie ASCII w pakiecie Microsoft Office

Jeśli to konieczne, ten typ kodowania tekstuinformacje mogą być używane w edytorach tekstu firmy Microsoft, takich jak Notatnik i Office Word. Jednak przy pisaniu w tym przypadku niemożliwe będzie użycie niektórych funkcji. Na przykład zaznaczenie pogrubioną czcionką nie będzie możliwe, ponieważ kodowanie ASCII zachowuje tylko znaczenie informacji, ignorując jej ogólny wygląd i formę.

Standaryzacja

ISO przyjęło normy ISO 8859. Ta grupa definiuje ośmiobitowe kodowania dla różnych grup językowych. W szczególności ISO 8859-1 to Rozszerzony ASCII, który jest tabelą dla Stanów Zjednoczonych i krajów Europy Zachodniej. I ISO 8859-5 to tabela używana dla cyrylicy, w tym rosyjskiej.

Z kilku historycznych powodów norma ISO 8859-5 nie była używana bardzo długo.

W przypadku języka rosyjskiego kodowanie jest obecnie stosowane:

CP866 (Code Page 866) lub DOS, który jest często nazywany alternatywnym kodowaniem GOST. Używano go aktywnie do połowy lat 90. ubiegłego wieku. W tej chwili prawie nie używane.
KOI-8. Kodowanie zostało opracowane w latach 1970-80, orazJest to standard wiadomości e-mail w RuNet. Jest szeroko stosowany w systemie operacyjnym rodziny Unix, w tym w systemie Linux. "Rosyjska" wersja KOI-8 nosi nazwę KOI-8R. Ponadto istnieją wersje dla innych języków cyrylicą, na przykład ukraiński.
Kod strony 1251 (CP 1251, Windows - 1251). Opracowany przez firmę Microsoft Corporation w celu zapewnienia obsługi języka rosyjskiego w środowisku Windows.

Główną zaletą pierwszego standardowego CP866było zachowanie symboli pseudo graficznych na tych samych pozycjach, co w rozszerzonym ASCII. Pozwoliło to na prowadzenie niezmienionych programów tekstowych, produkcji zagranicznej, takich jak słynny Norton Commander. W tej chwili CP866 jest używany do programów opracowanych pod Windows, które działają w trybie pełnoekranowym lub w oknach tekstowych, w tym FAR Manager.

Teksty komputerowe, zapisane w kodowaniu CP866, były ostatnio rzadkie, ale są używane w rosyjskich nazwach plików w "Vindous".

"Unicode"

W tej chwili najbardziej rozpowszechnionyotrzymał to szczególne kodowanie. Kody Unicode są podzielone na regiony. Pierwsza (od U + 0000 do U + 007F) obejmuje znaki zestawu ASCII z kodami. Następnie postępuj zgodnie z obszarami znaków różnych krajowych skryptów, a także znaków interpunkcyjnych i symboli technicznych. Ponadto część kodów Unicode jest zarezerwowana na wypadek, gdyby w przyszłości pojawiły się nowe symbole.

Teraz wiesz, że w kodowaniu ASCII, każdysymbol jest reprezentowany jako kombinacja 8 zer i jedynek. Dla osób niebędących specjalistami ta informacja może wydawać się niepotrzebna i nieinteresująca, ale czy nie chcesz wiedzieć, co dzieje się w "mózgu" komputera?

</ p>

Ocena: