Представяне на текстова информация в компютъра

Натискането на каквито и да било буквено-цифрови клавиши на клавиатурата, причинява, че сигналът се изпраща до компютъра като двоично число, представляващо една от кодовата книга ценности.







Код маса - това е вътрешен представяне на символи в компютъра.

Като стандарт, дълго време се използва за маса \ (ASCII \) (\ (A \) Merican \ (S \) tandard \ (С \) ода за \ (I \) nformational \ (I \) nterchange - американски стандарт код за обмен на информация ).

За да съхраните двоичен един символ разпределени \ (1 \) Байт \ (= \) \ (8 \) бита. Като се има предвид, че всеки бит е \ (1 \) или \ (0 \), броят на възможните комбинации от нули и единици е 2, 8 и + = 256.

Така че, с помощта на \ (1 \) байта могат да бъдат получени \ (256 \) различни комбинации от двоичен код и да ги гледате с помощта на \ (256 \) на различни герои.

Тези кодове съставляват маса \ (ASCII \).

За краткост и лекота на тези кодове характер в таблицата с помощта на система за шестнадесетичен номерация, състояща се от \ (16 \) символи - \ (10 ​​\) цифри и \ (6 \) латински букви: \ (A \) \ (B \ ) \ (С \) \ (Г \) \ (Е \) \ (F \). Когато кодираща първи характер е написан фигура колона и след това редове са разположени в пресечната точка на даден символ.

Какво е кодовата таблица

Например, латинска буква \ (S \) в таблица \ (ASCII \), представена в шестнадесетичен - \ (53 \). Чрез натискане на буквата \ (S \) се записва в паметта на компютъра код \ на (01010011 \), което представлява двоичен еквивалент шестнадесетичен номер \ (53 \). Този код може да бъде получена чрез замяна на всеки шестнадесетични цифри от двоичната му представяне. В този случай, броят \ (5 \) се заменя със код \ (0101 \) и номер 3 - код \ (0011 \). В произтичащи буквите \ (S \) на екрана, компютърът изпълнява декодиране: въз основа на двоичен образ на героя е изграден.

Всеки символ в таблица \ (ASCII \) е кодиран с помощта на \ (8 \) бита или \ (2 \) шестнадесетична цифри.

Standard \ (в ASCII \) кодира първия \ (128 \) героите от \ (0 \) на \ (127 \): числа, букви от латинската азбука, героите контрол. Горната таблица показва символите кодиране в шестнадесетичен формат.







Първият \ (32 \) символи са контрол и е предназначен предимно за предаване на управляващите команди. Тяхната функция може да варира в зависимост от софтуера и хардуера. През втората половина на кодовата таблица (от \ (128 \) на \ (255 \)) американски стандарт не е определена и са предназначени за герои на националните азбуки, pseudographic и някои математически символи. Различни изпълнения на втората половина на кодова книга могат да бъдат използвани в различни страни.

Числата са кодирани от стандартната \ (ASCII \) в два случая: когато вход-изход, а когато те се появяват в текста. Ако броят на участващите в изчисленията, а след тяхното преобразуване се извършва в двоичен код в съответствие с правилата (вж. Тук).

За сравнение, помислете за броя на \ (45 \) за двете кодиране опции.


Когато се използва в текста на този брой ще изисква за представянето му \ (2) \ байта, като всяка цифра е представена от кода в съответствие с маса \ (ASCII \) на. код Системата за шестнадесетичен ще изглежда \ (3435 \) в двоична система - \ (00110100 00110101 \).

Когато се използва при изчисляването на този кодов номер се получава при специални правила за превод и представени като \ (8 \) - битова двоична брой \ (00101101 \) на цена от \ (1 \) байта.

В момента, разпространено код \ (Unicode \). Това кодиране се поддържа от повечето операционни системи, всички съвременни браузъри, както и много други програми.

Standard \ (Unicode \) е резултат от сътрудничеството на Международната организация по стандартизация (\ (ISO \)) с водещите производители на компютри и софтуер. В света има \ (6700 \) живите езици, но само \ (50 \) от тях са официалните езици на държавата. Писане системи, използвани около \ (25 \), което го прави възможно да се създаде универсален стандарт.

За да се кодира тези скриптове достатъчно \ (16 \) - малко обхват (\ (2 \) байта на един характер), т.е. обхват от \ (0000 \) на \ (FFFF \). Standard \ (в ASCII \) отнема в код пространство почетно място в границите на \ (0000 \) на \ (00FF \).

Всеки скрипт избрания от вас код блок. Към днешна дата, на кодирането на всички живеещи официално писмено се счита за завършено: разпределени около \ (29000 \) позиция на \ (65535 \) е възможно.

Unicode набор от символи

Какво е кодовата таблица

Наскоро един консорциум \ (Unicode \) започна да се кодира другите системи за писане на нашата планета, които представляват интерес :. писането на мъртви езици, отпадна от съвременната употреба, китайски йероглифи, изкуствено създадени азбуки и др ..

Да представлява това многообразие от езици \ (16 \) - битово криптиране не е достатъчно дълъг, а днес \ (на Unicode \) вече е започнало развитието на \ (21 \) - малко космически кодове (\ (000000 \) - \ (10FFFF \)) се разделя на \ (16 \) зони, споменатите равнини.