Представяне на текстова информация в компютъра
Натискането на каквито и да било буквено-цифрови клавиши на клавиатурата, причинява, че сигналът се изпраща до компютъра като двоично число, представляващо една от кодовата книга ценности.
Код маса - това е вътрешен представяне на символи в компютъра.
Като стандарт, дълго време се използва за маса \ (ASCII \) (\ (A \) Merican \ (S \) tandard \ (С \) ода за \ (I \) nformational \ (I \) nterchange - американски стандарт код за обмен на информация ).
За да съхраните двоичен един символ разпределени \ (1 \) Байт \ (= \) \ (8 \) бита. Като се има предвид, че всеки бит е \ (1 \) или \ (0 \), броят на възможните комбинации от нули и единици е 2, 8 и + = 256.
Така че, с помощта на \ (1 \) байта могат да бъдат получени \ (256 \) различни комбинации от двоичен код и да ги гледате с помощта на \ (256 \) на различни герои.
Тези кодове съставляват маса \ (ASCII \).
За краткост и лекота на тези кодове характер в таблицата с помощта на система за шестнадесетичен номерация, състояща се от \ (16 \) символи - \ (10 \) цифри и \ (6 \) латински букви: \ (A \) \ (B \ ) \ (С \) \ (Г \) \ (Е \) \ (F \). Когато кодираща първи характер е написан фигура колона и след това редове са разположени в пресечната точка на даден символ.
Например, латинска буква \ (S \) в таблица \ (ASCII \), представена в шестнадесетичен - \ (53 \). Чрез натискане на буквата \ (S \) се записва в паметта на компютъра код \ на (01010011 \), което представлява двоичен еквивалент шестнадесетичен номер \ (53 \). Този код може да бъде получена чрез замяна на всеки шестнадесетични цифри от двоичната му представяне. В този случай, броят \ (5 \) се заменя със код \ (0101 \) и номер 3 - код \ (0011 \). В произтичащи буквите \ (S \) на екрана, компютърът изпълнява декодиране: въз основа на двоичен образ на героя е изграден.
Всеки символ в таблица \ (ASCII \) е кодиран с помощта на \ (8 \) бита или \ (2 \) шестнадесетична цифри.
Standard \ (в ASCII \) кодира първия \ (128 \) героите от \ (0 \) на \ (127 \): числа, букви от латинската азбука, героите контрол. Горната таблица показва символите кодиране в шестнадесетичен формат.
Първият \ (32 \) символи са контрол и е предназначен предимно за предаване на управляващите команди. Тяхната функция може да варира в зависимост от софтуера и хардуера. През втората половина на кодовата таблица (от \ (128 \) на \ (255 \)) американски стандарт не е определена и са предназначени за герои на националните азбуки, pseudographic и някои математически символи. Различни изпълнения на втората половина на кодова книга могат да бъдат използвани в различни страни.
Числата са кодирани от стандартната \ (ASCII \) в два случая: когато вход-изход, а когато те се появяват в текста. Ако броят на участващите в изчисленията, а след тяхното преобразуване се извършва в двоичен код в съответствие с правилата (вж. Тук).
За сравнение, помислете за броя на \ (45 \) за двете кодиране опции.
Когато се използва в текста на този брой ще изисква за представянето му \ (2) \ байта, като всяка цифра е представена от кода в съответствие с маса \ (ASCII \) на. код Системата за шестнадесетичен ще изглежда \ (3435 \) в двоична система - \ (00110100 00110101 \).
Когато се използва при изчисляването на този кодов номер се получава при специални правила за превод и представени като \ (8 \) - битова двоична брой \ (00101101 \) на цена от \ (1 \) байта.
В момента, разпространено код \ (Unicode \). Това кодиране се поддържа от повечето операционни системи, всички съвременни браузъри, както и много други програми.
Standard \ (Unicode \) е резултат от сътрудничеството на Международната организация по стандартизация (\ (ISO \)) с водещите производители на компютри и софтуер. В света има \ (6700 \) живите езици, но само \ (50 \) от тях са официалните езици на държавата. Писане системи, използвани около \ (25 \), което го прави възможно да се създаде универсален стандарт.
За да се кодира тези скриптове достатъчно \ (16 \) - малко обхват (\ (2 \) байта на един характер), т.е. обхват от \ (0000 \) на \ (FFFF \). Standard \ (в ASCII \) отнема в код пространство почетно място в границите на \ (0000 \) на \ (00FF \).
Всеки скрипт избрания от вас код блок. Към днешна дата, на кодирането на всички живеещи официално писмено се счита за завършено: разпределени около \ (29000 \) позиция на \ (65535 \) е възможно.
Unicode набор от символи
Наскоро един консорциум \ (Unicode \) започна да се кодира другите системи за писане на нашата планета, които представляват интерес :. писането на мъртви езици, отпадна от съвременната употреба, китайски йероглифи, изкуствено създадени азбуки и др ..
Да представлява това многообразие от езици \ (16 \) - битово криптиране не е достатъчно дълъг, а днес \ (на Unicode \) вече е започнало развитието на \ (21 \) - малко космически кодове (\ (000000 \) - \ (10FFFF \)) се разделя на \ (16 \) зони, споменатите равнини.