глава 20

Преглед

Азбука на 256 знака е достатъчно голяма, за да съдържа букви (главни и малки) за чифт европейски езици, цифри, препинателни набор господа, а нещо друго на малките неща.







Задължителни стандарти, които да се създаде подобна кореспонденция.

Таблица 20.1. ASCII код на страницата (0 ‥ 127 знака)

История на кирилица (т.е. кирилица) код на страницата е сложна. Тяхната обща черта е, че те са пълни с първото полугодие в съответствие с ASCII. защо не са споменати тук.

Един от най-древните, както изглежда, е KOI8-R. роден в света на компютрите, работещи с операционните системи Unix. По-скоро странно нареждане на букви от кирилицата има обяснение. Моля, имайте предвид, че размерът на ASCII символи достатъчно седем бита. С други думи, всички -Symbols ASCII кодиран с байт 0 ******* форма. Монтаж-лявата изхвърлени бита в този байт е еквивалентно на добавяне 128 с кодови номера. Това допълнение дава същия ефект като налагането на горната половина на кодовата таблица на дъното. От друга страна, не изпускайте тази малко измества всеки символ в таблицата до 8 линии.

В старите дни, когато байта не са осем и седем-битови (първия октет се използва за контрол на грешки в предаването на информация между компютърни системи), символи на долната половина на страницата могат да загубят своята пожелах лявата малко. KOI8-R кодиране гаранция, че този текст ще остане повече или по-малко за четене. Например, когато повреда на текст кодовата страница, ще kODOWAQ страница.







В кода на страницата KOI8-R са украински версия на KOI8-U. както и версията на KOI8-C с предварително реформа българската азбука (yatyami, fitami, ижица), както и писма балкански езици с кирилица графика.

Таблица 20.3. Код Page KOI8-R (втората половина; символи 128 ‥ 255)

Код страница CP866. който се нарича също алтернатива кодиране ГОСТ. Това стана широко разпространена в нашата страна на компютри Microsoft DOS. Имаше също така нареченото ядро ​​кодиране ГОСТ. но тя не е широко разпространена, както и кодиране ISO8859-5. предложен от организацията ISO за подкрепа на кирилицата.

Ние CP866 кодировки имат по-малко проблеми с по азбучен ред (ако не говорим за страда писмото Oo. И специфични символи и украински belobolgarskogo азбуки). Въпреки това, има един нещастен разминаване между н на писма и р. изпълнена с икони за рисуване рамки.

Таблица 20.4. CP866 Кодът страница (втората половина; символи 128 ‥ 255)

Изглежда, най-съвършеното cp1251 код на страницата. предложен от Microsoft за използване в операционната система Microsoft Windows.

Таблица 20.5. Cp1251 Кодът страница (втората половина; символи 128 ‥ 255)

Проблемите, свързани с кодови страници

Изобилието на различни кодови страници създава проблеми при прехвърляне на текстове между различни компютърни системи.

За всеки предаден текст е необходимо да се направи, придружаващ информацията за използвания код страницата.

Поради факта, че различни кодировки могат да съдържат различни кодови таблици, обработва повторно кодиране не винаги е добре дефинирана. Например, символът - (дълго тире) е наличен в CP1251 и отсъства в кодовата страница CP866. Какво трябва да се случи, когато транскодиране с този символ?

И накрая, малкия размер на страницата код или невъзможно за нас да се използва единен текст на цялото разнообразие от знаци, изобретен от човечеството. Например, никой от описаните в предишния раздел, кодовата страница на кирилица, не позволява да се напише следния текст:

Ugly, но е необходимо