Кодовые таблицы кыр­гыз­ско­го языка для применения в компьютерной технике и икт



Скачать 341.56 Kb.
страница1/5
Дата07.08.2013
Размер341.56 Kb.
ТипДокументы
  1   2   3   4   5
Кодовые таблицы кыр­гыз­ско­го языка
для применения в компьютерной технике и ИКТ

Э.Д. Асанов, Институт кибернетики и информационных технологий,
каф. "Компьютерная лингвистика"

В статье дан обзор кодовых таблиц, применяемых в ИКТ. Кроме того, подробно рассмотрены вопросы построения кодовых таблиц кыргызского языка для операционной системы Windows. Приведены кодовые таблицы кыргызского языка, построенные на базе кодовых страниц CP_1251 и CP_866 корпорации Майкрософт. Детально описана таблица международного стандарта Unicode (диапазон 0400-04FF, кириллица).

Макалада МКТ тармагындагы колдонгон код-жадыбалдар жалпысынан каралып чыккан. Андан тышкары Windows оператив системасы үчүн кыргыз тилинин код-жадыбалдарын түзүү маселеси каралды. Майкрософт корпорациясынын CP_1251 жана CP_866 код-барактардын негизинде түзүлгөн кыргыз тилинин жадыбалдары көрсөтүлгөн. Эл аралык Unicode стандарттын жадыбалы (диапазон 0400-04FF, кириллица) толуу менен берилген.

In this article survey the code tables, which uses in IT. After detail described the problems of Kyrgyz language code tables design for Windows operation system. Shows the Kyrgyz language code tables, composed on Microsoft CP_1251 and CP_866 code pages. And Unicode International standard (0400-04FF, diapason of Cyrillic) are carefully described.
О кодировках. Краткий обзор и анализ
Кодировки, применяемые в компьютерных системах и ИКТ, представляет со­бой таблицы символов (кодовые таблицы), где каждой букве алфавита, вклю­чая также цифры и специаль­ные знаки, присвоен свой уни­кальный номер, так называе­мый код символа.

При однобай­товой системе кодирования ко­довая таблица состоит из 256 (по количеству состояний, кото­рый может принять один байт) символов, из которых первые 128 символов используются для кодирования букв латинского алфавита. Вторая же половина таб­лицы отдана под национальные символы, и в каждой стране эта часть различна. Так, например, в странах бывшего СССР суще­ствует 5 различных кирилличе­ских кодировок. Термин "раз­личные" обозначает то, что од­ному и тому же коду (позиции в таблице символов) соответст­вуют разные символы. Т.е. если мы неправильно определим и настроим кодировку текста, то нашему вниманию предстанет абсолютно нечитаемый текст. Кириллические кодировки появились исторически.

  1. Первая широко используемая кириллическая кодировка называлась KOI-8. Она появилась в результате адаптации к русскому языку системы UNIX. Это было еще в семидесятых годах, до появления персональных компьютеров1.

  2. С появлением персональных компьютеров IBM PC началось широкое использование DOS (дисковая операционная система). Вместо того чтобы воспользоваться KOI-8 кодировкой, корпорация Microsoft решила сделать свою. Так появилась DOS-кодировка кириллицы (или CP_866 кодовая страница Microsoft).

  3. Параллельно с IBM-совместимыми развивались и Macintosh-совместимые компьютеры.
    Несмотря на то, что их доля была очень мала, тем не менее, потребность в кириллизации существовала и, разумеется, была придумана еще одна кодировка - MAC.

  4. В 1990 году корпорация Microsoft выпустила первую успешную версию Windows нового поколения (3.0-3.11). А вместе с ней и поддержку национальных языков. При этом Microsoft не поддержала ни одну из уже существовавших ранее кодировок, а предложила новую Win-кодировку (или кодовая страница CP_1251, называемая также стандартом ANSI). Де-факто, в связи с тотальным распространением самой Windows 3.0-3.11, кодовая таблица CP_1251 стала самой распространенной в СНГ.

  5. Наконец, пятый вариант кодировки связан уже не с конкретной фирмой, а с попытками стандартизации кодировок на уровне всей планеты. Занималась этим ISO - международная организация по стандартам. Вместо того чтобы принять за основу стандарта какую-нибудь из вышеописанных кодировок, была придумана еще одна (!), названная ISO-8859-5. Разумеется, кодировка тоже оказалась ни с чем не совместимой. И, как следствие, в настоящий момент эта кодировка практически нигде не применяется. Ее используют как основную только в базе данных Oracle. Тем не менее, ее поддержка присутствует во всех браузерах.


Кодовые таблицы кыргызской кириллицы
Аналогичная ситуация сложилась и с кыргызским языком. Так, для системы Windows сегодня используются различные ANSI-кодировки кыргызской кириллицы, что очень затрудняет, а порой и делает невозможным обмен документами в электронном виде. На настоящий момент существует четыре различных кодировки, построенные на основе модификации кодовой страницы CP_1251, причем каждая со своими шрифтами. Назовем их условно по названию шрифтов, в которых они используются:

  1. MENCHIK, авторство неизвестно;

  2. KYRGYZ BALTIKA, авторство неизвестно;

  3. UniToktom, © Информационный Центр "Токтом";

  4. тип "Q", © Асанов Э.Д.2

В отличие от первых трех последняя кодировка при работе со стандартными средствами Windows на кыргызском языке позволяет корректно работать как с кодовой страницей CP_866 (DOS), так и с кодовой страницей CP_1251 (Windows). Кроме того, поддержка этой кодировки обеспечена обширной библиотекой кыргызских шрифтов (на сегодняшний день это порядка 26 гарнитур и около 70 начертаний3), а сама кодировка и шрифты с 1995 года успешно используется большинством кыргызскоязычных СМИ и рядом полиграфических предприятий Кыргызстана. Рассмотрим эту кодировку более подробно.

При разработке кодовых таблиц типа "Q" в качестве шаблонов для совместимости были использованы стандартные кодовые таблицы кириллицы корпорации Майкрософт (кодовые страницы Microsoft 1251/ANSI и OEM/DOS). Эти таблицы являются 8 битовыми и, соответственно, общее число символов равно 256. Поэтому для расположения 6 дополнительных (с точки зрения стандартной кириллицы) символов были использованы знакоместа символов украинского (Є, є, Ї, ї) и белорусского (Ў, ў) языков. Таким образом, были получены следующие модифицированные таблицы кыргызской кириллицы.
Знакоместа кыргызских букв Ң, ң, Ө, ө, Ү, ү (десятичные коды)
в кодовых страницах CP_1251 (таблица ANSI) и CP_866 (таблица DOS)

Символ
Ң

ң

Ө

ө

Ү


ү
№ знакоместа в таблице 1251

161

162

170

186

175

191
№ знакоместа в таблице 866

246

247

242

243

244

245
  1   2   3   4   5

Похожие:

Кодовые таблицы кыр­гыз­ско­го языка для применения в компьютерной технике и икт iconКодовые таблицы кыр­гыз­ско­го языка для применения в компьютерной технике и икт
Кодировки, применяемые в компьютерных системах и икт, представляет со­бой таблицы символов (кодовые таблицы), где каждой букве алфавита,...
Кодовые таблицы кыр­гыз­ско­го языка для применения в компьютерной технике и икт iconКодовые таблицы iso 8859
В настоящее время международной организацией стандартизации (iso) принято для использования в междунароной системе передачи данных...
Кодовые таблицы кыр­гыз­ско­го языка для применения в компьютерной технике и икт iconIi кымакско-кыргызские и другие племена енисейско-иртышского междуречья до XIII в
Кыр(ы)гыз — форма множественного числа кырыг с аффиксом —ыз. Термин первоначально имел значение топо-этнонима, то есть названия «красных»...
Кодовые таблицы кыр­гыз­ско­го языка для применения в компьютерной технике и икт iconПрограмма курса «Информатика и икт»
Икт, в которых эти данные используются. Такое расположение материала способствует лучшему формированию в сознании учеников связи...
Кодовые таблицы кыр­гыз­ско­го языка для применения в компьютерной технике и икт iconПроектная деятельность по русскому языку с использованием икт
В поисках новых подходов к изучению русского языка учителя нашей школы используют информационные технологии. Это уроки с компьютерной...
Кодовые таблицы кыр­гыз­ско­го языка для применения в компьютерной технике и икт iconПедсовет org Живое пространство образования
Икт в образовании, создавая таким образом Сеть творческих учителей. Эта Сеть объединяет по всему миру работников образования, интересующихся...
Кодовые таблицы кыр­гыз­ско­го языка для применения в компьютерной технике и икт iconАвторы: Гришкова Татьяна Павловна, учитель высшей категории Россамахина Ирина Юрьевна, учитель высшей категории Аукцион знаний интерактивная интеллектуальная игра для учащихся 10-11 классов
Икт; выработка навыков применения средств икт в повседневной жизни, при выполнении индивидуальных и коллективных проектов
Кодовые таблицы кыр­гыз­ско­го языка для применения в компьютерной технике и икт iconБыли выявлены специфические особенности применения lms moodle в образовательном процессе кафедры икт. Произведено внедрение lms moodle в учебный процесс на основе перевода одной из дисциплин
На базе действующих электронных учебных ресурсов по компьютерной графике был создан объединенный учебный ресурс интегрированный в...
Кодовые таблицы кыр­гыз­ско­го языка для применения в компьютерной технике и икт iconОписание процедур проведения егэ по информатике и информационно-коммуникационным технологиям в компьютерной форме (тэ икт)
Проведение экзамена по информатике и информационно-коммуникационным технологиям в компьютерной форме имеет следующие ключевые отличия...
Кодовые таблицы кыр­гыз­ско­го языка для применения в компьютерной технике и икт iconКраткий исторический обзор
Разработка и построение кыргызской национальной клавиатурной раскладки для применения в икт и компьютерных технологиях
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org