Технические аспекты проблемы кыргызификации компьютеров и программ



страница1/5
Дата08.04.2013
Размер0.49 Mb.
ТипДокументы
  1   2   3   4   5
Технические аспекты проблемы кыргызификации
компьютеров и программ

Асанов Э.Д.,
член рабочей группы для подготовки предложений по вопросам поддержки кыргызского языка в компьютерных системах

Основа для компьютеризации кыргызского языка – это, конечно же "кыргызификация" компьютеров и компьютерных программ, включая операционные системы (ОС). На мой взгляд, сегодня существует 9 основных технических проблем "кыргызификации", решение которых и даст возможность полноценной компьютеризации государственного языка. Что же это за проблемы?

1. Отсутствие государственных стандартов кодовые таблицы и раскладки клавиатур.

Как было отмечено ранее, существование множества кодировок символов кыргызской кириллицы привело к тому, что учреждения и организации Кыргызской Республики не могут в полной мере обмениваться информацией. Однако речь не идет только об одной Windows кодировке ANSI (CP1251), стандартизация которой позволит решить только часть проблем "кыргызификации". Это объясняется наличием, по крайней мере, еще трех стандартов, соблюдение которых позволит говорить о полном единообразии данных – это:

  • однобайтовая кодовая таблица MS DOS (CP866);

  • однобайтовая кодовая таблица KOI-8;

  • унифицированная двухбайтовая кодовая таблица UNICODE.

Одновременное соблюдение всех четырех стандартов является необходимым условием для полноценной работы не только с кыргызским, но и любым другим языком. Кратко остановимся на области применения каждой из трех кодировок:

  1. Кодировка MS-DOS используется в файловых системах Windows и MS-DOS и в приложениях, работающих в среде MS-DOS (сеанс MS-DOS);

  1. Кодировка ANSI является базовой для Windows и используется во всех Windows приложениях;

  2. Кодировка KOI-8 является базовой для ОС Unix и используется во всех ее приложениях;

  3. Кодировка по стандарту Unicode получила в последнее время широкое распространение и используется во многих программах для обеспечения многоязычности ввиду реализации в одной кодовой таблице алфавитов практически всех существующих языков мира, даже таких, как китайский и японский языки.

Кроме стандартов на кодовые таблицы необходимы и единый стандарт на раскладки клавиатур. Принятие такого стандарта позволит организовать подготовку, издание и внедрение единых методик и программ для обучения "слепому" методу набора текстов на кыргызском языке в рамках перевода делопроизводства на государственный язык, что сейчас пока невозможно.

2. Зависимость от особенностей используемого прикладного ПО.

Даже решение проблемы стандартизации не позволяет в полной мере говорить о возможности использования кыргызского языка. Это обусловлено большим разнообразием программ, которые каждая по-своему трактуют возможность использования того или иного языка.
Большинство популярных программ разработано крупными мировыми производителями, которые при создании ПО не учитывали возможность использования кыргызского языка, а разрабатывались, в лучшем случае, на тех языковых установках, которые предусматриваются в ОС. Здесь важно отметить, что только в последней версии ОС Windows XP реализована поддержка кыргызского языка на уровне системы, но только в стандарте UNICODE. Это означает, что большинство программ, использующих ANSI или DOS-кодировку, не будет полноценно поддерживать кыргызский язык. Из всего этого следует, что возможность использования кыргызского языка связана и зависит от двух важных факторов:

  • от самого прикладного ПО и способа его реализации;

  • от версии операционной системы.

Комбинация этих двух составляющих дает самые разные результаты, то есть в каком-то случае кыргызский язык будет поддерживаться, в каком-то частично, а в каком-то и вовсе нет. В связи с этим надо отметить, что внутренняя архитектура и технологии операционных систем семейства Windows, не смотря на общее имя, очень сильно отличаются. Можно условно выделить два класса операционных систем семейства Windows, а именно Windows 95/98/ME и Windows NT/2000/XP. Различие способов внутренней организации разных версий Windows также вызывает немалые трудности при попытке единообразно решить вопрос поддержки кыргызского языка для всех версий Windows.

3. Устойчивость к изменениям в работе ОС.

Существовавшие до сих пор решения по поддержке кыргызского языка характеризуются слабой устойчивостью работы к малейшим изменениям в ОС. Пользователям регулярно время от времени требуется их переустановка, так как они могут перестать нормально функционировать в случае, если в систему устанавливали какое-нибудь новое ПО, изменяющее системные модули и настройки. Как известно, многие программные продукты, особенно продукты Microsoft, при установке обновляют системные файлы и данные реестра Windows под свои стандартные требования, и это неизбежно отражается, в той или иной степени, на возможность последующего использования кыргызского языка.

4. Шрифтовое обеспечение.

До недавнего времени ввиду отсутствия шрифтов, содержащих символы кыргызского языка, многим разработчикам приходилось самим разрабатывать такие шрифты. Однако создание качественного нового шрифта процесс трудоемкий и требует специальных знаний в области шрифтовой графики и стандарта UNICODE. На сегодняшний день уже существуют UNICODE-шрифты с символами кыргызского алфавита, разработанные крупными мировыми производителями, специализирующимися в области шрифтов. Большинство таких шрифтов поставляется вместе с программными продуктами корпорации Microsoft. Использование таких шрифтов гарантирует пользователям качество и обеспечивает читабельность документов при переходе на другие программные продукты или их версии.

5. Буфер обмена.

Работа буфера обмена сильно зависит от версии ОС. В любом случае при переносе информации посредством буфера обмена происходит конвертация текста из одной кодовой таблицы в другую и обратно. Конвертация символов осуществляется согласно специальным таблицам перекодировок. Эти таблицы являются частью ОС, в которой может отсутствовать информация о символах кыргызского алфавита. Поэтому при работе с буфером обмена может иметь место потеря информации вследствие неверной конвертации. Поэтому, чтобы работа буфера была правильной, должна так же правильно осуществляться конвертация данных из UNICODE в ANSI, UNICODE в DOS, ANSI в DOS и обратно.

6. Сетевое использование.

Если говорить о полноценном использовании кыргызского языка при работе на компьютере, то нельзя обойти стороной такой вопрос, как использование его в локальных корпоративных сетях. При использовании символов кыргызского алфавита в именах файлов, папок и ярлыков они становятся недоступными в сети. Это является следствием отсутствия правильной интерпретации символов1. При наличии же правильных таблиц соответствия у вас будут так же правильно обрабатываться файлы и папки с кыргызскими именами, как в сети, так и на локальном компьютере, независимо от версий используемой ОС.

8. Системы управления базами данных.

Большинство современных баз данных не поддерживает данные на кыргызском языке, что также является существенным препятствием на пути использования кыргызского языка. Речь идет в первую очередь о функциях поиска данных например по заданной маске, а также о сортировке данных согласно алфавиту кыргызского языка.

8. Интернет и электронная почта.

Проблема использования кыргызского языка в такой быстро развивающейся сфере, как Интернет, актуальна уже не первый год. Имеются какие-то частные решения, но нет общего решения, устраивающего всех. Использование кыргызского языка при написании электронных писем, а также гарантированная читабельность получаемых писем – это те проблемы, которые до сих пор в государственном масштабе вообще никак и никем не решались.

9. Языковая среда на кыргызском языке.

Нет обеспечения полноценной кыргызской языковой среды в программах, а именно отсутствует интерфейс приложений на кыргызском языке. У многих бытует ошибочное мнение, что это является обязанностью крупных фирм-разработчиков, в частности Microsoft. К сожалению (а может быть и к счастью) Microsoft Кыргызстану ничем не обязан, и, поэтому о выходе кыргызской версии Windows приходится только мечтать. Локализовать же Windows можно было бы и собственными силами, однако в ближайшем будущем этого не предвидится в силу ряда причин, а именно:

  1. Отсутствие в Кыргызстане цивилизованного рынка программного обеспечения вообще, поэтому из-за пиратства частные инвестиции могут и не вернуться;

  2. Отсутствие у программистов мотивации в разработке приложений с кыргызским интерфейсом по причине отсутствия финансирования;

  3. Незаинтересованность бизнес-структур в финансировании работ подобного рода вследствие отсутствия для них экономических и политических стимулов;

  4. Отсутствие сформировавшейся единой терминологической базы;

  5. Отсутствие государственной политики в области функционирования электронной формы кыргызского языка.

И, тем не менее, вопрос обеспечения полноценной кыргызской языковой среды в системном и прикладном программном обеспечении требует своего решения.

Тиркеме

Өзгөчө белгилер:

■ - аныкталган маалымат;
? - аныкталбаган маалымат.

Функциялар (текст иштетүү үчүн аспаптар)

Тил группасы

Тил

Орфо­графияны текшерүү

Грамма­тиканы текшерүү

Сино­нимдер сөздүгү

Ташымал

Славян

Болгар











Поляк









Орус









Серб











Словак










Словен










Украин









Хорват










Чех










Герман

Англис









Голланд









Немис









Норвег









Швед









Роман

Галисия











Испан









Италия









Каталан










Португал









Румын










Француз









Түрк

Азербайжан

?










Башкыр













Казак











Кыргыз











Өзбек

?










Татар

?










Түрк










Түркмөн













Якут













Угр-финн

Мажар (Венгр)









Финн









Эстон



?





Башка тилдер

Кытай












Корей











Жапон












ПРОГРАММНЫЙ ПРОДУКТ «ТАМГА-КИТ»

© Асанов Э.Д., 1994, 2001; Чодоев Р.А., 2001




Первый и единственный в Кыргызстане!

Программный продукт «Тамга-Кит» предназначен для комплексного решения вопросов функционирования кыргызского языка в ИКТ. Продукт незаменим для пользователей, использующих кыргызский язык в таких областях как делопроизводство, офисные применения, базы данных, Интернет и электронная почта, а также в сферах просвещения и науки.

Программный продукт состоит из следующих компонентов:

  1. Кыргызификатор операционной системы Windows 95/98/ME/NT/2000/XP. Состоит из набора клавиатурных раскладок, системных и пользовательских шрифтов в стандартах ANSI и Unicode-2, а также тюнера системных установок Windows;

  2. Реализованная в виде DLL-модуля встраиваемая в MS Office 97/2000/XP функции проверки кыргызской орфографии (при работе с текстами появляется еще один язык – "киргизский"). Объем словаря - около 72 000 лексических единиц. Алгоритм проверки с элементами искусственного интеллекта позволяет получить из них на этапе проверки порядка 5-7 млн. производных слов);

  3. Библиотека кыргызских шрифтов – более 70 самых разнообразных начертаний шрифтов в формате TrueType, оптимизированных для использования с распространенными в Кыргызстане программами верстки и дизайна (PageMaker, QuarkXpress, PhotoShop, CorelDraw и т.д.);

  4. Утилиты для работы с кыргызскими текстами (конвертор кыргызских кодировок и программа переносов по правилам кыргызского языка);

  5. Русско-кыргызский терминологический словарь объемом 5600 терминов из экономики, юриспруденции, техники и т.д.;

  6. Специальное шрифтовое обеспечение (совмещенный стандарт ANSI / Unicode) для оптического распознавания кыргызских текстов при работе со сканером в программе FineReader 5.0;

  7. Совместимый Word 97 национальный текстовый редактор «Тамга 2.0» с интеграцией всех необходимых функций поддержки кыргызского языка.

«Тамга-КИТ» - это:

  • Полная работоспособность и отсутствие конфликтов при работе с MS Windows и MS Office всех версий;

  • Взаимосвязь всех компонентов программного продукта друг с другом – возможность удобной и комфортной работы с кыргызскими текстами без дополнительного обучения;

  • Автоматическая взаимная перекодировка текстов в кодировках ANSIUnicode – это беспроблемный перенос текстов и документов на кыргызском языке как с компьютера на компьютер посредством магнитных носителей, так и через среду Интернет.



Кодовые таблицы кыр­гыз­ско­го языка
для применения в компьютерной технике и ИКТ

Э.Д. Асанов.

Институт кибернетики и информационных технологий,
кафедра. "Компьютерная лингвистика"

О кодировках. Краткий обзор и анализ

Кодировки, применяемые в компьютерных системах и ИКТ, представляет со­бой таблицы символов (кодовые таблицы), где каждой букве алфавита, вклю­чая также цифры и специаль­ные знаки, присвоен свой уни­кальный номер, так называе­мый код символа.

При однобай­товой системе кодирования ко­довая таблица состоит из 256 (по количеству состояний, кото­рый может принять один байт) символов, из которых первые 128 символов используются для кодирования букв латинского алфавита. Вторая же половина таб­лицы отдана под национальные символы, и в каждой стране эта часть различна. Так, например, в странах бывшего СССР суще­ствует 5 различных кирилличе­ских кодировок. Термин "раз­личные" обозначает то, что од­ному и тому же коду (позиции в таблице символов) соответст­вуют разные символы. Т.е. если мы неправильно определим и настроим кодировку текста, то нашему вниманию предстанет абсолютно нечитаемый текст. Кириллические кодировки:

  1. KOI-8. Она появилась в результате адаптации к русскому языку системы UNIX2.

  2. DOS-таблица или CP_866 кодовая страница Microsoft.

  3. MAC-таблица для Macintosh-совместимых компьютеров.

  4. Win-кодировка или кодовая страница CP_1251, называемая также ANSI-таблицей. Де-факто, в связи с тотальным распространением самой Windows, кодовая таблица CP_1251 стала самой распространенной в СНГ.

  5. Таблица ISO-8859-5. В настоящий момент эта кодировка практически нигде не применяется. Ее используют как основную только в базе данных Oracle. Тем не менее, ее поддержка присутствует во всех браузерах.


Кодовые таблицы кыргызской кириллицы

Аналогичная ситуация сложилась и с кыргызским языком. Так, для системы Windows сегодня используются различные ANSI-кодировки кыргызской кириллицы, что очень затрудняет, а порой и делает невозможным обмен документами в электронном виде. На настоящий момент существует четыре различных кодировки, построенные на основе модификации кодовой страницы CP_1251, причем каждая со своими шрифтами. Назовем их условно по названию шрифтов, в которых они используются:


  1. MENCHIK, авторство неизвестно;

  2. KYRGYZ BALTIKA, авторство неизвестно;

  3. UniToktom, © Информационный Центр "Токтом";

  4. тип "Q", © Асанов Э.Д.3


В отличие от первых трех последняя кодировка при работе со стандартными средствами Windows на кыргызском языке позволяет корректно работать как с кодовой страницей CP_866 (DOS), так и с кодовой страницей CP_1251 (Windows). Кроме того, поддержка этой кодировки обеспечена обширной библиотекой кыргызских шрифтов (на сегодняшний день это порядка 26 гарнитур и около 70 начертаний4), а сама кодировка и шрифты с 1995 года успешно используется большинством кыргызскоязычных СМИ и рядом полиграфических предприятий Кыргызстана. Рассмотрим эту кодировку более подробно.

При разработке кодовых таблиц типа "Q" в качестве шаблонов для совместимости были использованы стандартные кодовые таблицы кириллицы корпорации Майкрософт (кодовые страницы Microsoft 1251/ANSI и OEM/DOS). Эти таблицы являются 8 битовыми и, соответственно, общее число символов равно 256. Поэтому для расположения 6 дополнительных (с точки зрения стандартной кириллицы) символов были использованы знакоместа символов украинского (Є, є, Ї, ї) и белорусского (Ў, ў) языков. Таким образом, были получены следующие модифицированные таблицы кыргызской кириллицы.
Знакоместа кыргызских букв Ң, ң, Ө, ө, Ү, ү (десятичные коды)
в кодовых страницах CP_1251 (таблица ANSI) и CP_866 (таблица DOS)
Символ
Ң

ң

Ө

ө

Ү


ү
№ знакоместа в таблице 1251

161

162

170

186

175

191
№ знакоместа в таблице 866

246

247

242

243

244

245
  1   2   3   4   5

Похожие:

Технические аспекты проблемы кыргызификации компьютеров и программ iconПравовые аспекты формирования и проблемы реализации
Мая 2006 года Комитет Совета Федерации по делам Федерации и региональной политике провел «круглый стол» на тему: «Правовые аспекты...
Технические аспекты проблемы кыргызификации компьютеров и программ iconПрограмма по курсу информатика и применение компьютеров в научных исследованиях
Процесс написания программ. Оформление текстов, требования к текстам и комментариям. Сопровождение программ. Документация на по,...
Технические аспекты проблемы кыргызификации компьютеров и программ iconСистемное руководство FinTax v 8
Этот документ описывает комплект поставки, состав, структуру программ FinTax v 8, требования к оборудованию и системному программному...
Технические аспекты проблемы кыргызификации компьютеров и программ iconР. Д. Григорьев, А. А. Красилов Автоматический синтез программ Корпорация «Галактика»
Интеллсист, позволяющая решать классы задач на основе баз знаний. Рассматриваются актуальные базы знаний, проблемы формализации знаний,...
Технические аспекты проблемы кыргызификации компьютеров и программ iconИнформация о финансировании и реализации федеральных, областных и муниципальных целевых программ в Селивановском районе за 9 месяцев 2011 года
Состояние финансирования программ, краткий перечень выполненных работ и мероприятий, проблемы и меры, принимаемые по улучшению ситуации...
Технические аспекты проблемы кыргызификации компьютеров и программ iconЛекция Классификация компьютеров По каким критериям классифицируют компьютеры?
Четких границ между классами компьютеров не существует. По мере совершенствования структур и технологии производства, появляются...
Технические аспекты проблемы кыргызификации компьютеров и программ iconПроблема власти в раннесредневековом обществе: историографический и методологический аспекты
Методологические аспекты проблемы власти в раннее средневековье в работах отечественных и зарубежных
Технические аспекты проблемы кыргызификации компьютеров и программ iconТехнические науки: формирование и специфика технических наук
Технические науки охватывают различные виды технологии, производственных и технических средств и различные аспекты деятельности инженеров,...
Технические аспекты проблемы кыргызификации компьютеров и программ iconПрограмма Российской научно-практической конференции светских ученых и теологов с участием зарубежных исследователей «Проблемы российского самосознания. Религиозные, нравственные и правовые аспекты культуры»
«Проблемы российского самосознания. Религиозные, нравственные и правовые аспекты культуры»
Технические аспекты проблемы кыргызификации компьютеров и программ iconDr. Web для Mac os X аннотация Антивирус Dr. Web для Mac os X
Антивирус Dr. Web для Mac os X обеспечивает защиту компьютеров от вирусов, шпионского и рекламного по, хакерских утилит, программ...
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org