Кодирование текстовой информации



Дата18.07.2013
Размер93.2 Kb.
ТипРешение
Решение задач на тему «Кодирование текстовой информации»
Типы задач:

  1. Объем памяти, занимаемый текстом.

  2. Кодирование (декодирование) текстовой информации.

  3. Внутреннее представление текста в компьютере.


  1. Объем памяти, занимаемый текстом.



Методические рекомендации:

В задачах такого типа используются понятия:

  • алфавит,

  • мощность алфавита

  • символ,

  • единицы измерения информации (бит, байт и др.)

Для представления текстовой (символьной) информации в компьютере используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации (28 =256). 8 бит =1 байту, следовательно, двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.

1. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:

Певец-Давид был ростом мал, Но повалил же Голиафа! (ЕГЭ_2005. демо, уровень А)


1)

400 бит

2)

50 бит

3)

400 байт

4)

5 байт

Решение:

В тексте 50 символов, включая пробелы и знаки препинания. При кодировании каждого символа одним байтом на символ будет приходиться по 8 бит, Следовательно, переведем в биты 50*8= 400 бит.

Ответ: 400 бит

2. Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующего предложения в кодировке Unicode:

Каждый символ кодируется 8 битами.

(ЕГЭ_2005, уровень А)

Решение:

34 символа в предложении. Переведем в биты: 34*16=544 бита.

Ответ: 544 бит




3. Сколько секунд потребуется модему, передающему сообщение со скоростью 28800 бит/с, чтобы передать 100 страниц текста в 30 строк по 60 символов каждая, при условии, что каждый символ кодируется одним байтом? (ЕГЭ_2005, уровень В)

Решение:

  1. Найдем объем сообщения. 30*60*8*100 =1440000 бит.

  2. Найдем время передачи сообщения модемом.
    1440000 : 28800 =50 секунд


Ответ: 50 секунд


  1. Кодирование (декодирование) текстовой информации.


Методические рекомендации:

В задачах такого типа используются понятия:

Кодирование – отображение дискретного (прерывного, импульсного) сообщения в виде определенных сочетаний символов.

Код (от французского слова code – кодекс, свод законов) – правило по которому выполняется кодирование.

Кодовая таблица (или кодовая страница) – таблица, устанавливающая соответствие между символами алфавита и двоичными числами.

Примеры кодовых таблиц (имеются на CD диске к учебнику Н. Угринович):

  • КОИ-7, КОИ-8 – кодирование русских букв и символов (семи-, восьми -битное кодирование)


 

1) #154 неразрывный пробел.

Рис.1 Кодировка КОИ8-Р

  • ASCII –American Standard Code for Information Interchange (американский стандарт кодов для обмена информацией) – это восьмиразрядная кодовая таблица, в ней закодировано 256 символов (127- стандартные коды символов английского языка, спецсимволы, цифры, а коды от 128 до 255 – национальный стандарт, алфавит языка, символы псевдографики, научные символы, коды от 0 до 32 отведены не символам, а функциональным клавишам).



1) #32 - пробел.

Рис. 2 Международная кодировка ASCII

  • Unicode – стандарт, согласно которому для представления каждого символа используется 2 байта. (можно кодировать математические символы, русские, английские, греческие, и даже китайские). C его помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов

  • СР1251 - наиболее распространенной в настоящее время является кодировка Microsoft Windows, ("CP" означает "Code Page", "кодовая страница").



1) #160 неразрывный пробел,

2)  #173 мягкий перенос.

Рис. 3 Кодировка CP1251

  • СР866 - кодировка под MS DOS

1) #255 неразрывный пробел.

Рис. 4 Кодировка СР866

  • Мас – кодировка в ПК фирмы Apple, работающих под управлением операционной системы Mac OS.



    1. #202 неразрывный пробел.

Рис. 5 Кодировка Mac

  • ISO 8859-5 -Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку.



 1) Коды 128-159 не используются;

2)  #160 неразрывный пробел,

3)  #173 мягкий перенос.

Рис. 6 Кодировка ISO 8859-5

Используем кодировочные таблицы

4. Как будет выглядеть слово "диск", записанное в кодировке СР1251, в других кодировках.

Решение:

Последовательность десятичных кодов слова "диск" составляем на основе кодировочных таблиц

Кодовая таблица

Коды

Слово

СР1251

228 232 241 234

диск

КОI8-Р

228 232 241 234

ДХЯЙ

СР866

228 232 241 234

фшёъ

Мас

228 232 241 234

диск

ISO

228 232 241 234

фшёъ


Не используем кодировочные таблицы

5. Буква «I »в таблице кодировки символов имеет десятичный код 105. что зашифровано последовательностью десятичных кодов: 108 105 110 107?

Решение:

Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите и, можно, не обращаться к таблице кодировки символов.


Десятичный код

105

106

107

108

109

110

Латинская буква

i

j

k

l

m

n

Ответ: Закодировано слово «link»

6. Десятичный код (номер) буквы «е» в таблице кодировки символов ASCII равен 101. Какая последовательность десятичных кодов будет соответствовать слову:

help?
Решение:

Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите:

Десятичный код

101

102

103

104

105

106

107

108

109

110

111

112

Латинская буква

e

f

g

h

i

j

k

l

m

n

o

p

Ответ:

2) 104 101 108 112
7. Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв из двух бит, для некоторых из трех). Эти коды представлены в таблице.

A

B

C

D

E

000

01

100

10

011

Определить, какой набор букв закодирован двоичной строкой 0110100011000

1) EBCEA 2) BDDEA 3)BDCEA 4) EBAEA ?
Решение:

Так как код записывается, начиная с младшего разряда, то рассмотрим двоичную строку справа налево: 0110 100 011 000. Легко увидеть, что последние три буквы будут С, Е, А. Кода 110 нет, значит рассмотрим код из двух бит. 10 – D, 01 – B. Значит, двоичной строкой закодирован набор букв 3) BDCEA. Других вариантов дешифровки заданной двоичной строки не существует.

Ответ: 3) BDCEA




Не используем кодировочные таблицы
8. Десятичный код (номер) буквы «i» в таблице кодировки символов ASCII равен 105. Какая последовательность десятичных кодов будет соответствовать слову INFORMATION?

Решение:
Учитываем, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32, а также, что сначала в таблице записываются заглавные, а потом строчные буквы, определим код заглавной буквы «I». 105-32 =73. Учитывая принцип последовательности кодирования и порядок букв в латинском алфавите, имеем:

код

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

буква

A

B


C

D

Е

f

g

h

i

j

k

l

m

n

o

p

q

r

s

t


Ответ: 73 78 70 79 82 77 65 84 73 79 78


  1. Внутреннее представление текста в компьютере.


9. Закодируйте с помощью кодировочной таблицы ASCII и представьте в шестнадцатеричной системе счисления следующий текст:

Password;



Решение:

1. Найдите в кодовой таблице ASCII коды соответствующих символов (в десятичной системе счисления)
а) Password → 80 97 115 115 119 111 114 100.
2. Переведите коды с помощью калькулятора в шестнадцатеричную систему счисления.
а) 80 97 115 115 119 111 114 100 → 50 61 73 73 77 6F 72 64
Ответ:

а) 50 61 73 73 77 6F 72 64



10. Декодируйте с помощью кодировочной таблицы ASCII следующий текст, заданные шестнадцатеричным кодом:
а) 54 6F 72 6E 61 64 6F;


Решение:

1. Переведите коды с помощью калькулятора из шестнадцатеричной системы счисления в десятичную.
а) 54 6F 72 6E 61 64 6F → 84 111 114 110 97 100 111
2. Найдите в кодовой таблице ASCII символы, соответствующие кодам:
а) 84 111 114 110 97 100 111 → Tornado;

Ответ: а) Tornado;

Похожие:

Кодирование текстовой информации iconКонспект урока по ивт в 9 классе «Кодирование текстовой информации»
Создать у учащихся полное представление о кодировании текстовой информации в компьютере
Кодирование текстовой информации iconКодирование текстовой информации
Для представления текстовой (символьной) информации в компьютере используется алфавит мощностью 256 символов. Один символ из такого...
Кодирование текстовой информации icon«Двоичное кодирование текстовой информации»
Традиционно для кодирования одного символа используется количество информации, равное 1 байту
Кодирование текстовой информации iconКодирование информации в компьютере
Образовательная: Сформировать у учащихся знания о принципах кодирования текстовой, графической, звуковой информации в компьютере
Кодирование текстовой информации iconКодирование текстовой информации
Текстовая информация, как и все другие виды информации, кодируется двоичными кодами. Посмотрите как представляется десятичное число...
Кодирование текстовой информации iconДвоичное кодирование текстовой информации
Программно-дидактическое обеспечение: пк, таблицы кодов, текстовый редактор, калькулятор
Кодирование текстовой информации iconКодирование текстовой информации 1
Тест занимает 0,25 Кбайт памяти компьютера. Сколько символов содержит этот текст?
Кодирование текстовой информации iconДомашнее задание «Кодирование текстовой информации»
В текстовом редакторе Word определить числовые коды нескольких символов
Кодирование текстовой информации iconКонспект урока по информатике в 8 классе Урок Кодирование текстовой информации. Цели и задачи: Обучающая
Познакомить учащихся со способами представления и организации текстов в компьютерной памяти
Кодирование текстовой информации iconКодирование текстовой информации. Различных кодировки кириллицы
Учитывая, что каждый символ кодируется 16-ю битами, оцените информационный объем следующей пушкинской фразы в кодировке Unicode
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org