Знаймо

Додати знання

приховати рекламу

Цей текст може містити помилки.

КОИ-8



План:


Введення

ЯКІ-8 (код обміну інформацією, 8 бітів), KOI8 - восьмибитового ASCII -сумісна кодова сторінка, розроблена для кодування букв кириличних алфавітів.

Існує також семібітовая версія кодування, не повністю сумісна з ASCII - КОИ-7. ЯКІ-7 і КОІ-8 описані в ГОСТ 19768-74 (зараз недійсний, на сайті Федерального агентства з метрології про нього навіть не залишилося згадки), більш нова версія ГОСТ 19768-93 нормує зовсім інші значення кодів).

Розробники КОІ-8 помістили символи російського алфавіту в верхньої частини кодової таблиці таким чином, що позиції кириличних символів відповідають їх фонетичним аналогам в англійському алфавіті в нижній частині таблиці. Це означає, що якщо в тексті, написаному в КОІ-8, прибирати восьмий біт кожного символу, то виходить "читається" текст, хоча він і написаний латинськими символами. Наприклад, слова "Російський Текст" перетворилися б у "rUSSKIJ tEKST". Як побічний наслідок, символи кирилиці виявилися розташовані не в алфавітному порядку.

Існує кілька варіантів кодування КОІ-8 для різних кирилічних алфавітів, що розширюють певні коди (загальний діапазон 192-255 з 32 російськими літерами в двох регістрах залишається незмінним у всіх варіантах). Російський алфавіт описується в кодуванні KOI8-R, український - в KOI8-U.

KOI8-R став фактично стандартом для російської кирилиці в 1990-х роках в юнікс -подібних операційних системах і електронною поштою.

IETF затвердив кілька RFC за варіантами кодування KOI-8:

  • RFC1489 - KOI8-R
  • RFC2319 - KOI8-U
  • RFC1345 - ISO-IR-111 (з помилкою у визначенні основного діапазону)

IANA зареєструвала їх у своєму списку.

Стандарт RFC 1489 наказує наявність графічних символів "рамок" ( псевдографіки), проте ця вимога виконується досить рідко.

В Microsoft Windows KOI8-R присвоєно код сторінки 20866, KOI8-U - 21866.

Початок таблиці кодування (латиниця) повністю відповідає кодуванні ASCII.

У наведених таблицях числа під буквами позначають шістнадцятковий код букви в Юникоде.


1. Кодування KOI8-R (російська)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 . A . B . C . D . E . F

8.

2500

2502

250C

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588

258C

2590

9.

2591

2592

2593

2320

25A0

2219

221A

2248

2264

2265

A0

2321

B0

B2

B7

F7

A.

2550

2551

2552
е
451

2553

2554

2555

2556

2557

2558

2559

255A

255B

255C

255D

255E

B.

255F

2560

2561
Е
401

2562

2563

2564

2565

2566

2567

2568

2569

256A

256B

256C

A9

C.
ю
44E
а
430
б
431
ц
446
д
434
е
435
ф
444
г
433
х
445
і
438
ї
439
до
43A
л
43B
м
43C
н
43D
про
43E

D.
п
43F
я
44F
р
440
з
441
т
442
у
443
ж
436
в
432
ь
44C
и
44B
з
437
ш
448
е.
44D
щ
449
ч
447
ь
44A

E.
Ю
42E
А
410
Б
411
Ц
426
Д
414
Е
415
Ф
424
Г
413
Х
425
І
418
Й
419
До
41A
Л
41B
М
41C
Н
41D
Про
41E

F.
П
41F
Я
42F
Р
420
З
421
Т
422
У
423
Ж
416
В
412
Ь
42C
И
42B
З
417
Ш
428
Е
42D
Щ
429
Ч
427
Ред
42A

2. Інші варіанти

(Показані тільки незбіжні рядки таблиць, оскільки все інше збігається)

3. Кодування KOI8-U (російсько-українська)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 . A . B . C . D . E . F

A.

2550

2551

2552
е
451
є
454

2554
и
456
ї
457

2557

2558

2559

255A

255B
г
491

255D

255E

B.

255F

2560

2561
Е
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A
Г
490

256C

A9

4. Кодування KOI8-RU (російсько-білорусько-українська)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 . A . B . C . D . E . F

A.

2550

2551

2552
е
451
є
454

2554
и
456
ї
457

2557

2558

2559

255A

255B
г
491
ў
45E

255E

B.

255F

2560

2561
Е
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A
Г
490
Ў
40E

A9

5. Кодування KOI8-C (кавказька)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 . A . B . C . D . E . F
8. ғ
493
җ
497
қ
49B
ҝ
49D
ң
4A3
ү
4AF
ұ
4B1
ҳ
4B3
ҷ
4B7
ҹ
4B9
һ
4BB

2580
ҝ
49D
ӣ
4E3
ө
4E9
ӯ
4EF
9. Ғ
492
Җ
496
Қ
49A
Ҝ
49C
Ң
4A2
Ү
4AE
Ұ
4B0
Ҳ
4B2
Ҷ
4B6
Ҹ
4B8
Һ
4BA

2321
Ә
4D8
Ӣ
4E2
Ө
4E8
Ӯ
4EE
A.
A0
ђ
452
ѓ
453
е
451
є
454
ѕ
455
и
456
ї
457
ј
458
љ
459
њ
45A
ћ
45B
ќ
45C
г
491
ў
45E
џ
45F
B.
2116
Ђ
402
Ѓ
403
Е
401
Є
404
Ѕ
405
І
406
Ї
407
Ј
408
Љ
409
Њ
40A
Ћ
40B
Ќ
40C
Г
490
Ў
40E
Џ
40F

6. Кодування KOI8-T (таджицька)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 . A . B . C . D . E . F
8. қ
49B
ғ
493
,
201A
Ғ
492
"
201E
...
2026

2020

2021

2030
ҳ
4B3
<
2039
Ҳ
4B2
ҷ
4B7
Ҷ
4B6
9. Қ
49A
'
2018
'
2019
"
201C
"
201D

2022
-
2013
-
2014

2122
>
203A
A. ӯ
4EF
Ӯ
4EE
е
451

A4
ӣ
4E3
|
A6

A7
"
AB

AC

AD

AE
B.
B0

B1

B2
Е
401
Ӣ
4E2

B6

B7

2116
"
BB

A9

7. Кодування KOI8-O, KOI8-C (слов'янська, стара орфографія)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 . A . B . C . D . E . F

8.
Ђ
0402
Ѓ
0403

00B8
ѓ
0453
"
201E
...
2026

2020

00A7

20AC

00A8
Љ
0409
<
2039
Њ
040A
Ќ
040C
Ћ
040B
Џ
040F

9.
ђ
0452
'
2018
'
2019
"
201C
"
201D

2022
-
2013
-
2014

00A3

00B7
љ
0459
>
203A
њ
045A
ќ
045C
ћ
045B
џ
045F

A.

00A0
ѵ
0475
ѣ
0463
е
0451
є
0454
ѕ
0455
и
0456
ї
0457
ј
0458

00AE

2122
"
00AB
ѳ
0473
г
0491
ў
045E
'
00B4

B.

00B0
Ѵ
0474
Ѣ
0462
Е
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408

2116

00A2
"
00BB
Ѳ
0472
Г
0490
Ў
040E

00A9

8. Кодування ISO-IR-111, KOI8-E

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 . A . B . C . D . E . F

A.

00A0
ђ
0452
ѓ
0453
е
0451
є
0454
ѕ
0455
и
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C

00AD
ў
045E
џ
045F

B.

2116
Ђ
0402
Ѓ
0403
Е
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C

00A4
Ў
040E
Џ
040F

9. Кодування KOI8-Unified, KOI8-F

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 . A . B . C . D . E . F

8.

2500

2502

250C

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588

258C

2590

9.

2591
'
2018
'
2019
"
201C
"
201D

2022
-
2013
-
2014

00A9

2122

00A0
"
00BB

00AE
"
00AB

00B7

00A4

A.

00A0
ђ
0452
ѓ
0453
е
0451
є
0454
ѕ
0455
и
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
г
0491
ў
045E
џ
045F

B.

2116
Ђ
0402
Ѓ
0403
Е
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
Г
0490
Ў
040E
Џ
040F

10. Некірілліческіе варіанти КОИ-8

У деяких країнах РЕВ були створені модифікації КОІ-8 для національних варіантів латиниці. Базова ідея була та ж сама - при "зрізає" восьмого біта текст повинен залишатися більш-менш зрозумілим. Наприклад, у чеському варіанті КОІ-8 (ČSN 369103) літери Čč повинні перетворюватися на cC, - в zZ і т. д. В даний час ці кодування використовуються в 1C.


Цей текст може містити помилки.

Схожі роботи | скачати

Схожі роботи:
КОИ-7
© Усі права захищені
написати до нас