Керуючі символи

Керуючі символи - елементи даної кодування, яким не приписано графічне представлення, але які використовуються для управління пристроями, організації передачі даних і інших цілей.

Зараз для цих цілей застосовуються формати файлів, мови управління пристроями (такі як Postscript) та мережеві протоколи. Тому багато керуючі символи зараз або не використовуються взагалі, або використовуються не за призначенням.

Стандарт POSIX вимагає обов'язкової наявності лише восьми керуючих символів - \ 0, \ a, \ b, \ t, \ n, \ v, \ f, \ r (див. переносимий набір символів).


Керуючі символи ASCII

Номер Англійська назва Російська назва Соче-
таніе
кла-
виш
Escape
після-
дова-
тель-
ність
Призначення
00 NULL порожній символ \ 0 Цей символ нічого не робить. Деякі термінали зображують його як пробіл, але це неправильно. Часто NULL використовують для позначення кінця ланцюжка символів (наприклад, в мові C).
01 START OF HEADING початок заголовка ^ A В даний час використовується в консолі маршрутизаторів Cisco.
02 START OF TEXT початок тексту ^ B В даний час використовується в консолі маршрутизаторів Cisco.
03 END OF TEXT кінець тексту ^ C При введенні на терміналі зазвичай інтерпретується як сигнал переривання.
04 END OF TRANSMISSION кінець передачі ^ D При введенні на терміналі в UNIX -системах інтерпретується як кінець вводяться. Якщо поточна програма брала дані з терміналу, то вона завершується, як тільки обробить все, що було до символу ^ D.
05 ENQUIRY запит ^ E Використовувався в телетайпной зв'язку. У відповідь передбачалося отримати ідентифікаційну рядок віддаленого апарату.
06 ACKNOWLEDGE підтвердження ^ F Використовувався в телетайпной зв'язку.
07 BELL звуковий сигнал ^ G \ A Якщо цей символ послати на принтер або на термінал, то нічого не друкується, але почується звуковий сигнал.
08 BACKSPACE повернення на крок ^ H \ B Переміщує позицію друку на один символ назад. На принтерах може використовуватися для накладення одного символу на інший, наприклад a BS ^ = . При введенні з терміналу іноді використовується для стирання попереднього символу ("забій").
09 CHARACTER TABULATION (horizontal tabulation) горизонтальна табуляція ^ I \ T Переміщує позицію друку до наступної позиції горизонтальної табуляції.
0A LINE FEED переклад рядка ^ J \ N Переміщує позицію друку на один рядок вниз. В текстових файлах в Unix розділяє рядки.
0B LINE TABULATION (vertical tabulation) вертикальна табуляція ^ K \ V Переміщує позицію друку до наступної позиції вертикальної табуляції. На терміналах цей символ зазвичай еквівалентний перекладу рядка.
0C FORM FEED прогін сторінки, зміна сторінки ^ L \ F Викидає поточну сторінку і починає друк з наступною. На терміналах цей символ зазвичай еквівалентний перекладу рядка (хоча в принципі можна було б його використовувати для очищення екрана).
0D CARRIAGE RETURN повернення каретки ^ M \ R Переміщує позицію друку в крайнє ліве положення. В текстових файлах в Mac OS (але не Mac OS X) розділяє рядки. В CP / M, MS-DOS і Microsoft Windows для розділення рядків у текстових файлах використовується поєднання символів \ r \ n.
0E SHIFT OUT (locking-shift one) режим національних символів ^ N В КОІ-7 включає російський режим. На деяких принтерах включає режим символів подвійної ширини.
0F SHIFT IN (locking-shift zero) режим звичайного ASCII ^ O В КОІ-7 включає латинський режим. На деяких принтерах включає режим вузьких символів.
10 DATA LINK ESCAPE звільнення каналу даних ^ P Означає, що наступний за ним керуючий символ повинен сприйматися як дані, а не як керуючий символ.
11 DEVICE CONTROL ONE 1-й код управління пристроєм ^ Q На терміналах дозволяє продовжити виведення даних.
12 DEVICE CONTROL TWO 2-й код управління пристроєм ^ R
13 DEVICE CONTROL THREE Третя код управління пристроєм ^ S На терміналах тимчасово перериває (призупиняє) висновок даних.
14 DEVICE CONTROL FOUR 4-й код управління пристроєм ^ T
15 NEGATIVE ACKNOWLEDGE негативне підтвердження ^ U Використовувався в телетайпной зв'язку.
16 SYNCHRONOUS IDLE порожній символ для синхронного режиму передачі ^ V Деякі лінії зв'язку влаштовані так, що вимагають безперервної передачі даних. Якщо передавати нічого, то передають цей символ.
17 END TRANSMISSION BLOCK кінець блоку переданих даних ^ W
18 CANCEL відміна ^ X Дані, які йдуть перед ним, є некоректними. (Звичайно мова йде про одному рядку.)
19 END OF MEDIUM кінець носія ^ Y Використовувався, напр., Якщо закінчилася перфострічка і т.п.
1A SUBSTITUTE символ заміни ^ Z Ставиться на місці символів, значення яких були втрачені при передачі. В CP / M і MS-DOS використовувався для позначення кінця текстових файлів і кінця вводяться з консолі даних (хоча для цього були призначені символи ^ C і ^ D). Деякі текстові редактори під DOS автоматично додавали в кінці файлу ^ Z.
1B ESCAPE Альтернативний регістр № 2 (АР2) ^ [ Означає, що наступні за ним символи мають якесь інше значення, відмінне від того, яке визначено в ASCII. Зазвичай починає керуючі послідовності.
1C INFORMATION SEPARATOR FOUR (file separator) роздільник даних № 4 (роздільник файлів) ^ \
1D INFORMATION SEPARATOR THREE (group separator) роздільник даних № 3 (роздільник груп) ^]
1E INFORMATION SEPARATOR TWO (record separator) роздільник даних № 2 (роздільник записів) ^ ^ Мабуть, призначався для поділу записів у базах даних, але практично ніколи не використовується для цього.
1F INFORMATION SEPARATOR ONE (unit separator) роздільник даних № 1 (роздільник полів) ^ _ Мабуть, призначався для поділу полів у базах даних, але практично ніколи не використовується для цього.
7F DELETE видалення ^? Призначений для забивання помилково пробитих символів на семідорожечних перфострічках (оскільки позначається пробиттям дірочок у всіх доріжках), тому там він еквівалентний порожньому символу (\ 0). На терміналах може генеруватися натисканням або кнопки Backspace, або кнопки Delete.

Керуючі символи ISO 8859

80, PADDING CHARACTER, символ-заповнювач.

81, HIGH OCTET PRESET,???.

82, BREAK PERMITTED HERE, тут дозволений розрив рядка.

83, NO BREAK HERE, тут не дозволений розрив рядка.

84, INDEX,???.

85, NEXT LINE, наступний рядок. Одночасно переводить рядок і повертає позицію друку до початку рядка (еквівалентно \ r \ n).

86, START OF SELECTED AREA, початок виділеної області.

87, END OF SELECTED AREA, кінець виділеної області.

88, CHARACTER TABULATION SET, установка позицій горизонтальної табуляції.

89, CHARACTER TABULATION WITH JUSTIFICATION, установка позицій і вирівнювання горизонтальної табуляції.

8A, LINE TABULATION SET, установка позицій вертикальної табуляції.

8B, PARTIAL LINE FORWARD, частковий переклад рядка вперед.

8С, PARTIAL LINE BACKWARD, частковий переклад рядка назад.

8D, REVERSE LINE FEED, зворотний переклад рядка.

8E, SINGLE SHIFT TWO, 2-e значення для наступного символу.

8F, SINGLE SHIFT THREE, 3-e значення для наступного символу.

90, DEVICE CONTROL STRING, рядок управління пристроєм.

91, PRIVATE USE ONE, користувальницький символ № 1.

92, PRIVATE USE TWO, користувальницький символ № 2.

93, SET TRANSMIT STATE, установка режиму передачі.

94, CANCEL CHARACTER, символ скасування.

95, MESSAGE WAITING, є повідомлення.

96, START OF GUARDED AREA, початок захищеної області.

97, END OF GUARDED AREA, кінець захищеної області.

98, START OF STRING, початок рядка.

99, SINGLE GRAPHIC CHARACTER INTRODUCER, наступний символ інтерпретується як спеціальний графічний.

9A, SINGLE CHARACTER INTRODUCER, наступний символ інтерпретується як керуючий.

9B, CONTROL SEQUENCE INTRODUCER, початок керуючої послідовності. Зазвичай цей символ еквівалентний Escape + [.

9C, STRING TERMINATOR, закінчення рядка.

9D, OPERATING SYSTEM COMMAND, команда операційної системи.

9E, PRIVACY MESSAGE, секретне повідомлення.

9F, APPLICATION PROGRAM COMMAND, команда прикладної програми.


Керуючі символи Unicode

034F, COMBINING GRAPHEME JOINER. Об'єднати символи, що стоять ліворуч і праворуч (створити лігатуру).

200B, ZERO-WIDTH SPACE, пробіл нульовою ширини. При вирівнюванні по ширині може розширюватися.

200C, ZERO WIDTH NON-JOINER. Забороняє утворення лігатур.

200D, ZERO WIDTH JOINER. Дозволяє освіту лігатур.

200E, LEFT-TO-RIGHT MARK. Писати зліва направо.

200F, RIGHT-TO-LEFT MARK. Писати справа наліво.

2028, LINE SEPARATOR, роздільник рядків. Розділяє рядки тексту, але не абзаци.

2029, PARAGRAPH SEPARATOR, роздільник абзаців. Розділяє абзаци тексту.

202A, LEFT-TO-RIGHT EMBEDDING. Початок тексту, написаного зліва направо, всередині тексту, написаного справа наліво.

202B, RIGHT-TO-LEFT EMBEDDING. Початок тексту, написаного справа наліво, всередині тексту, написаного зліва направо.

202C, POP DIRECTIONAL FORMATTING. Кінець вставленого тексту з іншим напрямком.

202D, LEFT-TO-RIGHT OVERRIDE. Замінити текст, написаний зліва направа, текстом, написаним справа наліво.

202E, RIGHT-TO-LEFT OVERRIDE. Замінити текст, написаний справа наліво, текстом, написаним зліва направо.

2060, WORD JOINER, з'єднувач слів.

FE01... FE0F, VARIATION SELECTOR-1 ... 16, вибір варіанта накреслення № 1 ... № 16.

FEFF, ZERO WIDTH NO-BREAK SPACE / BYTE ORDER MARK, нерозривний пробіл нульовою ширини / індикатор порядку байтів. Цей символ використовується для вказівки того, що даний файл записаний в UTF-16 або UTF-32 з визначеним порядком байтів (оскільки символу FFFE немає, а в UTF-8 байти FE і FF не використовуються). Використання цього символу в якості нерозривного пробілу нульовою ширини не рекомендується; для цього є символ U +2060 (word joiner).

FFFD, REPLACEMENT CHARACTER, замінюючий символ. Використовується, коли значення символу невідомо чи не може бути виражене в Юникоде (див. також символ 1A).

E0100... E01EF, VARIATION SELECTOR-17 ... 256, вибір варіанта накреслення № 17 ... № 256.

Кодування символів
Основи → алфавіт текст ( файл дані) набір символів конверсія
Історичні кодування → Докомп.: СЕМАФОРНА (Макарова) Морзе Бодо МТК-2 Комп.: 6 біт УПП RADIX-50 EBCDIC ( ДКОИ-8) КОІ-7 ISO 646
сучас-
менное
8-бітове
представ-
ление
символи ASCII (керуючі друковані) не-ASCII ( псевдографіка)
8біт. код.стр. Різні → Кирилиця: КОІ-8 ГОСТ 19768-87 MacCyrillic
ISO 88591 (лат.) 2 3 4 5 (кір.) 6 7 8 9 10 11 12 13 14 15 () 16
Windows → 1250 1251 (кір.) 1252 1253 +1254 один тисячі двісті п'ятьдесят п'ять тисячу двісті п'ятьдесят-шість один тисяча двісті п'ятьдесят сім 1258 | WGL4
IBM & DOS → 437 850 852 855 866 "альт." ( МІК) ( НДІ ЕОМ)
Багато-
байтниє
Традиційні → DBCS ( GB2312) HTML
UnicodeUTF-16 UTF-8 список символів ( кирилиця)
Пов'язані
теми →
інтерфейс користувача розкладка клавіатури локаль переклад рядка шрифт кракозябри трансліт нестандартні шрифти текст як зображення Утиліти: iconv recode