Байт

Байт ( англ. byte ) - Одиниця зберігання і обробки цифрової інформації; сукупність бітів, оброблювана комп'ютером одномоментно. У сучасних обчислювальних системах байт вважається рівним восьми бітам, в цьому випадку він може приймати одне з 256 (2 8) різних значень (станів, кодів). Однак в історії комп'ютерів відомі рішення з іншим розміром байта (наприклад, 6 бітів, 32 біта, 36 бітів), тому іноді в комп'ютерних стандартах і офіційних документах для позначення 8-бітного слова використовується термін " октет "( лат. octet ).

У більшості обчислювальних архітектур байт - це мінімальний незалежно адресується набір даних.


1. Історія

Назва "байт" (слово byte являє собою скорочення словосполучення BinarY TErm - "двійковий терм") було вперше використано в 1956 В. Бухгольц ( англ. Werner Buchholz ) При проектуванні першого суперкомп'ютера IBM 7030 (англ.) для пучка одночасно переданих в пристроях введення-виведення шести бітів. Пізніше, в рамках того ж проекту, байт був розширений до восьми біт.

Ряд ЕОМ 1950-х і 1960-х років ( БЕСМ-6, М-220) використовували 6-бітові символи в 48-бітових або 60-бітових машинних словах. У деяких моделях ЕОМ виробництва Burroughs Computer Corporation (англ.) (нині Unisys) розмір символу був дорівнює 9 бітам. В радянської ЕОМ Мінськ-32 використовувався 7-бітний байт.

Байтовая адресація пам'яті була вперше застосована в системі IBM System/360. У більш ранніх комп'ютерах адресувати можна було тільки цілком машинне слово, яке складалося з декількох байтів, що ускладнювало обробку текстових даних.

8-бітові байти були прийняті в System/360, ймовірно, через використання BCD -формату представлення чисел: одна десяткова цифра (0-9) вимагає 4 біта (тетраду) для зберігання; один 8-бітовий байт може представляти дві десяткові цифри. 6-бітні байти можуть зберігати лише по одній десятковій цифрі, два біти залишаються незадіяними.

За іншою версією, 8-бітний розмір байта пов'язаний з 8-бітним ж числовим представленням символів в кодуванні EBCDIC.

За третьою версією, через двійкової системи кодування в комп'ютерах найбільш вигідними для апаратної реалізації і зручними для обробки даних є довжини слів кратні ступеням 2, в тому числі і 1 байт = 2 3 = 8 бітів, системи і комп'ютери з довжинами слів не кратними ступенями 2 відпали через невигідність і незручності.

Поступово 8-бітові байти стали стандартом де-факто і з початку 1970-х у більшості комп'ютерів байти складаються з 8 біт і розмір машинного слова кратний 8 бітам.

З міркувань зручності одиниці нетекстових типів даних також роблять кратними 8 бітам, наприклад:

  • розмір одного семпли в звукових файлах дорівнює 8, 16 або 24 бітам
  • розмір пікселя в системі RGB дорівнює 24 бітам (по 8 біт на колір)

2. Кількість станів (кодів) в байті

Кількість станів (кодів, значень), яке може приймати 1 восьмібітного байт з позиційним кодуванням, визначається в комбінаториці, дорівнює кількості розміщень з повтореннями і обчислюється за формулою:

N_p = \ bar {A} (n, k) = \ bar {A} _n ^ k = n ^ k = 2 ^ 8 = 256 можливих станів (кодів, значень), де
  • N_p - Кількість станів (кодів, значень) в одному байті.
  • \ Bar {A} (n, k) = \ bar {A} _n ^ k - Кількість розміщень з повтореннями.
  • n - Кількість станів (кодів, значень) в одному бите; в біті 2 стани (n = 2).
  • k - Кількість бітів в байті; в 8-бітному байті k = 8 і в ньому може бути від 0 до 8 однакових бітів (повторень).

3. Похідні одиниці

Вимірювання в байтах
ГОСТ 8.417 -2002 Приставки СІ приставки МЕК
Назва Символ Ступінь Назва Ступінь Назва Символ Ступінь
байт Б 2 0 - 10 0 байт B Б 2 0
кілобайт 10 лютого кіло- 10 березня кібібайт KiB КІБ 10 лютого
мегабайт МБ 20 лютого мега- 10 Червень мебібайт MiB МІБ 20 лютого
гігабайт ГБ 30 лютого гіга- 10 вересня гібібайт GiB ГИНУВ 30 лютого
терабайт ТБ 2 40 тера- 10 грудня тебібайт TiB Тиб 2 40
петабайт ПБ 2 50 пета- 15 жовтня пебібайт PiB ПІБ 2 50
ексабайт ЕБ 2 60 екса- 18 жовтня ексбібайт EiB ЕіБ 2 60
зеттабайт ЗБ 2 70 Зетта- 21 жовтня зебібайт ZiB ЗіБ 2 70
йоттабайт ЙБ 2 80 йотта- 24 жовтня йобібайт YiB ЙіБ 2 80

Кратні приставки для утворення похідних одиниць для байта застосовуються не як зазвичай: зменшувальні приставки не використовуються зовсім, а одиниці вимірювання інформації менші ніж байт називаються спеціальними словами ( ніббл і біт); збільшувальні приставки кратні 1024 = 2 10, тобто кілобайт дорівнює 1024 байтам, мегабайт - 1024 кілобайтам або 1048576 байтам і т. д. для гіга-, тера- і петабайт. Різниця між ємностями (обсягами), вираженими в кіло = 10 3 = 1000 і вираженими в Кіло = 2 10 = 1024, зростає зі зростанням ваги приставки. МЕК рекомендує використовувати двійкові приставки, але на практиці вони поки не застосовуються, можливо, через немилозвучність - кібібайт, мебібайт, йобібайт і т. п. .

Іноді десяткові приставки використовуються і в прямому сенсі, наприклад, при вказівці ємності жорстких дисків : у них гігабайт може позначати не 1 073 741 824 = 1024 3 байтів, а мільйон кілобайтів (тобто 1024000000 байтів), а то й просто мільярд байтів.


4. Позначення

Міждержавний ( СНД) стандарт ГОСТ 8.417-2002 [1] ("Одиниці величин") в "Додатку А" для позначення байта регламентує використання російської великої літери "Б". Крім того, констатується традиція використання приставок СІ разом з найменуванням "байт" для вказівки множників, що є ступенями двійки (1 Кбайт = 1024 байт, 1 Мбайт = 1024 Кбайт, 1 Гбайт = 1024 Мбайт і т. д., причому замість рядкової "до "використовується заголовна" К "), і згадується, що подібне використання приставок СІ не є коректним.

Використання великої літери "Б" для позначення байта відповідає вимогам ГОСТ і дозволяє уникнути плутанини між скороченнями від байт і біт. Однак слід враховувати, що в стандарті немає скорочення для "біт", тому використання записи на зразок "Гб" як синоніма для "Гбіт" неприпустимо.

У міжнародному стандарті МЕК IEC 60027-2 2005 [2], для застосування в електротехнічної й електронної областях, рекомендуються позначення:

  • bit - для біта;
  • o, B - для октету, байта. Причому про - єдине зазначене позначення у французькій мові.

5. Схиляння

Згідно рекомендації Інституту російської мови імені В. В. Виноградова Російської Академії Наук байт, як і біт, схиляти необхідно [Джерело не вказано 503 дні] .

Крім звичайної форми родового відмінка (бітів, байтів, кілобайтів) існує рахункова форма, яка використовується в поєднанні з числівниками: 8 байт, 16 кілобайт. Рахункова форма є розмовної. Точно так само, наприклад, з кілограмами: звичайна форма родового відмінка вживається, якщо немає числівника, а в поєднанні з числівником можуть бути варіанти: 16 кілограмів (стилістично нейтральна звичайна форма) та 16 кілограм (розмовна рахункова форма) [3].


Примітки

  1. Довідник по ГОСТ-ам :: Довідник :: Прилад. Інфо - pribor.info / docs /? start = 0 & action = obj & objid = 82476 & relid = 3
  2. фр. NORME INTERNATIONALE CEI, Troisime dition, англ. INTERNATIONAL STANDARD IEC, Third edition - 60027-2, від 2005-08, стор 5, 112 -117.
  3. "Російський орфографічний словник" (М., 2005)