Знаймо

Додати знання

приховати рекламу

Цей текст може містити помилки.

DjVu


DjVu-logo.svg

План:


Введення

DjVu (від фр. dj vu - "Вже бачене") - технологія стиснення зображень з втратами, розроблена спеціально для зберігання відсканованих документів - книг, журналів, рукописів та інше, де велика кількість формул, схем, малюнків і рукописних символів робить надзвичайно трудомістким їх повноцінне розпізнавання. Також є ефективним рішенням, якщо необхідно передати всі нюанси оформлення, наприклад, історичних документів, де важливе значення має не тільки зміст, але і колір і фактура паперу; дефекти пергаменту: тріщини, сліди від складання; виправлення, плями, відбитки пальців, сліди, залишені іншими предметами і т. д.

DjVu став основою для кількох бібліотек наукових книг. Величезна кількість книг в цьому форматі є в файлообмінних мережах.

Формат оптимізований для передачі по мережі таким чином, що сторінку можна переглядати ще до завершення завантаження файлу. DjVu-файл може містити текстовий ( OCR) шар, що дозволяє здійснювати повнотекстовий пошук по файлу. Крім того, DjVu-файл може містити вбудоване інтерактивне зміст і активні області - посилання, що дозволяє реалізувати зручну навігацію в DjVu-книгах.


1. Використовувані технології

Для стиснення кольорових зображень в DjVu застосовується спеціальна технологія, що розділяє вихідне зображення на три шари: передній план, задній план і чорно-білу (однобітових) маску. Маска зберігається з дозволом вихідного файлу; саме вона містить зображення тексту та інші чіткі деталі. Дозвіл заднього плану, в якому залишаються ілюстрації та текстура сторінки, за замовчуванням знижується для економії місця. Передній план містить кольорову інформацію про маску, його дозвіл зазвичай знижується ще сильніше. Потім задній і передній плани стискаються за допомогою вейвлет -перетворення, а маска - алгоритмом JB2.

Особливістю алгоритму JB2 є те, що він шукає на сторінці повторювані символи і зберігає їх зображення тільки один раз. У багатосторінкових документах кожні кілька поспіль сторінок користуються спільним "словником" зображень.

Для стиснення більшості книг можна обійтися лише двома кольорами. У цьому випадку використовується всього один шар, що дозволяє досягти рекордної ступеня стиснення. У типовій книзі з чорно-білими ілюстраціями, відсканованої з роздільною здатністю 600 dpi, середній розмір сторінки становить близько 15 Кб, тобто приблизно в 100 разів менше, ніж вихідний файл. У присутності складного заднього плану виграш обсягу становить зазвичай 4-10 разів. Однак при цьому не варто забувати, що в DjVu використовується стиснення даних з втратами, тому для особливо важливих документів, можливо, буде розумніше використовувати формати стиснення без втрат: PNG, JPEG 2000, TIFF і т. п.

В основі формату DjVu лежать кілька технологій, розроблених в AT & T Labs:

  • алгоритм відділення тексту від фону на відсканованому зображенні;
  • вейвлетного алгоритм стиснення фону IW44;
  • алгоритм стиснення чорно-білих зображень JB2;
  • універсальний алгоритм стиснення ZIP;
  • алгоритм розпакування "по запиту";
  • алгоритм "маскування" зображень.

2. Текстове представлення зображень DjVu

Формат DjVu передбачає наявність текстового шару, який містить текст із сторінки. (Використовується для пошуку і легкого копіювання тексту при роботі з ним). У разі, якщо текстовий шар недоступний, єдиний метод отримання тексту - виконання оптичного розпізнавання в сторонніх програмах.

3. Ліцензійна інформація

AT & T продали технологію компанії LizardTech, яка намагалася використовувати її у своїх комерційних інтересах, але завдяки відкритості формату [2] для створення та перегляду документів DjVu існує вільне програмне забезпечення, доступне для різних платформ. 1 липня 2008 LizardTech передав менеджмент DjVu батьківської компанії Celartem [3], а 10 червня 2009 Celartem передав права на технологію DjVu компанії Caminova [4].

Існує відкрита публікує під ліцензією GNU GPL бібліотека DjVuLibre і програми-кодувальники і переглядачі на ній.


Примітки

  1. DjVu File Format Versions - www.djvu.org/forum/phpbb/viewtopic.php?p=862 # 862. Розробники DjVu (липень 2006).
  2. Ліцензія - djvu.sourceforge.net / licensing.html
  3. Прес-реліз LizardTech - www.lizardtech.com/press/news.php?item=07-01-2008
  4. Прес-реліз LizardTech - lizardtech.com / press / news.php? item = 06-10-2009

Цей текст може містити помилки.

Схожі роботи | скачати
© Усі права захищені
написати до нас