Аналіз тексту

Аналіз тексту - процес отримання високоякісної інформації з тексту на природній мові. Як правило, для цього застосовується статистичне навчання на основі шаблонів: вхідний текст розділяється за допомогою шаблонів, потім проводиться обробка отриманих даних. Також використовується і в літературі


1. Застосування

Останнім часом аналіз тексту привертає все більше уваги в різних областях, таких як безпека, комерція, наука.

1.1. В безпеці

Багато пакети аналізу тексту, такі як Aerotext і Attensity, націлені на ринок додатків безпеки, зокрема на аналіз джерел простого тексту, наприклад новинних сайтів.

1.2. У програмному забезпеченні

Дослідження і розробки підрозділів великих компаній, таких як IBM, Apple і Microsoft, досліджують технології аналізу тексту з метою майбутньої автоматизації процесів аналізу й витягу даних.