Завдання прогнозування - в ​​прогностиці існують різні приватні види класичних задач на прогнозування. Формулювання таких завдань однаковим чином дозволяє порівнювати різні методи, пропоновані різними дисциплінами.




1. Приклади задач прогнозування

1.1. Завдання медичної діагностики

У ролі об'єктів виступають пацієнти. Ознаки характеризують результати обстежень, симптоми захворювання і застосовувалися методи лікування. Приклади бінарних ознак: стать, наявність головного болю, слабкості. Порядковий ознака - тяжкість стану (задовільний, середньої тяжкості, важкий, вкрай важкий). Кількісні ознаки - вік, пульс, артеріальний тиск, вміст гемоглобіну в крові, доза препарату. Ознакового опису пацієнта є, по суті справи, формалізованої історією хвороби. Накопичивши достатню кількість прецедентів в електронному вигляді, можна вирішувати різні завдання:

  • класифікувати вид захворювання ( диференціальна діагностика);
  • визначати найбільш доцільний спосіб лікування;
  • передбачати тривалість і результат захворювання;
  • оцінювати ризик ускладнень;
  • знаходити синдроми - найбільш характерні для даного захворювання сукупності симптомів.

Цінність такого роду систем в тому, що вони здатні миттєво аналізувати та узагальнювати величезна кількість прецедентів - можливість, недоступна фахівцеві-лікареві.


1.2. Передбачення родовищ корисних копалин

Ознаками є дані геологічної розвідки. Наявність або відсутність тих чи інших порід на території району кодується бінарними ознаками. Фізико-хімічні властивості цих порід можуть описуватися як кількісними, так і якісними ознаками. Навчальна вибірка складається з прецедентів двох класів: районів відомих родовищ і схожих районів, в яких цікавить викопне виявлено не було. При пошуку рідкісних корисних копалин кількість об'єктів може виявитися набагато менше, ніж кількість ознак. У цій ситуації погано працюють класичні статистичні методи. Завдання вирішується шляхом пошуку закономірностей в наявному масиві даних. У процесі вирішення виділяються короткі набори ознак, що володіють найбільшою інформативністю - здатністю найкращим чином розділяти класи. За аналогією з медичною задачею, можна сказати, що відшукуються "синдроми" родовищ. Це важливий побічний результат дослідження, що представляє значний інтерес для геофізиків і геологів.


1.3. Оцінювання кредитоспроможності позичальників

Це завдання вирішується банками при видачі кредитів. Потреба в автоматизації процедури видачі кредитів вперше виникла в період буму кредитних карт 60-70-х років у США та інших розвинених країнах. Об'єктами в даному випадку є фізичні або юридичні особи, що претендують на отримання кредиту. У разі фізичних осіб ознакового опису складається з анкети, яку заповнює сам позичальник, і, можливо, додаткової інформації, яку банк збирає про нього з власних джерел. Приклади бінарних ознак: стать, наявність телефону. Номінальні ознаки - місце проживання, професія, роботодавець. Порядкові ознаки - освіта, займана посада. Кількісні ознаки - сума кредиту, вік, стаж роботи, дохід сім'ї, розмір заборгованостей в інших банках. Навчальна вибірка складається з позичальників з відомою кредитною історією. У простому випадку прийняття рішень зводиться до класифікації позичальників на два класи: "хороших" і "поганих". Кредити видаються тільки позичальникам першого класу. У більш складному випадку оцінюється сумарне число балів (score (Англ.) ) Позичальника, набраних за сукупністю інформативних ознак. Чим вище оцінка, тим більш надійним вважається позичальник. Звідси й назва - кредитний скоринг. На стадії навчання проводиться синтез і відбір інформативних ознак і визначається, скільки балів призначати за кожну ознаку, щоб ризик прийнятих рішень був мінімальний. Наступне завдання - вирішити, на яких умовах видавати кредит: визначити процентну ставку, термін погашення, та інші параметри кредитного договору. Це завдання також може бути рішення методами навчання по прецедентів.


1.4. Прогнозування споживчого попиту

Вирішується сучасними супермаркетами і торговими роздрібними мережами. Для ефективного управління торговою мережею необхідно прогнозувати обсяги продажів для кожного товару на задане число днів вперед. На основі цих прогнозів здійснюється планування закупівель, управління асортиментом, формування цінової політики, планування промоакцій (рекламних кампаній). Специфіка завдання в тому, що кількість товарів може обчислюватися десятками чи навіть сотнями тисяч. Прогнозування та прийняття рішень по кожному товару "вручну" просто немислимо. Вихідними даними для прогнозування є часові ряди цін і обсягів продажів по товарах і по окремих магазинах. Сучасні технології дозволяють знімати ці дані безпосередньо з касових апаратів. Для збільшення точності прогнозів необхідно також враховувати різні зовнішні фактори, що впливають на споживчий попит: рівень інфляції, погодні умови, рекламні кампанії, соціально-демографічні умови, активність конкурентів. В залежності від цілей аналізу в ролі об'єктів виступають або товари, або магазини, або пари "магазин, товар". Ще одна особливість задачі - несиметричність функції втрат. Якщо прогноз робиться з метою планування закупівель, то втрати від заниженого прогнозу істотно вище втрат від завищеного.


1.5. Прийняття інвестиційних рішень на фінансовому ринку

У цьому завданні вміння добре прогнозувати самим безпосереднім чином перетворюється в прибуток. Якщо інвестор припускає, що ціна акції зросте, він купує акції, сподіваючись продати їх пізніше по більш високій ціні. І, навпаки, прогнозуючи падіння цін, інвестор продає акції, щоб згодом викупити їх назад за нижчою ціною. Завдання інвестора-спекулянта в тому, щоб правильно вгадати напрям майбутньої зміни ціни - зростання чи падіння. Великою популярністю користуються автоматичні торгові стратегії - алгоритми, які приймають торгові рішення без участі людини. Розробка такого алгоритму - теж завдання навчання з учителем. У ролі об'єктів виступають ситуації, фактично, моменти часу. Опис об'єкта - це вся передісторія зміни цін і обсягів торгів, зафіксована до даного моменту. У простому випадку об'єкти необхідно класифікувати на три класи, що відповідають можливим рішенням: купити, продати або вичікувати. Навчаючої вибірки для налаштування торгових стратегій служать історичні дані про рух цін і обсягів за деякий проміжок часу. Критерій якості в даній задачі істотно відрізняється від стандартного функціоналу середньої помилки, оскільки інвестора цікавить не точність прогнозування, а максимізація підсумкової прибутку. Сучасний біржовий технічний аналіз налічує сотні параметричних торгових стратегій, параметри яких прийнято настроювати за критерієм максимуму прибутку на вибраному інтервалі історії.