Знаймо

Додати знання

приховати рекламу

Цей текст може містити помилки.

Обробка природної мови



План:


Введення

Обробка природної мови (Natural Language Processing, NLP) - загальний напрямок штучного інтелекту та математичної лінгвістики. Воно вивчає проблеми комп'ютерного аналізу та синтезу природних мов. Стосовно до штучного інтелекту аналіз означає розуміння мови, а синтез - генерацію грамотного тексту. Вирішення цих проблем буде означати створення більш зручної форми взаємодії комп'ютера і людини.


1. Завдання та обмеження

Теоретично, побудова природно-мовного інтерфейсу для комп'ютерів - дуже приваблива мета. Ранні системи, такі як SHRDLU, працюючи з обмеженим "світом кубиків" і використовуючи обмежений словниковий запас, виглядали надзвичайно добре, надихаючи цим своїх творців. Однак оптимізм швидко вичерпався, коли ці системи зіткнулися зі складністю і неоднозначністю реального світу.

Розуміння природної мови іноді вважають AI-повній завданням, тому як розпізнавання живої мови вимагає величезних знань системи про навколишній світ і можливості з ним взаємодіяти. Саме визначення сенсу слова " розуміти "- одне з головних завдань штучного інтелекту.


2. Складності розуміння

2.1. У російській мові

Якість розуміння залежить від безлічі факторів: від мови, від національної культури, від самого співрозмовника і т. д. Ось деякі приклади складнощів, з якими стикаються системи розуміння текстів.

  • Пропозиції "Ми віддали банани мавпам, тому що вони були голодні" і "Ми віддали банани мавпам, тому що вони були перезрілими" схожі по синтаксичній структурі. В одному з них займенник вони відноситься до мавп, а в іншому - до бананів. Правильне розуміння залежить від знань комп'ютера, якими можуть бути банани і мавпи. За нормами російської мови друге речення некоректно , Тому що в ньому займенник посилається не на останнє підходяще слово, проте в усному мовленні така пропозиція цілком може зустрітися.
  • Вільний порядок слів може привести до зовсім іншого тлумачення фрази: "Буття визначає свідомість" - хто кого визначає?
  • У російській мові вільний порядок компенсується розвинутою морфологією, службовими словами і розділовими знаками, але в більшості випадків для комп'ютера це являє додаткову проблему.
  • У промові можуть зустрітися неологізми, наприклад, дієслово "Пятідесятірубліруй" - тобто висилай 50 рублів. Система повинна вміти відрізняти такі випадки від опечаток і правильно їх розуміти.
  • Правильне розуміння омонімів - ще одна проблема. При розпізнаванні мови, крім інших, виникає проблема фонетичних омонімів. У фразі "Сірий вовк в глухому лісі зустрів руду лисицю" виділені слова чуються однаково, і без знання, хто глухий, а хто рудий, не обійтися (Крім того, що лисиця може бути рудою, а ліс - глухим, ліс також може бути рудим (характеристика, в даному випадку позначає переважаючий колір листя в лісі), у той час як лисиця може бути глухою, що породжує додаткову проблему, яка випливає з попередньої.)

3. Головні завдання


4. Програмне забезпечення


Цей текст може містити помилки.

Схожі роботи | скачати

Схожі роботи:
Коефіцієнт природної освітленості
Американський музей природної історії
Філдовскій музей природної історії
Національний музей природної історії (Вашингтон)
Лос-Анджелеський музей природної історії
Національний музей природної історії (Париж)
Електрохімічна обробка
Обробка зображень
Обробка транзакцій
© Усі права захищені
написати до нас
Рейтинг@Mail.ru