Знаймо

Додати знання

приховати рекламу

Цей текст може містити помилки.

Хемоінформатика



План:


Введення

Хемоінформатика - застосування методів інформатики для вирішення хімічних проблем.

Сфери програми хемоінформатика: прогноз фізико-хімічних властивостей молекул (зокрема, ліпофільності, водорозчинності), токсикологічна та біологічна активність, ADME / T, екотоксикологічні властивості, розробка нових лікарських препаратів.


1. Визначення хемоінформатика

Термін хемоінформатика був введений у вживання Ф. К. Брауном [1] [2] в 1998 р.:

Хемоінформатика означає спільне використання інформаційних ресурсів для перетворення даних в інформацію та інформації в знання для якнайшвидшого прийняття найкращих рішень при пошуку сполук-лідерів в розробці ліків та їх оптимізації.

Надалі це визначення було розширено Й. Гастайгером [3] [4] :

Хемоінформатика це застосування методів інформатики для вирішення хімічних проблем.

Г. Періз з компанії "Новартіс" дав таке визначення хемоінформатика [5] :

Хемоінформатика це наукова дисципліна, що охоплює дизайн, створення, організацію, управління, пошук, аналіз, поширення, візуалізацію та використання хімічної інформації.

Відповідно до визначення, даному А. Варнеке та І. Баскін [6] [7] :

Хемоінформатика - це частина теоретичної хімії, що базується на своїй власній молекулярної моделі; на відміну від квантової хімії, в якій молекули представлені як ансамблі електронів і ядер, і заснованого на силових полях молекулярного моделювання, що має справу з класичними "атомами" і "зв'язками", хемоінформатика розглядає молекули як об'єкти в хімічному просторі.

Найбільш повне і розгорнуте визначення хемоінформатика як наукової дисципліни міститься в Декларації Оберне [8] :

Хемоінформатика це наукова дисципліна, що виникла за останні 40 років у прикордонній області між хімією та обчислювальної математикою. Було усвідомлено, що в багатьох областях хімії величезний обсяг інформації, накопичений в ході хімічних досліджень, може бути оброблений і проаналізовано тільки за допомогою комп'ютерів. Більш того, багато з проблем в хімії настільки складні, що для їх вирішення потрібні нові підходи, засновані на застосуванні методів інформатики. Виходячи з цього, були розроблені методи для побудови баз даних по хімічних сполуках і реакцій, для прогнозування фізичних, хімічних і біологічних властивостей сполук і матеріалів, для пошуку нових лікарських препаратів, аналізу спектральної інформації, для передбачення ходу хімічних реакцій і планування органічного синтезу.


2. Хемоінформатика та інші науки


3. Основи

Хемоінформатика знаходиться на перетині хімії і інформатики. В основі хемоінформатика лежить уявлення про хімічний просторі - сукупності всіх доступних хімікатів (хімічних сполук, реакцій, матеріалів та ін.) У більшості випадків хімічні об'єкти представимо у вигляді молекулярних графів, і тому методи теорії графів знаходять широке застосування в хемоінформатика. Традиційний підхід до обробки хімічної інформації, однак, полягає у відображенні хімічного простору на дескрипторної простір, утворене обчислюваними для кожного хімічного об'єкта векторами молекулярних дескрипторів - числових характеристик, що описують хімічні об'єкти (особливо, молекулярні графи). Це дає можливість застосовувати методи математичної статистики і машинного навчання (у тому числі, інтелектуального аналізу даних) для роботи з хімічними об'єктами.

Основи хемоінформатика докладно викладені в монографіях [3] [4] [5] [9] [10] [11] та оглядових статтях [1] [2] [7].


4. Внутрішнє і зовнішнє уявлення хімічної інформації

У хемоінформатика для внутрішнього представлення структур хімічних сполук зазвичай використовуються молекулярні графи, які можуть бути при необхідності доповнені інформацією про тривимірних координатах атомів, а також про динаміку їх зміни в часі. Довготривале зберігання хімічної інформації та обмін нею між додатками здійснюється за допомогою файлів, організованих відповідно до типів зовнішнього подання хімічної інформації.

Найпростішим типом зовнішнього подання структур хімічних сполук є лінійні нотації у вигляді рядка символів. Історично першим видом лінійних нотацій з'явилася Лінійна нотація Вісвессера (WLN). В даний час найбільш поширеною видом лінійних нотацій є рядки SMILES. Крім того, застосовуються також лінійні нотації SLN (Sybyl Line Notation, Tripos, Inc.; містить також можливість сппеціфікаціі структур Маркуша), SMARTS (розширення SMILES для пошукових запитів до хімічних баз даних), ROSDAL. Для кодування хімічних структур ІЮПАК запропонував універсальну лінійну нотацію InChI.

Другий тип зовнішнього подання структур хімічних сполук і реакцій між ними заснований на безпосередньому кодуванні матриці суміжності молекулярного графа. Такі поширені формати як MOL, SDF і RDF, які в даний час є стандартними для обміну хімічної інформацією, можна вважати способами представлення у вигляді такстового файлу матриці суміжності молекулярного графа. Цією ж метою служать і специфічні формати MOL2, HIN, PCM і ін, призначені для роботи з поширеними програмами по молекулярному моделювання.

Нарешті, третій тип зовнішнього подання структур хімічних сполук заснований на технології XML. Найбільш поширеним мовою опису хімічної інформації, що спирається на ці принципи, є CML.


5. Основні розділи

5.1. Створення та керування базами даних з хімії

Особливістю управління базами даних з хімії є те, що воно забезпечує наступні види пошуку, характерні для хімічної інформації:

  1. Пошук ідентичною хімічної структури, контроль за дублікатами
  2. Подструктурний пошук
  3. Пошук по молекулярному подобою
  4. Пошук фармакофора
  5. Пошук по структурам Маркуша

Software для роботи з базами даних хімічних структур (зберігання, пошук):

  1. ISIS / Host, ISIS / Base (www.mdli.com)
  2. ChemFinder, ChemOffice (www.cambridgesoft.com)
  3. JChem (www.chemaxon.com)
  4. THOR (www.daylight.com)
  5. MOE (www.chemcomp.com)
  6. ICM Pro (під mySQL) (www.molsoft.com)
  7. CheD (Сергій Трепалін)
  8. UNITY (www.tripos.com)
  9. OrChem (orchem.sourceforge.net)
  10. Bingo (ggasoftware.com / opensource / bingo)
  11. Pgchem:: tigress (pgfoundry.org / projects / pgchem)

Публічні бази даних, що містять хімічну інформацію:

  1. PubChem (pubchem.ncbi.nlm.nih.gov)
  2. ZINC (zinc.docking.org)
  3. NCI (129.43.27.140/ncidb2)
  4. DrugBank (www.drugbank.ca)
  5. BindingDB (www.bindingdb.org)
  6. DUD (dud.docking.org)
  7. ChemSpider (www.chemspider.com)
  8. ChEMBL (www.ebi.ac.uk)
  9. ChEBI (www.ebi.ac.uk)

5.2. Моделювання властивостей хімічних сполук і матеріалів

Моделювання властивостей хімічних сполук в хемоінформатика засноване на застосуванні методів математичної статистики і машинного навчання для побудови моделей, що дозволяють за описом структур хімічних сполук передбачати їх властивості (фізичні, хімічні, біологічну активність). За моделями, що дозволяють прогнозувати кількісних характеристики біологічної активності, історично закріпилося англомовне назва Quantitative Structure-Activity Relationship (QSAR). Абревіатура QSAR часто трактується розширено для позначення будь-яких моделей структура-властивість.


5.3. Фармакофори і фармакофорні пошук

Фармакофор - це набір просторових та електронних ознак, необхідних для забезпечення оптимальних супрамолекулярних взаємодій зі специфічною біологічною мішенню, які можуть викликати (або блокувати) її біологічний відповідь. При фармакофорні пошуку проводиться пошук відповідності між описом фармакофора і характеристиками молекул з бази даних, що знаходяться в допустимих конформаціях.

5.4. Молекулярне подобу і пошук по молекулярному подобою

Молекулярне подібність (або хімічне подобу, chemical similarity) - це близькість, подібність, подібність структур хімічних сполук. В якості кількісної міри молекулярного подібності часто розглядається величина, зростаюче зі зменшенням відстані між хімічними сполуками в дескрипторної просторі. Пошук за хімічним подобою заснований на припущенні про те, що подібні сполуки мають подібної біологічною активністю.


5.5. Віртуальний скринінг

Віртуальний скринінг - це обчислювальна процедура, яка включає автоматизований перегляд бази даних хімічних сполук і відбір тих з них, для яких прогнозується наявність бажаних властивостей. Найчастіше віртуальний скринінг застосовується при розробці нових лікарських препаратів для пошуку хімічних сполук, що володіють потрібним видом біологічної активності.

5.6. Комп'ютерний синтез

Комп'ютерний синтез - область хемоінформатика, що охоплює методи, алгоритми і реалізують їх комп'ютерні програми, які надають допомогу хіміку в плануванні синтезу органічних сполук, прогнозуванні результатів і дизайні нових типів органічних реакцій на основі узагальнення даних по відомим синтетичним перетворенням.

5.7. Візуалізація та дослідження хімічного простору

Однією з центральних завдань хемоінформатика є візуалізація і складання карт хімічного простору, навігація і виявлення недосліджених зон в ньому [7]. Аналіз хімічного простору зазвичай буває заснований або на представленні хімічних об'єктів (структур і реакцій) у вигляді векторів дескрипторів фіксованого розміру, або на описі хімічних об'єктів за допомогою молекулярних графів. В останньому випадку для подання хімічного простору часто використовуються дерева молекулярних кістяків.


6. Наукові журнали


Примітки

  1. 1 2 FK Brown (1998). "Chapter 35. Chemoinformatics: What is it and How does it Impact Drug Discovery". Annual Reports in Med. Chem. 33: 375. DOI : 10.1016/S0065-7743 (08) 61100-8 - dx.doi.org/10.1016/S0065-7743 (08) 61100-8.
  2. 1 2 Brown, Frank (2005). "Editorial Opinion: Chemoinformatics - a ten year update". Current Opinion in Drug Discovery & Development 8 (3): 296-302.
  3. 1 2 Gasteiger J. (Editor), Engel T. (Editor): Chemoinformatics: A Textbook. John Wiley & Sons, 2004, ISBN 3-527-30681-1
  4. 1 2 Gasteiger, Johann (ed.) Handbook of Chemoinformatics. From Data to Knowledge. Wiley-VCH, Weinheim, 2003, in 4 volumes, ISBN 3-527-30680-3
  5. 1 2 Varnek A., Tropsha, A. Chemoinformatics Approaches to Virtual Screening, RSCPublishing, 2008, ISBN 978-0-85404-144-2
  6. Varnek, A. Chemoinformatics: recognition through teaching. Presented at 235th ACS National Meeting. New Orleans, Louisiana, April 6-10, 2008
  7. 1 2 3 Alexandre Varnek and Igor Baskin (2011). "Chemoinformatics as a Theoretical Chemistry Discipline". Molecular Informatics 30 (1): 20-32.
  8. Декларація Оберне - infochim.u-strasbg.fr/chemoinformatics/Obernai Declaration.pdf
  9. AR Leach, VJ Gillet: An Introduction to Chemoinformatics. Springer, 2003, ISBN 1-4020-1347-7
  10. J. Bajorath, Chemoinformatics: Concepts, Methods, and Tools for Drug Discovery, Humana Press: Totowa, New Jersey, 2004, ISBN 1-58829-261-4
  11. TI Oprea, Chemoinformatics in Drug Discovery, Wiley-VCH, 2005, ISBN 3-527-30753-2

Цей текст може містити помилки.

Схожі роботи | скачати
© Усі права захищені
написати до нас
Рейтинг@Mail.ru