Знаймо

Додати знання

приховати рекламу

Цей текст може містити помилки.

Біоінформатика



План:


Введення

Біоінформатика

  1. математичні методи комп'ютерного аналізу в порівняльної геноміки (геномна біоінформатика).
  2. розробка алгоритмів і програм для передбачення просторової структури білків ( структурна біоінформатика).
  3. дослідження стратегій, відповідних обчислювальних методологій, а також загальне управління інформаційної складності біологічних систем [1].

У біоінформатики використовуються методи прикладної математики, статистики та інформатики. Біоінформатика використовується в біохімії, біофізиці, екології та в інших областях.



1. Основні області досліджень

1.1. Аналіз генетичних послідовностей

Обробка гігантської кількості даних, одержуваних при секвенування, є однією з найважливіших задач біоінформатики

C тих пір як в 1977 був секвенований фаг Phi-X174, послідовності ДНК все більшого числа організмів були дешифровані і збережені в базах даних. Ці дані використовуються для визначення послідовностей білків і регуляторних ділянок. Порівняння генів в рамках одного або різних видів може продемонструвати схожість функцій білків або відношення між видами (таким чином можуть бути складені Філогенетичні дерева). Із зростанням кількості даних вже давно стало неможливим вручну аналізувати послідовності. У наші дні для пошуку по геномам тисяч організмів, що складаються з мільярдів пар нуклеотидів використовуються комп'ютерні програми. Програми можуть однозначно зіставити ( вирівняти) схожі послідовності ДНК в геномах різних видів; часто такі послідовності несуть схожі функції, а відмінності виникають в результаті дрібних мутацій, таких як заміни окремих нуклеотидів, вставки нуклеотидів, і їх "випадання" (делеції). Один з варіантів такого вирівнювання застосовується при самому процесі секвенування. Так звана техніка " дробового секвенування (яка була, наприклад, використана Інститутом генетичних досліджень для секвенування першого бактеріального генома, Haemophilus influenzae) замість повної послідовності нуклеотидів дає послідовності коротких фрагментів ДНК (кожен завдовжки близько 600-800 нуклеотидів). Кінці фрагментів накладаються один на одного і, суміщені належним чином, дають повний геном. Такий метод швидко дає результати секвенування, але збірка фрагментів може бути досить складним завданням для великих геномів. У проекті по расшіфроке генома людини збірка зайняла декілька місяців комп'ютерного часу. Зараз цей метод застосовується для практично всіх геномів, і алгоритми збірки геномів є однією з найгостріших проблем біоінформатики на сьогоднішній момент.

Іншим прикладом застосування комп'ютерного аналізу послідовностей є автоматичний пошук генів і регуляторних послідовностей в геномі. Не всі нуклеотиди в геномі використовуються для завдання послідовностей білків. Наприклад, в геномах вищих організмів, великі сегменти ДНК явно не кодують білки і їх функціональна роль невідома. Розробка алгоритмів виявлення кодують білки ділянок геному є важливим завданням сучасної біоінформатики.

Біоінформатика допомагає зв'язати геномні та протеомні проекти, наприклад, допомагаючи у використанні послідовності ДНК для ідентифікації білків.


1.2. Анотація геномів

У контексті геноміки анотація - процес маркіровки генів і інших об'єктів в послідовності ДНК. Перша програмна система анотації геномів була створена в 1995 Оуеном Вайтом ( англ. Owen White ), Що працювали в команді, секвенувати і проаналізували перший декодований геном свободноживущее організму, бактерії Haemophilus influenzae. Доктор Вайт побудував систему для знаходження генів, тРНК і інших об'єктів ДНК і зробив перші позначення функцій цих генів. Більшість сучасних систем працюють схожим чином, але ці програми постійно розвиваються і поліпшуються.


1.3. Обчислювальна еволюційна біологія

Еволюційна біологія досліджує походження і появу видів, також як їх розвиток з плином часу. Інформатика допомагає еволюційним біологам в декількох аспектах:

  • вивчати еволюцію великого числа організмів, вимірюючи зміни в їх ДНК, а не тільки в будівлі або фізіології;
  • порівнювати цілі геноми (див. BLAST), що дозволяє вивчати більш комплексні еволюційні події, такі як: дуплікація генів, латеральний перенесення генів, і пророкувати бактеріальні спеціалізуються фактори;
  • будувати комп'ютерні моделі популяцій, щоб передбачити поведінку системи в часі;
  • відстежувати появу публікацій, що містять інформацію про велику кількість видів.

Область в комп'ютерних науках, яка використовує генетичні алгоритми, часто плутають з комп'ютерною еволюційної біологією. Робота в цій області використовує спеціалізоване програмне забезпечення для поліпшення алгоритмів і обчислень і грунтується на еволюційних принципах, таких, як реплікація, диверсифікацію через рекомбінацію або мутації, і виживання в природному відборі.


1.4. Оцінка біологічного різноманіття

Біологічне різноманіття екосистеми може бути визначено як повна генетична сукупність певного середовища, що складається з усіх що живуть видів, була б це біоплівка в покинутій шахті, крапля морської води, жменя землі або вся біосфера планети Земля. Для збору видових імен, описів, ареалу розповсюдження, генетичної інформації використовуються бази даних. Спеціалізоване програмне забезпечення застосовується для пошуку, візуалізації та аналізу інформації, і, що більш важливо, надання її іншим людям. Комп'ютерні симулятори моделюють такі речі, як популяційна динаміка, або обчислюють загальне генетичне здоров'я культури в агрономії. Один з найважливіших потенціалів цієї області полягає в аналізі послідовностей ДНК або повних геномів цілих вимираючих видів, дозволяючи запам'ятати результати генетичного експерименту природи в комп'ютері і можливо використовувати знову в майбутньому, навіть якщо ці види повністю вимруть.

Часто з області розгляду біоінформатики випадають методи оцінки інших компонентів біорізноманіття - таксонів (в першу чергу видів) і екосистем. В даний час математичні підстави біоінформаційних методів для таксонів представлені в рамках такого наукового напрямку як Фенетіка, чи чисельна таксономія. Методи аналізу структури екосистем розглядаються фахівцями таких напрямків як системна екологія, біоценометрія.


1.5. Основні біоінформаційні програми

  • ACT (Artemis Comparison Tool) - геномної аналіз
  • Arlequin - аналіз популяційно-генетичних даних
  • BioEdit - редактор множинного вирівнювання нуклеотидних і амінокислотних послідовностей
  • BioNumerics - комерційний універсальний пакет програм
  • BLAST - пошук споріднених послідовностей в базі даних нуклеотидних і амінокислотних послідовностей
  • ClustalW - множинне вирівнювання нуклеотидних і амінокислотних послідовностей
  • ClustalX - множинне вирівнювання нуклеотидних і амінокислотних послідовностей
  • DnaSP - аналіз поліморфізму послідовностей ДНК
  • FigTree - редактор філогенетичних дерев
  • Genepop - популяційно-генетичний аналіз
  • Genetix - популяційно-генетичний аналіз (програма доступна тільки французькою мовою)
  • JalView - редактор множинного вирівнювання нуклеотидних і амінокислотних послідовностей
  • MacClade - комерційна програма для інтерктівного еволюційного аналізу даних
  • MEGA - молекулярно-генетичний аналіз еволюційний
  • Mesquite - програма для порівняльної біології на мові Java
  • Muscle - множинне порівняння нуклеотидних і амінокислотних послідовностей. Більш швидка і точна в порівнянні з ClustalW
  • PAUP - філогенетичний аналіз з використанням методу парсімоніі (та інших методів)
  • PHYLIP - пакет філогенетичних програм
  • Phylo_win - філогенетичний аналіз. Програма має графічний інтерфейс.
  • PopGene - аналіз генетичної різноманітності популяцій
  • Populations - популяційно-генетичний аналіз
  • PSI Protein Classifier - узагальнення результатів, отриманих за допомогою програми PSI-BLAST
  • Seaview - філогенетичний аналіз (з графічним інтерфейсом)
  • Sequin - депонування послідовностей в GenBank, EMBL, DDBJ
  • SplitsTree
  • T-Coffee - множинне прогресивне вирівнювання нуклеотидних і амінокислотних послідовностей. Більше чутлива, ніж у ClustalW / ClustalX.
  • UGENE - вільний російськомовний інструмент, множинне вирівнювання нуклеотидних і амінокислотних послідовностей, філогенетичний аналіз, анотування, робота з базами даних.

2. Біоінформатика і обчислювальна біологія

Під біоінформатики розуміють будь-яке використання комп'ютерів для обробки біологічної інформації. На практиці, іноді це визначення більш вузьке, під ним розуміють використання комп'ютерів для обробки експериментальних даних по структурі біологічних макромолекул ( білків і нуклеїнових кислот) з метою одержання біологічно значущої інформації. У світлі зміни шифру наукових спеціальностей (03.00.28 "Біоінформатика" перетворилася на 03.01.09 "Математична біологія, біоінформатика") поле терміну "біоінформатика" розширилося і включає всі реалізації математичних алгоритмів, пов'язаних з біологічними об'єктами.

Терміни біоінформатика і " обчислювальна біологія "часто вживаються як синоніми, хоча останній частіше вказує на розробку алгоритмів і конкретні обчислювальні методи. Вважається, що не всяке використання обчислювальних методів в біології є біоінформатики, наприклад, математичне моделювання біологічних процесів - це не біоінформатика.

Біоінформатика використовує методи прикладної математики, статистики та інформатики. Дослідження в обчислювальної біології нерідко перетинаються з системної біологією. Основні зусилля дослідників в цій галузі спрямовані на вивчення геномів, аналіз і прогноз структури білків, аналіз і прогноз взаємодій молекул білка один з одним та іншими молекулами, а також реконструкція еволюції.

Біоінформатика та її методи використовуються також в біохімії, біофізиці, екології та в інших областях. Основна лінія в проектах біоінформатики - це використання математичних засобів для витягу корисної інформації з "гучних" або занадто об'ємних даних про структуру ДНК і білків, отриманих експериментально.


3. Структурна біоінформатика

До структурної біоінформатики належить розробка алгоритмів і програм для передбачення просторової структури білків. Теми досліджень в структурній біоінформатики:

  • Рентгеноструктурний аналіз (РСА) макромолекул
  • Індикатори якості моделі макромолекули, побудованої за даними РСА
  • Алгоритми обчислення поверхні макромолекули
  • Алгоритми знаходження гідрофобного ядра молекули білка
  • Алгоритми знаходження структурних доменів білків
  • Просторове вирівнювання структур білків
  • Структурні класифікації доменів SCOP і CATH
  • Молекулярна динаміка

Примітки



Цей текст може містити помилки.

Схожі роботи | скачати
© Усі права захищені
написати до нас
Рейтинг@Mail.ru