Функціональна похідна

В математики та теоретичної фізики, функціональна похідна є узагальненням похідної за напрямком. Різниця полягає в тому, що для останньої диференціювання проводиться в напрямку якого-небудь вектора, а для першої мова йде про функції. Обидва ці поняття можна розглядати як узагальнення звичайного диференціального обчислення.

Існують два основні види функціональних похідних, відповідних загальному визначенню похідною Фреше і похідною Гато функції на банаховому просторі. На практиці вони часто не розрізняються.


1. Визначення

Нехай F - Деякий функціонал, тобто функція, визначена на деякій множині функцій. Значення функціонала F на функції \ Phi позначають F [\ phi] . Його похідна Гато (похідна за напрямком) є межа (якщо він існує) вирази \ Lim_ {\ varepsilon \ to 0} \ frac {F [\ phi + \ varepsilon \ delta \ phi] - F [\ phi]} {\ varepsilon} . Тут \ Delta \ phi - Деяка функція з області визначення F . Відзначимо, що така похідна, взагалі кажучи, залежить від вибору функції \ Delta \ phi . У цьому сенсі ситуація цілком аналогічна конечномерное. Наприклад, функція y = | x | дифференцируема в крапці x = 0 праворуч і ліворуч, але ці односторонні похідні різні, а в звичайному сенсі ця функція в 0 не дифференцируема.

Набагато частіше в додатках виникає похідна функціоналу, аналогічна класичній конечномерное похідною і що є окремим випадком похідною Гато. Не даючи загального визначення, розглянемо типовий приклад: пошук екстремуму функціонала на безлічі траєкторій, що проходять через дві задані точки. Така задача виникає при дослідженні задач класичної механіки за допомогою принципу найменшої дії, подібного ж типу задача про знаходження фігури максимальної площі із заданим периметром і т. п.

Нехай функціонал F має інтегральний вид

F [\ phi] = \ int_a ^ b L (\ phi, \ dot \ phi, t) dt

Його першою варіацією називається вираз

\ Delta F = F [\ phi + \ delta \ phi] - F [\ phi]

Якщо вона представима у вигляді

\ Delta F = \ int_a ^ b S (\ phi, \ dot \ phi, t) \ delta \ phi (t) dt

з точністю до величин другого порядку по \ Delta \ phi , То функція S називається функціональної похідної F по \ Phi і позначається \ Frac {\ delta F} {\ delta \ phi} . Функціонал при цьому називають диференційовних.

Конкретно в даній задачі \ Frac {\ delta F} {\ delta \ phi} = \ frac {\ partial L} {\ partial \ phi} - \ frac {d} {dt} \ frac {\ partial L} {\ partial \ dot \ phi } , Але в загальному випадку відповідь суттєво залежить від постановки задачі і граничних умов.


2. Друга варіація

Якщо функціонал диференціюємо, то можна визначити аналог другої похідної (в даному випадку він скоріше аналогічний матриць другого приватних похідних). Розкладаючи повну варіацію \ Delta F до другого порядку по \ Delta \ varphi і відкидаючи величини першого порядку, отримаємо вираз, зване другої варіації функціоналу:

\ Delta ^ 2 F = \ iint \ frac {\ delta ^ 2 F} {\ delta \ varphi \ delta \ varphi ^ \ prime} \ delta \ varphi (x) \ delta \ varphi ^ \ prime (x ^ \ prime) dx dx ^ \ prime

3. Властивості

Функціональна похідна за властивостями аналогічно звичайній. Наприклад:

  • Лінійність. \ Frac {\ delta} {\ delta \ phi} (\ lambda F + \ mu G) = \ lambda \ frac {\ delta F} {\ delta \ phi} + \ mu \ frac {\ delta G} {\ delta \ phi}, \ \ lambda, \ mu \ in \ C
  • Тотожність Лейбніца. \ Frac {\ delta FG} {\ delta \ phi} = \ frac {\ delta F} {\ delta \ phi} G + F \ frac {\ delta G} {\ delta \ phi}
  • Розкладання повної варіації по приватним похідним: \ Delta F [\ phi, \ psi] = \ frac {\ delta F} {\ delta \ phi} \ delta \ phi + \ frac {\ delta F} {\ delta \ psi} \ delta \ psi
  • В точці екстремуму функціонала його похідна дорівнює 0. Точка екстремуму є точкою мінімуму (максимуму), якщо друга варіація - позитивно (негативно) визначена квадратична форма.

і так далі.


4. Приклади

4.1. Ентропія

Інформаційна ентропія дискретної випадкової величини це функціонал функції ймовірності.

\ Begin {align} H [p (x)] = - \ sum_x p (x) \ log p (x) \ end {align}

Тому,

\ Begin {align} \ left \ langle \ frac {\ delta H} {\ delta p}, \ phi \ right \ rangle & {} = \ sum_x \ frac {\ delta H [p (x)]} {\ delta p (x ')} \, \ phi (x') \ \ & {} = \ left. \ Frac {d} {d \ epsilon} H [p (x) + \ epsilon \ phi (x)] \ right | _ {\ epsilon = 0} \ \ & {} = - \ frac {d} {d \ varepsilon} \ left. \ Sum_x [p (x) + \ varepsilon \ phi (x)] \ log [p (x) + \ varepsilon \ phi (x)] \ right | _ {\ varepsilon = 0} \ \ & {} = \ displaystyle - \ sum_x [1 + \ log p (x)] \ phi (x) \ \ & {} = \ left \ langle - [1 + \ log p (x)], \ phi \ right \ rangle. \ End {align}

Тому,

\ Frac {\ delta H} {\ delta p} = - [1 + \ log p (x)].

4.2. Експонента

Нехай

F [\ varphi (x)] = e ^ {\ int \ varphi (x) g (x) dx}.

Використовую в якості пробної функції дельта-функцію,

\ Begin {align} \ frac {\ delta F [\ varphi (x)]} {\ delta \ varphi (y)} & {} = \ lim_ {\ varepsilon \ to 0} \ frac {F [\ varphi (x ) + \ varepsilon \ delta (xy)]-F [\ varphi (x)]} {\ varepsilon} \ \ & {} = \ lim_ {\ varepsilon \ to 0} \ frac {e ^ {\ int (\ varphi (x) + \ varepsilon \ delta (xy)) g (x) dx}-e ^ {\ int \ varphi (x) g (x) dx}} {\ varepsilon} \ \ & {} = e ^ {\ int \ varphi (x) g (x) dx} \ lim_ {\ varepsilon \ to 0} \ frac {e ^ {\ varepsilon \ int \ delta (xy) g (x) dx} -1} {\ varepsilon} \ \ & {} = e ^ {\ int \ varphi (x) g (x) dx} \ lim_ {\ varepsilon \ to 0} \ frac {e ^ {\ varepsilon g (y)} -1} {\ varepsilon} \ \ & {} = e ^ {\ int \ varphi (x) g (x) dx} g (y). \ End {align}

Тому,

\ Frac {\ delta F [\ varphi (x)]} {\ delta \ varphi (y)} = g (y) F [\ varphi (x)].