вход

Оглавление


1.  Основные сведения: механика, теория поля, теория относительности

1.1.  Принцип наименьшего действия

Принцип наименьшего действия -- один из основных современных инструментов для формулировки и теоретического исследования физических теорий и уравнений [33,34].

1.1.1.  Геометрия

Рассмотрим две точки $ A_1$ и $ A_2$ в евклидовом пространстве и семейство кривых $ \{\gamma_{A_1A_2}\}$ с концами в точках $ A_1$ и $ A_2$ . Среди всех кривых этого семейства выделяется одна -- прямолинейный отрезок $ A_1A_2$ , обладающий очевидным экстремальным свойством:

$\displaystyle l[A_1A_2]=\min\limits_{\gamma_{A_1A_2}}l[\gamma_{A_1A_2}],
$

где $ l[\gamma_{A_1A_2}]$ -- евклидова длина кривой $ \gamma_{A_1A_2}.$ В случае гладких кривых эта длина представляется интегралом:

$\displaystyle l[\gamma_{A_1A_2}]=\int\limits_{\gamma_{A_1A_2}}dl=\int\limits_{\...
...{\tau_{A_2}}\sqrt{\dot x_1^2(\tau)+ +\dot x_2^2(\tau)+\dot x_3^2(\tau)} d\tau,$ (54)
где в последнем равенстве использовано параметрическое представление кривой $ \gamma_{A_1A_2}$ с помощью тройки декартовых координат $ x_1,x_2,x_3,$ рассматриваемых как функции параметра $ \tau$ (координата на кривой), и инфинитиземальный (дифференциально-геометрический) вид теоремы Пифагора: $ dl^2=dx_1^2+dx_2^2+dx_3^2$ . Точка обозначает дифференцирование по параметру $ \tau.$ Обратим внимание на характерную зависимость длины от кривой: кривая задается набором функций, а длина, вычисляемая с помощью интеграла (54), есть неотрицательное число. Таким образом, длину можно рассматривать как "функцию на множестве функций". Такого рода зависимости в математике называют функционалами. Использование квадратных скобок для аргумента функционала вместо круглых, как у обычной функции, служит для напоминания особой природы функционала. Другими важными примерами функционалов, которые встречаются в физике, являются: масса, заряд, энергия, импульс, действие (см. ниже) и другие.

Для аналитического исследования экстремальных свойств функционалов применяется функциональное обобщение идей и методов математического анализа -- вариационное исчисление. Как известно, необходимым условием локального экстремума гладкой функции9 $ \phi(x)$ является обращение в нуль ее дифференциала:

$\displaystyle d\phi=0.$ (55)
Этому условию можно придать наглядный геометрический смысл (см. рис. [перейти]), если записать его несколько по иному:

$\displaystyle \frac{d}{d\lambda}\phi(x+\lambda\xi)\vert _{\lambda=0} \vrule height0pt depth15pt width0pt =(\xi\cdot\nabla)\phi(x)=0,$ (56)
где $ \xi$ -- произвольный вектор, начинающийся из точки $ x,$ $ \lambda$ -- параметр (координата вдоль направления $ \xi$ ), $ \nabla$ -- дифференциальный оператор, состоящий из частных производных по координатам $ x.$ Функциональным обобщением условий (55)-(56), записанные, к примеру, для функционала длины, являются следующие выражения:

$\displaystyle \delta l=0$ (57)
или

$\displaystyle \frac{d}{d\lambda}l[x(\tau)+\lambda\xi(\tau)]\vert _{\lambda=0} \vrule height0pt depth15pt width0pt =0,$ (58)
где символ $ \delta$ обозначает функциональный вариант дифференциала, называемый вариацией, $ \xi(\tau)$ -- произвольная вектор-функция, задающая вариацию кривой, иногда обозначаемая $ \delta x(\tau).$ Смысл выражений (57)-(58) остается прежним: значение функционала на экстремальной кривой (или, в общем случае, функции из области определения) не изменяются, если экстремальную кривую "немного пошевелить", т.е. заменить на близкую кривую. Рис. [перейти] иллюстрирует это свойство.

Соотношение вида (57) используют для краткой записи условий экстремума, а соотношения вида (58) -- для вычисления его явного вида в конкретных случаях. Рассмотрим в качестве примера задачу об экстремуме функционала вида:

$\displaystyle F[x(\tau)]=\int\limits_{\tau_1}^{\tau_2}f(\dot x)  d\tau,
$

где $ f$ -- произвольная дифференцируемая функция трех переменных $ \dot x_1,\dot x_2,\dot x_3.$ Будем полагать при этом, что экстремум отыскивается среди кривых с фиксированными концами: $ x(\tau_1)=X_1=$const$ , x(\tau_2)=X_2=$const$ .$ Используя стандартные сведения из анализа, получаем:

$\displaystyle F[x(\tau)+\lambda\xi(\tau)]=\int\limits_{\tau_1}^{\tau_2}f(\dot x...
...u_1}^{\tau_2} \frac{\partial f}{\partial \dot x_i}\dot\xi_i  d\tau+o(\lambda),$ (59)
Здесь и далее мы используем полезное сокращенное обозначение для суммирования по повторяющимся индексам (правило суммирования Эйнштейна): $ a_ib_i\equiv\sum_{i=1}^Na_ib_i,$ где $ N$ -- число компонент величин $ a$ и $ b.$ Выполняя во втором слагаемом правой части (60) стандартное интегрирование по частям, приходим к следующему выражению для этого слагаемого:

$\displaystyle \lambda\int\limits_{\tau_1}^{\tau_2} \frac{\partial f}{\partial \...
... \frac{d}{d\tau}\left(\frac{\partial f}{\partial \dot x_i}\right)\xi_i  d\tau.$ (60)
Явное вычисление первого слагаемого в правой части (60) (первообразная полной производной), приводит к выражению:

$\displaystyle \lambda\left(\left.\frac{\partial f}{\partial \dot x_i}\xi_i\righ...
...ft.\frac{\partial f}{\partial \dot x_i}\xi_i\right\vert _{\tau=\tau_1}\right),
$

которое обращается в нуль ввиду условия фиксации конечных точек $ \xi(\tau_1)=\xi(\tau_2)=0$ (конечные точки кривых, среди которых отыскивается экстремаль, не варьируются). Подставляя оставшееся выражение из (60) в (59), а затем (59) в (58) и выполняя дифференцирование по параметру $ \lambda,$ приходим к необходимому условию экстремума в виде:

$\displaystyle \delta F=-\int\limits_{\tau_1}^{\tau_2} \frac{d}{d\tau}\left(\frac{\partial f}{\partial \dot x_i}\right)\xi_i  d\tau=0$ (61)
Ввиду произвольности, взаимной независимости и непрерывности вариаций $ \xi_i,$ обращение в нуль интеграла (61) эквивалентно условиям:

$\displaystyle \frac{d}{d\tau}\left(\frac{\partial f}{\partial \dot x_i}\right)=0,\quad i=1,2,3,$ (62)
представляющим собой систему дифференциальных уравнений второго порядка. За исключением нескольких особых случаев (например, когда функция $ f$ линейна по всем аргументам или по их части) ее полными интегралами являются линейные функции: $ x_i(\tau)=\alpha_i\tau+\beta_i,$ где $ \alpha_i,\beta_i$ -- константы интегрирования, определяемые из дополнительных условий. В частности, для функционала длины (54), у которого $ f=\sqrt{\dot x_1^2+\dot x_2^2+\dot x_3^2},$ мы можем интерпретировать полученный результат как экстремальное свойство прямых. При этом константы интегрирования, входящие в параметрические уравнения семейства прямых, определятся из условий $ x(\tau_1)=X_1,$ $ x(\tau_2)=X_2.$

1.1.2.  Механика

Отметим, что условие экстремума функционалов в виде интегралов от функции $ f=f(x,\dot x,\tau)$ более общего вида, чем рассмотренный нами в примере предыдущего раздела, как нетрудно убедиться, также приводит к системам обыкновенных дифференциальных уравнений второго порядка. Это обстоятельство является ключевым для вариационной формулировки законов классической механики Ньютона. Применение вариационных методов в механике основано на следующих наблюдениях и гипотезах, которые можно сделать на основе результатов предыдущего раздела.

  1. (Наблюдение 1). Условие экстремальности функционала вида

    $\displaystyle F[x]=\int\limits_{\tau_1}^{\tau_2}f(x,\dot x,\tau) d\tau$ (63)
    имеет вид системы дифференциальных уравнений второго порядка, т.е. соответствует структуре уравнений ньютоновской динамики.
  2. (Гипотеза 1) Для каждой механической системы $ N$ материальных точек с начальным состоянием $ x(t_1)=X_1$ и конечным состоянием $ x(t_2)=X_2$ (здесь $ x=\{x_1,\dots x_{3N}\}$ -- набор декартовых координат всех $ N$ точек, $ t$ -- абсолютное время механики Ньютона) существует "физическое расстояние" $ \mathcal{A}$ , зависящее от способа эволюции системы из $ X_1$ в $ X_2,$ которое минимально, когда система эволюционирует в соответствии с уравнениями ньютоновской динамики. Это "физическое расстояние" называется действием (action (англ.)) механической системы. Функцию $ f,$ определяющую функционал $ \mathcal{A}$ и его свойства, называют функцией Лагранжа механической системы и традиционно в физике обозначают $ L$ . Другими словами, вариационная формулировка законов механики предполагает существование функционала действия

    $\displaystyle \mathcal{A}[x]=\int\limits_{t_1}^{t_2}L(x,\dot x,t)  dt
\vrule height0pt depth15pt width0pt
$

    вида (63), условие экстремальности которого влечет справедливость уравнений ньютоновской динамики:

    $\displaystyle \delta\mathcal{A}=0\Rightarrow$   уравнения динамики Ньютона (64)
  3. (Наблюдение 2) Экстремалями функционала (63) с функцией $ f,$ зависящей только от производных $ \dot x,$ являются прямые.
  4. (Гипотеза 2) Функция Лагранжа свободных частиц имеет вид $ L_0=L_0(\dot x).$
Дальнейшая конкретизация вида механического действия с учетом принципа относительности Галилея, соображений аддитивности и соответствия уравнениям механики Ньютона (64) приводит к его следующему выражению:

$\displaystyle \mathcal{A}[x]=\int\limits_{t_1}^{t_2}(T-U)  d\tau, \vrule height0pt depth15pt width0pt$ (65)
где

$\displaystyle T=\sum\limits_{i=1}^N\frac{m_i \dot{\vec x}_i^2}{2}$ (66)
-- полная кинетическая энергия системы частиц ($ m_i$ -- масса $ i$ -ой точки, $ \vec x_i$ -- радиус-вектор положения $ i$ -ой частицы), $ U=U(x)$ -- потенциальная энергия этой системы, связанная с равнодействующей $ \vec F_i$ сил, действующих на $ i$ -ую точку соотношением:

$\displaystyle \vec F_i=-\frac{\partial U}{\partial\vec x_i}. \vrule height0pt depth15pt width0pt$ (67)
Здесь и далее производная по вектору понимается как совокупность частных производных по его компонентам. Вычисления по формуле (58), аналогичные проведенным в предыдущем разделе, приводят к условиям экстремума следующего вида:

$\displaystyle \frac{\partial L}{\partial \vec x_i}-\frac{d}{dt}\left(\frac{\partial L}{\partial \dot{\vec x}}\right)=0,$ (68)
называемым в механике уравнениями Эйлера-Лагранжа. Уравнения Эйлера-Лагранжа для действия (65) с учетом определения потенциальной энергии (67) принимают, как и требуется, вид уравнений динамики Ньютона:

$\displaystyle m_i\ddot{\vec{x}}_i=\vec F_i.$ (69)

Приведем в качестве важного примера действие и соответствующие уравнения Эйлера-Лагранжа для системы одинаковых частиц, попарно взаимодействующих посредством силы, обратно пропорциональной квадрату мгновенного расстояния между ними:

$\displaystyle \mathcal{A}[x]= \vrule height0pt depth15pt width0pt \int\limits_{...
...}_i^2 -\alpha\sum\limits_{i<j}\frac{1}{\vert\vec x_i-\vec x_j\vert}\right) dt;$ (70)

$\displaystyle \ddot{\vec x}_i=\frac{\alpha}{m}\sum\limits_{j\neq i}\frac{\vec x_i-\vec x_j}{\vert\vec x_i-\vec x_j\vert^3}.$ (71)
Здесь $ m$ -- одинаковая для всех частиц масса, $ \alpha$ -- одинаковая для всех пар частиц константа взаимодействия (случай $ \alpha>0$ описывает отталкивание, $ \alpha<0$ -- притяжение), $ \vert\vec x_i-\vec x_j\vert=\sqrt{(\vec x_i-\vec x_j)\cdot(\vec x_i-\vec x_j)}$ -- расстояние между $ i$ -ой и $ j$ -ой частицей. В правой части (71) стоит сумма удельных (т.е. приходящихся на единицу массы) сил кулоновского типа, действующих на $ i$ -ую частицу со стороны всех остальных окружающих ее частиц.

1.1.3.  Теория поля

Необходимость перехода к полевому описанию физических систем возникает уже в рамках классической механики при рассмотрении сплошной среды. Возникающие при этом поля (смещений, скоростей, деформаций, напряжений и т.д.) можно рассматривать как способ описания механической системы с бесконечным (даже континуальным) числом степеней свободы. Вариационная формулировка теории механических полей строится по образу и подобию вариационной формулировки механики системы материальных точек, за исключением нескольких специфических и общих для любой теории поля нюансов.

  1. Вместо функции Лагранжа $ L$ при полевом описании необходимо использовать ее пространственную плотность $ \mathcal{L},$ которая для полей механического происхождения имеет знакомую структуру: $ \mathcal{L}=\mathcal{T}-\mathcal{U},$ где $ \mathcal{T}$ -- плотность кинетической энергии, $ \mathcal{U}$ -- плотность потенциальной энергии. Эта плотность называется в теории поля лагранжианом. Если $ u(t,x)$ -- рассматриваемое поле, то лагранжиан в данной точке обычно зависит от значений поля в этой точке и совокупности всех его производных в этой точке, что мы будем отмечать с помощью символической записи $ \mathcal{L}=\mathcal{L}(u(t,x),\partial u(t,x)),$ где $ \partial u(t,x)$ -- совокупность всех частных производных поля $ u$ в рассматриваемой точке. Теории поля с лагранжианом, удовлетворяющим этому свойству, называются локальными. Именно это свойство позволяет истолковать в духе концепции близкодействия те взаимодействия, которые описывают посредством локальной теории поля. Теории поля, в которых лагранжиан в некоторой точке зависит от значений поля или его производных, взятых в разных точках, называются нелокальными. Небольшой существующий интерес к нелокальным теориям поля в основном обусловлен попытками решения некоторых парадоксов квантовой механики.
  2. Действие полевой системы необходимо распространить на 4-мерную пространственно-временную область $ \Omega=T\times \mathcal{V},$ где $ T$ -- интервал на вещественной оси времени, $ \mathcal{V}$ -- область 3-мерного евклидова пространства, в которой рассматривается полевая динамика. Таким образом, полевое действие имеет вид:

    $\displaystyle \mathcal{A}[u(t,x)]=\int\limits_{\Omega}\mathcal{L}(u,\partial u)  d^4x,$ (72)
    где $ d^4x=dt  dV$ -- формальный элемент 4-объема.
  3. Граничные условия, необходимые для зануления граничных слагаемых, возникающих в процессе вычислений по формуле (58) при интегрировании по частям, теперь принимают вид:

    $\displaystyle \delta u\vert _{\partial\Omega}=0
$

    -- обращения в нуль вариации на границе $ \partial\Omega$ области интегрирования.

Условия экстремума действия (72) принимают в теории поля вид полевых уравнений Эйлера-Лагранжа:

$\displaystyle \frac{\partial L}{\partial u_i}-\frac{\partial}{\partial x_\alpha...
...(\frac{\partial\mathcal{L}}{\partial(\partial u_i/\partial x_\alpha)}\right)=0.$ (73)
Здесь $ u_i$ -- $ i$ -ая компонента поля. В практически важных случаях эти уравнения представляют собой систему дифференциальных уравнений в частных производных второго порядка.

Рассмотрим несколько примеров.

  1. Пусть $ u(t,x)$ -- поле поперечных деформационных смещений однородной упругой струны ($ x$ -- координата вдоль струны), которая имеет натяжение $ T,$ линейную плотность $ \rho$ и на которую действует распределенная поперечная сила с линейной плотностью $ f(t,x)$ . Лагранжиан такой системы имеет вид:

    $\displaystyle \mathcal{L}_1=\frac{\rho}{2}\dot u^2-\frac{T}{2}{u'}^2+ fu.$ (74)
    Уравнение Эйлера-Лагранжа (73) для системы с таким лагранжианом принимают вид неоднородного волнового уравнения:

    $\displaystyle \Box^1_{c_0}u=f/\rho,$ (75)
    где

    $\displaystyle \Box_{c_0}\equiv\frac{1}{c_0^2}\frac{\partial^2}{\partial t^2}-\frac{\partial^2}{\partial x^2}
$

    -- 1-мерный волновой оператор, $ c_0=\sqrt{T/\rho}$ -- скорость распространения поперечных волн на струне.
  2. Пусть $ \varphi(x)$ -- статический электрический потенциал, создаваемый системой зарядов, распределенных в 3-мерном пространстве с объемной плотностью $ \rho(x).$ Лагранжиан такой системы имеет вид:

    $\displaystyle \mathcal{L}_2=\frac{1}{8\pi}(\nabla\varphi)^2-\rho\varphi.$ (76)
    Отметим, что первое слагаемое имеет смысл плотности энергии электростатического поля ( $ W=\vec E^2/8\pi,$ где $ \vec E=-\nabla\varphi$ ), второе -- плотности энергии взаимодействия этого поля с зарядами, которые его создают. Уравнения Эйлера-Лагранжа (73) принимают в рассматриваемом случае вид основного уравнения электростатики:

    $\displaystyle \Delta\varphi=-4\pi\rho$ (77)
    -- уравнения Пуассона.
  3. Для вариационной формулировки уравнений электродинамики Максвелла, необходимо определить напряженности электрического и магнитного полей через потенциалы по формулам [9]:

    $\displaystyle \vec E=-\nabla\varphi-\frac{1}{c}\frac{\partial A}{\partial t}; \vrule height0pt depth15pt width0pt \quad\vec B=\mathop{\mathrm{rot}}\vec A,$ (78)
    где $ \varphi$ и $ \vec A$ -- скалярный и векторный потенциалы соответственно, $ c$ -- скорость света в вакууме, $ \mathop{\mathrm{rot}}A=\nabla\times \vec A$ -- ротор векторного поля $ \vec A$ . Отметим, что в случае электростатики можно положить $ \vec A=0$ и вторая формула в (78) переходит в обычное условие потенциальности электрического поля. Лагранжиан электромагнитного поля, порождаемого плотностью заряда $ \rho(t,x)$ и плотностью тока $ \vec j(t,x)$ имеет вид:

    $\displaystyle \mathcal{L}_3=\frac{1}{8\pi}\left((\nabla\varphi)^2+ \left(\frac{...
...rtial t} -(\text{rot}\vec A)^2\right)-\rho\varphi+\frac{1}{c}\vec j\cdot\vec A.$ (79)
    Отметим, что при $ \vec A=0$ он переходит в лагранжиан $ \mathcal{L}_2$ предыдущего случая. Уравнения Эйлера-Лагранжа (58) в рассматриваемом случае принимают вид пары уравнений Максвелла: уравнения (77) и уравнения

    $\displaystyle \Box\vec A+\nabla($div$\displaystyle \vec A)+ \vrule height0pt depth15pt width0pt \frac{1}{c}\frac{\partial}{\partial t}\nabla\varphi=\frac{4\pi}{c}\vec j,$ (80)
    где div$ \vec A=\nabla\cdot\vec A$ -- дивергенция векторного поля, $ \Box\equiv\Box_c^3$ -- релятивистский волновой оператор. Отметим, что на языке напряженностей эти уравнения имеют более привычный вид теоремы Гаусса и закона Эрстеда в дифференциальной формулировке:

    div$\displaystyle \vec E=4\pi\rho;$   rot$\displaystyle \vec B=\frac{1}{c}\frac{\partial\vec E}{\partial t}+\frac{4\pi}{c}\vec j.$ (81)
    Вторая пара уравнений:

    rot$\displaystyle \vec E=-\frac{1}{c}\frac{\partial \vec B}{\partial t};$   div$\displaystyle \vec B=0$ (82)
    выполняется тождественно в силу определения (78) и тождеств div$  $rot$ \equiv0$ и rot$  $grad$ =0.$
  4. Рассмотрим вещественное скалярное поле $ \varphi(x)$ , описываемое лагранжианом

    $\displaystyle \mathcal{L}_4=\frac{1}{2}\left(\frac{1}{c^2}\left(\frac{\partial\phi}{\partial t}\right)^2 -(\nabla\varphi)^2-\frac{m^2c^2}{h^2}\phi^2\right).$ (83)
    Здесь $ h$ -- постоянная Планка, $ m$ -- параметр массы. Скалярное поле с таким лагранжианом возникает в приложениях теории поля к физике элементарных частиц. Уравнения Эйлера-Лагранжа (58) этого поля имеют вид:

    $\displaystyle \left(\Box+\frac{m^2c^2}{h^2}\right)\phi=0$ (84)
    -- релятивистского уравнения Клейна-Гордона-Фока и описывают поведение релятивистской скалярной частицы с массой покоя $ m$ [35].

1.2.  Дельта-функция и функции Грина

На ранних этапах развития современных полевых концепций существовал некоторый разрыв в описании сосредоточенных объектов, типа точечных масс, зарядов и т.д. и распределенных в пространстве и времени величин. Если, к примеру, плотность заряда понимать как предел:

$\displaystyle \rho(x)=\lim\limits_{\Delta V(x)\to0}\frac{\Delta Q}{\Delta V(x)},$ (85)
где $ \Delta Q$ -- заряд, заключенный внутри объема $ \Delta V(x),$ стягивающегося в процессе предельного перехода к точке $ x,$ то в случае точечного заряда, находящегося в точке $ x,$ такого предела не существует. Точнее говоря, не существует функции в ее классическом смысле, к которой стремится отношение под знаком предела в (85). Оказывается, как показали Соболев и Шварц в 30-е годы XXв., можно расширить понятие функции таким образом, чтобы сингулярные зависимости можно было рассматривать в определенном смысле на равных правах с обычными функциями. Такое расширение, включающее в себя соответствующие обобщения понятий и теорем классического математического анализа получило название теории обобщенных функций. Эта математическая теория является неотъемлемой технической частью современной квантовой теории поля [].

Классическим (и, в определенном смысле, основным) примером сингулярной функции является т.н. $ \delta$ -функция Дирака. Пусть на отрезке $ L_1=[-1/2;1/2]$ вещественной прямой равномерно распределен единичный заряд с плотностью $ \rho_1=1,$ а на остальной части прямой заряды отсутствуют. Рассмотрим последовательн ость отрезков $ L_n=[-1/2^n;1/2^n]$ и последовательность соответствующих плотностей $ \rho_n=2^{n-1}.$ Последовательность $ L_n$ стягивается к точке $ x=0$ при $ n\to\infty,$ а последовательность $ \rho_n$ неограниченно возрастает. При этом, как нетрудно проверить непосредственным вычислением, полный заряд распределения с любым номером $ n$ остается постоянным и равным 1:

$\displaystyle Q=\int\limits_{-\infty}^{+\infty}\rho_n  dx=1
$

(функцию плотности заряда мы рассматриваем определенной на всей вещественной оси, поэтому пределы интегрирования бесконечные). Поместим теперь наши распределения зарядов во внешнее поле с потенциалом $ \varphi(x)$ и подсчитаем энергию его взаимодействия с $ n$ -ым распределением. Имеем

$\displaystyle W_n=\int\limits_{-\infty}^{+\infty}\varphi(x)\rho_n  dx=\int\limits_{-1/2^n}^{1/2^n}\varphi(x)
2^{n-1}  dx=\varphi(a_n).
$

Здесь для получения последнего равенства мы применили формулу среднего значения, при этом точка $ a_n\in L_n.$ Переходя к пределу при $ n\to\infty$ и вводя обозначение $ \rho_\infty=\delta(x)$ получаем из предыдущего выражения стандартную формулу для энергии взаимодействия внешнего поля с единичным точечным зарядом, помещенным в точке $ x=0$ :

$\displaystyle \int\limits_{-\infty}^{\infty}\varphi(x)\delta(x)  dx=\varphi(0).$ (86)
В теории обобщенных функций формула (86) рассматривается как определение $ \delta$ -функции Дирака $ \delta(x)$ : при интегрировании произведения $ \delta$ -функции $ \delta(x)$ с любой функцией $ \varphi(x)$ , не имеющей особенностей в точке $ x=0,$ интеграл принимает значение $ \varphi(0).$

Непосредственно из определения (86) вытекают следующие свойства $ \delta$ -функции Дирака:

  1. $ \int\limits_{-\infty}^{+\infty}\delta(x)  dx=1\quad $ (условие нормировки);
  2. $ \int\limits_{-\infty}^{+\infty}\varphi(x)\delta(x-a)  dx=\varphi(a)\quad $ (сдвиг координаты);
  3. $ \delta(ax)=\delta(x)/\vert a\vert\quad $ (изменение масштаба).
В приведенных формулах $ \varphi(x)$ -- произвольная непрерывная функция, $ a$ -- произвольная вещественная константа. Две последние формулы являются частным случаем общего правила функциональной замены переменной в аргументе $ \delta$ -функции:

$\displaystyle \delta(f(x))=\sum\limits_{i}\frac{\delta(x-x_i)}{\vert f'(x_i)\vert},$ (87)
где $ \{x_i\}$ -- совокупность корней уравнения $ f(x_i)=0,$ а $ f$ -- произвольная дифференцируемая функция, не имеющая кратных нулей.

Следует заметить, что обозначение $ \delta(x),$ термин "функция" применяемый к нему, а также свойства $ \delta$ -функции Дирака имеют символический смысл. Придание им точного смысла подразумевают использование $ \delta$ -функции под знаком интеграла в соответствии с определением (86). С точки зрения функционального анализа, $ \delta$ -функцию правильнее называть не функцией, а функционалом (см. определение на стр. [перейти]). Несмотря на практическое удобство символических формул с $ \delta$ -функцией, не следует забывать об ее особой природе. Так, к примеру, выражению $ \delta^2(x)$ уже нельзя придать никакого (даже символического) смысла.

С помощью $ \delta$ -функции Дирака легко записать явные выражения для плотности дискретных распределений. Так, для массы $ m,$ сосредоточенной в точке $ a$ на вещественной прямой имеем линейную плотность:

$\displaystyle \rho(x)=m\delta(x-a).
$

Для массы, сосредоточенной в точке $ (x_0,y_0,z_0)$ 3-мерного пространства:

$\displaystyle \rho(x)=m\delta(x-x_0)\delta(y-y_0)\delta(z-z_0),
$

где смысл произведения $ \delta$ -функций от разных переменных раскрывается с помощью свойства 1 и интегральной формулы:

$\displaystyle \int\limits_{R^3}\rho(x)  dV=m\int\limits_{R^3}\delta(x-x_0)\delta(y-y_0)\delta(z-z_0)  dx dy dz=
$

$\displaystyle \int\limits_{-\infty}^{+\infty}\delta(x-x_0) dx \int\limits_{-\i...
...{+\infty}\delta(y-y_0) dy
\int\limits_{-\infty}^{+\infty}\delta(z-z_0) dz=m.
$

Действие мгновенного источника силы в момент времени $ t=t_0$ в точке $ (x_0,y_0,z_0)$ описывается плотностью импульса:

$\displaystyle s(t,x)=P\delta(t-t_0)\delta(x-x_0)\delta(y-y_0)\delta(z-z_0),
$

где $ P$ -- конечная величина импульса, сообщенная этой силой. Наконец, плотность массы совокупности $ N$ частиц c массами $ m_i,$ движущихся по законам $ \vec r_i(t)$ $ (i=1,\dots,N),$ дается выражением:

$\displaystyle \rho(x)=\sum\limits_{i=1}^Nm_i\delta(\vec r-\vec r_i(t)),
$

где $ \delta(\vec r-\vec r_i(t))\equiv\delta(x-x_i(t))\delta(y-y_i(t))\delta(z-z_i(t)).$

Аппарат обобщенных функций является естественным и эффективным средством решения классических задач математической физики. Такие задачи в физической постановке возникают всякий раз, когда рассматриваемая физическая система описывается физическим полем или совокупностью полей, подчиняющихся линейным дифференциальным уравнениям второго порядка. В частности, все рассмотренные в разделе ([перейти]) примеры полевых системы приводят в конкретных ситуациях к одному из типов задач математической физики.

Рассмотрим линейное дифференциальное уравнение $ m$ -ого порядка в частных производных общего вида:

$\displaystyle Lu=f(x).$ (88)
Здесь $ x=(x_0,x_1,\dots,x_n)$ -- совокупность независимых переменных, $ u(x)$ -- неизвестная функция, $ L$ -- линейный дифференциальный оператор вида:

$\displaystyle L=\sum\limits_{\vert\alpha\vert<m}a_\alpha(x)\frac{\partial^{\vert\alpha\vert}}{\partial x_1^{\alpha_1}\dots\partial x_n^{\alpha_n}},
$

где $ \alpha=(\alpha_0,\alpha_1,\dots,\alpha_n)$ -- мультииндекс, показывающий тип частного дифференцирования в соответствующем слагаемом, $ \vert\alpha\vert=\alpha_0+\alpha_1+\dots+\alpha_n$ -- его порядок, $ a_\alpha(x)$ -- коэффициент уравнения (бесконечно-дифференцируемая функция). Например, дифференциальный оператор релятивистского волнового уравнения описывается следующим набором отличных от нуля коэффициентов ( $ n=3,  x_0=ct$ ):

$\displaystyle a_{(2,0,0,0)}=-a_{(0,2,0,0)}=-a_{(0,0,2,0)}=-a_{(0,0,0,2)}=1,
$

а для уравнения Пуассона набор отличных от нуля коэффициентов таков:

$\displaystyle a_{(0,2,0,0)}=a_{(0,0,2,0)}=a_{(0,0,0,2)}=1.
$

Правая часть уравнения (88) в физических приложениях описывает источники (силы, заряды, токи, нагреватели) соответствующих физических полей. В силу линейности общее решение уравнения (88) имеет вид суммы $ u_0+\bar u$ общего решения $ u_0$ однородного уравнения $ Lu_0=0$ и некоторого частного решения $ \bar u$ неоднородного уравнения $ L\bar u=f.$ Для нахождения констант (точнее, произвольных функций), содержащихся в общем решении неоднородного уравнения, необходимо надлежащим образом задать начально-краевые условия задачи, обычно вытекающие из ее физического контекста. Идея применения аппарата обобщенных функций для решения задач математической физики заключается в следующем. Представим произвольный источник поля $ f(x)$ в виде следующего разложения:

$\displaystyle f(x)=\int\limits_{R^{n+1}}f(\xi)\delta(x-\xi)  d\xi.$ (89)
Здесь

$\displaystyle \xi=(\xi_0,\dots,\xi_n),\quad \delta(x-\xi)=
\delta(x_0-\xi_0)\dots\delta(x_n-\xi_n),\quad d\xi=d\xi_0\dots d\xi_n.
$

Математически формула (89) -- элементарное следствие свойства 2 $ \delta$ -функции. Физически эта формула представляет произвольный источник как суперпозицию (континуальную сумму) точечных источников $ \delta(x-\xi) d\xi$ с амплитудами $ f(\xi).$ В силу линейности уравнения частное решение $ \bar u$ для поля, создаваемого суперпозицией источников $ f=f_1+f_2$ будет равно сумме решений для полей $ \bar u_1$ и $ \bar u_2$ , создаваемых каждым источником по отдельности: $ \bar u=\bar u_1+\bar u_2.$ Рассмотрим теперь символическое уравнение вида:

$\displaystyle L\mathcal{E}=\delta(x-\xi).$ (90)
Согласно сделанным замечаниям, для нахождения частного решения уравнения (88), достаточно найти решение более простого уравнения ([перейти]) с универсальным $ \delta$ -образным источником, а затем просуммировать эти решения с амплитудами $ f.$ Решение $ \mathcal{E}$ уравнения (90), рассматриваемое, вообще говоря, в классе обобщенных функций, называется фундаментальным решением или функцией точечного источника или функцией влияния или функцией Грина дифференциального оператора $ L.$ Функция Грина имеет простой физический смысл: она описывает поле, порожденное мгновенным точечным источником, действующим в точке $ x=\xi.$ Полная картина поля, создаваемого реальным источником, получается суммированием точечных возмущений с помощью соотношения:

$\displaystyle \bar u(x)=\int\limits_{R^{n+1}}\mathcal{E}(x-\xi)f(\xi) d\xi$ (91)
Разумеется, функция Грина любого линейного дифференциального оператора определена с точностью до $ u_0$ -- решения однородного уравнения.

Регулярным методом отыскания функций Грина дифференциальных операторов с постоянными коэффициентами является метод преобразования Фурье. В пространстве фурье-образов уравнение ([перейти]) для случая постоянных коэффициентов $ a_\alpha$ становится алгебраическим, а вычисление обратного преобразования Фурье его решения осуществляется переходом на комплексную плоскость.

Опуская технические детали, мы рассмотрим здесь лишь результат вычислений для некоторых важных конкретных примеров.

  1. Функция Грина оператора Лапласа: $ \Delta\mathcal{E}_L(x-\xi)=\delta(x-\xi).$ :

    $\displaystyle \mathcal{E}_L(x-\xi)=-\frac{1}{4\pi}\frac{1}{\vert x-\xi\vert}.$ (92)
  2. Функция Грина волнового оператора: $ \Box\mathcal{E}_W(x-\xi)=\delta(x-\xi).$ :

    $\displaystyle \mathcal{E}_{W\pm}(x-\xi)=\frac{\theta(\pm x_0-\xi_0)}{2\pi c}\delta(c^2(x_0^2-\xi_0^2)-\vert x-\xi\vert^2),$ (93)
    где $ \mathcal{E}_{W-}$ -- запаздывающая (причинная функция Грина), $ \mathcal{E}_{W+}$ -- опережающая (антипричинная) функция Грина,

    \begin{displaymath}
\theta(x)=\left\{
\begin{array}{ll}
1, & x>0;\\
0, & x\le0
\end{array}\right.
\end{displaymath}

    -- ступенчатая функция Хевисайда.
  3. Функция Грина оператора Клейна-Гордона-Фока: $ (\Box+k^2)\mathcal{E}(x-\xi)=\delta(x-\xi).$ :

    $\displaystyle \mathcal{E}_{K\pm}(x-\xi)= \frac{\theta(\pm c(t-\tau_0)}{2\pi c}\...
...c^2(t-\xi_0)^2-\vert x-\xi\vert^2})}{\sqrt{c^2(t-\xi_0)^2-\vert x-\xi\vert^2}},$ (94)
    где $ \mathcal{E}_{K-}$ -- запаздывающая (причинная) функция Грина, $ \mathcal{E}_{K+}$ -- опережающая (антипричинная) функция Грина.
Отметим, что в нестационарных задачах теории поля используется причинные функции Грина, которые дают решения, согласующиеся с картиной упорядочения причины (источника) и следствия (полевого возмущения) во времени.


1.3.  Теория относительности

Теория Фоккера-Шварцшильда существенным образом опирается на релятивистские свойства пространства, времени и взаимодействий, которые вскрыла в начале XX века специальная теория относительности [37]. Основная идея теории относительности заключается в отказе от абсолютного времени и абсолютного пространства ньютоновской физики. Вместо них в качестве арены для физических событий теория относительности предлагает рассматривать единое 4-мерное пространство-время Минковского. При этом пространственные и временные отношения между событиями объединяются друг с другом в рамках 4-мерной псевдоевклидовой геометрии, основным инвариантным объектом которой является 4-мерный интервал:

$\displaystyle s^2=c^2(t-t_0)^2-(x-x_0)^2-(y-y_0)^2-(z-z_0)^2.$ (95)
Три координаты 4-мерного мира Минковского $ x,y,z$ -- это обычные пространственные декартовы координаты, а четвертая -- временная координата $ ct.$ Несмотря на очевидное для всех нас отличие временной протяженности от пространственной, формула (95) говорит нам о том, что с точки зрения новой геометрии, приспособленной для правильного описания и истолкования наблюдаемых физических явлений, между пространственными и временными координатами нет резкой разницы и четкой границы. В этом отношении ситуация аналогична евклидовой геометрии с 3-мерным интервалом

$\displaystyle l^2=(x-x_0)^2_1+(y-y_0)^2+(z-z_0)^2,$ (96)
остающимся неизменным при вращениях и параллельных переносах системы координат: никому не придет в голову сказать, что координата $ x$ чем-то выделена по отношению к координате $ y.$ Напротив, при вращениях системы координат координата $ x$ может поменяться местами с координатой $ y$ и наоборот. С другой стороны, в целом выражение (96) остается неизменным относительно вращений системы координат и ее сдвигов, поскольку выражает длину отрезка, соединяющего пару точек в 3-мерном пространстве. Аналогично, формула (95) выражает инвариантную длину между парой событий (т.е. между совокупностями пространственного положения и момента времени) в 4-мерном пространстве-времени.

Переход от геометрии с интервалом (96) к геометрии с интервалом (95) повлек за собой кардинальный пересмотр большей части понятий и законов классической физики Ньютона.

  1. Преобразования Лоренца вместо преобразований Галилея. Анализ элементарного электромагнитного процесса -- распространения фронта светового сигнала, испущенного мгновенным точечным источником света, обнаруживает нарушение принципа относительности Галилея с его правилами перехода от одной инерциальной системы отсчета к другой:

    $\displaystyle x'=x-Vt;\quad t'=t;\quad v'=v-V,$ (97)
    где $ V$ -- скорость движения системы отсчета $ S'$ относительно $ S,$ ориентированная вдоль их общей оси, $ v$ -- скорость частицы в системе $ S,$ $ v'$ -- скорость частицы в системе $ S'$ (см. рис. [перейти]). Нетрудно видеть, что уравнение фронта (расширяющаяся со скоростью света сфера) такой волны:

    $\displaystyle c^2(t-t_0)^2-(x-x_0)^2-(y-y_0)^2-(z-z_0)^2=0$ (98)
    (источник испускает свет в момент времени $ t=t_0$ в точке с координатами $ (x_{0},y_{0},z_{0})$ ) изменит свой вид при смене системы отсчета по формулам (97). Это означало бы, что наблюдая за фронтом световой волны, можно определить скорость системы отсчета наблюдателя, что противоречит духу принципа относительности. Несмотря на то, что принцип относительности Галилея распространялся только на механические явления, анализ оптических и электромагнитных экспериментов и теории Максвелла настоятельно приводили к мысли о необходимости его расширения на множество всех электромагнитных явлений. Попытка согласования расширенного принципа относительности Эйнштейна-Максвелла с теорией Максвелла и привела, в конечном счете, к разработке теории относительности -- новой релятивистской теории пространства времени и взаимодействий. С точки зрения этой теории уравнение (98) может быть записано в виде:

    $\displaystyle s^2=0,$ (99)
    где $ s$ -- релятивистский инвариантный интервал (95). Правда, для обеспечения инвариантности интервала (95), а следовательно и уравнения (99) фронта световой волны, необходимо отказаться от преобразований (97), вытекающих из евклидовых абсолютных свойств времени и пространства, а вместо них использовать их релятивистское обобщение -- преобразования Лоренца:

    $\displaystyle x'=\frac{x-Vt}{\sqrt{1-V^2/c^2}};\quad t'=\frac{t-Vx/c^2}{1-V^2/c^2},$ (100)
    которые в нерелятивистском пределе $ c\to\infty$ переходят в преобразования Галилея (97). Таким образом, скорость света в теории относительности выступает не как частная константа, а как фундаментальная постоянная пространства-времени, отвечающая за его неевклидовы (релятивистские) свойства. Выделенная роль этой константы замечательным образом подтверждается релятивистским законом сложения скоростей:

    $\displaystyle v'=\frac{v-V}{1-vV/c^2},$ (101)
    из которого, в частности, следует, что во всех системах отсчета скорость света постоянна и равна $ c.$
  2. 4-мерные векторы и тензоры. Последовательное воплощение принципа относительности Эйнштейна-Максвелла предполагает, что все фундаментальные уравнения природы должны формулироваться в виде уравнений, инвариантных относительно преобразований (100). Этот свойство уравнений иногда называют их 4-мерной ковариантностью. Требование инвариантности вида уравнений классической механики Ньютона относительно замены одних декартовых систем координат другими (3-мерная ковараинтность) приводит к 3-мерной векторной (или тензорной) формулировке уравнений. Именно векторный характер сил и ускорений и скалярный характер инертной массы в классической механике гарантируют инвариантный характер уравнений ньютоновской механики относительно вращений 3-мерного пространства:

    $\displaystyle \vec a=\frac{\vec F(x)}{m}\Leftrightarrow\vec a'=\frac{\vec F'(x')}{m'},$ (102)
    где штрихом отмечены величины, относящиеся к повернутой системе координат. Разумеется $ m=m',$ а вот компоненты векторов $ \vec a$ и $ \vec F$ изменяются согласованно (с помощью одной и той же ортогональной матрицы) и потому уравнение в целом не изменяет своего вида. В 4-мерном мире ситуация геометрически вполне аналогична, поэтому 4-мерная ковариантность законов будет автоматически обеспечена, если мы будем записывать эти уравнения в терминах 4-мерных векторов или тензоров. Так, уравнение (102) обладает 3-мерной ковариантностью, но 4-мерно нековариантно. С точки зрения 4-мерного мира Минковского оно является (приближенной) проекцией 4-мерного ковариантного уравнения на 3-мерное пространство.

    Сформулируем общее правило: явно 4-мерно ковариантный вид уравнений и соотношений подразумевает запись уравнений на языке 4-мерных векторов (или тензоров) и 4-мерных операций между ними: суммы 4-векторов, 4-мерного скалярного произведения и т.д. Последнее, кстати, определяется формулой:

    $\displaystyle A\cdot B=A^0B^0-A^1B^1-A^2B^2-A^3B^3,$ (103)
    для всякой пары 4-векторов $ A$ и $ B$ , где расстановка знаков согласована с видом 4-мерного интервала (95). Заметим, что иногда такое скалярное произведение записывают с плюсами, но у одного из сомножителей переносят индекс сверху вниз:

    $\displaystyle A\cdot B=A^0B_0+A^1B_1+A^2B_2+A^3B_3=A^\alpha B_\alpha.$ (104)
    При этом вектор с компонентами $ B_\alpha$ имеет вид: $ (B^0,-B^1,-B^2,-B^3)$ и называется ковариантным вектором, в отличие от вектора с компонентами $ B^\alpha,$ который называется контравариантным вектором. К примеру, 4-мерный радиус-вектор $ R=(x^0,x^1,x^2,x^3)$ имеет по определению контравариантный вид, но его можно перевести в ковариантный вид, изменив знаки пространственной части компонент. Далее нам встретятся векторные объекты, имеющие по определению ковариантную природу, но их перевод в контравариантный вид выполняется по тому же правилу.

  3. Мировые линии и их характеристики Рассмотрим вкратце кинематику и динамику частиц в специальной теории относительности. Всякая частица вычерчивает в 4-мерном пространстве-времени о мировую линию -- кривую, изображающую график ее движения в некоторой 4-мерной системе координат. Мировая линия является 4-мерным аналогом 3-мерной траектории частицы.

    В качестве координаты на мировой линии можно выбрать время $ t.$ В этом случае параметрическое уравнение мировой линии будет иметь вид:

    $\displaystyle x^0=ct;\quad x^1=x^1(t);\quad x^2=x^2(t);\quad x^3=x^3(t),
$

    где $ x^1(t),x^2(t),x^3(t)$ -- некоторые функции, задающие конкретный закон движения. Такая параметризация, однако, неудобна для ковариантной формулировки уравнений, поскольку время преобразуется при смене системы отсчета по второй формуле из (100). Для перехода к инвариантной параметризации вычислим релятивистский 4-мерный интервал между двумя близкими точками на мировой линии. Подставляя параметрические уравнения в формулу (95) и переходя к дифференциалам, получаем:

    $\displaystyle ds^2=(1-\frac{v^2}{c^2})c^2dt^2,$ (105)
    где $ v^2=(\dot x^1(t))^2+(\dot x^2(t))^2+(\dot x^3(t))^2$ -- квадрат координатной скорости. В теории относительности показывается, что никакое тело конечной массы не может за счет действия какой-либо силы приобрести за конечное время скорость света или скорость большую нее. При условии $ v<c$ из последней формулы следует, что интервал $ s$ является монотонной функцией времени, следовательно его можно взять в качестве нового параметра на мировой линии. Новая параметризация:

    $\displaystyle x^0=x^0(s),x^1=x^1(s),x^2=x^2(s),x^3=x^3(s)$ (106)
    будет уже релятивистски инвариантной. Физический смысл интервала $ ds$ на мировой линии частицы легко установить, если перейти в систему отсчета, мгновенно сопутствующую частице, т.е. такую, относительно которой частица в данный момент времени покоится. Если $ \tau$ -- время в этой системе, называемое мгновенным собственным временем частицы то из формулы (105) следует, что $ ds=cd\tau,$ т.е. интервал между парой близких событий пропорционален промежутку собственного времени между этими событиями. Такое время покажут часы, закрепленные на самой частице и движущиеся вместе с ней. Интегрируя последнюю формулу, приходим к тому же выводу для конечных приращений интервала и собственного времени. Собственное время -- важная характеристика мировой линии. В частности, оказывается, что 4-мерно ковариантное выражение для действия свободной частицы в пространстве времени Минковского пропорционально собственному времени10:

    $\displaystyle \mathcal{A}_0=-mc\int\limits_{s_1}^{s_2}ds= \vrule height0pt depth15pt width0pt -mc\int\limits_{t_1}^{t_2}\sqrt{1-v^2/c^2}  dt.$ (107)
    В нерелятивистском пределе $ c\to\infty$ это выражение с точностью до бесконечного постоянного слагаемого переходит в нерелятивистское действие свободной частицы (ф-ла (65) при $ U=0$ ). Разумеется, как и в нерелятивистском случае, условие экстремума $ \delta \mathcal{A}_0=0$ обеспечивается прямолинейным равномерным движением $ \vec v=$const$ .$

    Рассмотрим 4-вектор $ U$ с компонентами

    $\displaystyle U^\alpha=\frac{dx^\alpha}{ds},
\vrule height0pt depth15pt width0pt
$

    который получается дифференцированием закона движения (106) по параметру $ s.$ По аналогии с 3-мерной кинематикой, этот вектор является касательным к мировой линии и, в определенном смысле, определяет быстроту движения по ней. По этой причине этот вектор называют 4-скоростью. С помощью соотношения (105) нетрудно получить его более явное и наглядное представление в компонентах:

    $\displaystyle U=\left(\frac{1}{\sqrt{1-v^2/c^2}},\frac{\vec v/c}{\sqrt{1-v^2/c^2}}\right).$ (108)
    В отличие от обычной 3-мерной скорости этот вектор безразмерен (скорость в нем выражена в единицах $ c$ ) и удовлетворяет важному условию 4-мерной нормировки:

    $\displaystyle U\cdot U=(U^0)^2-(U^1)^2-(U^2)^2-(U^3)^2=1,$ (109)
    которое выполняется тождественно в силу определения и явного вида (108) вектора $ U.$ Именно вектор 4-скорости является 4-мерным обобщением 3-мерного вектора скорости $ \vec v.$ При этом, его направление в каждой точке мировой линии частицы определяет направление ее собственного времени в 4-мерном пространстве-времени.

    Рассмотрим далее 4-вектор, компоненты которого представляют производные компонент 4-скорости по параметру $ s$ :

    $\displaystyle A^\alpha=\frac{dU^\alpha}{ds}. \vrule height0pt depth15pt width0pt$ (110)
    Этот вектор характеризует быстроту изменения 4-скорости вдоль мировой линии, поэтому называется 4-ускорением. Вектор 4-ускорения имеет размерность обратной длины и с дифференциально-геометрической точки зрения характеризует кривизну $ k=1/R$ мировой линии в 4-мерном пространстве-времени, где $ R$ -- радиус кривизны (т.е. всегда имеет смысл "центростремительного ускорения" в 4-мерном мире). Дифференцируя по $ s$ соотношение нормировки (109), нетрудно убедиться в 4-мерной ортогональности векторов $ U$ и $ A$ :

    $\displaystyle A\cdot U=A^0U^0-A^1U^1-A^2U^2-A^3U^3=0,$ (111)
    т.е. вектор ускорения является пространственным по отношению к направлению собственного времени частицы в каждой точке ее мировой линии.

    Кинематика протяженного (неточечного) тела в СТО требует более серьезного математического аппарата и здесь обсуждаться не будет.

  4. 4-мерная (ковариантная) формулировка электродинамики Максвелла. Важным шагом на этапе развития теории относительности было открытие 4-мерных ковариантных свойств уравнений Максвелла. Центральным моментом в этом открытии была догадка о том, что подобно пространству и времени, электрические и магнитные поля по отдельности не обладают абсолютным смыслом: таким смыслом обладает лишь электромагнитное поле в целом. Для реализации этой идеи было необходимо найти надлежащий геометрический объект, который содержал бы внутри себя одновременно как компоненты электрического, так и компоненты магнитного полей на равных правах, которые могли бы переходить друг в друга при смене системы отсчета, подобно пространственным и временным координатам. Ясно, что 4-вектор не годится для этой цели, поскольку имеет только четыре компоненты, вместо необходимых шести. Следующим по типу сложности идут 4-мерные тензоры 2-ого ранга. Такие тензоры можно понимать как квадратные $ 4\times4$ массивы компонент (координат), в котором каждая компонента при смене системы координат преобразуется как произведение соответствующих компонент пары радиус-векторов, т.е., во всяком случае, линейно и однородно. Другими словами, для всякого тензора $ T$ его компонента:

    $\displaystyle T_{\alpha\beta} $   преобразуется так же как $\displaystyle  X_\alpha X_\beta.
$

    Среди всех тензоров второго ранга выделяются симметричные тензоры, компоненты которых удовлетворяют соотношению $ T_{\alpha\beta}=T_{\beta\alpha}$ и антисимметричные тензоры, определяемые условием $ T_{\alpha\beta}=-T_{\beta\alpha}.$ Нетрудно подсчитать, что у симметричного $ 4\times4$ -тензора число независимых компонент равно десяти, а у антисимметричного -- шести. Таким образом, 4-мерные антисимметричные тензоры второго ранга являются простейшими кандидатами для релятивистского описания электромагнитного поля. Вспомним теперь, что напряженности электрического и магнитного полей выражаются через скалярный и векторный потенциалы по формулам (78). Следующей догадкой была мысль об объединении этих потенциалов в единый ковариантный 4-потенциал $ \mathfrak{A}$ по формулам:

    $\displaystyle \mathfrak{A}_0=\varphi;\quad \mathfrak{A}_i=-A_i.$ (112)
    При этом формулы (78) можно переписать в следующем виде:

    $\displaystyle F_{\alpha\beta}= \vrule height0pt depth15pt width0pt \frac{\parti...
...beta}{\partial x^\alpha}-\frac{\partial \mathfrak{A}_\alpha}{\partial x^\beta},$ (113)
    где $ F$ -- антисимметричный тензор электромагнитного поля с компонентами:

    $\displaystyle (F_{\alpha\beta})=\left( \begin{array}{cccc} 0&E_1&E_2&E_3 -E_1&0&-B_3&-B_2 -E_2&B_3&0&-B_1 -E_3&-B_2&B_1&0 \end{array} \right);$   или$\displaystyle \quad (F^{\alpha\beta})=\left( \begin{array}{cccc} 0&-E_1&-E_2&-E_3 E_1&0&-B_3&-B_2 E_2&B_3&0&-B_1 E_3&-B_2&B_1&0 \end{array} \right)$ (114)
    Именно тензор электромагнитного поля является адекватным средством релятивистского описания электромагнитного взаимодействия зарядов и токов на полевом языке.

    Тензор электромагнитного поля позволяет записать сразу записать одну пару уравнений Максвелла, которая не содержит источников (зарядов и токов), в 4-мерно ковариантном виде:

    $\displaystyle \frac{\partial F_{\alpha\beta}}{\partial x^\gamma}+\frac{\partial...
...ght0pt depth15pt width0pt \frac{\partial F_{\gamma\alpha}}{\partial x^\beta}=0.$ (115)
    В подробной записи это тензорное уравнение, как нетрудно убедиться с помощью (114), дает шесть компонент векторных уравнений (82). С другой стороны, непосредственная подстановка определения (113) $ F$ через 4-потенциал приводит к тождеству в силу перестановочности операторов частного дифференцирования.

    Для ковариантной записи уравнений Максвелла необходимо отыскать ковариантную форму заряда и тока. Оказывается, как впервые показал Пуанкаре, эта пара величин -- 3-мерный скаляр и 3-мерный вектор -- объединяются в 4-вектор тока:

    $\displaystyle j=\rho_0cU,$ (116)
    где $ \rho_0$ -- плотность заряда в системе отсчета, сопутствующей движущемуся заряду. При этом полный заряд оказывается инвариантной величиной (скаляром), независящей от выбора системы отсчета. С учетом определения плотности заряда и формул релятивистского сокращения длин и объемов имеем:

    $\displaystyle \rho_0=\frac{\Delta Q}{\Delta V_0}=\frac{\Delta Q}{\Delta V}\sqrt{1-v^2/c^2}=\rho\sqrt{1-v^2/c^2},
$

    где $ dV$ и $ \rho$ -- элемент объема и плотность заряда, измеренные в лабораторной системе отсчета, $ v$ -- скорость заряда относительно лабораторной системы отсчета, откуда с учетом вида 4-скорости (108) и определения (116) имеем выражение для компонент плотности тока:

    $\displaystyle j=(c\rho,\rho\vec v),$ (117)
    согласующееся с выражением обычной 3-мерной плотности тока. Нетрудно проверить, что оставшаяся пара уравнений (81) получается, если подробно расписать следующее 4-мерно ковариантное выражение:

    $\displaystyle \frac{\partial F^{\alpha\beta}}{\partial x^\beta}=-\frac{4\pi}{c}j^\alpha$ (118)

    4-мерно ковариантное действие для электромагнитного поля имеет вид: $ \mathcal{A}_{\text{em}}=\mathcal{A}_{\text{f}}+\mathcal{A}_{\text{int}},$ где

    $\displaystyle \mathcal{A}_{\text{f}}=-\frac{1}{16\pi c}\int F_{\alpha\beta}F^{\alpha\beta}  d^4x$ (119)
    действие свободного электромагнитного поля (под интегралом стоит "скалярное произведение тензоров" устроенное по типу выражения (104) для векторов, а интегрирование производится по инвариантному элементу 4-объема $ d^4x=dx^0 dx^1 dx^2 dx^3$ ),

    $\displaystyle \mathcal{A}_{\text{int}}=-\frac{1}{c^2}\int (j\cdot\mathfrak{A})  d^4x$ (120)
    -- действие взаимодействия электромагнитного поля и зарядов. Для перехода к точечным частицам в последнем слагаемом необходимо выделить из 4-объема $ d^4x$ элемент 3-объема $ dV$ и проинтегрировать по нему с учетом определения (116): и определения заряда, как интеграла от плотности по объему:

    $\displaystyle \int j^\alpha dV=c\int \rho_0 U^\alpha dV=
\vrule height0pt depth...
...c\int \rho_0 \frac{dx^\alpha}{ds}\sqrt{1-v^2/c^2}dV_0=
qc\frac{dx^\alpha}{dt}.
$

    Запишем полное действие для системы частиц $ N$ частиц, взаимодействующих посредством электромагнитного поля с учетом (107), (119), (120) и последней формулы:

    $\displaystyle \mathcal{A}_{\text{tot}}=-\sum\limits_{i=1}^Nm_ic\int ds_i-\sum\l...
...}_\alpha dx^\alpha-\frac{1}{16\pi c}\int F_{\alpha\beta}F^{\alpha\beta}  d^4x.$ (121)
    В этом выражении интегралы в первых двух слагаемых вычисляются вдоль мировых линий заряженных частиц, а в последнем слагаемом интегрирование производится по области пространства-времени, занятой электромагнитным полем.
  5. Причинная структура пространства-времени Выше мы сказали, что в теории относительности разница между временными и пространственными координатами становится условной. Сейчас мы уточним это утверждение. Зафиксируем точку в пространстве-времени, которую всегда можно принять за начало 4-мерной декартовой системы координат. Рассмотрим произвольную точку с радиус-вектором $ R=(x^0,x^1,x^2,x^3)$ относительно выбранного начала. Квадрат 4-мерного интервала между рассматриваемой парой точек можно записать как 4-мерный скалярный квадрат:

    $\displaystyle s^2=R\cdot R=(x^0)^2-(x^1)^2-(x^2)^2-(x^3)^2.$ (122)
    Характерной и важной для физики особенностью 4-мерной геометрии является нарушение свойства евклидовости скалярного произведения: величина $ s^2$ может иметь любой знак и обращаться в нуль даже если $ R\neq 0.$ Действительно, как мы видели выше уравнение фронта световой волны (98) имеет вид (99) -- обращения в нуль квадрата 4-мерного интервала. В рассматриваемой нами ситуации с парой точек, мы можем заключить, что если радиус-вектор $ R$ некоторой точки пространства-времени удовлетворяет условию $ s^2=R\cdot R=0,$ то начало системы координат и эта точка, рассматриваемые как события, (могут быть) связаны световым сигналом. Другими словами, фронт световой вспышки, испущенной в в начальной точке, захватывает в пространстве-времени все точки с радиус-векторами $ R,$ удовлетворяющими уравнению $ R\cdot R=0.$ Геометрически это уравнение описывает 3-мерный конус. Его проекция на 3-мерное пространство время показана на рис. [перейти].

    Рассмотрим точки снаружи конуса. Нетрудно убедиться, что радиус-вектор $ R$ любой из таких точек удовлетворяет неравенству:

    $\displaystyle s^2=R\cdot R<0$   или$\displaystyle \quad t^2<\frac{x_1^2+x_2^2+x_3^2 }{c}.$ (123)
    Вторую форму этого неравенства можно интерпретировать так: промежуток времени, который разделяет событие $ R$ с началом меньше времени, необходимого световому сигналу для того, чтобы преодолеть пространственное расстояние, разделяющее эти события. Поскольку скорость света -- максимально возможная скорость передачи информации и сигналов, мы приходим к заключению, что внешность светового конуса -- это область событий, причинно не связанных с событием $ O.$

    Наконец, радиус-вектор любой точки внутри конуса удовлетворяет обратному неравенству:

    $\displaystyle s^2=R\cdot R>0$   или$\displaystyle \quad t^2>\frac{x_1^2+x_2^2+x_3^2 }{c}.$ (124)
    Его вторая форма говорит о том, что промежуток времени, разделяющий события $ O$ и $ R$ достаточен для того, чтобы свет успел преодолеть пространственное расстояние, которое их разделяет. Следовательно, внутренность светового конуса представляет собой множество событий, которые, в принципе, могут быть причинно связанными с событием $ O.$ При этом, как нетрудно понять с позиций обычных представлений о причинности, нижний конус -- он называется конусом прошлого точки $ O$ -- состоит из событий, которые могут повлиять на $ O$ , а верхний конус -- он называется конусом будущего события $ O$ -- состоит из событий, на которые может влиять само событие $ O.$ Итак, для каждая точка $ O$ пространства-времени $ \mathcal{M},$ определяет его разбиение на пять подмножеств:

    $\displaystyle \mathcal{M}=\mathcal{C}_-\cup\mathcal{C}_+\cup\mathcal{G}_-\cup\mathcal{G}_+\cup\mathcal{G}_0.$ (125)
    Интересно, что такое разбиение инвариантно относительно смены системы отсчета по формулам преобразований Лоренца (100), т.е. каждая компонента в целом переходит в себя, хотя отдельные точки-события внутри компоненты переходят друг в друга. Таким образом, 4-мерный интервал (точнее говоря, его знак) определяет инвариантное разбиение пространства времени на причинные компоненты или, как иногда говорят, задает причинную структуру пространства-времени.


Далее: Литература Вверх: Близкодействие против дальнодействия: окончательна Previous: 8.  Заключение: еще раз