Глава 11 РАСПРОСТРАНЕНИЕ В КРИСТАЛЛИЧЕСКОЙ РЕШЕТКЕ
§ 1. Состояния электрона в одномерной решетке
На первый взгляд вам может показаться, что обладающий небольшой энергией электрон с превеликим трудом протискивается через твердый кристалл. Атомы в нем уложены так, что их центры отстоят один от другого лишь на несколько ангстрем, а эффективный диаметр атома при рассеянии электронов составляет примерно 1Å или около этого. Иначе говоря, атомы, если их сравнивать с промежутками между ними, очень велики, так что можно ожидать, что средний свободный пробег между столкновениями будет порядка нескольких ангстрем, а это практически равно нулю. Следует ожидать, что электрон почти тотчас же влетит в тот или иной атом. Тем не менее перед нами самое обычное явление природы: когда решетка идеальна, электрону ничего не стоит плавно пронестись сквозь кристалл, почти как сквозь вакуум. Странный этот факт — причина того, что металлы так легко проводят электричество; кроме того, он позволил изобрести множество весьма полезных устройств. Например, благодаря ему транзистор способен имитировать радиолампу. В радиолампе электроны движутся свободно через вакуум, в транзисторе они тоже движутся свободно, но только через кристаллическую решетку. Механизм того, что происходит в транзисторе, будет описан в этой главе; следующая глава посвящена применениям этих принципов в различных практических устройствах.
Проводимость электронов в кристалле — один из примеров очень общего явления. Через кристаллы могут странствовать не только электроны, но и другие «объекты». Так, атомные возбуждения тоже могут путешествовать аналогичным способом. Явление, о котором мы сейчас будем говорить, то и дело возникает при изучении физики твердого состояния.
Мы уже неоднократно разбирали примеры систем с двумя состояниями. Представим себе на этот раз электрон, который может находиться в одном из двух положений, причем в каждом из них он оказывается в одинаковом окружении. Предположим также, что имеется определенная амплитуда перехода электрона из одного положения в другое и, естественно, такая же амплитуда перехода обратно, в точности, как в гл. 8, § 1 (вып. 8) для молекулярного иона водорода. Тогда законы квантовой механики приводят к следующим результатам. У электрона возникнет два возможных состояния с определенной энергией, причем каждое состояние может быть описано амплитудой того, что электрон пребывает в одном из двух базисных положений. В каждом из состояний определенной энергии величины этих двух амплитуд постоянны во времени, а фазы меняются во времени с одинаковой частотой. С другой стороны, если электрон сперва был в одном положении, то со временем он перейдет в другое, а еще позже вернется в первое положение. Изменения амплитуды похожи на движение двух связанных маятников.
Рассмотрим теперь идеальную кристаллическую решетку и вообразим, что в ней электрон может расположиться в некоторой «ямке» возле определенного атома, имея определенную энергию. Допустим также, что у электрона имеется некоторая амплитуда того, что он перескочит в другую ямку, которая находится неподалеку, возле другого атома. Это чем-то напоминает систему с двумя состояниями, но с добавочными осложнениями. После того как электрон достигает соседнего атома, он может перейти в совершенно новое место или вернуться в исходную позицию. Все это похоже не столько на пару связанных маятников, сколько на бесконечное множество маятников, связанных между собой. Это чем-то напоминает одну из тех машин (составленных из длинного ряда стержней, прикрепленных к закрученной проволоке), с помощью которых на первом курсе демонстрировалось распространение волн.
Если у вас имеется гармонический осциллятор, связанный с другим гармоническим осциллятором, который в свою очередь связан со следующим осциллятором, который и т.д..., и если вы создадите в одном месте какую-то нерегулярность, то она начнет распространяться, как волна по проволоке. То же самое возникает и в том случае, если вы поместите электрон возле одного из атомов в длинной их цепочке.
Как правило, задачи по механике легче всего решать на языке установившихся волн; это проще, чем анализировать последствия отдельного толчка. Тогда появляется какая-то картина смещений, которая распространяется по кристаллу, как волна с заданной, фиксированной частотой. То же самое происходит с электроном, и по той же причине, потому что электрон описывается в квантовой механике похожими уравнениями.
Но нужно помнить одну вещь: амплитуда для электрона быть в данном месте это амплитуда, а не вероятность. Если бы электрон просто просачивался из одного места в другое, как вода через дырочку, то его поведение было бы совсем иным. Если бы, скажем, мы соединили два бачка с водой тоненькой трубочкой, по которой вода из одного бачка по капле перетекала в другой, то уровни воды выравнивались бы по экспоненте. С электроном же происходит просачивание амплитуды, а не монотонное переливание вероятностей. А одно из свойств мнимого члена (множителя i в дифференциальных уравнениях квантовой механики) — что он меняет экспоненциальное решение на колебательное. И то, что после этого происходит, ничуть не походит на то, как вода перетекает из одного бачка в другой.
Теперь мы хотим квантовомеханический случай проанализировать количественно. Пусть имеется одномерная система, состоящая из длинной цепи атомов (фиг. 11.1,а).
Фиг. 11.1. Базисные состояния электрона в одномерной решетке.
(Кристалл, конечно, трехмерен, но физика в обоих случаях очень близка; если вы разберетесь в одномерном случае, то сможете разобраться и в том, что бывает в трех измерениях.) Мы хотим знать, что случится, если в эту линию атомов поместить отдельный электрон. Конечно, в реальном кристалле таких электронов мириады. Но большинство их (в непроводящем кристалле почти все) занимает в общей картине движения свое место, каждый вертится вокруг своего атома, и все оказывается совершенно установившимся. А мы хотим рассуждать о том, что будет, если внутрь поместить лишний электрон. Мы не будем думать о том, что делают прочие электроны, потому что будем считать, что на то, чтобы изменить их энергию, потребуется очень много энергии возбуждения. Мы собираемся добавить электрон и создать как бы новый слабо связанный отрицательный ион. Следя за тем, что поделывает этот лишний электрон, мы делаем приближение, пренебрегая при этом внутренним механизмом атомов.
Ясно, что этот электрон сможет перейти к другому атому, перенося в новое место отрицательный ион. Мы предположим, что (в точности, как и в случае электрона, «прыгавшего» от протона к протону) электрон может с какой-то амплитудой «прыгать» от атома к его соседям с любой стороны.
Как же описывать такую систему? Что считать разумными базисными состояниями? Если вы вспомните, что мы делали, когда у электрона было только две возможные позиции, вы сможете догадаться. Пусть в нашей цепочке все расстояния между атомами одинаковы, и пусть мы их пронумеруем по порядку, как на фиг. 11.1,а. Одно базисное состояние — когда электрон находится возле атома № 6; другое базисное состояние — когда электрон находится возле № 7, или возле № 8, и т. д.; n-е базисное состояние можно описать, сказав, что электрон находится возле атома № n. Обозначим это базисное состояние |n>. Из фиг. 11.1 ясно, что подразумевается под тремя базисными состояниями:
С помощью этих наших базисных состояний можно описать любое состояние |φ> нашего одномерного кристалла, задав все амплитуды
(11.1)
Кроме того, мы хотим еще предположить, что когда электрон находится близ одного из атомов, то имеется некоторая амплитуда того, что он просочится к тому атому, что слева, или к тому, что справа. Возьмем простейший случай, когда считается, что он может просочиться только к ближайшим соседям, а к следующему соседу он сможет дойти в два приема. Примем, что амплитуды того, что электрон перепрыгнет от одного атома к соседнему, равны iA/ℏ (за единицу времени).
Изменим на время обозначения, и амплитуду
(11.2)
Если бы вы знали каждую из амплитуд Сn в данный момент, то, взяв квадраты их модулей, можно было бы получить вероятность того, что вы увидите электрон, взглянув в этот момент на атом n.
Но что сталось бы чуть позже? По аналогии с изученными нами системами с двумя состояниями мы предлагаем составить гамильтоновы уравнения для этой системы в виде уравнений такого типа:
(11.3)
Первый справа коэффициент Е0 физически означает энергию, которую имел бы электрон, если бы он не мог просачиваться от одного атома к другим. (Совершенно неважно, что мы назовем Е0; мы неоднократно видели, что реально это не означает ничего, кроме выбора нуля энергии.) Следующий член представляет амплитуду в единицу времени того, что электрон из (n+1)-й ямки просочится в n-ю ямку, а последний член означает амплитуду просачивания из (n-1)-й ямки. Как обычно, А считается постоянным (не зависящим от t).
Для полного описания поведения любого состояния |φ> надо для каждой из амплитуд Сn иметь по одному уравнению типа (11.3). Поскольку мы намерены рассмотреть кристалл с очень большим количеством атомов, то допустим, что состояний имеется бесконечно много, атомы тянутся без конца в обе стороны. (При конечном числе атомов придется специально обращать внимание на то, что случается на концах.) А если количество N наших базисных состояний бесконечно велико, то и вся система наших гамильтоновых уравнений бесконечна! Мы напишем только часть ее:
(11.4)
§ 2. Состояния определенной энергии
Об электроне в решетке мы теперь уже можем узнать очень многое. Для начала попробуем отыскать состояния определенной энергии. Как мы видели в предыдущих главах, это означает, что надо отыскать такой случай, когда все амплитуды меняются с одной частотой, если только они вообще меняются. Мы ищем решение в виде
(11.5)
Комплексное число аn говорит нам о том, какова не зависящая от времени часть амплитуды того, что электроны будут обнаружены возле n-го атома. Если это пробное решение подставить для проверки в уравнения (11.4), то получим
(11.6)
Перед нами бесконечное число уравнений для бесконечного количества неизвестных аn ! Ситуация тяжелая!
Но мы знаем, что надо только взять детерминант... нет, погодите! Детерминанты хороши, когда уравнений два, три или четыре. Но здесь их очень много, даже бесконечно много, и вряд ли от детерминантов будет толк. Нет, лучше попробовать решать эти уравнения прямо. Во-первых, пронумеруем положения атомов; будем считать, что n-й атом находится в хn , а (n+1)-й— в хn +1 . Если расстояние между атомами равно b (как на фиг. 11.1), то хn +1 =хn +b. Взяв начало координат в атоме номер нуль, можно даже получить хn =nb. Уравнение (11.5) можно тогда переписать в виде
(11.7)
а уравнение (11.6) превратится в
(11.8)
Пользуясь тем, что xn +1 =xn +b, это выражение можно также записать в виде
(11.9)
Это уравнение немного походит на дифференциальное. Оно говорит, что величина а(х) в точке хn связана с той же физической величиной в соседних точках хn ±b. (Дифференциальное уравнение связывает значения функции в точке с ее значениями в бесконечно близких точках.) Может быть, здесь подойдут методы, которыми мы обычно пользуемся для решения дифференциальных уравнений? Попробуем.
Решения линейных дифференциальных уравнений с постоянными коэффициентами всегда могут быть выражены через экспоненты. Попробуем и здесь то же самое; в качестве пробного решения выберем
(11.10)
Тогда (11.9) обратится в
(11.11)
Сократим на общий множитель exp(ikxn ); получим
(11.12)
Два последних члена равняются 2Аcoskb, так что
(11.13)
Мы обнаружили, что при любом выборе постоянной k имеется решение, энергия которого дается этим уравнением. В зависимости от k получаются различные возможные энергии, и каждая k соответствует отдельному решению. Решений бесконечно много, но это и не удивительно, ведь мы исходим из бесконечного числа базисных состояний.
Посмотрим, каков смысл этих решений. Для каждой k уравнение (11.10) дает свои а. Тогда амплитуды обращаются в
(11.14)
причем нужно помнить, что энергия Е также зависит от k в согласии с уравнением (11.13). Множитель exp(ikxn ) дает пространственную зависимость амплитуд. Амплитуды при переходе от атома к атому колеблются.
При этом имейте в виду, что колебания амплитуды в пространстве комплексны, модуль ее вблизи любого атома один и тот же, а фаза (в данный момент) от атома к атому сдвигается на ikb. Чтобы можно было видеть, что происходит, поставим у каждого атома вертикальную черточку, равную вещественной части амплитуды (фиг. 11.2).
Фиг. 11.2. Изменение вещественной части Сn с хn .
Огибающая этих вертикалей (показанная штрихованной линией) является, конечно, косинусоидой. Мнимая часть Сn — это тоже колеблющаяся функция, но она сдвинута по фазе на 90°, так что квадрат модуля (сумма квадратов вещественной и мнимой частей) у всех С один и тот же.
Итак, выбирая k, мы получаем стационарное состояние с определенной энергией Е. И в каждом таком состоянии электрону одинаково вероятно оказаться около любого из атомов, никаких преимуществ у одного атома перед другим нет. От атома к атому меняется только фаза. Фазы меняются еще и со временем. Из (11.14) следует, что вещественная и мнимая части распространяются по кристаллу, как волны, как вещественная и мнимая части выражения
(11.15)
Волна может двигаться либо к положительным, либо к отрицательным х, смотря по тому, какой знак выбран для k.
Заметьте, что мы предположили, что поставленное в нашем пробном решении (11.10) число k есть число вещественное. Теперь видно, почему в бесконечной цепочке атомов так и должно быть. Пусть k было бы мнимым числом —ik'. Тогда амплитуды аn менялись бы, как exp(k'xn ), что означало бы, что амплитуда растет все выше и выше, когда х возрастает, или при k' отрицательном, когда х становится большим отрицательным числом. Такой вид решения был бы вполне хорош, если бы цепочка атомов на чем-то кончалась, но в бесконечной цепи атомов это не может быть физическим решением. Оно привело бы к бесконечным амплитудам и, стало быть, к бесконечным вероятностям, которые не могут отражать действительного положения вещей. Позже мы встретимся с примером, когда и у мнимых k есть смысл.
Соотношение (11.13) между энергией Е и волновым числом k изображено на фиг. 11.3.
Фиг. 11.3. Энергия стационарных состояний как функция параметра k.
Как следует из этого рисунка, энергия может меняться от Е0-2А при k=0 до Е0+2А при k=±π/b. График начерчен для положительных А, при отрицательных А кривую пришлось бы перевернуть, но область изменения осталась бы прежней. Существенно то, что в некоторой области, или «полосе» энергий допустимы любые значения энергии; вне полосы энергии быть не может. Из наших предположений следует, что если электрон в кристалле находится в стационарном состоянии, энергия его не сможет оказаться вне этой полосы.
Согласно (11.10), меньшие k отвечают более низким энергетическим состояниям Е≈Е0-2А. Когда k по величине растет (все равно, в положительную или отрицательную сторону), то энергия сперва растет, а потом при k=±π/b достигает максимума, как показано на фиг. 11.3. Для k, больших, чем π/b, энергия опять начала бы убывать. Но такие k рассматривать не стоит, они не приведут к каким-либо новым состояниям, а просто повторяют те состояния, которые уже появлялись при меньших k. Вот как в этом можно убедиться. Рассмотрим состояние наинизшей энергии, для которого k=0. Тогда при всех хn коэффициент а(хn ) будет один и тот же [см. (11.10)]. Та же самая энергия получилась бы и при k=2π/b. Тогда из (11.10) следовало бы
Но, считая, что начало координат приходится на х0, можно положить хn =nb, и тогда а (хn ) превратится в
т. е. состояние, описываемое этими а (хn ), физически ничем не будет отличаться от состояний при k=0. Оно не представляет особого решения.
В качестве другого примера возьмем k=π/4b. Вещественная часть а (хn ) изображена на фиг. 11.4 кривой 1.
Фиг. 11.4. Пара значений к, представляющих одну и ту же физическую ситуацию. Кривая 1—для k=π/4b, кривая 2 —для k=7π/4b.
Если бы k было в семь раз больше (k=7π/4b), то вещественная часть а (хn ) менялась бы так, как показано на кривой 2. (Сама косинусоида смысла не имеет, важны только ее значения в точках хn .
Кривые нужны просто для того, чтобы было видно, как все меняется.) Вы видите, что оба значения k во всех хn дают одинаковые амплитуды.
Вывод из всего этого состоит в том, что все возможные решения нашей задачи получатся, если взять k только из некоторой ограниченной области. Мы выберем область от -π/b до +π/b (она показана на фиг. 11.3). В этой области энергия стационарных состояний с ростом абсолютной величины k возрастает.
Еще одно побочное замечание о том, с чем было бы забавно повозиться. Представьте, что электрон может не только перепрыгивать к ближайшим соседям с амплитудой iA/ℏ, но имеет еще возможность одним махом перепрыгивать и к следующим за ними соседям с некоторой другой амплитудой iB/ℏ. Вы опять обнаружите, что решение можно искать в форме аn =exp(ikxn ), этот тип решений является универсальным. Вы также увидите, что стационарные состояния с волновым числом k имеют энергию E0-2Acos kb-2Bcos2kb. Это означает, что форма кривой Е как функции k не универсальна, а зависит от тех частных допущений, при которых решается задача. Это не обязательно косинусоида, и она даже не обязательно симметрична относительно горизонтальной оси. Но зато всегда верно, что кривая вне интервала (-π/b, π/b) повторяется, так что заботиться о других значениях k не нужно.
Посмотрим еще внимательнее на то, что происходит при малых k, когда вариации амплитуд между одним хn и соседним очень маленькие. Будем отсчитывать энергию от такого уровня, чтобы было Е0=2А; тогда минимум кривой фиг. 11.3 придется на нуль энергии. Для достаточно малых k можно написать
и энергия (11.13) превратится в
(11.16)
Получается, что энергия состояния пропорциональна квадрату волнового числа, описывающего пространственные вариации амплитуд Сn .
§ 3. Состояния, зависящие от времени
В этом параграфе мы хотим подробнее обсудить поведение состояний в одномерной решетке. Если для электрона амплитуда того, что он окажется в хn , равна Сn , то вероятность найти его там будет |Сn |2. Для стационарных состояний, описанных уравнением (11.12), эта вероятность при всех хn одна и та же и со временем не меняется. Как же отобразить такое положение вещей, которое грубо можно было бы описать, сказав, что электрон определенной энергии сосредоточен в определенной области, так что более вероятно найти его в каком-то одном месте, чем в другом? Этого можно добиться суперпозицией нескольких решений, похожих на (11.12), но со слегка различными значениями k и, следовательно, с различными энергиями. Тогда, по крайней мере при t=0, амплитуда Сn вследствие интерференции различных слагаемых будет зависеть от местоположения, в точности так же, как получаются биения, когда имеется смесь волн разной длины [см. гл. 48 (вып. 4)]. Значит, можно составить такой «волновой пакет», что в нем будет преобладать волновое число k0, но будут присутствовать и другие волновые числа, близкие к k0.
В нашей суперпозиции стационарных состояний амплитуды с разными k будут представлять состояния со слегка различными энергиями и, стало быть, со слегка различными частотами; интерференционная картина суммарного Сn поэтому тоже будет меняться во времени, возникнет картина «биений». Как мы видели в гл. 48 (вып. 4), пики биений [места, где |С(xn )|2 наибольшие] с течением времени начнут двигаться по х; скорость их движения мы назвали «групповой». Мы нашли, что эта групповая скорость связана с зависимостью k от частоты формулой
(11.17)
все это в равной мере относится и к нашему случаю. Состояние электрона, имеющее вид «скопления», т. е. состояние, для которого Сn меняется в пространстве так, как у волнового пакета на фиг. 11.5, будет двигаться вдоль нашего одномерного «кристалла» с быстротой v, равной dω/dk, где ω=E/ℏ.
Фиг. 11.5. Вещественная часть С(хn ) как функция х для суперпозиции нескольких состояний с близкими энергиями.
Подставляя (11.16) вместо Е, получаем
(11.18)
Иными словами, электроны движутся по кристаллу с быстротой, пропорциональной самому характерному k. Тогда, согласно (11.16), энергия такого электрона пропорциональна квадрату его скорости, он ведет себя подобно классической частице. Пока мы рассматриваем все в столь крупном масштабе, что никаких тонкостей строения разглядеть не можем, наша квантовомеханическая картина приводит к тем же результатам, что и классическая физика.
В самом деле, если из (11.18) найти k и подставить его в (11.16), то получится
(11.19)
где mэфф — постоянная. Избыточная «энергия движения» электрона в пакете зависит от скорости в точности так же, как и у классической частицы. Постоянная mэфф , именуемая «эффективной массой», дается выражением
(11.20)
Заметьте еще, что можно написать
(11.21)
Если мы решим назвать mэфф v «импульсом», то этот импульс будет связан с волновым числом k так же, как и у свободной частицы.
Не забывайте, что mэфф ничего общего не имеет с реальной массой электрона. Она может быть совсем другой, хотя следует сказать, что в реальных кристаллах часто случается, что ее порядок величины оказывается примерно таким же (в 2 или, скажем, в 20 раз больше, чем масса электрона в пустом пространстве).
Мы только что с вами раскрыли поразительную тайну — как это электрон в кристалле (например, пущенный в германий добавочный электрон) может пронестись через весь кристалл, может лететь по нему совершенно свободно, даже если ему приходится сталкиваться со всеми атомами. Это получается оттого, что его амплитуды, перетекая с одного атома на другой, прокладывают ему путь через кристалл. Вот отчего твердое тело может проводить электричество.
§ 4. Электрон в трехмерной решетке
Еще немного о том, как можно применить те же идеи, чтобы понять, что происходит с электроном в трех измерениях. Результаты оказываются очень похожими. Пусть имеется прямоугольная решетка атомов с расстояниями а, b, с в трех направлениях. (Если вам больше по душе кубическая решетка, примите все расстояния равными друг другу.) Предположим также, что амплитуда прыжка к соседу в направлении х есть iAx /ℏ; амплитуда прыжка в направлении у есть iAy /ℏ, а амплитуда прыжка в направлении z есть iAz /ℏ. Как же описать базисные состояния? Как и в одномерном случае, одно базисное состояние — это когда электрон находится близ атома с координатами х, у, z, где (х, у, z) — одна из точек решетки. Если выбрать начало координат в одном из атомов, то все эти точки придутся на
где nх , ny , nz — три целых числа. Вместо того чтобы ставить при х, у и z их номера, будем просто писать х, у, z, имея в виду, что они принимают лишь такие значения, которые бывают у точек решетки. Итак, базисное состояние изображается символом |электрон в х, у, z>, а амплитуда того, что электрон в некотором состоянии |ψ> окажется в этом базисном состоянии, есть
С (х, у, z)=<электрон в х, у, z|ψ>.
Как и прежде, амплитуды С (х, у, z) могут меняться во времени. При наших предположениях гамильтоновы уравнения обязаны выглядеть следующим образом:
(11.22)
Хоть это и выглядит громоздко, но вы сразу, конечно, поймете, откуда взялось каждое слагаемое.
Опять попробуем найти стационарное состояние, в котором все С меняются со временем одинаково. И снова решение есть экспонента
(11.23)
Если вы подставите это в (11.22), то увидите, что оно вполне подойдет, если только энергия Е будет связана с kx , ky и kz следующим образом:
(11.24)
Теперь энергия зависит от трех волновых чисел kx , ky , kz , которые, кстати, есть компоненты трехмерного вектора k. И действительно, (11.23) можно переписать в векторных обозначениях:
(11.25)
Амплитуда меняется как комплексная плоская волна, которая движется в трехмерном пространстве в направлении k с волновым числом k=(kx 2+ky 2+kz 2)1/2.
Энергия, связываемая с этими стационарными состояниями, зависит от трех компонент k сложным образом, подчиняясь уравнению (11.24). Характер изменения Е зависит от относительных знаков и величин Ах , Ау и Аz . Если вся эта тройка положительна и если нас интересуют лишь маленькие k, то зависимость оказывается сравнительно простой.
Разлагая косинус, как и раньше [см. (11.16)], мы теперь придем к
(11.26)
В простой кубической решетке с расстоянием а между узлами следует ожидать, что и Ах , и Аy , и Аг будут все равны друг другу (скажем, равны А), так что получилось бы
(11.27)
или
А это как раз совпадает с (11.16). Повторяя те же рассуждения, что и тогда, мы пришли бы к заключению, что электронный пакет в трех измерениях (составленный путем суперпозиции множества состояний с почти одинаковыми энергиями) также движется на манер классической частицы, обладающей некоторой эффективной массой.
В кристалле не с кубической, а с более низкой симметрией (или даже в кубическом кристалле, но таком, в котором состояние электрона около атома несимметрично) три коэффициента Ах , Аy и Az различны. Тогда «эффективная масса» электрона, сосредоточенного в узкой области, зависит от направления его движения. Может, например, оказаться, что у него разная инерция при движении в направлении х и при движении в направлении у. (Детали такого положения вещей иногда описываются с помощью «тензора эффективной массы».)
§ 5. Другие состояния в решетке
Согласно (11.24), состояния электрона, о которых мы говорили, могут обладать энергиями только в некоторой энергетической «полосе», простирающейся от наименьшей энергии
до наибольшей
Другие энергии тоже возможны, но они принадлежат к другому классу состояний электрона. Для тех состояний, о которых говорилось раньше, мы выбирали такие базисные состояния, когда электрон в атоме кристалла находился в некотором определенном состоянии, скажем в состоянии наинизшей энергии.
Если у вас есть атом в пустом пространстве и вы добавляете к нему электрон, чтобы получился ион, то этот ион можно образовать многими способами. Электрон может расположиться так, чтобы образовать состояние наинизшей энергии, или так, чтобы образовать то или иное из многих возможных «возбужденных состояний» иона, каждое с определенной энергией, которая превосходит наинизшее значение. То же может случиться и в кристалле. Допустим, что энергия Е0, которой мы пользовались выше, соответствует базисным состояниям, представляющим собой ионы с наинизшей возможной энергией. Но можно также вообразить новую совокупность базисных состояний, в которых электрон по-иному располагается возле n-го атома: он образует одно из возбужденных состояний иона, так что энергия Е0 теперь уже становится чуть повыше. Как и раньше, имеется некоторая амплитуда А (отличная от прежней) того, что электрон перепрыгнет из своего возбужденного состояния близ одного атома в такое же возбужденное состояние подле соседнего атома. И весь анализ проходит, как раньше; мы обнаружим полосу возможных энергий, сосредоточенных вокруг некоторой высшей энергии. Вообще говоря, таких полос может быть много и каждая будет отвечать своему уровню возбуждения.
Мыслимы и другие возможности. Может существовать некоторая амплитуда того, что электрон перепрыгнет из возбужденного положения возле одного атома в невозбужденное положение близ следующего атома. (Это называется взаимодействием между полосами.) Математическая теория становится все сложнее и сложнее по мере того, как вы принимаете во внимание все больше и больше полос и добавляете все больше и больше коэффициентов просачивания между различными состояниями. Никаких новых идей не нужно; но уравнения, как мы видели из нашего простого примера, сильно разрастаются.
Следует еще заметить, что о различных коэффициентах, таких, как появляющаяся в теории амплитуда А, сказать можно лишь немногое. Их, как правило, очень трудно подсчитать, и в практических случаях об этих параметрах теоретически бывает очень мало известно; в тех или иных реальных случаях приходится их значения брать из опыта.
Бывают и другие случаи, в которых вся физика и вся математика почти в точности совпадают с тем, что мы обнаружили для электрона, движущегося по кристаллу, но в которых движущийся «объект» совсем не тот. Представим, например, что нашим исходным кристаллом (или, лучше сказать, линейной решеткой) была цепочка нейтральных атомов, у каждого из которых связь с внешним электроном очень слаба. Теперь вообразим, что мы убрали один электрон. У какого из атомов? Пусть Сn есть амплитуда того, что электрон исчез у атома, стоящего в точке хn . Вообще говоря, имеется какая-то амплитуда А того, что электрон от соседнего атома, скажем от (n-1)-го, перепрыгнет к n-му, оставив свой (n-1)-й атом без электрона. Это все равно, что сказать, что у «нехватки электрона» имеется амплитуда А того, что она переберется от n-го атома к (n-1)-му. Легко видеть, что уравнения окажутся такими же, как и раньше, но, конечно, сами А не обязательно останутся прежними. Мы опять придем к тем же формулам для уровней энергии, для «волн» вероятности, которые бегут по кристаллу с групповой скоростью (11.18), для эффективной массы и т. д. Только теперь эти волны описывают поведение недостающего электрона или, как его называют, «дырки». Можно убедиться, что заряд этой частицы будет казаться положительным. В следующей главе мы немного подробнее расскажем об этих дырках. Другой пример. Представим себе цепочку нейтральных атомов, один из которых был приведен в возбужденное состояние, т. е. с более высокой, чем у нормального основного состояния, энергией. Пусть Сn — амплитуда того, что n-й атом возбужден. Он может взаимодействовать с соседним атомом, передавая ему свой избыток энергии и возвращаясь в основное состояние. Обозначим амплитуду этого процесса iA/ℏ. Вы видите, что опять повторяется та же математика. Но теперь то, что движется, называется экситоном. Оно ведет себя как нейтральная «частица», которая движется через кристалл и несет с собой энергию возбуждения. Существование такого движения можно предполагать в некоторых биологических процессах, таких, как зрение или фотосинтез. Была высказана догадка, что поглощение света в сетчатке создает «экситон», который движется через некоторую периодическую структуру [такую, как слои палочек, описанные в гл. 36 (вып. 3); см. там фиг. 36.5] и аккумулируется на некоторых специальных станциях, где эта энергия используется для возбуждения химической реакции.
§ 6. Рассеяние на нерегулярностях решетки
Теперь мы хотим рассмотреть одиночный электрон в неидеальном кристалле. Наш первоначальный анализ привел к выводу, что у идеальных кристаллов и проводимость идеальна, что электроны могут скользить по кристаллу, как по вакууму, без трения. Одной из самых важных причин, способных прекратить вечное движение электрона, является несовершенство кристалла, какая-то нерегулярность в нем. Допустим, что где-то в кристалле не хватает одного атома, или предположим, что кто-то поставил на место, предназначенное для какого-то атома, совсем не тот атом, какой положено, так что в этом месте все совсем не так, как в прочих местах. Скажем, другая энергия Е0 или другая амплитуда А. Как тогда можно будет описать все происходящее?
Для определенности вернемся к одномерному случаю и допустим, что атом номер «нуль» — это атом «загрязнения», «примеси» и у него совсем не такая энергия Е0, как у других атомов. Обозначим эту энергию Е0+F. Что же происходит? Для электрона, который достиг атома «нуль», есть какая-то вероятность того, что он рассеется назад. Если волновой пакет, мчась по кристаллу, достигает места, где все немного иначе, то часть его будет продолжать лететь вперед, а другая отскочит назад. Анализировать такой случай, пользуясь волновым пакетом, очень трудно, потому что все меняется во времени. С решениями в виде установившихся состояний работать много легче. Мы обратимся поэтому к стационарным состояниям; мы увидим, что их можно составить из непрерывных волн, состоящих из двух частей — пробегающей и отраженной. В случае трех измерений мы бы назвали отраженную часть рассеянной волной, потому что она разбегалась бы во все стороны.
Исходим из системы уравнений, похожей на (11.6), за одним исключением: уравнение при n=0 не похоже на остальные. Пятерка уравнений при n=-2,-1, 0, +1 и +2 выглядит так:
(11.28)
Конечно, будут и другие уравнения при |n|>2. Они будут выглядеть так же, как (11.6).
Нам полагалось бы на самом деле для общности писать разные А, в зависимости от того, прыгает ли электрон к атому «нуль» или же от атома «нуль», но главные черты того, что происходит, вы увидите уже из упрощенного примера, когда все А равны.
Уравнение (11.10) по-прежнему будет служить решением для всех уравнений, кроме уравнения для атома «нуль» (для него оно не годится). Нам нужно другое решение; соорудим его так. Уравнение (11.10) представляет волну, бегущую в положительном направлении х. Волна, бегущая в отрицательном направлении х, тоже подошла бы в качестве решения. Мы бы написали
Самое общее решение уравнения (11.6) представляло бы собой сочетание волны вперед и волны назад:
(11.29)
Это решение представляет комплексную волну с амплитудой α, бегущую в направлении +х, и волну с амплитудой β, бегущую в направлении -х.
Теперь бросим взгляд на систему уравнений нашей новой задачи: на (11.28) плюс такие же уравнения для остальных атомов. Уравнения, куда входят аn с n≤-1, решаются формулой (11.29) при условии, что k оказывается связанным с Е и постоянной решетки b соотношением
(11.30)
Физический смысл этого таков: «падающая» волна с амплитудой α приближается к атому «нуль» (или «рассеивателю») слева, а «рассеянная» или «отраженная» волна с амплитудой β бежит обратно, т. е. налево. Не теряя общности, можно положить амплитуду α падающей волны равной единице. Тогда амплитуда β будет, вообще говоря, комплексным числом.
То же самое можно сказать и о решениях аn при n≥1. Коэффициенты могут стать иными, так что следовало бы писать
(11.31)
Здесь γ — амплитуда волны, бегущей направо, а δ — амплитуда волны, приходящей справа. Мы хотим рассмотреть такой физический случай, когда вначале волна бежит только слева, и за рассеивателем (или атомом загрязнения) имеется только «прошедшая» волна. Будем поэтому искать решение, в котором δ=0. Стало быть, мы попытаемся удовлетворить всем уравнениям для аn , кроме средней тройки в (11.28), с помощью следующих пробных решений:
(11.32)
Положение, о котором идет речь, иллюстрируется фиг. 11.6.
Фиг. 11.6. Волны в одномерной решетке а одним «примесным» атомом в n=0.
Используя формулы (11.32) для а-1 и а+1, можно из средней тройки уравнений (11.28) найти а0 и два коэффициента β и γ. Таким образом, мы найдем полное решение. Надо решить три уравнения (полагая xn =nb):
(11.33)
Вспомните, что (11.30) выражает E через k. Подставьте это значение Е в уравнения и учтите, что
тогда из первого уравнения получится
(11.34)
а из третьего
(11.35)
что согласуется друг с другом только тогда, когда
(11.36)
Это уравнение сообщает нам, что прошедшая волна (γ) — это просто исходная падающая волна (1) плюс добавочная волна (β), равная отраженной. Это не всегда так, но при рассеянии на одном только атоме оказывается, что это так. Если бы у вас была целая группа атомов примеси, то величина, добавляемая к волне, бегущей вперед, не обязательно вышла бы такой же, как у отраженной волны.
Амплитуду β отраженной волны мы можем получить из среднего из уравнений (11.33); окажется, что
(11.37)
Мы получили полное решение для решетки с одним необычным атомом.
Вас могло удивить, отчего это проходящая волна оказалась «выше», чем падавшая, если судить по уравнению (11.34). Но вспомните, что β и γ — числа комплексные и что число частиц в волне (или, лучше сказать, вероятность обнаружить частицу) пропорционально квадрату модуля амплитуды. В действительности «сохранение числа электронов» будет выполнено лишь при условии
(11.38)
Попробуйте показать, что в нашем решении так оно и есть.
§ 7. Захват нерегулярностями решетки
Бывает и другой интересный случай. Он может возникнуть, когда F число отрицательное. Если энергия электрона в атоме примеси (при n=0) ниже, чем где-либо в другом месте, то электрон может оказаться захваченным этим атомом. Иначе говоря, если Е0+F ниже самого низа полосы (меньше, чем Е0-2А), тогда электрон может оказаться «пойманным» в состояние с Е<Е0-2А. Из всего того, что мы делали до сих пор, такое решение не могло получиться. Но это решение можно получить, если в пробном решении (11.15) разрешить k принимать мнимые значения. Положим k=ix. Для n<0 и для n>0 у нас опять будут разные решения. Для n>0 допустимое решение могло бы иметь вид
В экспоненте мы выбрали плюс; иначе амплитуда при больших отрицательных n стала бы бесконечно большой. Точно так же допустимое решение для n>0 имело бы вид
(11.40)
Если подставить эти пробные решения в (11.28), то они удовлетворят всем уравнениям, кроме средней тройки, при условии, что
(11.41)
А раз сумма этих двух экспонент всегда больше 2, то эта энергия оказывается за пределами (ниже) обычной полосы. Это-то мы и искали. Оставшейся тройке уравнений (11.28) удастся удовлетворить, если взять с=с' и если ϰ выбрать так, чтобы
(11.42)
Сопоставив это уравнение с (11.41), найдем энергию захваченного электрона
(11.43)
Захваченный электрон обладает одной-единственной энергией (а не целой полосой); она расположена несколько ниже полосы проводимости.
Заметьте, что амплитуды (11.39) и (11.40) не утверждают, что пойманный электрон сидит прямо в атоме примеси. Вероятность обнаружить его у одного из соседних атомов дается квадратом этих амплитуд. Изменение ее показано столбиками на фиг. 11.7 (при каком-то наборе параметров).
Фиг. 11.7. Относительные вероятности обнаружить захваченный электрон в атомных узлах поблизости от примесного атома — ловушки.
С наибольшей вероятностью электрон можно встретить близ атома примеси. Для соседних атомов вероятность спадает экспоненциально по мере удаления от атома примеси. Это новый пример «проникновения через барьер». С точки зрения классической физики электрону не хватило бы энергии, чтобы удалиться от энергетической «дырки» близ центра захвата. Но квантовомеханически он может куда-то недалеко просочиться.
§ 8. Амплитуды рассеяния и связанные состояния
Наш последний пример может быть использован, чтобы проиллюстрировать одну вещь, которая в наши дни очень полезна для физики частиц высокой энергии. Речь идет о связи между амплитудами рассеяния и связанными состояниями. Положим, мы открыли (при помощи опытов и теоретического анализа), как пионы рассеиваются на протонах. Затем открывается новая частица и кому-то хочется узнать, не является ли она просто комбинацией из пиона и протона, объединенных в одно связанное состояние (по аналогии с тем, как электрон, будучи связан с протоном, образует атом водорода)? Под связанным состоянием мы подразумеваем комбинацию, энергия которой ниже, чем у пары свободных частиц.
Существует общая теория, согласно которой, если амплитуду рассеяния проэкстраполировать (или, на математическом языке, «аналитически продолжить») на энергии вне разрешенной зоны, то при такой энергии, при которой амплитуда становится бесконечной, возникнет связанное состояние. Физическая причина этого такова. Связанное состояние — это когда имеются только волны, стоящие близ некоторой точки; это состояние не порождается никакой начальной волной, оно просто существует само по себе. Относительная пропорция между так называемыми «рассеянными», или созданными, волнами и волнами, «посылаемыми внутрь», равна бесконечности. Эту идею мы можем проверить на нашем примере. Выразим нашу рассеянную амплитуду (11.37) прямо через энергию Е рассеявшейся частицы (а не через k). Уравнение (11.30) можно переписать в виде
поэтому рассеянная амплитуда равна
(11.44)
Из вывода формулы следует, что применять ее можно только для реальных состояний — для тех, энергия которых попадает в энергетическую полосу, Е=Е0+2А. Но представьте, что мы об этом забыли и расширили нашу формулу на «нефизические» области энергии, где |Е-Е0|>2A. Для этих нефизических областей можно написать
Тогда «амплитуда рассеяния» (что бы это выражение ни значило) равна
(11.45)
Теперь задаем вопрос: существует ли такая энергия Е, при которой β становится бесконечным (т. е. при которой выражение для β имеет «полюс»)? Да, существует, если только F отрицательно; тогда знаменатель (11.45) обратится в нуль при
т. е. при
При знаке минус получается как раз то, что мы получили в (11.43) для энергии захваченного электрона.
А как быть со знаком плюс? Он приводит к энергии выше разрешенной полосы энергий. И действительно, существует другое связанное состояние, которое мы пропустили, решая (11.28). Найти энергию и амплитуды аn для этого связанного состояния вам предоставляется самим.
Одним из ключей (причем самых надежных) к разгадке экспериментальных наблюдений над новыми странными частицами служит это соотношение между законом рассеяния и связанными состояниями.
Глава 12 ПОЛУПРОВОДНИКИ
[47]
§ 1. Электроны и дырки в полупроводниках
Одним из самых замечательных и волнующих открытий последних лет явилось применение физики твердого тела к технической разработке ряда электрических устройств, таких, как транзисторы. Изучение полупроводников привело к открытию их полезных свойств и ко множеству практических применений. В этой области все меняется так быстро, что рассказанное вам сегодня может через год оказаться уже неверным или, во всяком случае, неполным. И совершенно ясно, что, подробнее изучив такие вещества, мы со временем сумеем осуществить куда более удивительные вещи. Материал этой главы вам не понадобится для понимания следующих глав, но вам, вероятно, будет интересно убедиться, что по крайней мере кое-что из того, что вы изучили, как-то все же связано с практическим делом.
Полупроводников известно немало, но мы ограничимся теми, которые больше всего применяются сегодня в технике. К тому же они и изучены лучше других, так что разобравшись в них, мы до какой-то степени поймем и многие другие. Наиболее широко применяемые в настоящее время полупроводниковые вещества это кремний и германий. Эти элементы кристаллизуются в решетке алмазного типа — в такой кубической структуре, в которой атомы обладают четверной (тетраэдральной) связью со своими ближайшими соседями. При очень низких температурах (вблизи абсолютного нуля) они являются изоляторами, хотя при комнатной температуре они немного проводят электричество. Это не металлы; их называют полупроводниками.
Если каким-то образом в кристалл кремния или германия при низкой температуре мы введем добавочный электрон, то возникнет то, что описано в предыдущей главе. Такой электрон начнет блуждать по кристаллу, перепрыгивая с места, где стоит один атом, на место, где стоит другой. Мы рассмотрели только поведение атома в прямоугольной решетке, а для реальной решетки кремния или германия уравнения были бы другими. Но все существенное может стать ясным уже из результатов для прямоугольной решетки.
Как мы видели в гл. 11, у этих электронов энергии могут находиться только в определенной полосе значений, называемой зоной проводимости. В этой зоне энергия связана с волновым числом k амплитуды вероятности С [см. (11.24)] формулой
(12.1)
Разные A — это амплитуды прыжков в направлениях х, у и z, а а, b, с — это постоянные решетки (интервалы между узлами) в этих направлениях.
Для энергий возле дна зоны формулу (12.1) можно приблизительно записать так:
(12.2)
(см. гл. 11, § 4).
Если нас интересует движение электрона в некотором определенном направлении, так что отношение компонент k все время одно и то же, то энергия есть квадратичная функция волнового числа и, значит, импульса электрона. Можно написать
(12.3)
где α — некоторая постоянная, и начертить график зависимости Е от k (фиг. 12.1).
Фиг. 12.1. Энергетическая диаграмма для электрона в кристалле изолятора.
Такой график мы будем называть «энергетической диаграммой». Электрон в определенном состоянии энергии и импульса можно на таком графике изобразить точкой (S на рисунке).
Мы уже упоминали в гл. 11, что такое же положение вещей возникнет, если мы уберем электрон из нейтрального изолятора. Тогда на это место сможет перепрыгнуть электрон от соседнего атома. Он заполнит «дырку», а сам оставит на том месте, где стоял, новую «дырку». Такое поведение мы можем описать, задав амплитуду того, что дырка окажется возле данного определенного атома, и говоря, что дырка может прыгать от атома к атому. (Причем ясно, что амплитуда А того, что дырка перепрыгивает от атома а к атому b, в точности равна амплитуде того, что электрон от атома b прыгает в дырку от атома а.)
Математика для дырки такая же, как для добавочного электрона, и мы опять обнаруживаем, что энергия дырки связана с ее волновым числом уравнением, в точности совпадающим с (12.1) и (12.2), но, конечно, с другими численными значениями амплитуд Ах , Ay и Аz . У дырки тоже есть энергия, связанная с волновым числом ее амплитуд вероятности. Энергия ее лежит в некоторой ограниченной зоне и близ дна зоны квадратично меняется с ростом волнового числа (или импульса) так же, как на фиг. 12.1. Повторяя наши рассуждения гл. 11, § 3, мы обнаружим, что дырка тоже ведет себя как классическая частица с какой-то определенной эффективной массой, с той только разницей, что в некубических кристаллах масса зависит от направления движения. Итак, дырка напоминает частицу с положительным зарядом, движущуюся сквозь кристалл. Заряд частицы-дырки положителен, потому что она сосредоточена в том месте, где нет электрона; и когда она движется в какую-то сторону, то на самом деле это в обратную сторону движутся электроны.
Если в нейтральный кристалл поместить несколько электронов, то их движение будет очень похоже на движение атомов в газе, находящемся под низким давлением. Если их не слишком много, их взаимодействием можно будет пренебречь. Если затем приложить к кристаллу электрическое поле, то электроны начнут двигаться и потечет электрический ток. В принципе они должны очутиться на краю кристалла и, если там имеется металлический электрод, перейти на него, оставив кристалл нейтральным.
Точно так же в кристалл можно было бы ввести множество дырок. Они бы начали повсюду бродить как попало. Если приложить электрическое поле, то они потекут к отрицательному электроду и затем их можно было бы «снять» с него, что и происходит, когда их нейтрализуют электроны с металлического электрода.
Электроны и дырки могут оказаться в кристалле одновременно. Если их опять не очень много, то странствовать они будут независимо. В электрическом поле все они будут давать свой вклад в общий ток. По очевидной причине электроны называют отрицательными носителями, а дырки — положительными носителями.
До сих пор мы считали, что электроны внесены в кристалл извне или (для образования дырки) удалены из него. Но можно также «создать» пару электрон—дырка, удалив из нейтрального атома связанный электрон и поместив его в том же кристалле на некотором расстоянии. Тогда у нас получатся свободный электрон и свободная дырка, и движение их будет таким, как мы описали.
Энергия, необходимая для того, чтобы поместить электрон в состояние S (мы говорим: чтобы «создать» состояние S),— это энергия Е-, показанная на фиг. 12.2.
Фиг. 12.2. Энергия Е, требуемая для «рождения» свободного электрона.
Это некоторая энергия, превышающая Е-мин. Энергия, необходимая для того, чтобы «создать» дырку в каком-то состоянии S',— это энергия Е+ (фиг. 12.3), которая на какую-то долю выше, чем Е (=Е+мин).
Фиг. 12.3. Энергия Е+ , требуемая для «рождения» дырки в состоянии S'.
А чтобы создать пару в состояниях S и S', потребуется просто энергия Е-+Е+.
Образование пар — это, как мы увидим позже, очень частый процесс, и многие люди предпочитают помещать фиг. 12.2 и 12.3 на один чертеж, причем энергию дырок откладывают вниз, хотя, конечно, эта энергия положительна. На фиг. 12.4 мы объединили эти два графика.
Фиг. 12.4. Энергетические диаграммы для электрона и дырки.
Преимущества такого графика в том, что энергия Eпары=Е-+Е+, требуемая для образования пары (электрона в S и дырки в S'), дается попросту расстоянием по вертикали между S и S', как показано на фиг. 12.4. Наименьшая энергия, требуемая для образования пары, называется энергетической шириной, или шириной щели, и равняется E-мин+E+мин.
Иногда вам может встретиться и диаграмма попроще. Ее рисуют те, кому не интересна переменная k, называя ее диаграммой энергетических уровней. Эта диаграмма (она показана на фиг. 12.5) просто указывает допустимые энергии у электронов и дырок.
Фиг. 12.5. Диаграмма энергетических уровней для электронов и дырок.
Как создается пара электрон—дырка? Есть несколько способов. Например, световые фотоны (или рентгеновские лучи) могут поглотиться и образовать пару, если только энергия фотона больше энергетической ширины. Быстрота образования пар пропорциональна интенсивности света. Если прижать к торцам кристалла два электрода и приложить «смещающее» напряжение, то электроны и дырки притянутся к электродам. Ток в цепи будет пропорционален силе света. Этот механизм ответствен за явление фотопроводимости и за работу фотоэлементов. Пары электрон — дырка могут образоваться также частицами высоких энергий. Когда быстро движущаяся заряженная частица (например, протон или пион с энергией в десятки и сотни Мэв) пролетает сквозь кристалл, ее электрическое поле может вырвать электроны из их связанных состояний, образуя пары электрон — дырка. Подобные явления сотнями и тысячами происходят на каждом миллиметре следа. После того как частица пройдет, можно собрать носители и тем самым вызвать электрический импульс. Перед вами механизм того, что разыгрывается в полупроводниковых счетчиках, в последнее время используемых в опытах по ядерной физике. Для таких счетчиков полупроводники не нужны, их можно изготовлять и из кристаллических изоляторов. Так и было на самом деле: первый из таких счетчиков был изготовлен из алмаза, который при комнатных температурах является изолятором. Но нужны очень чистые кристаллы, если мы хотим, чтобы электроны и дырки могли добираться до электродов, не боясь захвата. Потому и используются кремний и германий, что образцы этих полупроводников разумных размеров (порядка сантиметра) можно получать большой чистоты.
До сих пор мы касались только свойств полупроводниковых кристаллов при температурах около абсолютного нуля. При любой ненулевой температуре имеется еще другой механизм создания пар электрон — дырка. Энергией пару может снабдить тепловая энергия кристалла. Тепловые колебания кристалла могут передавать паре свою энергию, вызывая «самопроизвольное» рождение пар.
Вероятность (в единицу времени) того, что энергия, достигающая величины энергетической щели Eщели, сосредоточится в месте расположения одного из атомов, пропорциональна eхр(-Ещели/ϰT), где T — температура, а ϰ — постоянная Больцмана [см. гл. 40 (вып. 4)]. Вблизи абсолютного нуля вероятность эта мало заметна, но по мере роста температуры вероятность образования таких пар возрастает. Образование пар при любой конечной температуре должно продолжаться без конца, давая все время с постоянной скоростью все новые и новые положительные и отрицательные носители. Конечно, на самом деле этого не будет, потому что через мгновение электроны случайно снова повстречаются с дырками, электрон скатится в дырку, а освобожденная энергия перейдет к решетке. Мы скажем, что электрон с дыркой «аннигилировали». Имеется определенная вероятность того, что дырка встретится с электроном и оба они друг друга уничтожат.
Если количество электронов в единице объема есть Nn (n означает негативных, или отрицательных, носителей), а плотность положительных (позитивных) носителей Np , то вероятность того, что за единицу времени электрон с дыркой встретятся и проаннигилируют, пропорциональна произведению Nn Np . При равновесии эта скорость должна равняться скорости, с какой образуются пары. Стало быть, при равновесии произведение Nn Np должно равняться произведению некоторой постоянной на больцмановский множитель
(12.4)
Говоря о постоянной, мы имеем в виду ее примерное постоянство. Более полная теория, учитывающая различные детали того, как электроны с дырками «находят» друг друга, свидетельствует, что «постоянная» слегка зависит и от температуры; но главная зависимость от температуры лежит все же в экспоненте.
Возьмем, например, чистое вещество, первоначально бывшее нейтральным. При конечной температуре можно ожидать, что число положительных и отрицательных носителей будет одно и то же, Nn =Nр . Значит, каждое из этих чисел должно с температурой меняться как eхр(-Ещели/2ϰT). Изменение многих свойств полупроводника (например, его проводимости) определяется главным образом экспоненциальным множителем, потому что все другие факторы намного слабее зависят от температуры. Ширина щели для германия примерно равна 0,72 эв, а для кремния 1,1 эв.
При комнатной температуре ϰT составляет около 1/40 эв. При таких температурах уже есть достаточно дырок и электронов чтобы обеспечить заметную проводимость, тогда как, скажем, при 30°К (одной десятой комнатной температуры) проводимость незаметна. Ширина щели у алмаза равна 6—7 эв, поэтому при комнатной температуре алмаз — хороший изолятор.
§ 2. Примесные полупроводники
До сих пор мы говорили только о двух путях введения добавочных электронов в кристаллическую решетку, которая во всем остальном совершенно идеальна. Один путь — это впрыснуть электрон от внешнего источника, а другой — выбить связанный электрон из нейтрального атома, сотворив одновременно и электрон и дырку. Но можно внедрить электроны в зону проводимости кристалла совершенно иным способом. Представим себе кристалл германия, в котором один из атомов германия заменен атомом мышьяка. У атомов германия валентность равна 4, и кристаллическая структура контролируется четырьмя валентными электронами. А у мышьяка валентность равна 5. И вот оказывается, что отдельный атом мышьяка в состоянии засесть в решетке германия (потому что габариты у него как раз такие, как надо), но при этом он будет вынужден действовать как четырехвалентный атом, тратя четыре валентных электрона из своего запаса на создание кристаллических связей и отбрасывая пятый. Этот лишний электрон привязан к нему очень слабо — энергия связи менее 1/10 эв. При комнатной температуре электрон с легкостью раздобудет такую небольшую энергию у тепловой энергии кристалла и отправится на свой страх и риск блуждать по решетке на правах свободного электрона. Примесный атом наподобие мышьяка называется донорным узлом, потому что он может снабдить кристалл отрицательным носителем. Если кристалл германия выращивается из расплава, куда было добавлено небольшое количество мышьяка, то мышьяковые донорские пункты распределятся по всему кристаллу и у кристалла появится определенная плотность внедренных отрицательных носителей.
Могло бы показаться, что малейшее электрическое поле, приложенное к кристаллу, смело бы эти носители прочь. Но этого не случится, ведь каждый атом мышьяка в теле кристалла заряжен положительно. Чтобы весь кристалл оставался нейтральным, средняя плотность отрицательных носителей — электронов — должна быть равна плотности донорных узлов. Если вы приложите к граням этого кристалла два электрода и подключите их к батарейке, пойдет ток; но если с одного конца уносятся электроны-носители, то на другой конец должны поступать свежие электроны проводимости, так что средняя плотность электронов проводимости остается все время примерно равной плотности донорных узлов.
Поскольку донорные узлы заряжены положительно, у них должно наблюдаться стремление перехватывать некоторые из электронов проводимости, когда последние блуждают по кристаллу. Поэтому донорный узел должен действовать как раз как та ловушка, о которой мы говорили в предыдущем параграфе. Но если энергия захвата достаточно мала (как у мышьяка, например), то общее число захваченных в какой-то момент носителей должно составлять лишь малую часть их общего числа. Для полного понимания поведения полупроводников этот захват, конечно, следует иметь в виду. Однако мы в дальнейшем будем считать, что энергия захвата настолько низка, а температура так высока, что на донорных узлах нет электронов. Конечно, это всего-навсего приближение.
Можно также внедрить в кристалл германия атом примеси с валентностью 3, скажем атом алюминия. Этот атом пытается выдать себя за объект с валентностью 4, воруя добавочный электрон у соседей. Он может украсть электрон у одного из соседних атомов германия и оказаться в конце концов отрицательно заряженным атомом с эффективной валентностью 4. Конечно, когда он стащит у атома германия электрон, там остается дырка; и эта дырка начинает блуждать по кристаллу на правах положительного носителя. Атом примеси, который способен таким путем образовать дырку, называется акцептором от корня «акцепт» — принимать. Если кристалл германия или кристалл кремния выращен из расплава, в который была добавлена небольшая присадка алюминия, то в кристалле окажется определенная плотность дырок, которые действуют как положительные носители.
Когда к полупроводнику добавлена донорная или акцепторная примесь, мы говорим о «примесном» полупроводнике.
Когда кристалл германия с некоторым количеством внедренной донорной примеси находится при комнатной температуре, то электроны проводимости поставляются как донорными узлами, так и путем рождения электронно-дырочных пар за счет тепловой энергии. Естественно, электроны от обоих источников вполне эквивалентны друг другу, и в игру статистических процессов, ведущих к равновесию, входит их полное число Nn . Если температура не слишком низкая, то число отрицательных носителей, поставляемых атомами донорной примеси, примерно равно количеству имеющихся атомов примеси. При равновесии уравнение (12.4) еще обязано соблюдаться; произведение Nn Np при данной температуре есть вполне определенное число. Это означает, что добавление донорной примеси, которое увеличивает число Nn, вызывает такое уменьшение количества Np положительных носителей, что Nn Np не изменяется. Если концентрация примеси достаточно высока, то число Nn отрицательных носителей определяется количеством донорных узлов и почти не зависит от температуры — все изменения в экспоненте происходят за счет Nр , даже если оно много меньше Nn . В чистом в других отношениях кристалле с небольшой концентрацией донорной примеси будут преобладать отрицательные носители; такой материал называется полупроводником «n-типа».
Если в кристаллической решетке добавлена примесь акцепторного типа, то кое-какие из новых дырок, блуждая, начнут аннигилировать с некоторыми свободными электронами, создаваемыми тепловыми флуктуациями. Это будет продолжаться до тех пор, пока не выполнится уравнение (12.4). В равновесных условиях количество положительных носителей возрастает, а количество отрицательных убывает, поддерживая произведение постоянным. Материал с избытком положительных носителей называется полупроводником «p-типа».
Если к полупроводниковому кристаллу приложить пару электродов и присоединить их к источнику разницы потенциалов, то внутри кристалла появится электрическое поле. Оно вынудит двигаться положительные и отрицательные носители, и потечет электрический ток. Посмотрим сперва, что произойдет в материале n-типа, в котором имеется подавляющее большинство отрицательных носителей. В таком материале дырками можно пренебречь; они очень слабо скажутся на токе, потому что их мало. В идеальном кристалле при конечной температуре (а особенно в кристалле с примесями) электроны перемещаются не совсем беспрепятственно. С ними беспрерывно происходят столкновения, которые сбивают их с намеченного ими пути, т. е. меняют их импульс. Эти столкновения — те самые рассеяния, о которых мы толковали в предыдущей главе и которые происходят на неровностях кристаллической решетки. В материале n-типа главной причиной рассеяния служат те самые донорные узлы, которые поставляют носителей. Раз у электронов проводимости энергия на донорных узлах немного иная, то волны вероятности обязаны на этом месте рассеиваться. Но даже в идеально чистом кристалле бывают (при ненулевой температуре) нерегулярности решетки, вызванные тепловыми колебаниями. С классической точки зрения можно говорить, что атомы не выстроены точно в правильную решетку, а в любое мгновение немного сдвинуты со своих мест по причине тепловых колебаний. Энергия Е0, связывавшаяся по теории, изложенной в гл. 11, с каждой точкой решетки, чуть-чуть меняется от одного места к другому, так что волны амплитуды вероятности не передаются идеально, а каким-то неправильным образом рассеиваются. И при очень высоких температурах или для очень чистых веществ такое рассеяние может стать очень важным, но в большинстве примесных полупроводников, применяемых в практических устройствах, рассеяние происходит только за счет атомов примеси. Мы сейчас оценим величину электрической проводимости в таких веществах.
Если к полупроводнику n-типа приложить электрическое поле, то каждый отрицательный носитель приобретет в этом поле ускорение, набирая скорость до тех пор, пока не рассеется на одном из донорных узлов. Это означает, что носители, которые обычно движутся случайным образом, имея при этом тепловую энергию, начнут в среднем повышать свою скорость дрейфа вдоль линий электрического поля, вызвав ток через кристалл. Скорость дрейфа, как правило, по сравнению с типичными тепловыми скоростями очень мала, так что можно, прикидывая величину тока, принять, что от столкновения к столкновению среднее время странствий носителя постоянно. Допустим, что эффективный электрический заряд отрицательного носителя равен qn . Сила, действующая на носитель в электрическом поле ℰ, будет равна qnℰ. В гл. 43, §3 (вып. 4) мы как раз подсчитывали среднюю скорость дрейфа в таких условиях и нашли, что она равна Fτ/m, где F — сила, действующая на заряд; τ — среднее время свободного пробега между столкновениями, а m— масса. Вместо нее надо поставить эффективную массу, которую мы подсчитывали в предыдущей главе, но поскольку нас интересует только грубый расчет, то предположим, что эта эффективная масса во всех направлениях одинакова. Мы ее здесь обозначим mn . В этом приближении средняя скорость дрейфа будет равна
(12.5)
Зная скорость дрейфа, можно найти ток. Плотность электрического тока j равна просто числу носителей в единице объема, Nn , умноженному на среднюю скорость дрейфа и на заряд носителей. Поэтому плотность тока равна
(12.6)
Мы видим, что плотность тока пропорциональна электрическому полю; такие полупроводниковые материалы подчиняются закону Ома. Коэффициент пропорциональности между j и ℰ, или проводимость σ, равен
(12.7)
Для материалов n-типа проводимость в общем не зависит от температуры. Во-первых, общее число основных носителей Nn определяется главным образом плотностью доноров в кристалле (пока температура не настолько низка, чтобы позволять атомам захватить чересчур много носителей), а, во-вторых, среднее время от соударения к соударению, τn, регулируется главным образом плотностью атомов примеси, а она, ясное дело, от температуры не зависит.
Те же рассуждения можно приложить к веществу p-типа, переменив только значения параметров, которые появляются в (12.7). Если в одно и то же время имеется сравнимое количество отрицательных и положительных носителей, то вклады носителей обоего рода надо сложить. Полная проводимость определится из
(12.8)
Для очень чистых веществ Nр и Nn примерно равны. Они будут меньше, чем у материалов с примесями, так что и проводимость будет меньше. Кроме того, они будут резко меняться с температурой (по закону ехр(-Ещели/ϰT)), так что проводимость с температурой может меняться чрезвычайно быстро.
§ 3. Эффект Холла
Конечно, это очень странно, что в веществе, где единственными более или менее свободными объектами являются электроны, электрический ток вызывается дырками, которые ведут себя как положительные частицы. Мы хотим поэтому описать опыт, который довольно явно свидетельствует, что знак носителя электрического тока может быть положительным. Пусть имеется брусок, изготовленный из полупроводящего вещества (или из металла), и мы прикладываем к нему электрическое поле, чтобы вызвать ток в каком-то направлении, скажем в горизонтальном (фиг. 12.6).
Фиг. 12.6. Эффект Холла возникает при действии магнитных сил на носители. Сверху и снизу указаны знаки заряда при положительных и отрицательных (в скобках) носителях.
Пусть мы также приложили к бруску магнитное поле под прямым углом к току, скажем, чтобы оно уходило в плоскость чертежа. Движущиеся носители будут испытывать действие магнитной силы q(v×В). А так как средняя скорость дрейфа направлена либо направо, либо налево (смотря по тому, каков знак заряда носителя), то действующая на носители средняя магнитная сила будет направлена либо вверх, либо вниз. Впрочем, нет! При выбранных нами направлениях тока и магнитного поля магнитная сила, действующая на движущийся заряд, всегда будет направлена вверх. Положительные заряды, движущиеся в направлении j (направо), подвергнутся действию силы, направленной вверх. А если ток переносится отрицательными зарядами, то они будут двигаться влево (при том же знаке тока проводимости) и также испытывают действие силы, направленной кверху. Но после установления тока никакого движения носителей вверх не будет, потому что ток может течь только слева направо. Вначале несколько зарядов могут потечь вверх, образовав вдоль верхнего края полупроводника поверхностную плотность заряда и оставив равную по величине и обратную по знаку поверхностную плотность заряда на нижней грани кристалла. Заряды на верхней и нижней поверхностях будут накапливаться до тех пор, пока электрические силы, с которыми они действуют на движущиеся заряды, в точности погасят (в среднем) действие магнитной силы, и установившийся ток пойдет по горизонтали. Заряды на верхней и нижней поверхностях создадут по вертикали поперек кристалла разность потенциалов, которую можно измерить высокоомным вольтметром (фиг. 12.7).
Фиг. 12.7. Измерение эффекта Холла.
Знак разности потенциалов, отмечаемый вольтметром, будет зависеть от знака носителей зарядов, ответственных за ток.
Когда впервые ставились эти опыты, считалось, что знак разности потенциалов окажется отрицательным, как и положено отрицательным электронам проводимости. Поэтому все были очень удивлены, обнаружив, что у некоторых веществ знак разности потенциалов совсем не тот. Дело выглядело так, словно носитель тока — частица с положительным знаком. Из наших рассуждений о примесных полупроводниках ясно, что полупроводник n-типа обязан вызывать знак разности потенциалов, свойственный отрицательным носителям, а полупроводник p-типа должен вызывать разность потенциалов противоположного знака, поскольку ток создается положительно заряженными дырками.
Открытие аномального знака разности потенциалов в эффекте Холла сначала было сделано не в полупроводнике, а в металле. Считалось, что уж в металлах-то проводимостью всегда занимаются электроны, и вдруг оказалось, что у бериллия знак разности потенциалов не тот. Теперь ясно, что в металлах, как и в полупроводниках, при некоторых обстоятельствах «объектами», ответственными за проводимость, оказываются дырки. Хотя в конечном счете в кристалле движутся электроны, тем не менее соотношение между импульсом и энергией и отклик на внешнее поле в точности такие, каких следовало бы ожидать, если бы электрический ток осуществлялся положительными частицами.
Поглядим, нельзя ли качественно оценить, какая разность потенциалов может быть получена при эффекте Холла. Если ток через вольтметр (см. фиг. 12.7) пренебрежимо мал, то заряды внутри полупроводника должны двигаться слева направо и вертикальная магнитная сила должна в точности гаситься вертикальным электрическим полем, которое мы обозначим ℰ┴ (индекс означает «поперечный»). Чтобы это электрическое поле уничтожало магнитные силы, должно быть
(12.9)
Припоминая связь между скоростью дрейфа и плотностью электрического тока, приведенную в (12.6), получаем
Разность потенциалов между верхом и низом кристалла равна, естественно, этой самой напряженности электрического поля, умноженной на высоту кристалла. Напряженность электрического поля в кристалле ℰ┴ пропорциональна плотности тока и напряженности магнитного поля. Множитель пропорциональности 1/qN называется коэффициентом Холла и обычно изображается символом RH . Коэффициент Холла зависит просто от плотности носителей при условии, что носители одного знака находятся в явном большинстве. Поэтому измерение эффекта Холла дает удобный способ опытным путем определять плотность носителей в полупроводнике.
§ 4. Переходы между полупроводниками
Теперь мы хотим выяснить, что получится, если взять два куска германия или кремния с неодинаковыми внутренними характеристиками, скажем с разным количеством примеси, и приложить их друг к другу, чтобы возник «переход». Начнем с того, что именуется p—n-переходом, когда с одной стороны границы стоит германий p-типа, а с другой — германий n-типа (фиг. 12.8).
Фиг. 12.8. p — n-переход.
Практически не очень удобно прикладывать друг к другу два разных куска германия и добиваться однородности контакта между ними на атомном уровне. Вместо этого переходы делают из одного кристалла, обработанного в разных концах по-разному. Один из приемов состоит в том, чтобы после того, как из расплава была выращена половинка кристалла, добавить в оставшийся расплав подходящую присадку. Другой способ — это нанести на поверхность немного примесного элемента и затем подогреть кристалл, чтобы часть атомов примеси продиффундировала в тело кристалла. У сделанных такими способами переходов нет резкой границы, хотя сами границы могут быть сделаны очень тонкими — до 10-4 см. Для наших рассуждений мы вообразим идеальный случай, когда эти две области кристалла с разными свойствами резко разграничены. В n-области p—n-перехода имеются свободные электроны, которые могут переходить с места на место, а также фиксированные донорные узлы, которые уравновешивают полный электрический заряд. В p-области имеются свободные дырки, тоже переходящие с места на место, и равное количество отрицательных акцепторных узлов, гасящих полный заряд. Но в действительности такое описание положения вещей годится лишь до тех пор, пока между материалами не осуществлен контакт. Как только материалы соединятся, положение на границе изменится. Теперь, достигнув границы в материале n-типа, электроны не отразятся обратно, как это было бы на свободной поверхности, а смогут прямо перейти в материал p-типа. Часть электронов из материала n-типа поэтому будет стремиться проскользнуть в материал p-типа, где электронов меньше. Но так длиться без конца не может, потому что по мере того, как в n-области будут теряться электроны, ее заряд начнет становиться все более положительным, пока не возникнет электрическое напряжение, которое затормозит диффузию электронов в p-область. Подобным же образом положительные носители из материала p-типа смогут проскальзывать через переход в материал n-типа, оставляя позади себя избыток отрицательного заряда. В условиях равновесия полный ток диффузии должен будет равняться нулю. Это произойдет благодаря возникновению электрических полей, которые установятся таким образом, чтобы возвращать положительные носители обратно в p-область.
Оба описанных нами процесса диффузии продолжаются одновременно, и оба, как видите, действуют в таком направлении, чтобы материал n-типа зарядить положительно, а материал p-типа — отрицательно. Вследствие конечной проводимости полупроводящих материалов изменение потенциала между p-областью и n-областью произойдет в сравнительно узком участке близ границы; в основной же массе каждой области потенциал будет однороден. Проведем перпендикулярно границе ось х. Тогда электрический потенциал будет меняться с х так, как показано на фиг. 12.9,б.
Фиг. 12.9. Электрический потенциал и плотности носителей в полупроводниковом переходе без смещающего напряжения.
На фиг. 12.9,в показано ожидаемое изменение плотности Nn n-носителей и плотности Np p-носителей. Вдали от перехода плотности носителей Np и Nn должны быть попросту равны той равновесной плотности, которой положено устанавливаться в определенном бруске того же материала при той же температуре. (Фиг. 12.9 вычерчена для перехода, в котором в материале p-типа примеси больше, чем в материале n-типа.) Из-за перепада потенциала на переходе положительным носителям приходится взбираться на потенциальный холм, чтобы попасть в p-область. Это означает, что в условиях равновесия в материале n-типа будет меньше положительных носителей, чем в материале p-типа. Можно ожидать (вспомните законы статистической механики), что отношение количеств носителей p-типа в обеих областях будет даваться уравнением
(12.10)
Произведение qp V в числителе показателя экспоненты — это как раз та энергия, которая требуется, чтобы пронести заряд qp сквозь разность потенциалов V.
Точно такое же уравнение существует и для плотностей носителей n-типа:
(12.11)
Если мы знаем равновесные плотности в каждом из двух материалов, то любое из этих уравнений даст нам разность потенциалов на переходе.
Заметьте, что для того, чтобы (12.10) и (12.11) давали одинаковые значения разности потенциалов V, произведение Np Nn должно быть в p-области и в n-области одним и тем же. (Вспомните, что qn =-qp .) Но мы еще раньше видели, что это произведение зависит только от температуры и от ширины энергетической щели кристалла. Если обе части кристалла находятся при одинаковой температуре, оба уравнения будут совместны, давая одинаковое значение разности потенциалов.
Но раз между двумя сторонами перехода имеется разность потенциалов, то это напоминает батарейку. Если соединить n-область с p-областью проволочкой, может по ней пойдет ток? Это будет замечательно, ведь тогда ток будет идти без остановки, не истощая материала, и мы будем обладать бесконечным источником энергии в нарушение второго закона термодинамики! Но если вы действительно соедините p-область с n-областью проводами, никакого тока не будет. И легко понять почему.
Возьмем сперва проводничок из материала без примесей. Если подсоединить его к n-области, получится переход, на котором возникнет разность потенциалов. Пусть, скажем, она составит половину всей разности потенциалов между p- и n-областями. А когда мы подведем нашу чистую проволоку к p-области перехода, то там снова, на новом переходе, возникнет разность потенциалов, опять равная половине падения потенциала на p—n-переходе. Во всех переходах разности потенциалов так приладятся друг к другу, что никакой ток в схеме не пойдет. И какой бы вы проволокой ни начали соединять обе стороны p—n-перехода, у вас всегда выйдет два новых перехода, и до тех пор, пока температура всех переходов одинакова, скачки потенциалов на переходах будут компенсировать друг друга и тока не будет. Оказывается, однако (если вы рассчитаете все детали), что если у части переходов температура отличается от температуры других частей, то ток пойдет. Этот ток будет нагревать одни переходы и охлаждать другие, и тепловая энергия будет превращаться в электрическую. Это явление определяет собой действие термопар, применяемых для измерения температуры, и термоэлектрических генераторов. То же явление используется и в небольших холодильниках.
Но если мы не в состоянии измерять разность потенциалов между двумя сторонами p—n-перехода, то откуда уверенность, что перепад потенциалов, показанный на фиг. 12.9, действительно существует? Ну, во-первых, можно осветить переход светом. Когда фотоны света поглощаются, они могут образовать пару электрон — дырка. В том сильном электрическом поле, которое существует в переходе (равном наклону потенциальной кривой на фиг. 12.9), дырку затянет в p-область, а электрон — в n-область. Если теперь обе стороны перехода подсоединить ко внешней цепи, эти добавочные заряды вызовут ток. Энергия света перейдет в электрическую энергию перехода. Солнечные батареи, которые генерируют для спутников электрическую мощность, действуют именно на этом принципе.
Обсуждая свойства полупроводникового перехода, мы предполагали, что дырки и электроны действуют более или менее независимо, если не считать того, что они как-то все же приходят в тепловое равновесие. Когда мы говорили о токе, получающемся при освещении перехода светом, то предполагали, что электрон или дырка, образующиеся в области перехода, прежде чем аннигилировать с носителем противоположной полярности, успеют попасть в само тело кристалла. В непосредственной близости от перехода, где плотности носителей обоих знаков примерно одинаковы, аннигиляция пар электрон — дырка (называемая часто «рекомбинацией») — очень важный эффект, и его следует принимать во внимание при детальном анализе полупроводникового перехода.
Мы предполагали, что дырка или электрон, образуемые в области перехода, имеют хороший шанс еще до рекомбинации попасть в основное тело кристалла. Типичное время, требующееся электрону или дырке для того, чтобы найти противоположного партнера и аннигилировать, для типичных полупроводниковых материалов колеблется между 10-3 и 10-7 сек. Кстати, это время много больше времени среднего свободного пробега τ между столкновениями с узлами рассеяния в кристалле,— того времени, которым мы пользовались при анализе проводимости. В типичном p—n-переходе время, требуемое на то, чтобы смести в тело кристалла электрон или дырку, возникшую в области перехода, намного меньше времени рекомбинации. Поэтому большинство пар вливается во внешний ток.
§ 5. Выпрямление на полупроводниковом переходе
Теперь мы покажем, как получается, что p—n-переход действует как выпрямитель. Если мы к переходу приложим напряжение одного знака, то пойдет большой ток, если другого — тока почти не будет. А если к переходу приложить переменное напряжение, то ток пойдет только в одну сторону — он «выпрямится». Посмотрим еще раз, что получается в условиях равновесия, описанных кривыми фиг. 12.9. В материале p-типа имеется высокая концентрация Np положительных носителей. Эти носители повсюду диффундируют, и некоторое их количество каждую секунду приближается к переходу. Этот ток положительных носителей, достигающих перехода, пропорционален Np . Большая часть их, однако, разворачивается обратно, не будучи в состоянии взять высокий потенциальный холм у перехода, и только доля e- qV /ϰ T их проходит дальше. Имеется также ток положительных носителей, приближающихся к переходу с другой стороны. Этот ток тоже пропорционален плотности положительных носителей в n-области, но здесь плотность носителей намного ниже плотности в p-области. Когда положительные носители приближаются из n-области к переходу, они обнаруживают перед собой холм с отрицательным склоном и сходу соскальзывают под гору, на p-сторону перехода. Обозначим этот ток I0. В условиях равновесия токи в обе стороны одинаковы. Значит, можно ожидать, что будет выполняться следующее соотношение:
(12.12)
Вы замечаете, что оно на самом деле совпадает с (12.10). Мы просто вывели его другим способом.
Допустим, однако, что мы снизили напряжение на n-стороне перехода на величину ΔV — это можно сделать, приложив к переходу внешнюю разность потенциалов. Теперь разница в потенциалах по обе стороны потенциального холма уже не V, а V-ΔV. У тока положительных носителей из p-области в n-область теперь в показателе экспоненты будет стоять именно эта разность потенциалов. Обозначая этот ток через I1; имеем
Этот ток превосходит ток I0 в e- q Δ V /ϰ T раз. Значит, между I1 и I0 существует следующая связь:
(12.13)
Ток из p-области при приложении внешнего напряжения ΔV растет по экспоненте. А ток положительных носителей из n-области остается постоянным, пока ΔV не слишком велико.
Достигая барьера, эти носители по-прежнему будут видеть перед собой идущий под гору потенциал и будут все скатываться в p-область. (Если ΔV больше естественной разности потенциалов V, положение может измениться, но что случается при таких высоких напряжениях, мы рассматривать не будем.) В итоге ток положительных носителей I, текущий через переход, будет определяться разницей токов в обе стороны:
(12.14)
Дырочный ток I течет в n-область. Там дырки диффундируют в самую глубь n-области и могут, вообще говоря, аннигилировать на основной массе отрицательных носителей электронов. Убыль электронов, теряемых при этой аннигиляции, восполняется током электронов из внешнего контакта материала n-типа.
Когда ΔV=0, то и ток в (12.14) равен нулю. Если ΔV положительна, ток с напряжением резко растет, а если ΔV отрицательна, знак тока меняется, но экспоненциальный член вскоре становится пренебрежимо малым, и отрицательный ток никогда не превышает I0 — величины, которая, по нашему предположению, очень мала. Этот обратный ток I0 ограничен той слабой плотностью, которой обладают неосновные носители в n-области перехода.
Если вы проведете в точности тот же анализ для тока отрицательных носителей, текущего через переход, сперва без внешней разности потенциалов, а после с небольшой приложенной извне разностью потенциалов ΔV, то для суммарного электронного тока вы опять получите уравнение, похожее на (12.14). Поскольку полный ток есть сумма токов носителей обоего рода, то (12.14) применимо и к полному току, если только отождествить I0 с максимальным током, который может течь при перемене знака напряжения.
Вольтамперная характеристика (12.14) показана на фиг. 12.10.
Фиг. 12.10. Зависимость тока через переход от приложенного к нему напряжения.
Она демонстрирует нам типичное поведение кристаллических диодов, подобных тем, которые применяются в современных вычислительных машинах. Нужно только заметить, что (12.14) справедливо лишь при невысоких напряжениях. При напряжениях, сравнимых с естественной внутренней разностью потенциалов V (или превышающих ее), в игру входят новые явления и ток уже не подчиняется столь простому уравнению.
Быть может, вы вспомните, что в точности такое же уравнение мы получили, говоря о «механическом выпрямителе» — храповике и собачке [см. гл. 46 (вып. 4)]. Мы получали те же уравнения, потому что лежащие в их основе физические процессы весьма схожи.
§ 6. Транзистор
Пожалуй, самым важным применением полупроводников является изобретение транзистора. Состоит он из двух полупроводниковых переходов, расположенных вплотную друг к другу, и работа его частично опирается на те же принципы, которые мы только что описывали, говоря о полупроводниковом диоде — выпрямляющем переходе. Предположим, что мы изготовили из германия небольшой брусочек, составленный из трех участков: p-область, n-область и опять p-область (фиг. 12.11,а).
Фиг. 12.11. Распределение потенциала вдоль транзистора, если не приложено напряжение.
Такое сочетание именуется p—n—p-транзистором. Ведут себя эти переходы в транзисторе примерно так же, как описывалось в предыдущем параграфе. В частности, в каждом переходе должен наблюдаться перепад потенциала — падение потенциала из n-области в каждую из p-областей. Если внутренние свойства обеих p-областей одинаковы, то потенциал вдоль брусочка меняется так, как показано на фиг. 12.11,б.
Теперь представьте себе, что каждая из трех областей подключена к источнику внешнего напряжения (фиг. 12.12,а). Будем относить все напряжения к контакту, присоединенному к левой p-области, так что на этом контакте потенциал будет равен нулю.
Фиг. 12.12. Распределение потенциала в работающем транзисторе.
Этот контакт мы назовем эмиттером; n-область называется базой, или основанием, к ней подведен слабый отрицательный потенциал; правая p-область называется коллектором, к ней подведен намного больший отрицательный потенциал. В таких условиях потенциал будет меняться вдоль кристалла так, как показано на фиг. 12.12,б.
Посмотрим сначала, что происходит с положительными носителями, потому что именно их поведение в первую очередь управляет работой p—n—p-транзистора. Раз потенциал эмиттера более положителен, нежели потенциал базы, то из эмиттера в базу пойдет ток положительных носителей. Ток этот довольно велик, потому что перед нами переход, работающий при «подталкивающем напряжении» (что отвечает правой половине кривой на фиг. 12.10). При таких условиях положительные носители, или дырки, будут «эмиттироваться» из p-области в n-область. Может показаться, что этот ток вытечет из n-области через контакт Б. Но здесь-то и таится секрет транзистора. Эта n-область делается очень узкой, толщиной обычно в 10-3 см, а то и уже, намного уже, чем ее поперечные размеры. Следовательно, у дырок, попавших в n-область, имеется очень большой шанс успеть продиффундировать через всю область до следующего перехода, прежде чем они аннигилируют с электронами n-области. А когда они подойдут к правой границе n-области, они обнаружат перед собой крутой спуск с потенциального холма и сходу ссыплются в правую p-область. Эта сторона кристалла называется коллектором, потому что он собирает дырки после того, как они проскользнут через n-область. В типичном транзисторе почти весь дырочный ток, вышедший из эмиттера и попавший на базу, собирается в области коллектора, и только жалкие остатки (доли процента) включаются в суммарный ток с электрода базы. Сумма токов из базы и коллектора, естественно, равна току через эмиттер.
Теперь представим себе, что получится, если мы будем слегка менять потенциал VБ контакта. Поскольку мы находимся на сравнительно крутой части кривой фиг. 12.10, легкие изменения потенциала VБ довольно значительно отразятся на токе эмиттера IЭ. А напряжение на коллекторе VК намного более отрицательно, чем напряжение на электроде базы, и эти слабые изменения потенциала не скажутся заметно на крутом потенциальном холме между базой и коллектором. Большинство положительных носителей, испущенных в n-область, по-прежнему будут попадать в коллектор. Итак, изменениям потенциала электрода базы будут отвечать изменения тока через коллектор IK. Существенно, однако, что ток через базу IБ все время будет составлять лишь небольшую часть тока через коллектор. Транзистор — это усилитель; небольшой ток IБ , проходящий через электрод базы, приведет к сильному току (раз в 100 сильней, а то и больше) через коллекторный электрод.
А как же обстоит дело с электронами — с отрицательными носителями, которыми мы до сих пор пренебрегали? Заметьте, во-первых, что между базой и коллектором мы не ожидаем сколько-нибудь заметного тока электронов. При столь большом отрицательном напряжении на коллекторе электронам из базы пришлось бы карабкаться на очень высокий потенциальный холм, и вероятность этого очень мала. Ток электронов на коллектор очень слаб.
Но, с другой стороны, электроны с базы могут переходить в область эмиттера. Можно ожидать, что электронный ток в этом направлении будет сравним с дырочным током от эмиттера к базе. Такой электронный ток пользы не приносит, даже наоборот, потому что он увеличивает полный ток через базу, нужный для того, чтобы ток дырок к коллектору имел данную величину. Поэтому транзистор устраивается так, чтобы ток электронов к эмиттеру свести до самой малости. Электронный ток пропорционален Nn (базы)—плотности отрицательных носителей в веществе базы, тогда как дырочный ток от эмиттера зависит от Np (эмиттера)—плотности положительных носителей в области эмиттера. Сравнительно небольшим добавлением примеси в материал n-типа Nn (базы) может быть сделано много меньше, чем Np (эмиттера). (Кроме того, сильно помогает очень малая толщина базы, потому что выметание дырок из этой области в коллектор заметно увеличивает средний дырочный ток от эмиттера к базе, не затрагивая электронного тока.) В итоге ток электронов через переход эмиттер — база может быть сделан много слабее тока дырок, так что электроны в работе p—n—p-транзистора заметной роли не играют. Токи в основном определяются движением дырок, и транзистор играет роль усилителя.
Можно также сделать транзистор, поменяв на фиг. 12.11 местами материалы p-типа и n-типа. Тогда получится так называемый n—p—n-транзистор. В таком транзисторе основной ток — это ток электронов, текущий от эмиттера к базе, а оттуда — в коллектор. Разумеется, все рассуждения, которые мы проводили для p—n—p-транзистора, в равной мере применимы и к n—p—n-транзистору, если только переменить знаки потенциалов электродов.
Глава 13 ПРИБЛИЖЕНИЕ НЕЗАВИСИМЫХ ЧАСТИЦ
§ 1. Спиновые волны
В гл. 11 мы разработали теорию распространения электрона или любой другой «частицы», например атомного возбуждения, вдоль кристаллической решетки. В предыдущей главе мы эту теорию применили к полупроводникам. Но хотя электронов у нас всегда было много, мы тем не менее неизменно пренебрегали каким-либо взаимодействием между ними. Это, конечно, было не более чем приближение, и мы сейчас постараемся глубже разобраться в самой мысли о том, что взаимодействием между электронами разрешается пренебрегать. Мы к тому же воспользуемся возможностью продемонстрировать новые применения теории распространения частиц. Поскольку мы по-прежнему будем продолжать пренебрегать взаимодействием между частицами, то фактически в этой главе будет очень мало нового, разве что новые приложения. Однако первый пример, который мы хотим рассмотреть,— это пример, в котором есть возможность совершенно точно выписать правильные уравнения для случая, когда «частиц» больше чем одна. Из них мы сможем увидеть, как делается приближение пренебрежения взаимодействием. Впрочем, мы не будем слишком тщательно анализировать эту проблему.
В качестве первого примера рассмотрим «спиновую волну» в ферромагнитном кристалле.
Теории ферромагнетизма мы касались в гл.36 (вып. 7). При нулевой температуре все спины электронов, которые дают вклад в магнетизм всего ферромагнитного кристалла, параллельны между собой. Между спинами существует энергия взаимодействия, которая ниже всего тогда, когда все спины направлены вниз. Но при ненулевой температуре имеется какая-то вероятность того, что часть спинов перевернется. Эту вероятность тогда мы приближенно подсчитывали. На этот раз мы разовьем квантовомеханическую теорию явления, чтобы знать, что делать, если нужно будет решить задачу точнее. Но мы все еще будем прибегать к идеализации: будем считать, что электроны расположены вблизи атомов, а спины взаимодействуют только со своими соседями.
Рассмотрим такую модель: пусть в каждом атоме все электроны, кроме одного, спарены, и весь магнитный эффект обязан тому, что в каждом атоме остается один неспаренный электрон со спином 1/2. Вообразим еще, что эти электроны расположены в тех самых узлах решетки, где находятся атомы. Модель в общих чертах отвечает металлическому никелю.
Кроме того, допустим, что любая пара вращающихся соседей-электронов взаимодействует друг с другом и что каждое такое взаимодействие добавляет в энергию системы по слагаемому:
(13.1)
Здесь σ представляют собой спины, а суммирование идет по всем парам соседей-электронов. Мы уже говорили о подобной энергии взаимодействия, рассматривая сверхтонкое расщепление водорода, вызываемое взаимодействием магнитных моментов электрона и протона в атоме водорода. Тогда мы выражали это в виде Аσе ·σр . На этот раз для данной пары, скажем для электронов из атома № 4 и из атома № 5, гамильтониан имеет вид —Kσ4·σ5. Каждая такая пара дает по одному слагаемому, а весь гамильтониан (как это бывает и с классическими энергиями) есть сумма таких слагаемых для каждой взаимодействующей пары. Энергия написана с множителем —К, так что положительное К отвечает ферромагнетизму, т. е. тому случаю, когда наинизшая энергия получается при параллельности соседних спинов. В реальном кристалле могут появиться и другие слагаемые — взаимодействие с соседом через одного и т. д., но на нашем уровне такие усложнения нам не понадобятся.
Располагая гамильтонианом (13.1), мы обладаем и полным описанием ферромагнетика (в рамках нашего приближения), так что из него должны получиться все магнитные свойства. Кроме того, из него же должны получаться и термодинамические свойства при намагничивании. Если мы сможем определить все уровни энергии, то можно будет найти и свойства кристалла при температуре T, основываясь на том, что для системы вероятность оказаться в данном состоянии с энергией Е пропорциональна e- Е /ϰ Т . Эта задача никогда не была решена до конца.
Некоторые задачи мы сможем разобрать на простом примере, когда все атомы лежат на одной прямой — случай одномерной решетки. Все эти представления вы потом легко сможете распространить на трехмерную решетку. Возле каждого атома имеется электрон; у него есть два возможных состояния — либо спином вверх, либо вниз, и вся система описывается перечислением направлений спинов. В качестве гамильтониана системы возьмем оператор энергии взаимодействия. Интерпретируя спиновые векторы (13.1) как сигма-операторы, или сигма-матрицы, мы напишем для линейной решетки
(13.2)
В этом уравнении для удобства написан множитель А/2 (так что некоторые из дальнейших уравнений в точности совпадут с уравнениями из гл. 11).
Каково же наинизшее состояние системы? Состояние наинизшей энергии это то состояние, когда все спины параллельны, скажем все глядят вверх. Это состояние можно обозначить |... + + + + ...>, или |осн.>, чтобы подчеркнуть, что оно «основное», наинизшее. Энергию этого состояния легко себе представить. Можно, например, расписать все сигма-векторы через ^σх , ^σу и ^σz , аккуратно подсчитать, каков вклад каждого из них в энергию основного состояния, и все затем сложить. Путь, однако, можно сильно сократить. В гл. 10, § 2 (вып. 8) мы видели, что ^σi ·^σj может быть выражено через спин-обменный оператор Паули:
(13.3)
где оператор ^Pijспин-обм обменивает спины i-го и j-го электронов. После этой подстановки гамильтониан обращается в
(13.4)
Теперь уже легко подсчитать, что происходит в различных состояниях. Например, если и i и j смотрят вверх, то обмен спинами ничего не меняет, так что ^Pij , действуя на состояние, опять приводят к тому же состоянию, т. е. оно равнозначно умножению на +1. Выражение ^Рij -1/2 просто равно 1/2. (В дальнейшем слова «спин-обм» над Р мы писать не будем.)
В основном состоянии все спины направлены вверх; значит, обмен любой парой спинов приводит опять к исходному состоянию. Основное состояние является стационарным. Если подействовать на него гамильтонианом, получится опять то же состояние, умноженное на сумму чисел —(А/2), по одному на каждую пару спинов. Иначе говоря, энергия системы в основном состоянии составляет по —А/2 на атом.
Теперь подсчитаем энергии некоторых возбужденных состояний. Удобно будет отсчитывать энергии от основного состояния, т. е. в качестве нулевой энергии выбрать энергию основного состояния. Этого можно добиться, добавив к каждому слагаемому в гамильтониане по энергии А/2. Тогда 1/2 в (13.4) просто заменится единицей. Наш новый гамильтониан будет равен
(13.5)
При таком гамильтониане энергия низшего состояния равна нулю; спин-обменный оператор равнозначен умножению на единицу (для основного состояния), что сокращается с единицей в каждом слагаемом.
Для описания состояний, отличных от основного, нам понадобится своя совокупность базисных состояний. Удобно подойти к делу так: сгруппировать состояния в соответствии с тем, у скольких электронов спин направлен вниз: у одного ли, у двух и т. д. Конечно, состояний, когда один спин направлен вниз, очень много: он может быть опрокинут, скажем, у атома № 4 или у № 5, или у № 6... И можно, конечно, в качестве базисных состояний выбрать именно такие состояния, обозначив их |4>, |5>, |6>, ... Однако для дальнейшего удобнее, если мы будем отмечать «из ряда вон выходящий атом» (тот, у которого спин направлен вниз) его координатой х. Иначе говоря, мы определим состояние |х5> как такое, в котором все электроны вращаются спинами вверх, и один только (тот, что возле атома в точке х5) вращается спином вниз (фиг. 13.1).
Фиг. 13.1. Базисное состояние |x5 > системы спинов, расположенных по одной линии. Все спины направлены вверх, а тот, что в х5 , перевернут.
Вообще, |хn > будет обозначать состояние с одним перевернутым спином, расположенным в координате хn n-го атома.
Как же действует гамильтониан (13.5) на состояние |x5>? Один из членов гамильтониана это, скажем, — А(^P7,8-1). Оператор ^P7,8 обменивает спинами два соседних атома № 7 и № 8. Но в состоянии |x5> они оба направлены вверх, так что ничего не меняется; ^P7,8 равнозначно умножению на единицу:
Отсюда следует
Стало быть, все члены гамильтониана, кроме тех, куда входит атом № 5, дадут нуль. Операция ^P4,5, действуя на состояние |x5>, обменивает спинами атом № 4 (со спином вверх) и атом № 5 (со спином вниз). В результате появляется состояние, в котором все спины смотрят вверх, кроме атома в точке 4. Иначе говоря,
Точно так же
Значит, изо всего гамильтониана выживут только члены —A(^P4,5—1) и A(^P5,6—1). Действуя на |x5>, они дадут соответственно —A|x4>+A|x5> и —A|x6>+A|x5>.
В итоге
(13.6)
Когда гамильтониан действует на состояние |x5>, то возникает некоторая амплитуда оказаться в состояниях |x4> и |х6>. Это просто означает, что существует определенная амплитуда того, что направленный книзу спин перепрыгнет к соседнему атому. Значит, из-за взаимодействия между спинами, если вначале один спин был направлен вниз, имеется некоторая вероятность того, что позднее вместо него вниз будет смотреть другой. При действии на состояние |хn > гамильтониан дает
(13.7)
Заметьте, в частности, что если взять полную систему состояний только с одним спином-«перевертышем», то они будут перемешиваться только между собой. Гамильтониан никогда не перемешает эти состояния с другими, в которых спинов-«перевертышей» больше. Пока вы только обмениваетесь спинами, вы никогда не сможете изменить общего количества перевертышей. Удобно будет использовать для гамильтониана матричное обозначение, скажем, Hn,m ≡
(13.8)
Каковы же теперь уровни энергии для состояний с одним перевернутым спином? Пусть, как обычно, Сn — амплитуда того, что некоторое состояние |ψ> находится в состоянии |xn >. Если мы хотим, чтобы |ψ> было состоянием с определенной энергией, то все Сn обязаны одинаково меняться со временем, а именно по правилу
(13.9)
Подставим это пробное решение в наше обычное уравнение Гамильтона
(13.10)
используя в качестве матричных элементов (13.8). Мы, конечно, получим бесконечное количество уравнений, но все их можно будет записать в виде
(13.11)
Перед нами опять в точности та же задача, что и в гл. 11, только там, где раньше стояло Е0, теперь стоит 2А. Решения отвечают амплитудам Сn (амплитудам с перевернутым спином), которые распространяются вдоль решетки с константой распространения k и энергией
(13.12)
где b — постоянная решетки.
Решения с определенной энергией отвечают «волнам» переворота спина, называемым «спиновыми волнами». И для каждой длины волны имеется соответствующая энергия. Для больших длин волн (малых k) эта энергия меняется по закону
(13.13)
Как и прежде, мы можем теперь взять локализованный волновой пакет (содержащий, однако, только длинные волны), который соответствует тому, что электрон-«перевертыш» окажется в такой-то части решетки. Этот перевернутый спин будет вести себя как «частица». Так как ее энергия связана с k формулой (13.13), то эффективная масса «частицы» будет равна
(13.14)
Такие «частицы» иногда именуют «магнонами».
§ 2. Две спиновые волны
Теперь мы хотели бы выяснить, что происходит, когда имеется пара перевернутых спинов. Опять начнем с выбора системы базисных состояний. Выберем такие состояния, когда спины перевернуты в каких-то двух местах (так, как на фиг. 13.2).
Фиг. 13.2. Состояния с двумя перевернутыми спинами.
Эти состояния можно, скажем, отмечать x-координатами тех двух узлов решетки, в которых оказались электроны с перевернутым спином. То, что на рисунке, можно обозначить |х2, х5>. В общем случае базисные состояния будут |хn , хm > — дважды бесконечная совокупность! При таком способе описания состояние |x4, х9> и состояние |х9, x4> совпадают, потому что каждое из них просто говорит, что в точках 4 и 9 спин перевернут; порядок их не имеет значения. Не имеет также смысла состояние |x4, х4> — такого просто быть не может. Любое состояние |ψ> мы можем описать, задав амплитуды того, что оно обнаружится в одном из базисных состояний.
Итак, Сm,n =<хm ,хn |ψ> теперь означает амплитуду того, что система в состоянии |ψ> окажется в состоянии, когда у электронов, стоящих вблизи m-го и n-го атомов, спины смотрят вниз. Сложности, которые теперь возникнут, будут связаны не с усложнением идей,— это будут просто усложнения в бухгалтерии. (Одна из сложностей квантовой механики как раз и состоит в громоздкости бухгалтерии. Чем больше спинов перевернется, тем сложнее станут обозначения, тем больше будет индексов, тем страшнее будут выглядеть уравнения; но сами идеи вовсе не обязательно должны усложниться.)
Уравнения движения спиновой системы — это дифференциальные уравнения для Сn,m :
(13.15)
Пусть нам опять нужно найти стационарные состояния. Как обычно, производные по времени обратятся в Е, умноженное на амплитуду, а Cm,n , заменятся коэффициентами аm,n . Затем надо аккуратно рассчитать влияние Н на состояние с перевернутыми спинами m и n. Это сделать нетрудно. Представьте на минуту, что m далеко от n, так что не нужно думать, что будет, если ... и т. д. Обменная операция, производимая в точке хn , передвинет перевернутый спин либо к (n+1)-му, либо к (n-1)-му атому, так что имеется ненулевая амплитуда того, что теперешнее состояние получилось из состояния |хm , хn +1 >, и амплитуда того, что оно произошло из состояния |хm , хn -1 >. Но передвинуться мог и второй спин, так что не исключена и какая-то амплитуда того, что Сm,n питается от Сm +1, n или от Сm -1, n . Все эти эффекты должны быть одинаковы. Окончательный вид гамильтонова уравнения для Сm,n таков:
(13.16)
Это уравнение пригодно всегда, за исключением двух случаев. При m=n уравнения вообще нет, а при m=n±1 пара членов в (13.16) должна пропасть. Этими исключениями мы пренебрежем. Мы просто будем игнорировать тот факт, что некоторые из этих уравнений слегка меняются. Ведь как-никак кристалл считается бесконечным и слагаемых в гамильтониане бесчисленно много; пренебрежение некоторым их числом вряд ли сильно на чем-то скажется. Итак, в первом грубом приближении давайте позабудем об изменениях уравнений. Иными словами, допустим, что (13.16) верно при всех m и n, даже когда m и n стоят по соседству. Это самое существенное в нашем приближении.
Теперь уже решение отыскать нетрудно. Мы немедленно получаем
(13.17)
где
(13.18)
а
(13.19)
Поразмыслим минутку о том, что было бы, если бы у нас были две независимые, отдельные спиновые волны (как в предыдущем параграфе), соответствующие k=k1 и k=k2; их энергии из (13.12) имели бы вид
и
Заметьте, что энергия Е в (13.19) является как раз их суммой:
Иными словами, наше решение можно толковать следующим образом. Имеются две частицы, т. е. пара спиновых волн, одна из которых обладает импульсом, описываемым числом k1, а другая — числом k2; энергия системы равна сумме энергий этих двух объектов. Обе частицы действуют совершенно независимо. Вот и все, что в этом есть — и ничего больше.
Конечно, мы сделали некоторые приближения, но в данный момент мы не будем обсуждать точность нашего ответа. Вы, однако, чувствуете, что в кристаллах разумного размера с миллиардами атомов и, стало быть, с миллиардами слагаемых в гамильтониане большой ошибки от пренебрежения немногими слагаемыми не выйдет. Если бы, конечно, перевернутых спинов стало так много, что их плотность была бы заметной, то пришлось бы позаботиться и о поправках.
(Интересно, что в случае, когда перевернутых спинов только два, можно написать и точное решение. Но результат особой важности не представляет. Просто интересно, что в этом случае уравнения можно решить точно. Решение таково:
(13.21)
с энергией
и с волновыми числами kc и k, связанными с k1 и k2 формулами
(13.22)
В этом решении отражено и «взаимодействие» пары спинов. Оно описывает тот факт, что когда спины сближаются, возникает какая-то вероятность их рассеяния. Поведение спинов очень похоже на взаимодействие частиц. Но подробная теория их рассеяния выходит за пределы того, о чем мы здесь собрались говорить.)
§ 3. Независимые частицы
В предыдущем параграфе мы написали гамильтониан (13.15) для двухчастичной системы. Затем, пользуясь приближением, эквивалентным пренебрежению каким-либо «взаимодействием» между двумя частицами, мы нашли стационарные состояния, описываемые формулами (13.17) и (13.18). Это состояние попросту есть произведение двух одночастичных состояний. Но решение, которое мы написали для аm,n [формула (13.18)], на самом деле удовлетворить нас не может. Мы с самого начала подчеркивали, что состояние |х9, x4> не отличается от состояния |x4, x9>, что порядок хm и хn неважен. Вообще говоря, алгебраическое выражение для амплитуды Сm,n не должно меняться от перестановки значений хm и хn , потому что она не изменяет состояния. В любом случае она будет представлять амплитуду того, что спин, направленный вниз, обнаружится в хm и в хn . Но обратите внимание, что (13.18) несимметрично по хm и хn , поскольку k1 и k2, вообще говоря, различны.
Все дело в том, что мы не заставили наше решение (13.15) подчиниться этому добавочному условию. К счастью, пока нетрудно все исправить. Заметьте, во-первых, что ничуть не хуже формулы (13.18) другое решение уравнения Гамильтона:
(13.23)
И даже энергия здесь та же самая, что была в (13.18). Значит, любая линейная комбинация (13.18) и (13.23) также будет решением системы и будет обладать по-прежнему энергией, даваемой (13.19). Решение, которое нужно выбрать по требованиям симметрии,—просто сумма (13.18) и (13.23):
(13.24)
Теперь при данных k1 и k2 амплитуда Сm,n не зависит от того, в каком порядке мы берем хm и хn ; если мы случайно поставим хm и хn в обратном порядке, мы получим ту же амплитуду. И наше толкование уравнения (13.24) на языке «магнонов» тоже станет иным. Уже нельзя говорить, что уравнение представляет одну частицу с волновым числом k1 и другую частицу с волновым числом k2. Амплитуда (13.24) представляет одно состояние с двумя частицами (магнонами). Состояние характеризуется двумя волновыми числами k1 и k2. Наше решение выглядит как составное состояние одной частицы с импульсом р1=k1ℏ и другой частицы с импульсом р2=k2ℏ, но в этом состоянии нельзя сказать, где какая частица.
В этот момент полезно вспомнить гл. 2 (вып. 8) и наш рассказ о тождественных частицах. Мы просто только что показали, что частицы спиновых волн (магноны) ведут себя как тождественные бозе-частицы. Все амплитуды обязаны быть симметричны по координатам двух частиц; это все равно, что сказать, что после «обмена двумя частицами» мы снова получим ту же амплитуду с тем же знаком. Но вы можете подумать: «Почему же мы все-таки решили в (13.24) сложить два члена? Почему не вычесть?» Ведь при знаке минус обмен хm и хn просто изменил бы знак аm,n , а это не в счет, это не имеет значения. Но ведь обмен хm с хn ничего не меняет — все электроны кристалла останутся там же, где и были, так что даже для перемены знака нет, казалось бы, никакого повода. Но это, конечно, плохой аргумент.
Наше обсуждение имело двойную цель: во-первых, рассказать вам кое-что о спиновых волнах; во-вторых, продемонстрировать состояние, амплитуда которого равна произведению двух амплитуд, а энергия равна сумме энергий, отвечающих этим амплитудам. Для независимых частиц амплитуда получается умножением, а энергия — сложением. Почему сложением — легко понять. Энергия — это коэффициент при t в мнимом показателе экспоненты; она пропорциональна частоте. Если пара объектов что-то совершает, один с амплитудой exp(-iE2t/ℏ), а другой с амплитудой exp(-iE1t/ℏ), и если амплитуда того, что обе эти вещи произойдут вместе, является произведением отдельных амплитуд, то в произведении появится единственная частота, равная сумме двух частот. Энергия, отвечающая произведению амплитуд, есть сумма обеих энергий.
Нам понадобилось довольно долго говорить, чтобы сообщить очень простую вещь: когда вы не учитываете взаимодействия между частицами, вы вправе рассматривать каждую частицу независимо. Они могут отдельно существовать во всевозможных состояниях, в которых они пребывали бы и порознь, и давать тот же вклад в энергию, какой давали бы порознь. Однако следует помнить, что если частицы тождественны, то они могут вести себя как бозе- или ферми-частицы в зависимости от задачи. Например, пара электронов, добавленная к кристаллу, ведет себя как ферми-частицы. Обмен местоположениями двух электронов приводит к перемене знака амплитуды. В уравнении, соответствующем (13.24), между двумя слагаемыми стоит знак минус. Как следствие этого: две ферми-частицы не могут пребывать в точности в одних и тех же условиях — с одинаковыми спинами и одинаковыми k. Амплитуда такого состояния нуль.
§ 4. Молекула бензола
Хотя квантовая механика снабжает нас основными законами, определяющими строение молекул, эти законы, однако, удается точно применить лишь к самым простым соединениям. Поэтому химики разработали различные приближенные способы расчета некоторых из свойств сложных молекул. Мы хотим здесь рассказать, как химики-органики применяют приближение независимых частиц. Начнем с молекулы бензола. Мы ее рассматривали с другой точки зрения в гл. 8 (вып. 8). Тогда мы воспользовались приближенным представлением молекулы в виде системы с двумя состояниями, базисные состояния которой показаны на фиг. 13.3. Имеется кольцо из шести углеродов, к каждому из которых приделано по водороду. По принятой схеме валентных связей необходимо допустить, что между половиной атомов углерода имеются двойные связи и что в низших энергетических условиях возникают две возможности, показанные на рисунке. Но, кроме этого, имеются и еще другие, более высокоэнергетические состояния. Когда мы в гл. 8 говорили о молекуле бензола, мы пользовались только двумя состояниями, а прочие забыли. И мы обнаружили, что энергия основного состояния молекулы не совпадала с энергией ни одного из нарисованных состояний; нет, она была ниже на величину, пропорциональную амплитуде переброса из одного такого состояния в другое.
А теперь мы хотим взглянуть на ту же молекулу с совершенно иной точки зрения, применяя приближение другого рода. Обе точки зрения приведут нас к разным ответам, но когда мы усовершенствуем оба приближения, то придем к истине — к правильному описанию бензола.
Однако если не позаботиться об этих усовершенствованиях (что обычно и делают), то не нужно удивляться, что эти описания не сойдутся. Мы по крайней мере покажем, что при новой точке зрения низшая энергия молекулы бензола оказывается ниже, чем у любой из структур с тремя двойными связями (см. фиг. 13.3).
Фиг. 13.3. Два базисных состояния молекулы бензола, использовавшиеся в гл. 8.
Рассмотрим следующую картину. Представим себе шесть атомов водорода, связанных только одиночными связями (фиг. 13.4).
Фиг. 13.4. Бензольное кольцо, из которого убрали шесть электронов.
Мы убрали шесть электронов (поскольку каждая связь обозначает пару электронов), так что перед нами шестикратно ионизованная молекула бензола. Теперь посмотрим, что случится, когда мы поодиночке вернем в молекулу всю шестерку электронов, считая, что каждый из них может свободно двигаться вокруг кольца. Допустим также, что все связи, показанные на фиг. 13.4, заполнены и не нуждаются в дальнейшем рассмотрении. Что происходит, когда мы возвращаем молекулярному иону его электрон? Он, конечно, может расположиться в любом из шести мест на кольце, соответствующих шести базисным состояниям. И у него будет некоторая амплитуда (скажем А) того, что он перейдет с одного места на другое. При анализе стационарных состояний обнаружатся несколько возможных уровней энергии. Это только при одном электроне.
Добавим еще один электрон. И сделаем теперь самое странное предположение: то, что делает один электрон, не сказывается на том, что делает другой. На самом деле они, конечно, будут взаимодействовать; они отталкивают друг друга с помощью кулоновых сил, и, кроме того, их энергия, когда они попадают в одно место, должна заметно отличаться от удвоенной энергии, когда они туда попадают поодиночке. Конечно, приближение независимых частиц незаконно, когда мест только шесть, особенно когда в них хотят поместить шестерку электронов. Но, несмотря на это, химики-органики сумели многому научиться, делая именно такое приближение.
Прежде чем подробно рассчитывать молекулу бензола, возьмем пример попроще — молекулу этилена. В нее входят только два атома углерода и по паре атомов водорода с каждой стороны (фиг. 13.5).
Фиг. 13.5. Молекула этилена.
У молекулы есть одна «лишняя» связь между двумя атомами углерода, в которую входят два электрона. Уберем один из этих электронов; что мы получим? То, что останется, можно будет рассматривать как систему с двумя состояниями: оставшийся электрон может находиться либо возле одного атома, либо возле другого. И, как у всякой системы с двумя состояниями, допустимые энергии отдельного электрона могут быть равны либо Е0-А, либо Е0+А (фиг. 13.6).
Фиг. 13.6. Возможные уровни энергии «лишних» электронов в молекуле этилена.
Добавим теперь второй электрон. Все очень хорошо: электронов у нас два — первый можно поставить в нижнее состояние, а второй в верхнее, не так ли? Не совсем,— мы о чем-то забыли. Ведь каждое из состояний на самом деле двойное. Когда мы говорим, что допустимо состояние с энергией Е0-А, то в действительности там их пара. В одно и тоже состояние могут попасть два электрона, один со спином, направленным вверх, другой — вниз (но не больше, из-за принципа запрета). Так что на самом деле имеются два возможных состояния с энергией Е0-А. Можно начертить диаграмму (фиг. 13.7), которая показывает и уровни энергии, и их населенность.
Фиг. 13.7. В добавочной связи молекулы этилена два электрона (один со спином вверх, другой — вниз) могут занять низший уровень энергии.
В состоянии наименьшей энергии оба электрона будут в наинизшем состоянии с противоположными спинами. Энергия «лишней» связи в молекуле этилена поэтому равна 2(Е0-А), если пренебречь взаимодействием между двумя электронами.
Теперь вернемся к бензолу. У каждого из двух состояний на фиг. 13.3 есть три двойные связи. И каждая из них очень похожа на связь в этилене и дает вклад в энергию 2(Е0-А), где теперь Е0 — уже энергия, необходимая, чтобы поместить электрон в бензоле на нужное место, а А — амплитуда переброса его в соседнее место. Значит, энергия должна быть равна примерно 6(Е0-А). Но когда мы раньше изучали бензол, то пришли к выводу, что его энергия ниже энергии структуры с тремя двойными связями. Посмотрим, получится ли теперь, с нашей новой точки зрения, энергия бензола ниже, чем у трех двойных связей.
Начинаем с шестикратно ионизованного бензольного кольца. Добавляем один электрон. Теперь у нас система с шестью состояниями. Мы пока еще не решали таких систем, но знаем, что нужно делать. Можно написать шесть уравнений для шести амплитуд и т. д. Но не лучше ли сберечь свои силы, ведь мы уже решили эту задачу, исследуя электрон в бесконечной цепочке атомов. Конечно, бензол — не бесконечная цепочка, шесть мест для атомов в нем расположены по кругу. Но представьте, что мы разняли кольцо в цепь и пронумеровали атомы вдоль цепи числами от 1 до 6. В бесконечной линии следующее место имело бы номер 7, но если мы условимся, что оно совпадает с местом номер 1 и т. д., то все окажется в точности похожим на бензольное кольцо. Иными словами, мы можем взять решение для бесконечной линии с добавочным требованием, чтобы решение было периодичным с периодом длиной в шесть атомов. Согласно гл. 11, электрон на прямой обладает состояниями определенной энергии, когда амплитуда того, что он окажется в некотором месте хn , равна exp(ikxn )=exp(ikbn). При каждом k энергия равна
(13.25)
Теперь из этих решений нам нужно оставить только такие, которые через каждые 6 атомов повторяются. Разберем сперва общий случай, когда в кольце N атомов. Если решение должно иметь период в N атомных расстояний, то eikbN должна быть равна единице, или kbN должна быть кратна 2π. Если s — любое целое число, то наше условие имеет вид
(13.26)
Мы раньше видели, что нет смысла брать k вне пределов ±π/b. Это означает, что мы получим все мыслимые состояния, беря значения s в пределах ±N/2.
Стало быть, мы приходим к тому, что у N-атомного кольца имеется N состояний определенной энергии и их волновые числа ks даются числами
(13.27)
Каждое состояние имеет энергию (13.25). Получается линейчатый спектр возможных уровней энергий. Спектр для бензола (N=6) показан на фиг. 13.8, б. (Числа в скобках указывают число различных состояний с одинаковой энергией.)
Есть наглядный способ изобразить эти шесть уровней энергии. Он показан на фиг. 13.8, а. Вообразим круг с центром на одном уровне с Е0 и с радиусом 2А. Если мы отложим, начиная снизу, шесть равных дуг (под углами, считая от нижней точки, ks b=2πs/N, или 2πs/6 для бензола), то высоты точек круга будут решениями (13.25). Шесть точек представляют шесть возможных состояний. Низший уровень энергии придется на Е0-2А; дальше идут два состояния с одинаковой энергией Е0-А и т. д. Это возможные состояния одного электрона. Если электронов не один, а больше, то в каждое состояние может попасть по два электрона с противоположными спинами.
У молекулы бензола надо здесь разместить шесть электронов. Если состояние основное, то они должны попасть в наинизшие возможные энергетические состояния — пара в s=0, пара в s=+1 и пара в s=-1. Согласно приближению независимых частиц, энергия основного состояния равна
(13.28)
Она действительно оказывается меньше, чем у трех отдельных двойных связей,— на 2А.
Сравнив энергию бензола с энергией этилена, можно определить А. Эта величина оказывается равной 0,8 эв, или в единицах, которые нравятся химикам, 18 ккал/моль.
Этим описанием можно воспользоваться, чтобы вычислить или понять другие свойства бензола. Например, глядя на фиг. 13.8, можно разобраться в возбуждении бензола светом.
Фиг. 13.8. Уровни энергии в кольце, в котором для электрона приготовлены шесть свободных мест (например, в бензольном).
Что бы произошло, если бы мы попытались возбудить один из электронов? Он мог бы передвинуться к одному из незанятых высших состояний. Наинизшей энергией возбуждения оказался бы переход от наивысшего заполненного уровня к наинизшему пустому. Эта энергия равна 2A. Бензол будет поглощать свет с частотой v=2A/h. Кроме того, будет наблюдаться также поглощение фотонов с энергиями 3А и 4A. Нечего и говорить, что спектр поглощения бензола был измерен, и картина спектральных линий оказалась более или менее правильной, если не считать того, что наинизшие переходы наблюдаются в ультрафиолете; и чтобы удовлетворить всем данным, пришлось бы взять величину А около 1,4—2,4 эв. Иначе говоря, численное значение А вдвое-втрое выше, чем предсказывается энергией химической связи.
Как же поступает химик в таких случаях? Он анализирует множество молекул сходного типа и выводит какие-то эмпирические правила. Он учит, например: для расчета энергии связи берите вот такое-то и такое-то значение А, а для получения приближенно верного спектра поглощения возьмите другое значение A. Вам может показаться, что это звучит слегка абсурдно. И впрямь, в ушах физика, который пытается объяснить всю природу из первоначальных принципов, это звучит довольно дико. Но перед химиком задача другая. Он обязан заранее догадаться, что произойдет с молекулами, которых до сих пор не было или которые до конца не поняты. Ему нужен ряд эмпирических правил и ему совершенно все равно, откуда они возьмутся. Так что теорией он пользуется совсем не так, как физик. Он берет уравнения, в которых отразился свет истины, а потом вынужден менять в них константы, делая эмпирические поправки.
В случае бензола основная причина несогласия лежит в нашем предположении, что электроны независимы; теория, из которой мы исходили, на самом деле незаконна. Тем не менее на нее падает какой-то отблеск истины, потому что результаты, по-видимому, идут в правильном направлении. При помощи таких уравнений плюс некоторые эмпирические правила (со множеством исключений) химик-органик прокладывает свой путь через чащу тех сложнейших вещей, которые он решился изучать. (Не забывайте, что в действительности причина, по которой физику удается выводить что-то из основных принципов, состоит в том, что он выбирает только простые задачи. Он никогда не решает задач с 42 или даже с 6 электронами. До сих пор он смог рассчитать с приличной точностью только атом водорода да атом гелия.)
§ 5. Еще немного органической химии
Можно ли применить все эти идеи для изучения других молекул? Рассмотрим такую молекулу, как бутадиен (1,3); она показана на фиг. 13.9 с помощью обычной картины валентных связей.
Фиг. 13.9. Изображение с помощью валентных связей молекулы бутадиена (1,3).
Мы можем опять затеять те же игры с лишней четверкой электронов, отвечающей двум двойным связям. Если ее убрать, то остается четыре атома углерода по одной линии. А как рассчитывать такую линию, вы уже знаете. «Но позвольте,— скажете вы,—я ведь только знаю, как решать бесконечную линию». Однако решения для бесконечной линии включают также и решения для конечной. Следите. Пусть N — число атомов на прямой; пронумеруем их 1, 2, ..., N (фиг. 13.10).
Фиг. 13.10. Отрезок прямой с N молекулами.
В уравнении для амплитуды в точке 1 у вас не появится член для перехода из точки 0. Точно так же уравнение для точки N будет отличаться от того, которым мы пользовались для бесконечной прямой, потому что никакого вклада точки N+1 не будет. Но представьте, что мы придумали решение для бесконечной прямой со следующим свойством: амплитуда оказаться вблизи атома 0 есть нуль и амплитуда оказаться вблизи атома N+1 тоже нуль. Тогда система уравнений для всех точек от 1 до N на конечной линии также будет удовлетворяться. Казалось бы, таких решений не бывает, ибо все наши решения имеют вид exp(ikxn ) и обладают всюду одинаковой абсолютной величиной. Но вспомните, что энергия зависит только от абсолютной величины k, так что другим в равной мере законным решением было бы exp(-ikxn ). И то же справедливо для любой суперпозиции этих двух решений. Вычитая их, мы получим решение sin kxn , а оно удовлетворяет требованию, чтобы амплитуда при х=0 была нулем. И оно все еще соответствует энергии Е0-2Аcoskb. Далее, подходящим выбором величины k можно также добиться, чтобы амплитуда в xN +1 была тоже нулем. Для этого нужно, чтобы (N+1)kb было кратным π, т. е. чтобы
(13.29)
где s — целое число между 1 и N. (Берутся только положительные k, потому что каждое решение содержит и +k, и -k; перемена знака k опять дает то же состояние.) Для молекулы бутадиена N=4, так что имеется четверка состояний с
(13.30)
Уровни энергии можно теперь представить, пользуясь круговой диаграммой, похожей на бензольную. На сей раз возьмем полукруг, деленный на пять равных частей (фиг. 13.11).
Фиг. 13.11. Энергетические уровни бутадиена.
Точка внизу отвечает s=0, что не дает какого-либо состояния. То же самое справедливо для точки наверху, отвечающей s=N+1. Оставшиеся четыре точки дают четверку разрешенных энергий. Имеется четыре стационарных состояния, чего и следовало ожидать, судя по четырем базисным состояниям. В круговой диаграмме углы равны π/5, или 36°. Наинизшая энергия оказывается равной Е0 — 1,618A. (Каких только чудес не бывает в математике! Золотое сечение греков дает нам наинизшее энергетическое состояние молекулы бутадиена, как это следует из нашей теории!)
Теперь уже ясно, как меняется энергия молекулы бутадиена, когда в нее вводят четверку электронов. Эта четверка заполнит два нижних уровня — каждый будет заполнен парой электронов с противоположными спинами. Полная энергия будет равна
(13.31)
Это выглядит вполне разумно. Энергия чуть пониже, чем просто у двух двойных связей, но связь не так сильна, как в бензоле. Во всяком случае, именно так химик анализирует некоторые органические молекулы.
Но в его распоряжении есть не только энергии, но и амплитуды вероятности. Зная амплитуды для каждого состояния и зная, какие состояния заполнены, он может сообщить нам, какова вероятность нахождения электрона в каком-нибудь месте молекулы. Те места, где пребывание электрона более вероятно, вступают в игру при таких химических замещениях, которые требуют, чтобы электрон обслуживал и другую группу атомов. Другие же места молекулы участвуют в таких замещениях, при которых молекула имеет тенденцию передать системе еще один электрон.
Подобные же идеи могут помочь нам получить правильное представление даже о таких сложных молекулах, как хлорофилл, один из вариантов которого показан на фиг. 13.12.
Фиг. 13.12. Молекула хлорофилла.
Обратите внимание, что двойные и одиночные связи образуют длинное замкнутое кольцо с двадцатью интервалами.
Лишние электроны двойных связей могут бегать по этому кольцу. При помощи метода независимых частиц можно получить всю совокупность энергетических уровней. От переходов между этими уровнями возникают сильные линии поглощения, которые лежат в видимой части спектра и придают этой молекуле ее густой цвет. И другие сложные молекулы, такие, как ксантофилл, от которого листья получают красную окраску, можно изучить таким же точно способом.
В органической химии при работе с подобного рода теорией используют еще одну идею. Она, пожалуй, самая удачная из всех (или по крайней мере в определенном смысле самая точная). Она отвечает на такой вопрос: в каких случаях получается особенно прочная химическая связь? Ответ очень интересен. Возьмем вначале для примера бензол и представим ряд событий, которые произойдут, если мы начнем с шестикратно ионизованной молекулы и примемся добавлять новые и новые электроны. Тогда нужно будет говорить о различных ионах бензола — отрицательных и положительных. Изобразим энергию иона (или нейтральной молекулы) как функцию числа электронов. Если мы примем Е0=0 (мы не знаем, чему равно E0), то получим кривую, показанную на фиг. 13.13.
Фиг. 13.13. Сумма всех энергий электронов, когда нижние состояния на фиг. 13.8 заполнены n электронами (принято E0 =0).
Для первых двух электронов наклон функции постоянен — это прямая линия. Затем для каждой очередной группы электронов он возрастает, меняясь скачком от одной группы к другой. Наклон изменяется тогда, когда заканчивается заполнение системы уровней с одной энергией и очередному электрону приходится переходить к очередной более высокой системе уровней.
В действительности истинная энергия иона бензола совершенно непохожа на фиг. 13.13 из-за взаимодействий электронов и из-за электростатических энергий, которыми мы пренебрегли. Эти поправки, однако, меняются с n довольно плавно. Даже если бы их все учесть, на окончательной энергетической кривой все равно остались бы изломы при таких n, при которых как раз заполняются отдельные уровни энергии.
Рассмотрим теперь очень гладкую кривую, на которой в среднем укладываются все точки (фиг. 13.14).
Фиг. 13.14. Точки с фиг. 13.13 и плавная кривая. Молекулы с n=2, 6, 10 устойчивее остальных.
Можно сказать, что точки над этой кривой обладают энергией «выше чем нормальной», а точки под нею «ниже чем нормальной». И в общем случае следует ожидать, что у конфигураций с «ниже чем нормальной» энергией средняя устойчивость окажется повышенной. Обратите внимание, что конфигурации, которые значительно ниже кривой, всегда оказываются в конце одного из прямолинейных отрезков, а именно там, где электронов как раз хватает на то, чтобы заполнить «энергетическую оболочку», как ее называют. Это очень точное предсказание теории. Молекулы и ионы особо устойчивы (по сравнению с прочими подобными конфигурациями), когда имеющиеся у них в наличии электроны как раз заполняют энергетическую оболочку.
Эта теория объяснила и предсказала некоторые весьма необычные химические факты. Вот очень простой пример. Возьмем кольцо из трех атомов. Почти невозможно поверить, что химик сможет из трех атомов составить кольцо и сделать его устойчивым. Но это было сделано. Энергетический круг для трех электронов показан на фиг. 13.15.
Фиг. 13.15. Энергетическая диаграмма для кольца из трех атомов.
Если поместить в нижнее состояние два электрона, то пойдут в дело только два из трех требуемых электронов. Третий электрон придется поместить на более высокий уровень. Отсюда следует, что молекула не будет слишком устойчивой. Зато двухэлектронная структура обязана быть устойчивой. И действительно, оказывается, что нейтральную молекулу трифенилциклопропанила сделать очень трудно, но зато сравнительно легко соорудить положительный ион, показанный на фиг. 13.16.
Фиг. 13.16. Катион трифенилииклопропанила.
Правда, кольцо из трех атомов никогда не бывает легко сделать, потому что, когда связи в органической молекуле образуют равносторонний треугольник, всегда появляются большие напряжения. Чтобы соединение было устойчиво, структуру нужно как-то стабилизировать. Оказывается, что, если поставить по углам три бензольных кольца, можно сделать положительный ион. (Отчего нужно добавлять бензольные кольца, непонятно.)
Подобным же образом можно также проанализировать и пятиугольное кольцо. Если вы начертите энергетическую диаграмму, то качественно сможете убедиться, что шестиэлектронная структура должна быть особо устойчива, так что такая молекула должна быть устойчивее всего в виде отрицательного иона. И вот кольцо из пяти атомов действительно хорошо известно, легко сооружается и действует всегда как отрицательный ион. Подобным же образом вы легко убедитесь, что кольцо из 4 и 8 атомов не очень интересно, а кольцо из 14 или 10 (как и кольцо из 6) должно быть особенно устойчиво в форме нейтрального объекта.
§ 6. Другие применения приближения
Есть два других сходных случая, на которых мы остановимся лишь вкратце. Говоря о строении атома, можно считать, что электрон заполняет последовательные оболочки. Теорию движения электрона Шредингера удается с легкостью разработать лишь для отдельного электрона, движущегося в «центральном» поле — поле, зависящем только от расстояния от точки. Но как же тогда разобраться в том, что происходит в атоме, в котором 22 электрона?! Один из путей — воспользоваться приближением независимых частиц. Сперва вы подсчитываете, что происходит с одним электроном. Получаете сколько-то там уровней энергии. Помещаете электрон в нижнее энергетическое состояние. В грубой модели вы продолжаете игнорировать взаимодействия электронов и продолжаете заполнять последовательные оболочки, но еще лучшие ответы получатся, если учесть (хотя бы приближенно) влияние электрического заряда электрона. Добавляя электрон, каждый раз вычисляйте амплитуду того, что он будет обнаружен в различных местах, и затем с ее помощью прикидывайте вид сферически симметричного распределения заряда. Поле этого распределения (совместно с полем положительного ядра и всех предыдущих электронов) используйте для расчета состояний, доступных очередному электрону. Таким путем вы можете получить вполне разумные оценки энергий нейтрального атома и различных ионизованных состояний. Вы увидите, что и здесь имеются энергетические оболочки, так же как у электронов в кольцевой молекуле. При не совсем заполненной оболочке атом иногда охотнее присоединяет к себе один или несколько электронов, а иногда охотнее их теряет, чтобы прийти в устойчивое состояние, когда оболочка заполнена.
Эта теория объясняет механизм, лежащий в основе самых фундаментальных химических свойств, проявляющихся в периодической таблице элементов. Инертные газы — это те элементы, у которых как раз закончилось заполнение оболочки, и их особенно трудно заставить вступать в реакцию. (В действительности, конечно, некоторые из них реагируют, например, с фтором или с кислородом, но в таких соединениях связь очень слаба; так называемые инертные газы инертны лишь отчасти.) Атом, у которого на один электрон больше или на один меньше, чем у инертного газа, легко теряет или присоединяет этот электрон, чтобы оказаться в особо устойчивых (низкоэнергетических) условиях, какие возникают от того, что оболочка заполнена до конца,— они являются очень активными химическими элементами с валентностью +1 и -1.
В ядерной физике можно встретиться с другим подобным случаем. В атомном ядре протоны и нейтроны очень сильно взаимодействуют друг с другом. Но и при этом модель независимых частиц опять полезна для анализа структуры ядра. Сперва было открыто экспериментально, что ядра особо устойчивы, если в них содержится определенное число нейтронов — а именно 2, 8, 20, 28, 50, 82. Ядра, содержащие в таком же количестве протоны, тоже особенно устойчивы. Поскольку вначале объяснения этим числам не было, их назвали «магическими числами» ядерной физики. Хорошо известно, что нейтроны и протоны друг с другом сильно взаимодействуют; поэтому люди были чрезвычайно поражены, когда выяснилось, что модель независимых частиц предсказывает оболочечное строение ядра, причем сами собой возникают несколько первых магических чисел. Модель эта предполагала, что каждый нуклон (протон или нейтрон) движется в центральном потенциальном поле, создаваемом средним влиянием всех прочих нуклонов. Однако модели не удавалось верно предсказать другие магические числа. Но затем Мария Майер и независимо Йенсен с сотрудниками открыли, что, принимая модель независимых частиц и добавляя только поправку на так называемое «спин-орбитальное взаимодействие», можно в этой усовершенствованной модели получить все магические числа. (Спин-орбитальное взаимодействие приводит к тому, что энергия нуклона оказывается ниже, если его спин направлен туда же, куда направлен его орбитальный момент количества движения в ядре.) Теория дает даже больше — ее картина так называемой «оболочечной структуры» ядра позволяет предсказывать некоторые характеристики ядер и ядерных реакций.
Приближение независимых частиц оказалось полезным для широкого круга явлений — от физики твердого тела до химии, от биологии до ядерной физики. Такое приближение часто очень грубо, но оно в состоянии помочь нам понять, отчего бывают особо устойчивые условия — отчего возникают оболочки. Но поскольку оно опускает всю сложность взаимодействий между индивидуальными частицами, нас не должно удивлять, что часто ему не удается правильно предсказать многие важные детали.
Глава 14 ЗАВИСИМОСТЬ АМПЛИТУД ОТ МЕСТА
§ 1. Как меняются амплитуды вдоль прямой
Выясним теперь, как в квантовой механике амплитуды вероятности меняются в пространстве. В некоторых предыдущих главах у вас могло возникнуть смутное чувство, что кое о чем мы умалчиваем. Например, когда мы толковали о молекуле аммиака, мы решили описывать ее через два базисных состояния. За одно из них мы выбрали случай, когда атом азота находится «выше» плоскости трех атомов водорода, а в качестве другого базисного состояния выбрали такие условия, когда атом азота стоит «ниже» плоскости трех атомов водорода. Почему же мы выбрали именно эту пару состояний? Почему бы не считать, что атом азота может оказаться либо на расстоянии 2Å от плоскости трех атомов водорода, либо на расстоянии 3Å, а может, и 4Å. Ведь атом азота может занимать множество положений. Или, когда шла речь о молекулярном ионе водорода, в котором имеется электрон, распределенный между двумя протонами, мы тоже вообразили два базисных состояния. Одно — когда электрон находится по соседству с протоном № 1, и другое, когда он пребывает в окрестностях протона № 2. Ясно, что многие детали мы упустили. Электрон ведь находится не точно у самого протона № 2, а только в его окрестностях. Он может оказаться и где-то повыше протона, и где-то пониже, и где-то слева, и где-то справа.
Мы намеренно избегали уточнения таких деталей. Мы говорили, что нас интересуют только определенные стороны проблемы, и воображали, что если уж электрон находится поблизости от протона № 1, то он принимает некоторое довольно определенное положение. На самом деле в этих условиях вероятность обнаружить электрон обладает каким-то определенным распределением в пространстве вблизи протона. Но нас такие детали не заботили.
Можно представить дело и иначе. Когда мы рассматривали молекулярный ион водорода, то избрали приближенный подход, описывая положение вещей на языке двух базисных состояний. В действительности же таких состояний уйма. Электрон может попасть вблизи протона в свое наинизшее, или основное, состояние, но имеется еще и множество возбужденных состояний. В каждом из них электрон как-то по-особому распределен вблизи протона. Эти возбужденные состояния мы игнорировали, говоря, что нас интересуют лишь условия при наинизшей энергии. Но как раз они-то, эти возбужденные состояния, и приводят к тому, что возможны различные распределения электрона вокруг протона. Если мы хотим детально описать молекулярный ион водорода, то следует принять во внимание и эти прочие допустимые базисные состояния. Это можно сделать многими способами, и один из них — детальнее рассмотреть состояния, когда расположение электрона в пространстве описывается более тщательно.
Мы уже достаточно подготовлены, чтобы заняться более трудоемкой процедурой, которая позволит нам обстоятельнее говорить о местоположении электрона, задавая амплитуду вероятности того, что он будет обнаружен в каком угодно месте в данной ситуации. Эта более полная теория позволит подкрепить те приближения, которыми мы раньше пользовались. Наши прежние уравнения в каком-то смысле смогут быть выведены как своего рода приближения к более полной теории.
Вас может удивить, почему мы не начали прямо с более полной теории и не делали приближений по мере движения вперед. Но мы считали, что, отправившись от приближения двух состояний и постепенно подходя к более полной теории, вам будет легче достичь понимания всей механики квантовой механики. Наш подход, по-видимому, противоположен тому, который вы найдете во многих книгах.
Когда мы обратимся к теме этой главы, вы заметите, что мы нарушаем правило, которому в прошлом неизменно следовали. Какой бы темы мы ни касались, мы всегда пытались более или менее полно представить вам физику дела, указывая как можно полнее, куда ведут эти идеи. Мы стремились наряду с описанием общих следствий теории представить и некоторые характерные детали, чтобы вам было ясно, куда ведет эта теория. А теперь нам придется нарушить это правило. Мы расскажем об амплитудах вероятности пребывания электрона где-то в пространстве и продемонстрируем вам дифференциальные уравнения, которым они удовлетворяют. Но у нас не будет времени углубиться и обсудить многие очевидные выводы, следующие из теории.
Более того, нам даже не удастся связать эту теорию с некоторыми приближенными формулировками, к которым мы раньше прибегали, скажем, когда изучали молекулу водорода или молекулу аммиака. На этот раз придется бросить дело на полпути, не окончив его. Курс наш близится к концу, и хочешь не хочешь, придется обойтись одним только введением в общие представления. Мы укажем связь с тем, о чем говорилось раньше, и, кроме того, некоторые другие подходы к задачам квантовой механики. Надеемся, что этих представлений вам хватит, чтобы потом двинуться самостоятельно и уже по книгам узнать многие выводы из приведенных здесь уравнений. Все-таки нужно оставить кое-что и на будущее.
Вспомним еще раз, что нам известно о том, как электрон может продвигаться вдоль линии атомов. Когда электрон может с какой-то амплитудой перепрыгивать от одного атома к соседнему, то имеются состояния определенной энергии, в которых амплитуда вероятности обнаружить электрон распределяется вдоль решетки в виде бегущей волны. Для длинных волн (малых значений волнового числа k) энергия состояния пропорциональна квадрату волнового числа. Для кристаллической решетки с постоянной b, в которой амплитуда того, что электрон в единицу времени перепрыгнет от одного атома к следующему, равна iA/ℏ, энергия состояния связана с k (при малых kb) формулой
(14.1)
(см. гл. 11, § 1). Мы видели также, что группы таких волн с близкими энергиями образуют волновой пакет, который ведет себя как классическая частица с массой mэфф:
(14.2)
Раз волны амплитуды вероятности в кристалле ведут себя как частицы, то естественно ожидать, что общее квантовомеханическое описание частицы выявит такое же волновое поведение, какое мы наблюдали в решетке. Предположим, мы взяли одномерную решетку и вообразили, что постоянная решетки b становится все меньше и меньше. В пределе получилось бы, что электрон может оказаться в любой точке линии. Нам пришлось бы перейти к непрерывному распределению амплитуд вероятности. У электрона появилась бы амплитуда оказаться в любом месте линии. Таков был бы один из путей описания движения электронов в вакууме. Иными словами, если мы вообразим, что все пространство можно пронумеровать бесконечным числом очень тесно расположенных точек, и сможем вывести уравнения, связывающие между собой амплитуды в одной точке с амплитудами в соседних, то получим квантовомеханические законы движения электрона в пространстве.
Начнем с того, что напомним некоторые общие принципы квантовой механики. Пусть имеется частица, которая может в квантовомеханической системе существовать в разных условиях. Любые заданные условия, в которых может быть обнаружен электрон, мы называем «состоянием» и отмечаем их при помощи вектора состояния, скажем |φ>. В каких-то других условиях и метка будет другая, скажем вектор состояния |ψ>. Затем мы вводим идею о базисных состояниях. Мы говорим, что имеется совокупность состояний |1>, |2>, |3>, |4> и т. д., обладающая следующими свойствами. Во-первых, все эти состояния совершенно различны — мы говорим, что они ортогональны. Под этим мы понимаем, что для любой пары базисных состояний |i> и |j> равна нулю амплитуда того, что электрон, будучи в состоянии |j>, окажется также и в состоянии и |j> не обозначают одного и того же состояния. Все это символически представляется так:
(14.3)
Вспомните, что δij=0, если i и j различны, и δij =1, если i и j одинаковые числа.
Далее, базисные состояния |i> обязаны быть полной совокупностью, так чтобы любое состояние могло быть выражено на их языке. Иначе говоря, любое состояние |φ> может быть полностью описано заданием всех амплитуд того, что частица в состоянии |φ> обнаружится также в состоянии |i>. Вектор состояния |φ> представляется суммой базисных состояний, умноженных каждое на коэффициент, являющийся амплитудой того, что состояние |φ> находится также в состоянии |i>:
(14.4)
Наконец, если рассмотреть любые два состояния |φ> и |ψ>, то амплитуду того, что состояние |ψ> окажется также в состоянии |φ>, можно найти, проецируя сперва состояние |ψ> на базисные состояния, а затем каждое из базисных состояний — на состояние |φ>. Это записывается так:
(14.5)
Суммирование, конечно, проводится по всей совокупности базисных состояний |i>.
В гл. 11, когда мы рассчитывали, что бывает с электроном, помещенным в линейную цепочку атомов, вы выбрали совокупность базисных состояний, в которых электрон был расположен близ того или иного из атомов цепочки. Базисное состояние |n> представляло электрон, локализованный (расположенный) возле атома номер n. (Конечно, неважно, обозначать ли наши базисные состояния |n> или |i>.) Чуть позже мы нашли, что базисные состояния удобнее метить координатой атома, а не номером атома в цепочке. Состояние |хn > — это просто другой способ записи состояния |n>. Тогда, следуя общему правилу, любое состояние |ψ> можно описать заданием того, что электрон в состоянии |ψ> находится также в одном из состояний |хn >. Для удобства мы решили обозначать эти амплитуды символом
(14.6)
Поскольку базисные состояния связаны с местоположением электрона на линии, то амплитуду Сn можно рассматривать как функцию координаты х и писать ее в виде С(хn ). Амплитуды С(хn ) будут в общем случае меняться во времени и поэтому суть также функции от t, но мы не будем отмечать эту зависимость явно.
Кроме того, в гл. 11 мы предположили, что амплитуды С(хn ) обязаны меняться во времени так, как положено по гамильтонову уравнению (11.3). В нашем новом обозначении это уравнение имеет вид
(14.7)
Два последних слагаемых в правой части представляют такой процесс, когда электрон, находившийся возле атома (n+1) или возле атома (n-1), окажется возле атома (n).
Мы нашли, что (14.7) имеет решения, отвечающие состояниям определенной энергии. Мы записывали их в виде
(14.8)
У состояний с низкой энергией длины волн велики (k мало) и энергия связана с k формулой
(14.9)
или, если выбрать нуль энергии так, чтобы было (Е0-2А)=0, то энергия дается формулой (14.1).
Посмотрим, что бы произошло, если бы мы позволили расстоянию b между атомами решетки стремиться к нулю, сохраняя волновое число постоянным. Если бы больше ничего не случилось, то последнее слагаемое в (14.9) обратилось бы просто в нуль, и никакой физики бы не осталось. Но предположим, что А и b вместе изменяются так, что при стремлении b к нулю произведение Ab2 поддерживается постоянным: с помощью (14.2) мы запишем Аb2 в виде постоянной ℏ2/2mэфф . При этом (14.9) не изменится, но что произойдет с дифференциальным уравнением (14.7)?
Перепишем сперва (14.7) так:
(14.10)
При нашем выборе Е0 первое слагаемое выпадет. Далее, представим себе непрерывную функцию С(х), которая плавно проходит через значения С(хn ) в точках хn . Когда расстояние b стремится к нулю, точки хn сближаются все теснее и теснее и [если С(х) меняется достаточно плавно] величина в скобках попросту пропорциональна второй производной С(х). Можно написать (в чем легко убедиться, разложив в ряд Тэйлора каждый член) равенство
(14.11)
Тогда в пределе, когда b стремится к нулю, а b2A поддерживается равным ℏ2/2mэфф , уравнение (14.7) переходит в
(14.12)
Перед нами уравнение, утверждающее, что скорость изменения С(х) — амплитуды того, что электрон будет обнаружен в х— зависит от амплитуды того, что электрон будет обнаружен в близлежащих точках так, что эта скорость пропорциональна второй производной амплитуды по координате.
Правильное квантовомеханическое уравнение движения электрона в пустом пространстве впервые было открыто Шредингером. При движении по прямой оно имеет вид (14.12); надо только mэфф заменить на m — массу электрона в пустом пространстве. При движении по прямой в пустом пространстве уравнение Шредингера имеет вид
(14.13)
Мы не хотим, чтобы вы считали, будто мы сейчас вывели уравнение Шредингера; мы только показываем вам один из способов, каким его можно осмыслить. Когда Шредингер впервые написал его, он привел какой-то вывод, опиравшийся на эвристические доводы и блестящие интуитивные догадки. Некоторые из его доводов были даже неверны, но это не имело значения; важно то, что окончательное уравнение дает правильное описание природы. И цель нашего обсуждения состоит просто в том, чтобы показать вам, что правильное фундаментальное квантовомеханическое уравнение (14.13) имеет ту же самую форму, какая получается в предельном случае электрона, движущегося вдоль цепочки атомов. Это значит, что можно считать, что дифференциальное уравнение (14.13) описывает диффузию амплитуды вероятности от точки к точке вдоль прямой. Иначе говоря, если электрон имеет некоторую амплитуду того, что он будет в одной точке, то чуть позже у него появится амплитуда того, что он будет в близлежащих точках. Уравнение действительно напоминает уравнения диффузии, которыми мы пользовались в начале курса. Но есть и одно важное отличие: мнимый коэффициент перед производной по времени приводит к поведению, в корне отличному от обычной диффузии (например, от диффузии газа, распространяющегося по длинной трубе). Обычная диффузия приводит к действительным экспоненциальным решениям, а решения (14.13) суть комплексные волны.
§ 2. Волновая функция
Чтобы получить некоторое представление о том, как теперь все будет выглядеть, вернемся к самому началу и изучим проблему описания движения электрона по прямой, не рассматривая состояний, связанных с атомами решетки. Мы хотим возвратиться к самому началу и посмотреть, какими представлениями нужно пользоваться, чтобы описать движение свободной частицы в пространстве. Раз нас интересует поведение частицы вдоль континуума точек, то придется иметь дело с бесконечным множеством возможных состояний и, как вы увидите, идеи, которые были развиты для конечного числа состояний, потребуют некоторых технических видоизменений.
Начнем с того, что вектором состояния |х> обозначим состояние, в котором частица расположена в точности в точке с координатой х. Для каждого значения х вдоль прямой — для 1,73, для 9,67, для 10,00 и т. д.— имеется соответствующее состояние. Выберем эти состояния |х> в качестве базисных. Если это сделать для всех точек х прямой, то получится полная совокупность состояний для движения в одном измерении. Теперь положим, что имеется состояние другого рода, скажем |ψ>, в котором электрон как-то распределен вдоль прямой. Один из способов описать это состояние — задать все амплитуды того, что электрон будет также найден в каждом из базисных состояний |x>. Надо задать бесконечную совокупность амплитуд, по одной для каждого х. Запишем их в виде
(14.14)
Мы уже рассматривали такие амплитуды, которые непрерывным образом меняются с координатами, говоря в гл. 5 (вып. 8) об изменениях амплитуд во времени. Мы, например, показали там, что следует ожидать, что частица с определенным импульсом будет обладать особым типом изменения своей амплитуды во времени. Если частица имеет определенный импульс р и соответствующую ему определенную энергию Е, то амплитуда того, что она будет обнаружена в любом заданном месте x, такова:
(14.15)
Это уравнение выражает важный общий принцип квантовой механики, который связывает базисные состояния, соответствующие различным положениям в пространстве, с другой системой базисных состояний — со всеми состояниями определенного импульса. В некоторых задачах состояния определенного импульса удобнее, чем состояния с определенным х. И любая другая система базисных состояний также годится для описания квантовомеханической ситуации. К связи между ними мы еще вернемся. А сейчас мы по-прежнему будем придерживаться описания на языке состояний |х>.
Прежде чем продолжать, прибегнем к небольшой замене обозначений, которая, надеемся, вас не слишком смутит. Форма функции С(х), определенной уравнением (14.14), естественно, будет зависеть от рассматриваемого состояния |ψ>. Это нужно как-то отметить. Можно, например, указать, о какой функции С(х) идет речь, поставив снизу индекс, скажем Сψ(х). Хотя такое обозначение вполне подошло бы, но оно все же чуточку громоздко и в большинстве книг вы его не встретите. Обычно просто убирают букву С и пользуются символом ψ для определения функции
(14.16)
Поскольку это обозначение принято во всем мире, неплохо было бы и вам привыкнуть к нему и не пугаться, встретив его где-нибудь. Надо только помнить, что ψ теперь будет использоваться двояким образом. В (14.14) ψ обозначает метку, которой мы отметили заданное физическое состояние электрона. А в (14.16) слева символ ψ применяется для определения математической функции от х, равной амплитуде, связываемой с каждой точкой х прямой. Надеемся, что это не слишком смутит вас, когда вы привыкнете к самой идее. Кстати, функцию ψ(х) обычно именуют «волновой функцией», потому что она очень часто имеет форму комплексной волны своих переменных.
Раз мы определили ψ(х) как амплитуду того, что электрон в состоянии ψ обнаружится в точке х, то хотелось бы интерпретировать квадрат абсолютной величины ψ как вероятность обнаружить электрон в точке х. Но, к сожалению, вероятность обнаружить электрон в точности в каждой данной точке равна нулю. Электрон в общем случае размазывается по какому-то участку прямой, и поскольку точек на каждом участке бесконечно много, то вероятность оказаться в любой из них не может быть конечным числом. Вероятность обнаружить электрон мы можем описать только на языке распределения вероятностей, которое дает относительную вероятность обнаружить электрон в различных неточно указанных местах прямой. Пусть Вер. (х, Δх) обозначает вероятность обнаружить электрон в узком интервале Δх возле точки х. Если мы в каждой физической ситуации будем пользоваться достаточно мелким масштабом, то вероятность будет от точки к точке меняться плавно, и вероятность обнаружить электрон в произвольном конечном маленьком отрезке прямой Δх будет пропорциональна Δх. И можно так изменить наши определения, чтобы это было учтено. Можно считать, что амплитуда
Амплитуда
(14.17)
Теперь надо изменить некоторые наши прежние уравнения, чтобы согласовать их с этим новым определением амплитуды вероятности. Пусть имеется электрон в состоянии |ψ>, а мы хотим знать амплитуду того, что он будет обнаружен в другом состоянии |φ>, которое может соответствовать другим условиям размазанности электрона. Когда речь шла о конечной системе дискретных состояний, мы пользовались уравнением (14.5). До изменения нашего определения амплитуд мы должны были писать
(14.18)
А теперь если обе эти амплитуды нормированы так, как описано выше, то сумма по всем состояниям из узкого интервала х будет эквивалентна умножению на Δx, а сумма по всем значениям х превратится просто в интеграл. При наших измененных определениях правильная формула будет такой:
(14.19)
Амплитуда
(14.20)
При наших новых определениях все формулы останутся прежними, если только всюду знак суммы заменить интегрированием по х.
К тому, что было сказано, нужно сделать одну оговорку. Любая подходящая система базисных состояний должна быть полной, если хотят, чтобы она сполна отражала все, что происходит. Для одномерного движения электрона в действительности недостаточно указать только базисные состояния |x>, потому что в каждом из этих состояний спин электрона может быть направлен вверх или вниз. Один из способов получить полную систему — взять две совокупности состояний по х: одну для спина вверх, другую для спина вниз. Мы, впрочем, пока не будем входить в такие подробности.
§ 3. Состояния с определенным импульсом
Пусть у нас имеется электрон в состоянии |ψ>, описываемом амплитудой вероятности <х|ψ>=ψ(х). Мы знаем, что ψ(х) обозначает состояние, в котором электрон размазан по прямой по какому-то закону, так что вероятность обнаружить его в узком интервале dx близ точки х попросту равна
Что можно сказать об импульсе этого электрона? Можно спросить, какова вероятность того, что импульс этого электрона равен р? Начнем с расчета амплитуды того, что состояние |ψ> присутствует в другом состоянии |имп. p>, которое мы определим как состояние с определенным импульсом р. Эту амплитуду можно найти, применяя наше основное уравнение для разложения амплитуд (14.20). В терминах состояний |имп. p>
А вероятность того, что у электрона будет обнаружен импульс р, выразится квадратом абсолютной величины этой амплитуды. Но опять возникает тот же вопрос насчет нормирования. Ведь вообще можно говорить только о вероятности обнаружить электрон с импульсом в узкой области dp близ значения р. Вероятность того, что импульс в точности равен р, равна нулю (разве что состояние |ψ> окажется состоянием с определенным импульсом). Только вероятность обнаружить импульс в интервале dp возле значения р может оказаться конечной. Нормировку можно делать по-разному. Мы выберем тот способ нормировки, который нам кажется особенно удобным, хотя вам сейчас это может так и не показаться.
Примем такую нормировку, чтобы вероятность была связана с амплитудой равенством
(14.22)
Это определение дает нам нормировку амплитуды <имп. р|x>. Амплитуда <имп. р|х>, естественно, комплексно сопряжена с амплитудой <х|имп. р>, а последнюю мы писали в (14.15). При нашей нормировке оказывается, что коэффициент пропорциональности перед экспонентой как раз равен единице, т. е.
(14.23)
Тогда (14.21) превращается в
(14.24)
Вместе с (14.22) это уравнение позволяет находить распределение импульсов для любого состояния |ψ>.
Возьмем частный пример: скажем, когда электрон расположен в некоторой области вокруг х=0. Пусть мы взяли волновую функцию вида
(14.25)
Распределение вероятности иметь то или иное значение х для такой волновой функции дается ее квадратом
(14.26)
Функция плотности вероятности Р(х) — это кривая Гаусса, показанная на фиг. 14.1.
фиг. 14.1. Плотность вероятности для волновой функции (14.24).
Большая часть вероятности сосредоточена между х=+σ и х=-σ. Мы говорим, что «полуширина» кривой есть σ. (Точнее, σ равняется средней квадратичной координате х, если разброс координат соответствует этому распределению.) Коэффициент К следовало бы выбрать так, чтобы плотность вероятности Р(х) не просто была пропорциональна вероятности (на единицу длины x) обнаружить электрон, но имела бы такой масштаб, чтобы Р(х)Δx равнялось вероятности обнаружить электрон в Δx вблизи х. Коэффициент К, при котором так и получается, можно найти из требования -∞∫+∞Р(х)dx=1, потому что вероятность обнаружить электрон где попало равна единице. Мы находим, что К=(2πσ2)-1/4.
Теперь найдем распределение по импульсу. Пусть φ(p) есть амплитуда того, что импульс электрона окажется равным р:
(14.27)
Подстановка (14.25) в (14.24) дает
(14.28)
что можно также переписать в форме
(14.29)
Сделаем теперь замену u=x+2ipσ2/ℏ; интеграл обратится в
(14.30)
Математикам, вероятно, не понравился бы такой путь расчета, однако итог, несмотря на это, верен:
(14.31)
Мы пришли к интересному результату — распределение амплитуд по р имеет в точности ту же математическую форму, как и распределение амплитуд по х, только ширина кривой Гаусса иная. Можно записать это так:
(14.32)
где полуширина η распределения по р связана с полушириной σ распределения по х формулой
(14.33)
Наш результат утверждает: если сделать распределение по х очень узким, взяв σ малым, то η станет большим и распределение по р сильно расползется. Или наоборот, если распределение по р узко, то оно соответствует широкому распределению по х. Мы можем, если угодно, рассматривать η и σ как некую меру неопределенности локализации импульса и координаты электрона в изучаемом нами состоянии. Если обозначить их соответственно Δр и Δx, то (14.33) обратится в
(14.34)
Интересно вот что: можно доказать, что при всяком ином виде распределения по х или по р произведение ΔpΔx не может стать меньше, чем у нас получилось. Гауссово распределение дает наименьшее возможное значение произведения средних квадратичных. В общем случае
(14.35)
Это количественная формулировка принципа неопределенности Гейзенберга, который качественно нам уже давно известен. Мы обычно делали приближенное утверждение: наименьшее значение произведения ΔpΔx — это число порядка ℏ.
§ 4. Нормировка состояний с определенной координатой х
Теперь мы вернемся к обсуждению тех изменений в наших основных уравнениях, которые необходимо сделать для работы с континуумом базисных состояний. Когда имеется конечное число дискретных состояний, то фундаментальное условие, которому должна удовлетворять система базисных состояний, имеет вид
(14.36)
Если частица пребывает в одном базисном состоянии, то амплитуда пребывания в другом базисном состоянии равна нулю. С помощью подходящей нормировки можно так определить амплитуду , чтобы она была равна единице. Оба эти условия содержатся в (14.36). Теперь мы хотим понять, как надо видоизменить это соотношение, когда пользуются базисными состояниями частицы на прямой. Если известно, что частица пребывает в одном из базисных состояний |х>, то какова амплитуда того, что она пребывает в другом базисном состоянии |x'>? Если х и х' — две разные точки прямой, то амплитуда
(14.37)
Далее, амплитуда
(14.38)
Уравнение должно выполняться для любого состояния ψ и, стало быть, для любой функции ψ(х). Это требование обязано полностью определить природу амплитуды
Наша задача теперь состоит в том, чтобы отыскать функцию f(х, х'), которая после умножения на ψ(х) и интегрирования по всем х даст как раз величину ψ(х'). Но оказывается, что не существует математической функции, которая это умеет делать! По крайней мере не существует ничего похожего на то, что мы обычно имеем в виду под словом «функция».
Выберем какое-нибудь значение х', например 0, и определим амплитуду <0|x> как некую функцию х, скажем f(х). Тогда (14.38) обратится в
(14.39)
Какого же вида функция f(х) могла бы удовлетворить такому уравнению? Раз интеграл не должен зависеть от того, какие значения принимает ψ(х) при х, отличных от нуля, то ясно, что f(х) должна быть равна нулю для всех значений х, кроме нуля. Но если f(х) всюду равна нулю, то интеграл будет тоже равен нулю, и уравнение (14.39) не удастся удовлетворить. Возникает невозможная ситуация: нам нужно, чтобы функция была нулем всюду, кроме одной точки, и давала все же конечный интеграл. Что ж, раз мы не в состоянии сыскать функцию, которая так поступает, то простейший выход — просто сказать, что функция f(х) определяется уравнением (14.39). И именно f(х) — такая функция, которая делает (14.39) правильным. Функция, которая умеет это делать, впервые была изобретена Дираком и носит его имя. Мы обозначаем ее δ(х). Все, что о ней утверждается — это что функция δ(х) обладает странным свойством: если ее подставить вместо f(х) в (14.39), то интеграл выберет то значение, которое ψ(х) принимает при х=0; и поскольку интеграл не должен зависеть от ψ(х) при х, отличных от нуля, то функция δ(х) должна быть нулем всюду, кроме х=0. Словом, мы пишем
(14.40)
где δ(х) определяется соотношением
(14.41)
Посмотрите, что выйдет, если вместо ψ в (14.41) поставить частную функцию «1». Тогда получится
(14.42)
Иначе говоря, функция δ(х) обладает тем свойством, что всюду, кроме х=0, она равна нулю, но интеграл от нее конечен и равен единице. Приходится вообразить, что функция δ(х) обладает в одной точке такой фантастической бесконечностью, что полная площадь оказывается равной единице.
Как представить себе, на что похожа δ-функция Дирака? Один из способов — вообразить последовательность прямоугольников (или другую, какую хотите функцию с пиком), которая становится все уже и уже и все выше и выше, сохраняя все время единичную площадь, как показано на фиг. 14.2.
Фиг. 14.2. Последовательность функций, ограничивающих единичную площадь, вид которых все сильнее и сильнее напоминает δ-функцию.
Интеграл от этой функции от -∞ до +∞ всегда равен единице. Если вы умножите ее на произвольную функцию ψ(х) и проинтегрируете произведение, то получите нечто, приближенно совпадающее со значением функции при х=0, причем приближение становится все лучше и лучше, по мере того как прямоугольники становятся уже и уже. Если хотите, можете представлять δ-функцию посредством такого рода предельного процесса. Но единственно здесь важно то, что δ-функция определена так, что (14.41) справедливо для каждой волновой функции ψ(х). Это однозначно определяет δ-функцию. Ее свойства тогда получаются такими, как было сказано.
Заменим аргумент δ-функции с х на х- х', и соотношения обратятся в δ(х-x')=0,
(14.43)
Если в (14.38) вместо амплитуды
(14.44)
Теперь мы завершили все необходимые видоизменения наших основных уравнений, нужные для работы с континуумом базисных состояний, соответствующих точкам на прямой. Обобщение на три измерения вполне очевидно: во-первых, координата х заменяется вектором r; во-вторых, интегралы по х заменяются на интегралы по х, у и z (иными словами, они становятся интегралами по объему); в-третьих, одномерную δ-функцию надо заменить просто произведением трех δ-функций от x, от y и от z: δ(х-х')δ(у-у')δ(z-z'). Собирая все вместе, получаем следующую совокупность уравнений для амплитуд частицы в трехмерном мире:
(14.45)
(14.46)
(14.47)
(14.48)
А что бывает, когда частиц не одна, а больше? Мы расскажем вам, как управляться с двумя частицами, и вы сразу поймете, что нужно делать, если вам понадобится оперировать с несколькими частицами. Пусть имеются две частицы; назовем их № 1 и № 2. Что применить в качестве базисных состояний? Одну вполне приемлемую совокупность можно задать, сказав, что частица № 1 находится в х1, а частица № 2 — в х2, и записав это в виде |x1, х2>. Заметьте, что указание координаты только одной частицы не определяет базисного состояния. Каждое базисное состояние обязано определять условия всей системы целиком. Вы не должны думать, что каждая частица движется независимо как трехмерная волна. Всякое физическое состояние |ψ> можно определить, задав все амплитуды
§ 5. Уравнение Шредингера
До сих пор мы просто заботились о том, как бы записать состояния, которые бы учитывали, что электрон может находиться в пространстве где угодно. Теперь же следует позаботиться о включении в наше описание физики того, что может произойти в тех или иных обстоятельствах. Как и прежде, надо подумать о том, как состояния будут меняться со временем. Если у нас есть состояние |ψ>, которое несколько позже переходит в другое состояние |ψ>, то положение в любой момент мы сможем описать, сделав волновую функцию (т. е. попросту амплитуду
В гл. 6 мы описали на языке гамильтониана Нij ., как состояния меняются во времени. Мы видели, что временная вариация различных амплитуд дается матричным уравнением
(14.49)
Это уравнение говорит, что изменение во времени каждой из амплитуд Сi пропорционально сумме всех прочих амплитуд Сj с коэффициентами Нij .
Как должно выглядеть (14.49) при континууме базисных состояний |x>? Вспомним сперва, что (14.49) можно также записать в виде
Теперь ясно, что делать. Для x-представления следует писать
(14.50)
Сумма по базисным состояниям |j> заменяется интегралом по х'. Поскольку <х|^H|х'> должна быть какой-то функцией от x и х', запишем ее как Н(х, х'), что соответствует Нij в (14.49). Тогда (14.50) это то же самое, что
(14.51)
где
Согласно (14.51), быстрота изменения ψ в точке х зависела бы от значений ψ во всех других точках х'; множитель Н(х, х') — это амплитуда (в единицу времени) того, что электрон перепрыгнет из х' в x. Оказывается, однако, что в природе эта амплитуда всюду, кроме точек х', очень близких к х, равна нулю. Это означает, как мы видели на примере цепочки атомов в начале главы [см. (14.12)], что правая часть (14.51) может быть полностью выражена только через ψ и ее производные по x в точке х.
Для частицы, которая свободно движется в пространстве, не подвергаясь действию каких-либо сил и возмущений, правильный физический закон таков:
Откуда это получается? Это невозможно вывести из чего-либо нам уже известного. Это рождено в голове Шредингера, это выдумано им в битве за понимание экспериментальных наблюдений реального мира. Может быть, какой-то ключ к тому, почему так должно быть, вам дадут размышления по поводу нашего вывода уравнения (14.12), которое проистекло из рассмотрения распространения электрона в кристалле.
Конечно, от свободных частиц проку мало. Что будет, если к частице приложить силы? Что ж, если действующая на частицу сила может быть описана с помощью скалярного потенциала V(х) (что означает, что речь идет не о магнитных силах, а об электрических) и если мы ограничимся низкими энергиями, чтобы иметь право пренебрегать теми сложностями, которые возникают при релятивистском движении, то гамильтониан, который укладывается в реальный мир, таков:
(14.52)
Опять-таки некоторый ключ к происхождению этого уравнения вы получите, если вернетесь к движению электрона в кристалле и посмотрите, как надо изменить уравнения, если энергия электрона медленно меняется от атома к атому, как если бы к кристаллу было приложено электрическое поле. Тогда член Е0 в (14.7) будет медленно меняться в зависимости от места и будет соответствовать новому слагаемому, появившемуся в (14.52). [Вас может удивить, отчего мы сразу перешли от (14.51) к (14.52), а не дали правильного выражения для амплитуды Н(х, х')=<х|^H|х'>. Да потому, что Н(х, х') можно написать только с помощью необычных алгебраических функций, а интеграл в правой части (14.51) выражается через привычные вещи. Если вам это в самом деле интересно, то вот смотрите: Н(х, х') можно записать так:
где δ'' означает вторую производную δ-функции. Эту довольно странную функцию можно заменить чуть более удобным и полностью ей равнозначным алгебраическим выражением
Мы не будем пользоваться этими формулами, а прямо будем работать с (14.52).]
Если теперь взять выражение (14.52) и подставить в (14.50) вместо интеграла, то для ψ(х)=<х|ψ> получится дифференциальное уравнение
(14.53)
Совершенно очевидно, что надлежит поставить вместо (14.53), если нас интересует трехмерное движение. Надо только d2/dx2 заменить на
а V(х) заменить на V(x, у, z). Для электрона, движущегося в поле с потенциалом V(х, у, z), амплитуда ψ(х, у, z) удовлетворяет дифференциальному уравнению
(14.54)
Называется оно уравнением Шредингера и было первым известным квантовомеханическим уравнением. Его написал Шредингер, прежде чем было открыто любое другое описанное в этом томе уравнение.
Хотя мы здесь пришли к нему совсем иным путем, но появление этого уравнения в 1926 г., когда Шредингер впервые его написал, явилось великим историческим моментом, отметившим рождение квантовомеханического описания материи. Многие годы внутренняя атомная структура вещества была великой тайной. Никто не был в состоянии понять, что скрепляет вещество, отчего существует химическая связь, и, особенно, как атомам удается быть устойчивыми. Хотя Бор и смог дать описание внутреннего движения электрона в атоме водорода, которое, казалось бы, объясняло наблюдаемый спектр лучей, испускаемых этим атомом, но причина, отчего электроны движутся именно так, оставалась тайной. Шредингер, открыв истинные уравнения движения электронов в масштабах атома, снабдил нас теорией, которая позволила рассчитать атомные явления количественно, точно и подробно. В принципе его уравнение способно объяснить все атомные явления, кроме тех, которые связаны с магнетизмом и теорией относительности. Оно объясняет уровни энергии атома и все, что касается химической связи. Но, конечно, это объяснение только в принципе. Математика вскоре становится столь сложной, что точно решить удается только простейшие задачи. Одни лишь атомы водорода и гелия были рассчитаны с высокой точностью. Однако путем различных приближений, порой весьма сомнительных, можно многое понять и в более сложных атомах и в химической связи молекул. Некоторые из этих приближений были показаны в предыдущих главах.
Уравнение Шредингера в том виде, в каком мы его записали, не учитывает каких-либо магнитных эффектов. Их, правда, можно приближенно принять во внимание, добавив в уравнение еще другие члены. Но, как мы убедились раньше, магнетизм — это эффект существенно релятивистский, так что правильное описание движения электрона в произвольном электромагнитном поле можно обсуждать только в рамках надлежащего релятивистского уравнения. Правильное релятивистское уравнение для движения электрона было открыто Дираком через год после того, как Шредингер придумал свое уравнение; оно имеет совершенно другой вид. Мы его не успеем здесь изучить.
Прежде чем перейти к рассмотрению некоторых следствий из уравнения Шредингера, хотелось бы продемонстрировать, как оно выглядит для системы многих частиц. Мы не будем им пользоваться, а просто хотим показать вам его, чтобы подчеркнуть, что волновая функция ψ не просто обычная волна в пространстве, а функция многих переменных. Если частиц много, уравнение превращается в
(14.55)
Потенциальная функция V — это то, что классически соответствует полной потенциальной энергии всех частиц. Если на частицы не действуют внешние силы, то функция V есть попросту электростатическая энергия взаимодействия всех частиц. Иначе говоря, если заряд i-й частицы равен Zi qe , то функция V просто равна
(14.56)
§ 6. Квантованные уровни энергии
В одной из последующих глав мы на каком-нибудь примере более подробно разберем решение уравнения Шредингера. А сейчас мы хотим показать вам, как получается одно из самых замечательных следствий из уравнения Шредингера — тот поразительный факт, что из дифференциального уравнения, в которое входят только непрерывные функции непрерывных пространственных переменных, могут возникнуть квантовые эффекты, как, например, дискретные уровни энергии в атоме. Нам надо понять следующий существенный факт: как это может быть, что энергия электрона, попавшего в потенциальный «колодец» и вынужденного оставаться в определенной области пространства, с необходимостью принимает значения только из точно определенной дискретной их совокупности.
Пусть речь идет об одномерном случае движения электрона, когда потенциальная энергия меняется по х так, как показано на фиг. 14.3.
Фиг. 14.3. Потенциальная яма для частицы, движущейся вдоль оси х.
Предположим, что потенциал является статическим: со временем он не меняется. Как уже мы делали много раз, поищем решения, отвечающие состояниям определенной энергии, т. е. определенной частоты. Испытаем такую форму решения:
(14.57)
Если мы эту функцию подставим в уравнение Шредингера, то увидим, что функция а(х) обязана подчиняться следующему дифференциальному уравнению:
(14.58)
Это уравнение говорит, что, каково бы ни было х, вторая производная а(х) по х пропорциональна а(х) с коэффициентом пропорциональности V-Е. Вторая производная от а(х) это скорость изменения наклона а(х). Если потенциал V больше энергии Е частицы, то скорость изменения наклона а(х) будет иметь тот же знак, что и a(х). Это значит, что кривая а(х) повернута выпуклостью к оси х, т. е. более или менее следует ходу положительной или отрицательной экспоненты е±x. Это означает, что на участке слева от х1 (см. фиг. 14.3), где V больше предполагаемой энергии Е, функция а(х) будет напоминать одну из кривых на фиг. 14.4, а.
Фиг. 14.4. Возможные формы волновой функции а(х) при V>E и при V
Если же потенциальная функция V меньше энергии Е, то знак второй производной а(х) по х противоположен знаку самой а(х) и кривая a(х) будет всегда вогнута к оси х, подобно одной из линий на фиг. 14.4, б. Решение на этом участке приобретет форму кусочков синусоид.
Теперь поглядим, можем ли мы графически построить решение для функции а(х), отвечающей частице с энергией Еа при потенциале V, показанном на фиг. 14.5. Раз нас интересует такое положение, когда частица заключена внутри потенциальной ямы, то мы будем искать решения, при которых амплитуда волны принимает после удаления х за пределы потенциальной ямы очень малые значения. Мы очень легко можем представить себе кривую наподобие изображенной на фиг. 14.5, стремящуюся к нулю при больших отрицательных х и плавно поднимающуюся при приближении к х1. Поскольку V в точке х1 равно Еа , то кривизна функции в этой точке равна нулю. Между х1 и х2 величина V-Еа всегда отрицательна, так что функция а(х) все время вогнута к оси, а кривизна тем больше, чем больше разность между Еа и V. Если продолжить кривую в область между x1 и x2, ей придется идти примерно так, как на фиг. 14.5.
Фиг. 14.5. Волновая функция для энергии Еа , стремящаяся к нулю при удалении х в отрицательную сторону.
Теперь протянем эту кривую правее х2. Там она искривляется прочь от оси и движется к большим положительным значениям (фиг. 14.6).
Фиг. 14.6. Волновая функция а(х) (см. фиг. 14.5), продолженная за x2 .
Для выбранной нами энергии Еа решение a(х) с ростом х растет все сильнее и сильнее. Действительно, ведь и кривизна решения а(х) тоже возрастает (если потенциал остается почти постоянным). Амплитуда круто вырастает до гигантских масштабов. Что это означает? Просто что частица не «связана» потенциальной ямой. Обнаружить ее вне ямы бесконечно более вероятно, чем внутри. Для изготовленного нами решения гораздо более вероятно встретить электрон в x=+∞, чем где-либо еще. Найти решение для связанной частицы нам не удалось.
Что ж, попробуем взять другую энергию, скажем, чуточку повыше чем Еа , например Еb (фиг. 14.7).
фиг. 14.7. Волновая функция а(х) для энергии eb , большей чем Еа .
Если слева условия останутся теми же, то мы придем к решению, показанному на нижней части фиг. 14.7. На первых порах оно выглядит получше, но в конце концов оказывается таким же плохим, как и решение для Еа , только теперь при возрастании x величина а(х) становится все более и более отрицательной.
Может быть, в этом разгадка! Раз небольшое изменение энергии от Еа к Еb приводит к тому, что кривая перебрасывается с одной стороны оси на другую, то, может быть, существует энергия, лежащая между Еа и Еb , при которой кривая для больших х будет стремиться к нулю. Так оно и есть, и мы на фиг. 14.8 изобразили, как может выглядеть решение.
Фиг. 14.8. Волновая функция для энергии Еc между Еа и Еb .
Вам нужно понимать, что решение, показанное на рисунке, это весьма частное решение. Если бы мы даже чуть-чуть подняли или снизили энергию, то функция перешла бы в другие кривые, похожие на одну из штриховых кривых фиг. 14.8, и опять для связанной частицы не получилось бы надлежащих условий. Мы пришли к выводу, что если частица должна находиться в потенциальной яме, то это может с ней случиться только при вполне определенной энергии.
Значит ли это, что у частицы, находящейся в связанном состоянии в потенциальной яме, может быть только одна энергия? Отнюдь. Могут быть и другие, но не слишком близко к Ес . Обратите внимание, что волновая функция на фиг. 14.8 четыре раза пересекает ось на участке х1х2. Если бы мы выбрали энергию значительно ниже Ес , то могло бы получиться решение, которое бы пересекло ось только трижды, только дважды, только единожды или ни разу. Возможные решения намечены на фиг. 14.9.
Фиг. 14.9. Функция а(х) для пяти связанных состояний с наинизшими энергиями.
(Могут быть и решения, отвечающие более высоким энергиям.) Вывод состоит в том, что если частица загнана в потенциальную яму, то ее энергия принимает только определенные специальные значения, образующие дискретный энергетический спектр. Вы понимаете теперь, как способно дифференциальное уравнение описать этот основной факт квантовой физики.
Следует заметить только одно. Если энергия Е выше верха потенциальной ямы, то дискретных решений уже не будет, и разрешены все мыслимые энергии. Такие решения отвечают рассеянию свободных частиц на потенциальной яме. Пример таких решений мы видели, когда рассматривали влияние атомов примесей в кристалле.
Глава 15 СИММЕТРИЯ И ЗАКОНЫ СОХРАНЕНИЯ
[58]
§ 1. Симметрия
В классической физике немало величин (таких, как импульс, энергия и момент количества движения) сохраняется. Теоремы о сохранении соответствующих величин существуют и в квантовой механике. Самое прекрасное в квантовой механике это то, что теоремы сохранения в определенном смысле удается в ней вывести из чего-то другого; в классической же механике они сами практически являются исходными для других законов. (Можно, правда, и в классической механике поступать так же, как в квантовой, но это удается только на очень высоком уровне.) В квантовой механике, однако, законы сохранения очень тесно связаны с принципом суперпозиции амплитуд и с симметрией физических систем относительно различных изменений. Это и есть тема настоящей лекции. Хотя идеи эти мы будем применять главным образом к сохранению момента количества движения, но существенно здесь то, что все теоремы о сохранении каких угодно величин всегда связаны — в квантовой механике — с симметриями системы.
Начнем поэтому с изучения вопроса о симметриях систем. Очень простым примером служат молекулярные ионы водорода (впрочем, в равной степени подошли бы и молекулы аммиака), у которых имеется по два состояния. У молекулярного иона водорода за одно базисное состояние мы принимали такое состояние, когда электрон расположен возле протона № 1, а за другое базисное состояние то, в котором электрон располагался возле протона № 2. Эти два состояния (мы их называли |1> и |2>) мы снова показываем на фиг. 15.1, а.
Фиг. 15.1. Если состояния |1> и |2> отразить в плоскости Р—Р, они перейдут соответственно в состояния |2> и |1>.
И вот, поскольку оба ядра в точности одинаковы, в этой физической системе имеется определенная симметрия. Иначе сказать, если бы нам пришлось отразить систему в плоскости, поставленной посредине между двумя протонами (имеется в виду, если бы все находящееся с одной стороны плоскости симметрично перешло на другую сторону), то возникла бы картина, представленная на фиг. 15.1, б. А коль скоро протоны тождественны, операция отражения переводит |1> в |2>, а |2> в |1>. Обозначим эту операцию отражения ^P и напишем
(15.1)
Значит, наше ^P — это оператор, в том смысле, что он «что-то делает» с состоянием, чтобы вышло новое состояние. Интересно здесь то, что ^P, действуя на любое состояние, создает какое-то другое состояние системы.
Далее, у ^P, как у всякого другого оператора, с которыми мы встречались, есть матричные элементы, которые можно определить с помощью обычных очевидных обозначений. Именно
суть матричные элементы, которые получаются, если ^P |1> и
^P|2> умножить слева на <1|. Согласно уравнению (15.1), они равны
(15.2)
Таким же путем можно получить и Р21, и Р22. Матрица ^P относительно базисной системы|1> и |2> есть
(15.3)
Мы снова убеждаемся, что слова оператор и матрица в квантовой механике практически взаимозаменяемы. Есть, конечно, легкие технические различия, как между словами «числительное» и «число», но мы не такие педанты, чтобы забивать себе этим голову. Так что будем именовать ^P то оператором, то матрицей, независимо от того, определяет ли оно операцию или реально использовано для получения численной матрицы.
Теперь мы хотели бы кое на что обратить ваше внимание. Предположим, что физика всей системы молекулярного иона водорода сама по себе симметрична. Этого могло бы и не быть — это зависит, например, от того, что находится с нею рядом. Но если система симметрична, то с необходимостью должна быть справедлива следующая идея. Предположим, что вначале, при t=0, система находится в состоянии |1>, а через промежуток времени t мы обнаруживаем, что система оказалась в более сложном положении — в какой-то линейной комбинации обоих базисных состояний. Вспомните, что в гл. 6 (вып. 8) мы привыкли представлять «эволюцию во времени» умножением на оператор ^U. Это означает, что система через мгновение (скажем для определенности, через 15 сек) окажется в каком-то ином состоянии.
Например, это состояние на √2/3 может состоять из состояния |1> и на i√1/3 из состояния |2>, и мы бы написали
(15.4)
Теперь спросим: что же произойдет, если вначале мы запустим систему в симметричном состоянии |2> и при тех же условиях подождем 15 сек? Ясно, что если мир симметричен (что мы и предполагаем), то обязательно получится состояние, симметричное с (15.4):
(15.5)
Те же идеи схематично изображены на фиг. 15.2.
Фиг. 15.2. Если в симметричной системе чистое состояние |1> развивается во времени так, как показано в части (а), то чистое состояние |2> будет во времени развиваться так, как показано в части (б).
Итак, если физика системы симметрична относительно некоторой плоскости и мы рассчитали поведение того или иного состояния, то нам также известно поведение состояния, которое получилось бы после отражения исходного состояния в плоскости симметрии.
То же самое можно высказать чуть более общо, т. е. чуть более отвлеченно. Пусть ^Q — любая из множества операций, которые вы можете произвести над системой, не меняя физики. К примеру, за ^Q мы можем принять операцию отражения в плоскости, расположенной посредине между двумя атомами молекулы водорода. Или в системе с двумя электронами можно было бы под ^Q подразумевать операцию обмена двумя электронами. Третьей возможностью явилась бы в сферически симметричной системе операция поворота всей системы на конечный угол вокруг некоторой оси; от этого физика не изменится. Конечно, в каждом отдельном случае мы бы обозначали ^Q по-своему. В частности, через ^Ry (θ) мы обычно будем обозначать операцию «поверни систему вокруг оси у на угол θ». Под ^Q мы просто понимаем один из названных операторов или любой другой, который оставляет всю физическую ситуацию неизменной. Оператор ^Q мы будем называть оператором симметрии для системы.
Вот вам еще примеры операторов симметрии. Если у нас имеется атом, а внешнее магнитное или внешнее электрическое поле отсутствует, то после поворота системы координат вокруг любой оси физическая система остается той же самой. Опять-таки молекула аммиака симметрична относительно отражения в плоскости, параллельной той, в которой лежат три атома водорода (пока нет электрического поля). Если есть электрическое поле, то при отражении надо было бы обратить и поле, а это меняет всю физическую задачу. Но пока внешнего поля нет, молекула симметрична.
Теперь рассмотрим общий случай. Положим, мы начали с состояния |ψ1>, а через некоторое время или под влиянием других физических условий оно превратилось в состояние |ψ2>. Напишем
(15.6)
[Посмотрите на формулу (15.4).] Теперь вообразите, что над всей системой мы проводим операцию ^Q. Состояние |ψ1> преобразится в состояние |ψ'1>, которое также записывается в виде ^Q|ψ1>. А состояние |ψ2> превращается в |ψ'2>=^Q|ψ2>. И вот, если физика симметрична относительно ^Q (не забывайте про это, если это отнюдь не общее свойство системы), тогда, подождав в тех же условиях то же время, мы должны получить
е m — некоторое веществе(15.7)
[Как в (15.5).] Но вместо |ψ'1> можно написать ^Q|ψ1>, а вместо |ψ2> написать ^Q |ψ2>, так что (15.7) переписывается в виде
(15.8)
Теперь, если |ψ2> заменить на ^U |ψ1> [см. (15.6)], то получим
(15.9)
Нетрудно понять, что это значит. В отношении атома водорода это означает, что «отразить и после немного подождать» [правая часть (15.9)] — это то же самое, что «немного подождать, а после отразить» [левая часть (15.9)]. Они должны совпасть, если только ^U при отражении не меняется.
А поскольку (15.9) справедливо при любом исходном состоянии |ψ1>, то на самом деле это уравнение для операторов
(15.10)
Это-то мы и хотели получить — математическую формулировку симметрии. Когда соблюдается (15.10), мы говорим, что операторы ^U и ^Q коммутируют. Тогда «симметрию» можно определить следующим образом: физическая система симметрична относительно операции ^Q, когда ^Q коммутирует с ^U (с операцией прошествия времени). [На языке матриц произведение двух операторов равнозначно матричному произведению, так что (15.10) в системе, симметричной относительно преобразования ^Q, выполняется и для матриц ^Q и ^U.]
Кстати, поскольку для бесконечно малого времени 8 мы имеем [7=1 — i^Hε/ℏ, где ^H — обычный гамильтониан [см. гл. 6 (вып. 8)], то легко видеть, что когда (15.10) выполнено, то выполнено и
(15.11)
Так что (15.11) есть математическая формулировка условий на симметричность физической ситуации относительно оператора ^Q. Она определяет симметрию.
§ 2. Симметрия и ее сохранение
Прежде чем применять только что найденный результат, хотелось бы еще немного вникнуть в идею симметрии. Положим, что стечение обстоятельств таково, что после действия оператора ^Q на состояние получается опять то же состояние. Это очень частный случай, но все же допустим, что так сложилось, что состояние |ψ'>=^Q|ψ0>. физически совпадает с состоянием |ψ0>. Это значит, что |ψ'> равняется |ψ0>, если не считать некоторого фазового множителя. Как это себе представлять? Пусть, например, имеется ион H2+ в состоянии, которое мы когда-то обозначали |I>. У этого состояния имеется одинаковая амплитуда побывать в базисных состояниях |1> и |2>. Вероятности показаны столбиками на фиг. 15.3, а.
Фиг. 15.3. Состояние |I> и состояние ^P|I>, получаемые отражением |I> в плоскости, проходящей посредине между атомами в ионе Н2 + .
Если мы на состояние |I> подействуем оператором отражения ^P, он перевернет его, поменяв местами |1> с|2>, а |2> с|1>; получатся вероятности, показанные на фиг. 15.3,б. Перед нами опять состояние |I>. Если начать с состояния |II>, то вероятности до и после отражения будут выглядеть тоже одинаково. Правда, если посмотреть на амплитуды, то разница все же есть. У состояния |I> после отражения амплитуды останутся теми же, у состояния |II> они приобретут противоположный знак. Иными словами,
(15.12)
Если написать ^P|ψ0>=eiδ|ψ0>, то у состояния |I> мы имеем еi δ =1, а у состояния |II> имеем еi δ =-1.
Возьмем другой пример. Пусть у нас есть правополяризованный по кругу фотон, распространяющийся в направлении z. Если мы совершим операцию поворота вокруг оси z, то, как мы знаем, это просто приведет к умножению амплитуды на ei φ , где φ — угол поворота. Значит, в этом случае для операции поворота δ просто равно углу поворота.
Далее, ясно, что если оказывается верным, что оператор ^Q в какой-то момент времени просто меняет фазу состояния (скажем, в момент t=0), то это будет верно всегда. Иначе говоря, если состояние |ψ1> переходит за время t в состояние |ψ2>:
(15.13)
и если симметрия физической картины такова, что
(15.14)
то верно и то, что
(15.15)
Это ясно, ведь
и если ^Q|ψ1>=еi δ |ψ1>, то
[Верхние равенства следуют из (15.13) и (15.10) для симметричной системы, нижние — из (15.14) и из того, что всякое число, скажем еi δ , коммутирует с оператором.]
Итак, при некоторых симметриях то, что верно сначала, верно всегда. Но разве это не закон сохранения? Да! Он утверждает, что если вы взглянете на исходное состояние и, проделав где-то в стороне небольшой подсчет, откроете, что операция, которая является операцией симметрии для системы, приводит только к умножению на некоторый фазовый множитель, то вы будете уверены, что это же свойство будет выполнено для конечного состояния — та же операция умножит и конечное состояние на тот же фазовый множитель. Это будет верно всегда, даже если вы ничего не знаете о том внутреннем механизме мира, который изменяет систему от начального состояния к конечному. Даже если вы не позаботились вглядеться в детали того, каким именно способом система переходит от одного состояния к другому, вы все равно имеете право говорить, что если вещь вначале находилась в состоянии с определенным характером симметрии и если гамильтониан этой вещи симметричен относительно этой операции симметрии, тогда тот же характер симметрии останется у состояния на вечные времена. Это основа всех законов сохранения квантовой механики.
Рассмотрим частный пример. Возьмем опять оператор ^P. Сперва, правда, немножко изменим определение операции Р. Пусть ^P будет не просто зеркальным отражением, потому что оно требует определения плоскости, в которой поставлено зеркало. Существует особый вид отражения, который указания плоскости не требует. Переопределим операцию ^P таким образом: сперва вы отражаете в зеркале, находящемся в плоскости z, так что z переходит в -z, x остается х, а у остается у; затем вы поворачиваете систему на угол 180° вокруг оси z, так что х переходит в -х, а у в -у. Все вместе называется инверсией, обращением координат. Каждая точка проецируется через начало координат в диаметрально противоположное положение. Все координаты всего на свете меняют знак. Эту операцию мы, как и прежде, будем обозначать символом Р. Она изображена на фиг. 15.4 и немного удобнее, чем простая операция отражения, потому что не нужно указывать, в какой координатной плоскости происходит отражение, достаточно лишь указать точку, являющуюся центром симметрии.
Фиг. 15.4. Операция инверсии ^P. То, что находится в точке A(х, у, z), переходит в точку А'(-х, -у, -z).
Теперь предположим, что у нас есть состояние |ψ0>, которое при операции инверсии переходит в еiδ|ψ0>, т. е.
(15.16)
Сделаем теперь новую инверсию. После двух инверсий мы вернемся к тому, с чего начали: ничего не изменится. Должно получиться
Но
Отсюда следует, что (еi δ )2=1. Значит, если оператор инверсии является операцией симметрии для какого-то состояния, то у δ могут быть только две возможности:
а это означает, что или
(15.17)
В классической физике, если состояние симметрично относительно инверсии, то эта операция дает опять то же состояние. А в квантовой механике имеются две возможности: получается либо то же состояние, либо минус то же состояние. Когда получается то же состояние, ^P|ψ0>=|ψ0>, мы говорим, что у состояния |ψ0> четность положительна. Если знак меняется, так что ^P|ψ0>=-|ψ0>, мы говорим, что четность состояния отрицательна. (Оператор инверсии ^P известен также как оператор четности.) Состояние |I> иона Н2+ обладает положительной четностью; состояние же |II> — отрицательной [см. (15.12)]. Бывают, конечно, состояния, не симметричные относительно операции ^P; это состояния без определенной четности. Например, в системе Н2+ состояние |I> имеет положительную четность, состояние |II> — отрицательную, а состояние |1> определенной четности не имеет.
Когда мы говорим о том, что операция (например, инверсия) была совершена «над физической системой», то это можно представлять себе двояким образом. Можно считать, что все, что было в точке r, физически сдвинулось в обратную точку -r; или можно считать, что мы смотрим на ту же систему из новой системы отсчета х', y', z', связанной со старой формулами х'=-х, у'=-у и z'=-z. Точно так же, когда мы говорим о поворотах, то можно либо считать, что мы поворачиваем целиком всю физическую систему, либо что поворачиваем систему координат, в которой мы измеряем нашу систему, оставляя последнюю закрепленной в пространстве. Эти две точки зрения по существу равноценны. Они равноценны и при повороте, только поворот системы на угол θ подобен повороту системы отсчета на отрицательный угол —θ. В нашем курсе мы обычно смотрели, что получается, когда берется проекция на новую систему осей. То, что при этом получается, совпадает с тем, что получится, если мы оставим оси прежними и повернем тело на столько же назад. Когда вы это делаете, не забудьте поменять знаки углов.
Многие законы физики (но не все) не меняются при отражении или инверсии координат. Они симметричны по отношению к инверсии. Законы электродинамики, например, не изменяются, если мы меняем x на -х, у на -у и z на -z во всех уравнениях. То же относится и к законам тяжести, и к сильным взаимодействиям ядерной физики. Только у слабых взаимодействий, ответственных за β-распад, нет такой симметрии. [Мы обсуждали это несколько подробнее в гл. 52 (вып. 4).] Но мы сейчас пренебрежем β-распадом. Тогда в любой физической системе, на которую, как можно думать, β-распад не оказывает заметного влияния (в качестве примера возьмем испускание света атомом), гамильтониан ^H и оператор ^P будут коммутировать. В этих обстоятельствах верно следующее утверждение. Если четность состояния вначале положительна и вы поинтересуетесь физической ситуацией через некоторое время, то увидите, что четность останется положительной. Пусть, например, нам известно, что атом перед тем, как испустить фотон, находился в состоянии с положительной четностью. Вы рассматриваете всю эту систему (включая фотон) после испускания; четность опять будет положительна (и точно так же было бы, если бы вы начали с отрицательной четности). Этот принцип именуется сохранением четности. Вы теперь понимаете, почему слова «сохранение четности» и «симметрия относительно отражений» в квантовой механике тесно переплетены. Хотя до последних лет считалось, что природа всегда сохраняет четность, теперь известно, что это не так. Выяснилось, что это неверно, потому что реакция β-распада не обладает симметрией относительно инверсии, обнаруженной в других законах физики.
Теперь мы можем доказать интересную теорему (справедливую до тех пор, пока слабыми взаимодействиями можно пренебрегать): любое состояние определенной энергии, не являющееся вырожденным, обязано обладать определенной четностью. Его четность должна быть либо положительна, либо отрицательна. (Припомните, что нам иногда встречались системы, в которых несколько состояний имели одну и ту же энергию,— такие состояния мы называем вырожденными. Так вот наша теорема к ним не относится.)
Мы знаем, что если |ψ0> — состояние определенной энергии, то
(15.18)
где Е — просто число, энергия состояния. Если у нас имеется произвольный оператор ^Q, который является оператором симметрии для системы, то мы можем доказать, что
(15.19)
если только |ψ0> — единственное состояние с данной энергией. Рассмотрим новое состояние |ψ'0> которое вы получаете после действия ^Q. Если вся физика симметрична, то |ψ'0> должно иметь ту же энергию, что и |ψ0>. Но мы ведь выбрали случай, когда состояние с такой энергией только одно, а именно |ψ0>; значит, |ψ'0> должно быть тем же состоянием, отличаясь разве что фазой. Таково физическое доказательство.
Но то же последует и из нашей математики. Наше определение симметрии —это (15.10) или (15.11), справедливое для любого состояния |ψ>:
(15.20)
Но сейчас речь идет о состоянии |ψ0>, которое является состоянием с определенной энергией, так что ^H|ψ0>=Е|ψ0>. А раз Е — просто число, то оно попросту проходит сквозь ^Q, и мы имеем
так что
(15.21)
Значит, |ψ'0>=^Q|ψ0> — тоже состояние ^H с определенной энергией и при этом с тем же самым Е. Но по нашей гипотезе имеется только одно такое состояние; значит, |ψ'0> должно быть равно ei δ |ψ0>.
Все, что мы только что доказали, относится к любому оператору ^Q, лишь бы он был оператором симметрии для физической системы. Поэтому когда в рассмотрение входят только электрические силы и сильные взаимодействия (и нет никакого β-распада), так что симметрия относительно инверсии является вполне допустимым приближением, в этих обстоятельствах ^P|ψ>=еi δ |ψ>. Но мы видели также, что еi δ обязано равняться либо +1, либо -1. Итак, любое состояние с определенной энергией (если оно не вырождено) навсегда снабжено либо положительной, либо отрицательной четностью.
§ 3. Законы сохранения
Обратимся теперь к другому интересному примеру операции симметрии — к повороту. Рассмотрим частный случай оператора, который поворачивает атомную систему на угол φ вокруг оси z. Обозначим этот оператор ^Rz(φ). Предположим еще, что никаких влияний, выстроенных вдоль осей х и у, в нашем физическом случае нет. Все электрические или магнитные поля взяты параллельными оси z, так что никаких изменений во внешних условиях от поворота всей физической системы вокруг оси z не наступит. Например, если имеется атом в пустом пространстве и мы повернем этот атом вокруг оси z на угол φ, то получим ту же физическую систему.
Тогда существуют особые состояния, обладающие тем свойством, что такая операция создает новое состояние, равное первоначальному, умноженному на некоторый фазовый множитель. Заметим, что когда это так, то изменение фазы обязано быть всегда пропорционально углу φ. Представьте, что вы дважды захотели бы сделать поворот на угол φ. Это равносильно тому, что повернуть на угол 2φ. Если поворот на угол φ имеет своим следствием умножение состояния |ψ0> на фазовый множитель ei δ , так что
то два таких поворота, один вслед за другим, привели бы к умножению состояния на множитель (еi δ )2=еi 2δ , так как
Изменение фазы δ оказывается пропорциональным φ. Мы, стало быть, рассматриваем лишь те особые состояния |ψ0>, для которых
(15.22)
где m — некоторое вещественное число.
Нам известен также тот примечательный факт, что если система симметрична относительно поворота вокруг z и если исходное состояние обладает тем свойством, что (15.22) окажется выполненным, то и позже у этого состояния сохранится то же свойство. Значит, это число m имеет большую важность. Если его значение мы знаем в начале, то мы знаем его и в конце. Это число m, которое сохраняется, есть константа движения. Причина, почему мы говорим об m, выталкиваем его на первый план, состоит в том, что оно не связано с каким-либо определенным углом φ, и еще потому, что у него есть соответствие в классической механике. В квантовой механике мы выбираем для mℏ (в состояниях, подобных |ψ0>) название момент количества движения вокруг оси z. И тогда мы обнаруживаем, что в пределе больших систем та же величина равняется z-компоненте момента количества движения из классической механики. Значит, если мы имеем состояние, для которого поворот вокруг оси z приводит просто к фазовому множителю eim φ , то перед нами состояние с определенным моментом количества движения вокруг этой оси, и момент количества движения сохраняется. Он навсегда остается равным mℏ. Конечно, повороты можно делать вокруг любых осей, и сохранение момента количества движения тоже будет получаться для любых осей. Вы видите, что сохранение момента количества движения связано с тем фактом, что, когда вы поворачиваете систему, вы получаете опять то же состояние, только с новым фазовым множителем.
Сейчас мы покажем вам, насколько обща эта идея. Применим ее к двум другим законам сохранения, по физической идее точно соответствующим сохранению момента количества движения. В классической физике существует также сохранение импульса и сохранение энергии, и интересно, что оба они тоже связаны с некоторыми физическими симметриями. Положим, у нас имеется физическая система — атом, или сложное ядро, или же молекула, или что угодно — и если мы возьмем ее и как целое передвинем на новое место, то ничего не изменится. Значит, мы имеем гамильтониан с тем свойством, что он в некотором смысле зависит от внутренних координат, но не зависит от абсолютного положения в пространстве. В этих обстоятельствах существует специальная операция симметрии, которая называется пространственным переносом. Определим ^Dx (а) как операцию смещения на расстояние а вдоль оси х. Тогда для каждого состояния мы сможем проделать эту операцию и получить новое состояние. И опять здесь возможны весьма специальные состояния, обладающие тем свойством, что когда вы их смещаете по оси х на а, вы получаете то же самое состояние (если не считать фазового множителя). И так же, как делалось выше, можно доказать, что когда так бывает, то фаза пропорциональна а. Так что для этих специальных состояний |ψ0> можно писать
(15.23)
Коэффициент k, умноженный на ℏ, называется х-компонентой импульса. Его называют так потому, что это число, когда система велика, численно совпадает с классическим импульсом рх . Общее утверждение таково: если гамильтониан не меняется при сдвиге системы и если вначале состояние характеризуется определенным импульсом в направлении х, то импульс в направлении х останется с течением времени неизменным. Полный импульс системы до и после столкновений (или после взрывов или еще чего-нибудь?) будет один и тот же.
Есть и другая операция, которая совершенно аналогична смещению в пространстве: сдвиг во времени. Положим, перед нами физические обстоятельства, когда ничто внешнее от времени не зависит, и вот в этих обстоятельствах мы помещаем нечто в некоторый момент времени в данное состояние и пускаем его на произвол судьбы. А в другой раз (в новом опыте) мы то же самое устройство запускаем двумя секундами позже или вообще τ секундами позже. И вот если ничего во внешних условиях не зависит от абсолютного времени, то все будет развиваться точно так же, как прежде, и конечное состояние совпадет с прежним конечным состоянием, за исключением того, что запоздает на время τ. В этих обстоятельствах также найдутся особые состояния, у которых развитие во времени обладает той особенностью, что запоздавшее состояние — это попросту старое состояние, умноженное на фазовый множитель. И на этот раз тоже ясно, что для этих особых состояний изменение фазы должно быть пропорционально τ. Можно написать
(15.24)
Общепринято при определении ω пользоваться знаком минус; при таком соглашении ωℏ — это энергия системы; она сохраняется. Итак, система с определенной энергией — это такая система, которая при сдвиге во времени на τ воспроизводит самое себя, умноженную на e- i ωτ . (Это как раз то, что мы говорили, когда определяли квантовое состояние с определенной энергией, так что все согласуется.) Это означает, что если система находится в состоянии с определенной энергией и если гамильтониан не зависит от t, то независимо от того, что произойдет дальше, система во все позднейшие времена будет обладать той же энергией.
Теперь вы понимаете, стало быть, какая связь между законами сохранения и симметрией мира. Симметрия по отношению к сдвигам во времени влечет за собой сохранение энергии; симметрия относительно положения на осях х, у или z влечет за собой сохранение соответствующей компоненты импульса. Симметрия относительно поворотов вокруг осей х, у и z влечет за собой сохранение х-, у- и z-компонент момента количества движения. Симметрия относительно отражений влечет за собой сохранение четности. Симметрия по отношению к перестановке двух электронов влечет за собой сохранение чего-то, чему не придумано еще названия, и т. д. Часть этих принципов имеет классические аналоги, а часть — нет. В квантовой механике есть больше законов сохранения, чем это нужно для классической механики или по крайней мере чем обыкновенно в ней в ходу.
Чтобы вы смогли разобраться в других книгах по квантовой механике, мы сделаем небольшую техническую ремарку и познакомим вас с одним общепринятым обозначением. Операция сдвига по времени — это как раз та самая операция ^U, о которой мы как-то говорили:
(15.25)
Многие предпочитают язык бесконечно малых сдвигов по времени или бесконечно малых перемещений в пространстве или поворотов на бесконечно малые углы. Поскольку всякое конечное смещение или угол можно постепенно накопить последовательными бесконечно малыми смещениями или поворотами, то часто легче проанализировать сначала этот бесконечно малый случай. Оператор бесконечно малого сдвига Δt во времени есть (по определению гл. 6, вып. 8)
(15.26)
Тогда Н аналогично классической величине, которую мы именуем энергией, потому что если ^H|ψ> оказывается равным постоянной, умноженной на |ψ>, а именно если ^H|ψ>=E|ψ>, то эта постоянная есть энергия системы.
То же самое проделывается и с другими операциями. Если мы делаем легкое смещение по х, скажем на Δx, то состояние |ψ>, вообще говоря, перейдет в некоторое новое состояние |ψ'>. Мы можем написать
(15.27)
потому что, когда Δx стремится к нулю, |ψ'> обязано обратиться опять в |ψ>, или, что то же самое, ^Dx (0)=1, а для малых Δx отклонение ^Dx (Δx) от единицы должно быть пропорционально Δx. Оператор рх , определенный таким путем, называется оператором импульса (естественно, для x-компоненты).
По тем же причинам для малых поворотов обычно пишут
(15.28)
и называют ^Jz оператором z-компоненты момента количества движения. Для тех особых состояний, для которых ^Rz (φ)|ψ0>=еimφ |ψ0>, можно для каждого малого угла, скажем Δφ, разложить правую часть до членов первого порядка по Δφ и получить
Сравнивая это с определением ^Jz по формуле (15.28), приходим к
(15.29)
Иначе говоря, если вы действуете оператором ^Jz на состояние с определенным моментом количества движения вокруг оси z, то получаете mℏ, умноженное на это состояние, где mℏ—количество z-компоненты момента количества движения. Все совершенно аналогично тому, как действие ^H на состояние с определенной энергией дает Е|ψ>.
Теперь хотелось бы перейти к некоторым приложениям идеи о сохранении момента количества движения, чтобы показать вам ее в действии. Дело в том, что в действительности все это очень просто. О том, что момент количества движения сохраняется, вы знали и раньше. Единственное, что вам нужно запомнить из этой главы, это что если у состояния |ψ0> есть такое свойство, что при повороте на угол φ вокруг оси z оно превращается в еim φ |ψ0>, то z-компонента момента количества движения равна mℏ. Этих знаний достаточно, чтобы получить уйму интересных вещей.
§ 4. Поляризованный свет
Прежде всего необходимо проверить одну идею. В гл. 9, § 4 (вып. 8), мы показали, что когда состояние правополяризованного по кругу света наблюдается из системы, повернутой на угол φ вокруг оси z, то оно оказывается умноженным на еi φ . Не означает ли это, что фотоны правополяризованного по кругу света несут момент количества движения вдоль оси z, равный единице?
Да, так оно и есть. Это означает еще, что когда у нас имеется пучок света, содержащий множество фотонов, поголовно одинаково поляризованных по кругу (как бывает в классических пучках), то он будет нести с собой какой-то момент количества движения. Если полная энергия, уносимая пучком за какое-то время, есть W, то в нем имеется N=W/ℏω ω фотонов. Каждый несет по моменту ℏ, так что полный момент количества движения равен
(15.30)
Можно ли и в классике доказать, что свет, правополяризованный по кругу, несет с собой энергию и момент количества движения в пропорции W к ω? Ведь если все правильно, это было бы классическое утверждение — случай, когда можно перейти от квантов к классике. Надо проверить, подтверждается ли это классической физикой. Тогда станет ясно, имеем ли мы право назвать m моментом количества движения. Припомним, чем в классическом смысле является правополяризованный свет. Он описывается электрическим полем с колеблющейся x-компонентой и колеблющейся y-компонентой, сдвинутыми по фазе на 90°, так что суммарный вектор ℰ электрического поля бежит по кругу (фиг. 15.5, а).
Фиг. 15.5. Электрическое поле ℰ в поляризованной по кругу световой волне (а) и вращение электрона, приводимого в движение поляризованным по кругу светом (б).
Теперь положим, что мы осветили таким светом стенку, способную поглотить его (или по крайней мере часть его), и рассмотрим один из атомов стенки, опираясь на классические представления. Мы часто представляли движение электрона в атоме в виде гармонического осциллятора, который приводится в действие внешним электрическим полем. Предположим, что атом изотропен, так что с равным успехом колеблется как в направлении х, так и в направлении у. Далее, у света, поляризованного по кругу, смещения по х и по у одинаковы, хотя и отстают друг от друга на 90°. В итоге электрон будет двигаться по кругу (фиг. 15.5, б). Он сместится из положения равновесия в начале координат на величину r и начнет ходить по кругу, как-то отставая по фазе от вектора ℰ. Связь между ℰ и r может быть такая, как показано на фиг. 15.5, б. Электрическое поле с течением времени поворачивается, но с такой же частотой поворачивается и смещение, так что относительная ориентация остается той же. Посмотрим теперь, какая работа производится над электроном. Скорость, с какой электрону подается энергия, равна его скорости v, умноженной на компоненту ℰt, параллельную этой скорости:
(15.31)
Но вы не можете не заметить, что у электрона в это время непрерывно увеличивается и момент количества движения, потому что он все время испытывает действие момента, вращающего его вокруг начала координат. Вращательный момент равен ℰtr, и он обязан равняться скорости изменения момента количества движения dJz /dt:
(15.32)
Вспоминая, что v=ωr, имеем
Следовательно, если проинтегрировать поглощаемый полный момент количества движения, то он окажется пропорциональным полной энергии, с коэффициентом пропорциональности 1/ω, что согласуется с (15.30). Свет действительно несет с собой момент количества движения — одну единицу (×ℏ), когда он правополяризован по кругу вдоль оси z, и минус одну единицу, когда левополяризован.
Теперь зададим следующий вопрос: если свет линейно поляризован в направлении х, то чему равен момент количества движения? Свет, поляризованный в направлении х, может быть представлен суперпозицией право- и левополяризованного света. Поэтому имеется некоторая амплитуда того, что момент количества движения равен +ℏ, и некоторая амплитуда того, что момент равен -ℏ, так что определенного момента количества движения у него нет, а есть амплитуда появиться с +ℏ, и такая же появиться с -ℏ. Интерференция этих двух амплитуд создает линейную поляризацию, обладающую равной вероятностью оказаться с плюс или с минус одной единичкой момента количества движения. Макроскопические измерения, проведенные над пучком линейно поляризованного света, покажут, что он несет нулевой момент количества движения, потому что среди большого числа фотонов, несущих противоположные количества момента, окажется поровну правых и левых, и средний момент количества движения будет равен нулю. И в классической теории вы не обнаружите никакого момента количества движения, разве что где-то окажутся следы какой-то круговой поляризации.
Мы говорили, что частица со спином 1 может иметь три значения Jz : +1, 0, -1 (те три состояния, которые нам встретились в опыте Штерна — Герлаха).
Но у света свой нрав: у него только два состояния. Состояния с нулем у него нет. Эта странная потеря связана с тем, что свет не может стоять на месте. У покоящейся частицы со спином j имеются 2j+1 возможных состояния со значениями jz , идущими с шагом 1 от -j до +j. Но оказывается, что если что-то имеет спин j, а масса этого чего-то равна нулю, то у него могут быть только состояния с компонентами +j и -j вдоль направления движения. Например, у света не три состояния, а два, хотя фотон — это объект со спином 1. Как же это согласуется с нашими прежними доказательствами, опирающимися на то, что происходит при поворотах в пространстве, доказательствами того, что для частиц со спином 1 необходима тройка состояний? Покоящуюся частицу можно поворачивать вокруг любой оси, не меняя состояния ее момента. Частицы же с нулевой массой покоя (например, фотоны или нейтрино) не могут находиться в покое; только повороты вокруг оси, указывающей направление движения, не изменят состояния момента. А поворотов вокруг одной оси не хватает на то, чтобы доказать, что нужны обязательно три состояния, если дано, что одно из них при поворотах на угол φ меняется, как еi φ .
Еще одно замечание в сторону. Вообще-то частицы с нулевой массой покоя могут обойтись только одним из двух спиновых состояний (+j, -j) относительно линии движения. У нейтрино (частиц со спином 1/2) в природе существуют только состояния с компонентой момента количества движения -ℏ/2, обратной направлению движения (а у антинейтрино — только с компонентой по направлению движения, +ℏ/2). Когда же система обладает симметрией инверсии (так что четность сохраняется), требуются уже обе компоненты +j и -j. Примером является свет.
§ 5. Распад Λ
0
Теперь приведем пример того, как теорема о сохранении момента количества движения применяется в чисто квантовофизических задачах. Рассмотрим распад лямбда-частицы (Λ0), которая расщепляется на протон и π--мезон посредством слабого взаимодействия:
Пусть нам известно, что спин у пиона равен нулю, у протона — половине, а у Λ0 тоже половине. Мы хотели бы решить следующую задачу: положим, что Λ0 рождена таким образом, что оказалась полностью поляризованной; это значит, что ее спин направлен, скажем, вверх по отношению к подходящим образом выбранной оси z (фиг. 15.6, а).
Фиг. 15.6. Λ0 -частица со спином, направленным вверх, распадается на протон и пион (в системе центра масс). Какова вероятность того, что протон вылетит под углом θ?
Вопрос заключается в том, с какой вероятностью она распадется так, что протон вылетит под углом θ к оси z (фиг. 15.6, б). Иными словами, каково угловое распределение распадов? Мы будем рассматривать распад в системе координат, где Λ0 покоится, измеряя углы в системе покоя Λ0; если нужно, их всегда можно перевести в другую систему.
Начнем с рассмотрения того частного случая, когда протон испускается в небольшой телесный угол ΔΩ близ оси z (фиг. 15.7).
Фиг. 15.7. Две возможности распада частицы Λ0 со спином, направленным вверх, если протон движется по оси +z. Момент сохраняется только при схеме распада (б).
До распада спин Λ0 был направлен вверх (фиг. 15.7, а). Через мгновение (по причинам, по сей день неизвестным, известно только, что они связаны со слабыми распадами) Λ0 взрывается, образуя протон и пион. Пусть протон летит вверх по оси +z. Тогда пиону из-за сохранения импульса придется направиться вниз. Поскольку протон — это частица со спином 1/2, то его спин обязан быть направлен либо вверх, либо вниз,— в принципе имеются две возможности, показанные на фиг. 15.7, б и в. Сохранение момента количества движения требует, однако, чтобы спин протона был направлен только вверх. Легче всего понять это из следующих рассуждений. Частица, движущаяся вдоль оси z, никак не может приобрести за счет своего движения момента вокруг этой оси, поэтому в Jz могут дать вклад только спины. Спиновый момент количества движения вокруг оси z до распада был равен +ℏ/2; значит, и после он будет равен +ℏ/2. Можно сказать, что из-за того, что у пиона нет спина, спин протона должен смотреть вверх.
Если вас тревожит, что такого рода рассуждения могут в квантовой механике оказаться неправильными, стоит потратить минутку, чтобы показать, что и по квантовой механике все обстоит так же. Начальное (дораспадное) состояние, которое мы обозначим |Λ0, спин по +z>, обладает тем свойством, что если его повернуть вокруг оси z на угол φ, то вектор состояния умножается на фазовый множитель ei φ/2 . (В повернутой системе вектор состояния равен eitf/2|Λ0, спин но +z>.) Именно это и имеют в виду, говоря о спине вверх у частицы со спином 1/2. Поскольку поведение природы не зависит от нашего выбора осей, то конечное состояние системы «протон плюс пион» должно обладать тем же свойством. Конечное состояние мы можем, например, записать в виде
Но движение пиона на самом деле не нужно оговаривать, потому что в выбранной нами системе пион всегда движется противоположно протону; наше описание конечного состояния можно упростить до
Так что же случится с этим состоянием, если мы повернем систему координат вокруг оси z на угол φ?
Раз протон и пион движутся вдоль оси z, их движение поворотом не изменишь. (Вот почему мы и выбрали этот частный случай; иначе бы наше рассуждение не прошло.) Значит, с пионом ничего не случится, потому что спин его равен нулю. У протона, однако, спин равен 1/2. Если его спин направлен вверх, он в ответ на поворот изменит фазовый множитель в eiφ/2 раз. (А если бы спин его был направлен вниз, то изменение фазы стало бы e-iφ/2.) Но если момент количества движения обязан сохраняться (а это так, ибо в гамильтониане нет факторов, зависящих от внешних воздействий), то изменение фазы из-за поворота должно быть до распада и после распада одно и то же. Итак, единственная возможность состоит в том, что спин протона будет направлен вверх. Если протон двинулся вверх, то и спин его должен быть направлен вверх.
Мы, следовательно, заключаем, что сохранение момента количества движения разрешает процесс, показанный на фиг. 15.7, б, но не разрешает процесса, показанного на фиг. 15.7, в. А раз мы знаем, что распад все же происходит, то, значит, имеется некоторая амплитуда для процесса, показанного на фиг. 15.7, б, когда протон летит вверх и спин его при этом тоже смотрит вверх. И мы обозначим буквой а амплитуду того, что в бесконечно малый промежуток времени произойдет такой распад.
Теперь посмотрим, что было бы, если бы спин Λ0 вначале был направлен вниз. Опять рассматриваем распады, в которых протон взлетает вверх по оси z, как показано на фиг. 15.8.
Фиг. 15.8. Распад вдоль оси z для Λ0 со спином, направленным вниз.
Вам, конечно, теперь ясно, что в этом случае спин протона направлен вниз (если только момент количества движения сохраняется). Обозначим амплитуду такого распада буквой b.
Об амплитудах а и b мы ничего больше сказать не сможем. Они зависят от внутренней механики частицы Λ0 и от слабых распадов, и никто пока не знает, как их подсчитывать. Их приходится получать из опыта. Но, зная только эти две амплитуды, мы можем узнать об угловом распределении распадов все, что захотим. Надо только всегда тщательно и полностью определять те состояния, о которых идет речь.
Мы хотим знать вероятность того, что протон вылетит под углом θ к оси z (в некоторый узкий телесный угол ΔΩ), как показано на фиг. 15.6. Проведем новую ось z в этом направлении и обозначим ее z'! Как анализировать, что происходит вдоль этой оси, мы знаем. По отношению к ней спин Λ0 уже не направлен вверх, а имеет какую-то амплитуду того, что он окажется направленным вверх и какую-то — вниз. Все это мы уже подсчитывали в гл. 4, а потом опять в гл. 8 [уравнение (8.30)] (вып. 8). Амплитуда того, что спин будет направлен вверх, есть cosθ/2, а амплитуда того, что спин будет смотреть вниз, есть -sinθ/2. Когда спин Λ0 направлен вверх по оси z', она испустит протон в направлении z с амплитудой а. Значит, амплитуда того, что по направлению z пройдет протон, держа свой спин вверх, равна
(15.33)
Точно так же амплитуда того, что вдоль положительной оси z пройдет протон, направив свой спин вниз, равна
(15.34)
Те два процесса, к которым относятся эти амплитуды, показаны на фиг. 15.9.
Фиг. 15.9. Два возможных состояния распада Λ0 .
Теперь зададим такой немудреный вопрос. Пусть мы собираемся регистрировать протоны, вылетающие под углом θ, не интересуясь их спином. Два спиновых состояния (вверх и вниз по оси z') различимы, даже если бы мы того и не хотели. Значит, чтобы получить вероятность, надо амплитуды возвысить в квадрат и сложить. Вероятность f(θ) обнаружить протон в небольшом телесном угле ΔΩ при θ равна
(15.35)
Вспоминая, что sin2θ/2=1/2(1-cosθ) и cos2θ/2=1/2(1+cosθ), запишем f(θ) так:
(15.36)
Угловое распределение имеет вид
(15.37)
Одна часть вероятности не зависит от θ, а другая зависит от cosθ линейно. Из измерений углового распределения мы можем получить α и β, а значит, и |а|, и |b|.
Можно получить ответ и на многие другие вопросы. Может быть, вас интересуют лишь те протоны, спин которых направлен вверх относительно старой оси z? Каждый член в (15.33) и (15.34) даст амплитуду того, что спин протона окажется направленным вверх или вниз по отношению к оси z'(|+z'> и |-z'>). А состояние, когда спин направлен вверх относительно старой оси, |+z>, можно выразить через два базисных состояния |+z'> и |-z'>. Можно тогда взять две амплитуды (15.33) и (15.34) с надлежащими коэффициентами (cosθ/2 и -sinθ/2) и получить полную амплитуду
Ее квадрат даст вероятность того, что протон вылетит под углом θ со спином, направленным туда же, куда направлен спин Λ0 (вверх по оси z).
Если бы четность сохранялась, можно было бы сделать еще одно утверждение. Распад на фиг. 15.8 — это просто зеркальное отражение, скажем в плоскости yz, распада с фиг. 15.7. Если бы четность сохранялась, b равнялось бы либо a, либо -а. Тогда коэффициента в (15.37) был бы равен нулю и распад одинаково часто происходил бы во всех направлениях.
Результаты опытов говорят, однако, что при распаде асимметрия существует. Измеренное угловое распределение действительно, как мы предсказали, меняется по закону cosθ, а не по закону cos2θ или по другой степени. Из этого углового распределения, стало быть, следует, что спин Λ0 равен 1/2. Кроме того, мы видим, что четность не сохраняется. Действительно, коэффициент a на опыте найден равным -0,62±0,05, так что b примерно вдвое больше а. Отсутствие симметрии относительно отражений совершенно очевидно.
Вы видите, как много можно вывести из сохранения момента количества движения. Еще некоторые примеры будут приведены в следующей главе.
* * *
Замечание после лекции. Под амплитудой а здесь мы подразумевали амплитуду того, что состояние |протон летит по +z, спин по +z> образовано за бесконечно малое время dt из состояния |Λ, спин по +z>, или, иными словами, что
(15.38)
где H — гамильтониан всего мира или по крайней мере той его части, которая ответственна за Λ-распад. Сохранение момента количества движения означает, что у гамильтониана должно быть такое свойство:
(15.39)
Под амплитудой b подразумевается, что
(15.40)
Сохранение момента количества движения предполагает, что
(15.41)
Если вам не ясно, как написаны амплитуды (15.33) и (15.34), можно их записать в более математической форме. Когда мы писали (15.33), нам нужна была амплитуда того, что Λ со спином, направленным по +z, распадается на протон, движущийся вдоль направления +z' и обладающий спином, направленным тоже по +z', т. е.
(15.42)
По общим теоремам квантовой механики эту амплитуду можно записать так:
(15.43)
где суммирование проводится но базисным состояниям |Λ, i> покоящейся Λ-частицы. Поскольку спин Λ-частицы равен 1/2, таких состояний два, в каком бы базисе мы ни работали. Если в качестве базисных мы выберем состояния со спином, направленным вверх и вниз по отношению к оси z'(|+z'>, |-z'>), то амплитуда (15.43) будет равна сумме
(15.44).
Первый множитель в первом слагаемом равен а [из (15.38)], а первый множитель во втором слагаемом равен нулю — из формулы (15.41), в свою очередь следующей из сохранения момента количества движения. Второй множитель <Λ, +z'|Λ, +z> из первого слагаемого — это как раз амплитуда того, что частица со спином 1/2, направленным вверх по одной оси, будет также обладать спином, направленным вверх по другой оси, повернутой относительно первой на угол θ. Такая амплитуда равна cosθ/2 [см. табл. 4.2 (вып. 8)]. Так что (15.44) равно просто а cosθ/2, как и было написано в (15.33). Амплитуда (15.34) следует из таких же рассуждений для Λ-частицы со спином, направленным вниз.
* * *
§ 6. Сводка матриц поворота
Теперь мы хотим собрать воедино все, что мы узнали о поворотах частиц со спином 1/2 и спином 1; это будет удобно для дальнейшего. Ниже вы найдете таблицы двух матриц поворота Rz (φ) и Ry (θ) для частиц со спином 1/2, для частиц со спином 1 и для фотонов (частиц со спином 1 и нулевой массой).
Таблица 15.1. МАТРИЦЫ ПОВОРОТА ДЛЯ СПИНА ½. Два состояния:
|+>, вверх по оси z, m=+1/2
|—>, вниз по оси z, m=—1/2
Таблица 15.2. МАТРИЦЫ ПОВОРОТА ДЛЯ СПИНА 1. Три состояния:
|+>, m=+1
|0>, m=0
|—>, m=—1
Таблица 15.3. ФОТОНЫ. Два состояния:
|R>=1/√2(|x>+iy>), m=+1 (правополяризованные)
\L>=1/√2(\x>—i|y>), m=—1 (левополяризованные)
Для каждого из них приведены элементы матрицы
Глава 16 МОМЕНТ КОЛИЧЕСТВА ДВИЖЕНИЯ
§ 1. Электрическое дипольное излучение
В предыдущей главе мы развили представления о сохранении момента количества движения в квантовой механике и показали, как ими можно воспользоваться для предсказания углового распределения протонов при распаде Λ0-частицы. Теперь мы хотим добавить еще несколько иллюстраций тех следствий, которые вытекают из сохранения момента количества движения в атомных системах. Первым примером послужит излучение света атомом. Сохранение момента количества движения (наряду с другими обстоятельствами) определит поляризацию и угловое распределение испускаемых фотонов.
Пусть имеется атом в возбужденном состоянии с определенным моментом количества движения, скажем со спином, равным 1; он, излучая фотон, переходит к состоянию с моментом нуль при более низкой энергии. Задача в том, чтобы представить угловое распределение и поляризацию фотонов. (Она очень похожа на задачу о распаде Λ0-частицы, но только теперь спин равен не 1/2, а 1.) Раз у возбужденного состояния спин равен единице, то для z-компоненты момента имеются три возможности. Значение m может быть или +1, или 0, или -1. Возьмем для примера m=+1. (Если мы разберемся в этом примере, то справимся и с другими.) Предположим, что момент количества движения атома направлен по оси +z (фиг. 16.1, а), и спросим, какова амплитуда того, что он излучит вверх по оси z правополяризованный по кругу свет, так что в результате его момент станет равным нулю (фиг. 16.1, б).
Фиг. 16.1. Атом с m=+1 излучает вдоль оси +z правый фотон.
Ответа на этот вопрос мы не знаем. Но зато мы знаем, что правополяризованный по кругу свет уносит вдоль направления своего распространения одну единицу момента количества движения. Значит, после излучения фотона положение станет таким, как показано на фиг. 16.1, б, т. е. атом остался с нулевым моментом относительно оси z, поскольку мы предположили, что низшее состояние атома имеет спин нуль. Обозначим амплитуду такого события буквой а. Точнее, а будет обозначать амплитуду излучения фотона в некоторый узкий телесный угол ΔΩ, окружающий ось z, за время dt. Заметьте, что амплитуда излучения левого фотона в том же направлении равна нулю. У такого фотона момент относительно оси z был бы равен -1, а так как у атома он равен нулю, то и в сумме получилось бы -1, так что момент не сохранился бы.
Точно так же, если спин атома вначале направлен вниз (-1 вдоль оси z), то он может излучать в направлении оси +z только левые фотоны (фиг. 16.2).
Фиг. 16.2. Атом с m=-1 излучает вдоль оси z левый фотон.
Амплитуду такого события обозначим буквой b (снова имея в виду амплитуду излучения фотона в некоторый узкий телесный угол ΔΩ). С другой стороны, если атом находится в состоянии с m=0, он вообще не сможет испустить фотон в направлении +z, потому что у фотона момент количества движения относительно его направления распространения может быть только +1 или -1.
Далее, можно показать, что b и а связаны. Проделаем над системой, изображенной на фиг. 16.1, преобразование инверсии. Это значит, что мы должны представить себе, как будет выглядеть система, если мы каждую ее часть передвинем в соответствующую точку с другой стороны от начала координат. Но это не значит, что следует отражать и векторы момента количества движения, ведь они — искусственные образования. Нужно другое — нужно обратить истинный характер движения, соответствующего такому моменту количества движения.
На фиг. 16.3, а мы показали, как выглядит процесс, изображенный на фиг. 16.1, до и после инверсии относительно центра атома.
Фиг. 16.3. Если процесс (а) преобразовать путем инверсии относительно центра атома, он станет выглядеть, как (б).
Заметьте, что направление вращения атома не изменилось. В обращенной системе (фиг. 16.3, б) получается атом с m=+1, излучающий вниз левый фотон.
Если мы теперь повернем систему, изображенную на фиг. 16.3, б, на 180° вокруг оси х и у, она совпадет с фиг. 16.2. Сочетание инверсии и поворота превращает второй процесс в первый. Пользуясь табл. 15.2, мы видим, что поворот на 180° вокруг оси у как раз переводит состояние с m=-1 в состояние с m=+1, так что амплитуда b должна быть равна амплитуде а, если не считать возможной перемены знака при инверсии. А перемена знака при инверсии зависит от четностей начального и конечного состояний атома.
В атомных процессах четность сохраняется, так что четность всей системы до и после излучения фотона должна быть одной и той же. Что на самом деле произойдет, зависит от того, положительны или отрицательны четности начального и конечного состояний атома — в разных случаях угловое распределение излучения будет различным. Возьмем обычный случай отрицательной четности начального состояния атома и положительной четности конечного; он даст так называемое «электрическое дипольное излучение». (Если начальное и конечное состояния обладают одинаковой четностью, то говорят, что происходит «магнитное дипольное излучение», напоминающее по характеру излучение витка с переменным током.) Если четность начального состояния отрицательна, его амплитуда при инверсии, переводящей систему из а в б на фиг. 16.3, меняет знак. Конечное состояние атома имеет положительную четность, так что его амплитуда при инверсии знака не меняет. Если в реакции сохраняется четность, то амплитуда b должна быть равна а по величине, но противоположна по знаку.
Мы приходим к заключению, что если амплитуда того, что состояние m=+1 излучит фотон вперед, равна а, то для рассматриваемых четностей начального и конечного состояний амплитуда того, что состояние m=-1 излучит вперед левый фотон, равна -а.
Теперь у нас есть все, чтобы найти амплитуду того, что фотон будет испущен под углом θ к оси z. Пусть вначале атом поляризован так, что m=+1. Это состояние мы можем разложить на состояния с m=+1, 0, -1 относительно новой оси z', проведенной в направлении испускания фотона. Амплитуды этих трех состояний — как раз те, которые были приведены в нижней половине табл. 15.2. Амплитуда того, что правый фотон испускается в направлении θ, равна тогда произведению а на амплитуду того, что в этом направлении будет m=+1, а именно
(16.1)
Амплитуда того, что в том же направлении будет испущен левый фотон, равна произведению -а на амплитуду того, что в новом направлении будет m=-1. Из табл. 15.2 следует
(16.2)
Если вас интересуют другие поляризации, то их амплитуды вы получите из суперпозиции этих двух амплитуд. Чтобы получить интенсивность любой компоненты как функцию угла, вам придется, конечно, взять квадрат модуля амплитуд.
§ 2. Рассеяние света
Воспользуемся этими результатами, чтобы решить немного более сложную задачу, но зато и более близкую к реальности. Предположим, что те же атомы находятся в своем основном состоянии (j=0) и рассеивают падающий на них пучок света. Пусть свет первоначально распространяется в направлении +z, так что фотоны падают на атом из направления -z, как показано на фиг. 16.4, а.
Фиг. 16.4. Рассеяние света атомом, рассматриваемое как процесс, состоящий из двух шагов.
Рассеяние света мы можем рассматривать как процесс, состоящий из двух шагов: фотон поглощается, а затем вновь излучается. Если мы начнем с правого фотона (фиг. 16.4, а) и если момент количества движения сохраняется, то после поглощения атом окажется в состоянии с m=+1 (фиг. 16.4, б). Амплитуду этого процесса мы обозначим с. Затем атом может испустить правый фотон в направлении θ (фиг.16.4,в). Полная амплитуда того, что правый фотон рассеется в направлении θ, равна просто произведению с на (16.1). Обозначая эту амплитуду рассеяния
(16.3)
Имеется также амплитуда того, что поглотится правый фотон, а излучится левый. Произведение обеих амплитуд — это амплитуда
(16.4)
Теперь посмотрим, что происходит, если на атом падает левый фотон. Когда он поглощается, сам атом переходит в состояние с m=-1. Рассуждая так же, как в предыдущем параграфе, можно показать, что эта амплитуда будет равна -с. Амплитуда того, что атом в состоянии с m=-1 испустит правый фотон под углом θ, равна произведению а на амплитуду <+|Ry (θ)| —>, равную 1/2(1- cosθ). В итоге получается
(16.5)
Наконец, амплитуда того, что левый фотон после рассеяния останется левым, есть
(16.6)
(здесь минус на минус дал плюс).
Если мы измеряем интенсивность рассеяния для любой данной комбинации круговых поляризаций, то она будет пропорциональна квадрату одной из этих четырех амплитуд. Например, если падает правополяризованный пучок света, то интенсивность правополяризованного света в рассеянном излучении будет меняться как (1+cosθ)2.
Все это прекрасно, но допустим, что мы хотели бы начать с линейно поляризованного света. Чего можно было бы тогда ожидать? Если свет поляризован вдоль оси х, его можно представить как суперпозицию право- и левополяризованного по кругу света. Мы пишем [см. гл. 9, § 4 (вып. 8)]
(16.7)
Или если свет поляризован вдоль оси у, то
(16.8)
Что вы теперь хотите знать? Хотите знать амплитуду того, что х- поляризованный фотон рассеется под углом θ как правый фотон? Пожалуйста. Примените для этого обычное правило комбинирования амплитуд. Сначала умножьте (16.7) на
(16.9)
Теперь подставьте сюда (16.3) и (16.5). Получается
(16.10)
Если бы вам нужна была амплитуда того, что x-фотон рассеется как левый фотон, то вы бы получили
(16.11)
Наконец, представим, что вас заинтересовала амплитуда того, что x-поляризованный фотон рассеется, сохранив свою x-поляризацию. Значит, вам нужно знать <х'|S|х>. Это можно записать так:
(16.12)
Если вы затем вспомните соотношения
(16.13)
(16.14)
то из них последует
(16.16)
(16.16)
В итоге вы получите
(16.17)
Ответ, стало быть, состоит в том, что пучок x-поляризованного света рассеивается в направлении θ (в плоскости xz) с интенсивностью, пропорциональной cos2θ. Если же нас интересует y-поляризованный свет, то
(16.18)
Иначе говоря, рассеянный свет полностью поляризован в x-направлении.
Здесь отметим интересную вещь. Формулы (16.17) и (16.18) точно соответствуют классической теории рассеяния света, которую мы излагали в гл. 32, § 5 (вып. 3), считая, что электрон связан с атомом линейной возвращающей силой, что действует он как классический осциллятор. Вы можете подумать: «А в классической теории все было куда проще; если она дает верный ответ, зачем забивать себе голову квантовой теорией?» Во-первых, мы пока рассмотрели только один частный (хотя и частый) случай атома с возбужденным состоянием j=1 и с основным состоянием j=0. Если бы возбужденное состояние имело спин, равный 2, вы бы получили уже иные результаты. Во-вторых, нет причины, почему бы модель электрона, привязанного к пружинке и приводимого в движение колеблющимся электрическим полем, должна была бы быть верна для одиночного фотона. Правда, мы обнаружили, что она все же верна и что интенсивность и поляризация оказываются какими надо. Так что в каком-то смысле мы в течение нашего курса лавировали где-то неподалеку от истины. В начале курса мы излагали теорию показателя преломления и рассеяния света, опираясь на классические представления. А теперь мы показали, что квантовая теория в самых обычных случаях приводит к тому же результату. Мы фактически только что объяснили такое, скажем, явление, как поляризация дневного света, с помощью квантовомеханических рассуждений, а это единственный по-настоящему законный путь.
Вообще все имеющие сегодня хождение классические теории должны быть в конечном счете подтверждены единственно правильными квантовыми аргументами. Естественно, что все те вещи, на объяснения которых мы потратили прежде столько времени, были отобраны как раз из тех частей классической физики, которые еще подтверждаются квантовой механикой. Заметьте, что мы не обсуждали во всех деталях такие модели атома, в которых электроны двигались вокруг ядра по орбитам. Это потому, что такая модель не дает результатов, согласуемых с квантовой механикой. Но электрон на пружинке (хоть эта картина ничуть не смахивает на настоящий атом) действительно с ней согласуется, и потому мы применяли эту модель в теории показателя преломления.
§ 3. Аннигиляция позитрония
Теперь хотелось бы рассмотреть еще один очень интересный пример. Он очень привлекателен, хотя и немного сложен, но, надеемся, все же не слишком. Пример этот — система, именуемая позитронием, т. е. «атом», составленный из электрона и позитрона,— связанное состояние е+ и е-. Он походит на атом водорода, только вместо протона стоит позитрон. Как и у водорода, у него много состояний. И как у водорода, основное состояние вследствие взаимодействия с магнитным моментом расщепляется на «сверхтонкую структуру». Спины электрона и позитрона равны 1/2 и могут быть либо параллельны, либо антипараллельны любой данной оси. (В основном состоянии орбитальное движение не создает своего момента количества движения.) Итак, всего есть четверка состояний: три из них — подсостояния системы со спином 1, все с одной энергией; и одно состояние со спином нуль и с иной, отличной энергией. Однако расщепление уровней здесь намного сильнее, чем те 1420 Мгц, которые есть в спектре водорода, потому что магнитный момент у позитрона куда больше протонного — в 1000 раз.
Но самое важное различие в том, что позитроний не может существовать вечно. Позитрон — это античастица электрона; они могут взаимно друг друга уничтожить. Две частицы полностью исчезают, обращая свою энергию покоя в излучение в виде γ-квантов (фотонов). Две частицы с конечной массой покоя переходят в пару (а то и больше) объектов с нулевой массой покоя.
Начнем с анализа распада состояния позитрония со спином нуль. Он распадается на два γ-кванта со временем жизни 10-10 сек. Вначале имеются позитрон и электрон с антипараллельными спинами, расположенные очень близко один к другому и образующие систему позитрония. После распада возникают два фотона, разлетающиеся с равными и противоположными импульсами (фиг. 16.5).
Фиг. 16.5. Двухфотонная аннигиляция позитрония.
Импульсы обязаны быть равны и противоположны, потому что полный импульс после распада должен быть таким, как и до распада, т. е. равен нулю (если мы рассматриваем аннигиляцию в покое). Если позитроний движется, мы можем нагнать его, решить задачу и затем все преобразовать обратно в лабораторную систему (вот видите — мы теперь все умеем; все, что надо, у нас под рукой).
Для начала заметим, что угловое распределение интереса не представляет. Раз спин начального состояния равен нулю, то нет какой-либо выделенной оси, оно симметрично относительно любых поворотов. Значит, и конечное состояние должно быть симметрично относительно всякого поворота. Это означает, что все углы распада одинаково вероятны — амплитуда вылететь в любую сторону для фотона одна и та же. Конечно, если один из фотонов отправляется в одну сторону, то другой отправится в противоположную.
Единственное, что нам остается, это рассмотреть поляризацию фотонов. Проведем ось +z по направлению движения одного фотона, а ось -z по направлению движения второго фотона. Для описания состояний поляризации фотонов можно использовать любые представления. Мы выберем правую и левую круговые поляризации, всегда отсчитывая их относительно направлений движения. Сразу же видно, что если движущийся вверх фотон — правый, то момент количества движения останется прежним, если фотон, отправившийся вниз, тоже окажется правым. Каждый унесет по +1 единице момента относительно направления своего импульса, что означает +1 и -1 относительно оси z. В сумме будет нуль, и момент количества движения после распада окажется таким же, как и до распада (фиг. 16.6).
Фиг. 16.6. Одна из возможностей для аннигиляции позитрония вдоль оси z.
Те же рассуждения показывают, что если движущийся вверх фотон является правым, то движущийся вниз не может быть левым, ведь тогда конечное состояние обладало бы двумя единицами момента количества движения. А это не разрешается, если спин начального состояния равен нулю. Заметьте, что такое конечное состояние невозможно и тогда, когда основное состояние позитрония обладает спином 1, потому что в этом случае наибольшая величина момента количества движения в любом направлении равна единице.
А теперь мы покажем, что двухфотонная аннигиляция из состояния со спином 1 вообще невозможна. Могло бы показаться, что это не так, что если взять состояние с j=1, m=0, у которого момент количества движения относительно оси z равен нулю, то оно будет походить на состояние со спином 0 и поэтому распадется на два правых фотона. Конечно, изображенный на фиг. 16.7, а распад сохраняет момент количества движения относительно оси z.
Фиг. 16.7. Для состояния позитрония с j=1 процесс (а) и процесс (б), получаемый поворотом (а) вокруг оси у на 180°, в точности совпадают.
Но посмотрим, что будет, если мы повернем эту систему вокруг оси у на 180°; получится то, что показано на фиг. 16.7, б, т. е. конфигурация, в точности совпадающая с фиг. 16.7, а. Обменялись местами два фотона и больше ничего. А ведь фотоны — это бозе-частицы; перестановка их местами не меняет знака амплитуды, так что амплитуда распада на конфигурацию, показанную на фиг. 16.7, б, должна быть такой же, как и на конфигурацию фиг. 16.7, а. Но мы предположили, что у начального объекта спин был равен единице. А когда мы поворачиваем объект со спином 1 в состоянии с m=0 на 180° вокруг оси у, то его амплитуда меняет знак (см. табл. 15.2 для θ=π). Значит, амплитуды обеих конфигураций на фиг. 16.7 должны иметь обратные знаки; частица со спином 1 не может распадаться на два фотона.
Когда образуется позитроний, то можно ожидать, что в течение 1/4 времени он будет превращаться в состояние со спином 0 и в течение 3/4 времени — в состояние со спином 1 (с m=-1,0 или +1). Так что 1/4 времени будет происходить двухфотонная аннигиляция. Остальные 3/4 времени двухфотонная аннигиляция происходить не может. Аннигиляция происходит, но на три фотона. Такой аннигиляции труднее дождаться, и время жизни получается в 1000 раз дольше — около 10-7 сек. Это и наблюдается на опыте. Аннигиляцией состояния со спином 1 мы подробнее заниматься не будем.
До сих пор мы, опираясь на сохранение момента количества движения, считали, что состояние позитрония с нулевым спином может превращаться в два правых фотона. Имеется и другая возможность: это состояние может превратиться в пару левых фотонов, как показано на фиг. 16.8. Следующий вопрос — каково соотношение между амплитудами этих двух типов распада? Это можно узнать, учтя сохранение четности.
Но для этого нам нужно знать четность позитрония. Физики-теоретики показали (сложным путем, который нелегко пояснить), что четности электрона и позитрона (его античастицы) должны быть противоположны, так что основное состояние позитрония со спином 0 должно обладать отрицательной четностью. Мы просто предположим, что четность отрицательна, и, поскольку мы получим согласие с экспериментом, мы сочтем это достаточно убедительным доводом.
Посмотрим же, что произойдет, если мы проделаем инверсию процесса на фиг. 16.6. При инверсии оба фотона меняют свои направления и поляризации. Обращенная картина выглядит так, как показано на фиг. 16.8.
Фиг. 16.8 Другой мыслимый процесс аннигиляции позитрония.
Если считать, что четность позитрония отрицательна, то амплитуды процессов на фиг. 16.6 и 16.8 должны иметь обратные знаки. Пусть |R1R2> — конечное состояние на фиг. 16.6, где оба фотона правые, а |L1L2> — конечное состояние на фиг. 16.8, где оба фотона — левые. Истинное конечное состояние (обозначим его |F>) должно быть таким:
(16.19)
Тогда инверсия поменяет местами все R со всеми L и приведет к состоянию
имеющему по сравнению с (16.19) знак минус. Значит, конечное состояние |F> обладает отрицательной четностью, совпадающей с четностью первоначального состояния позитрония со спином 0. Это единственное конечное состояние, которое сохраняет и момент количества движения и четность. Можно, конечно, вычислить амплитуду того, что произойдет распад в это состояние, но мы не будем этим заниматься, нас сейчас интересует только поляризация.
Что же означает состояние (16.19) физически? Один из выводов таков: если мы наблюдаем пару фотонов при помощи двух детекторов, которые могут порознь считать число левых или число правых фотонов, то мы всегда будем видеть одновременно либо пару правых, либо пару левых фотонов. Иначе говоря, если вы встанете по одну сторону позитрония, а ваш приятель по другую, то вы сможете, измеряя поляризацию, сказать вашему приятелю, какая поляризация у него получилась. С вероятностью 50% вы будете ловить то левый, то правый фотон; что вы поймаете, то и предсказывайте.
Раз левая и правая поляризации встречаются поровну, то все это сильно смахивает на линейную поляризацию. Спросим себя, что будет, если наблюдать фотон с помощью счетчиков, которые воспринимают только линейно поляризованный свет? Поляризацию γ-квантов измерять не так легко, как поляризацию света; нет таких поляризаторов, которые на столь коротких волнах хорошо работают. Но вообразим, чтобы облегчить обсуждение, что такое бывает. Пусть имеется счетчик, который воспринимает только x-поляризованный свет, а по ту сторону позитрония стоит кто-то, кто тоже наблюдает линейно поляризованный свет, но только, скажем, y-поляризованный. Каков шанс, что вы оба одновременно заметите фотоны от аннигиляции? Нужно найти амплитуду того, что |F> будет в состоянии |х1y2>. Иными словами, мы ищем амплитуду
которая, конечно, равна просто разности
(16.21)
Далее, хотя нам сейчас нужны двухчастичные амплитуды для двух фотонов, с ними здесь можно обращаться так же, как с амплитудами для отдельных частиц, ведь каждая частица действует независимо от другой. Это значит, что амплитуда
Аналогично,
Вычитая их, как сказано в (16.21), получаем
(16.22)
Значит, если вы заметите в своем x-поляризованном детекторе фотон, то ваш приятель с вероятностью единица тоже заметит фотон в своем y-поляризованном детекторе.
Теперь предположим, что ваш приятель настраивает свой счетчик на ту же х-поляризацию, что и вы. Тогда он ни за что не получит отсчета одновременно с вами. Подсчитав все, что надо, вы найдете, что
(16.23)
Естественно, если вы настроите свой счетчик на y-поляризацию, то ваш приятель будет получать совпадающие отсчеты только тогда, когда он сам настроится на z-поляризацию.
Все это создает интересное положение. Представьте, что вы взяли кусок известкового шпата, который разделяет фотоны на х- и y-поляризованные пучки, и в каждом пучке поставили по счетчику. Назовем один из них x-счетчик, другой — y-счетчик. Если ваш приятель, стоящий по другую сторону, сделает то же самое, вы всегда сможете его предупредить, в каком пучке собирается пройти его фотон. Всякий раз, как у вас и у него получаются одновременные отсчеты, вы можете посмотреть, в какой из ваших детекторов попал фотон, и дать ему знать, какой из его счетчиков поймал фотон. Пусть, скажем, в некотором распаде вы обнаружите, что фотон вошел в ваш x-счетчик; тогда вы крикнете ему, что в его y-счетчике произошел отсчет.
Многих людей, изучающих квантовую механику обычным (старомодным) способом, это обстоятельство очень волнует. Им хотелось бы считать, что когда фотон излучается, то он движется как волна определенного характера. Они хотели бы думать, что поскольку «каждый данный фотон» обладает некоторой «амплитудой» того, что он окажется х- или y-поляризованным, то должен быть определенный шанс поймать его либо в х-, либо в y-счетчике, и что этот шанс не должен зависеть от того, что обнаруживает другой человек у совершенно другого фотона. Они доказывают, что «если кто-то другой делает измерения, он не должен быть в состоянии изменить вероятность того, что я обнаружу». Наша квантовая механика утверждает, однако, что, делая измерения над фотоном № 1, вы в состоянии предсказать точно, какая собирается быть поляризация у фотона № 2. С этим никак не мог согласиться Эйнштейн. Этот парадокс, так называемый «парадокс Эйнштейна — Подольского — Розена», его очень беспокоил. Но если описать положение вещей так, как это было сделано у нас, то вообще нет никакого парадокса; вполне естественно получается, что то, что измеряется в одном месте, коррелировано с тем, что измеряется где-то в другом. Рассуждать, чтобы результат стал парадоксальным, надо примерно так:
1) Если у вас есть счетчик, который сообщает вам, какой ваш фотон — правый или левый, то вы можете точно предсказать сорт фотона (правый или левый), который обнаружит ваш приятель.
2) Каждый фотон, который он принимает, должен поэтому быть либо чисто левым, либо чисто правым, причем часть фотонов будет одного сорта, а часть другого.
3) Вы бесспорно не в состоянии переменить физическую природу его фотонов, меняя характер тех наблюдений, которые вы совершаете над вашими фотонами. Какие бы вы измерения ни проделывали над своими фотонами, его фотоны по-прежнему должны быть либо правыми, либо левыми.
4) Допустим, что он меняет свой аппарат так, чтобы расщепить свои фотоны при помощи куска известкового шпата на два линейно поляризованных пучка, так что все его фотоны перейдут либо в x-поляризованный, либо в y-поляризованный пучок. Согласно квантовой механике, нет никакого способа сообщить, в какой из пучков перейдет заданный правый фотон. Есть 50%-ная вероятность, что он пойдет в x-пучок, и 50%-ная вероятность, что в y-пучок. То же будет и с левым фотоном.
5) Поскольку каждый фотон является либо левым, либо правым (согласно пунктам 2 и 3), то каждый из них должен с 50%-ной вероятностью перейти либо в x-пучок, либо в y-пучок, и невозможно предсказать, какой путь он выберет.
6) А теория предсказывает, что если вы заметили, что ваш фотон прошел через x-поляризатор, то вы со всей определенностью можете предсказать, что его фотон пройдет в его y-поляризованном пучке. Это противоречит пункту 5, так что налицо парадокс.
Но природа, по всей видимости, не замечает этого «парадокса», потому что опыт свидетельствует о том, что предсказание пункта 6 в действительности верно. Мы уже обсуждали ключ к решению этого «парадокса» в нашей самой первой лекции по квантовомеханическому поведению [см. гл. 37 (вып. 3)]. В приведенном выше рассуждении пункты 1, 2, 4 и 6 все правильны, а пункт 3 и, как следствие этого, пункт 5 — ошибочны; они не являются правильным описанием природы. Рассуждение в пункте 3 говорит, что с помощью вашего измерения (наблюдения правого или левого фотона) вы можете определить, какое из двух взаимоисключающих событий произойдет у него (увидит ли он правый фотон или левый), и что даже если вы не проделаете своих измерений, вы все равно сможете сказать, что у него произойдет либо одно событие, либо другое. В этом и состоит суть рассказанного в гл. 37 (вып. 3) — подчеркнуть сразу, с самого начала, что в Природе дело обстоит совсем не так. Ее путь требует описания на языке интерферирующих амплитуд, по одной амплитуде для каждого события, исключающего другие события. Измерение, в котором действительно реализуется одна из возможностей, разрушает интерференцию, но если измерение проделано не было, вы не вправе говорить, что все равно реализуется либо одна возможность, либо другая».
Вот если бы вы могли определить для каждого из ваших фотонов, какой он — правый или левый и, кроме того, является ли он x-поляризованным (все для одного и того же фотона), то это действительно было бы парадоксом. Но этого вы не сможете сделать — перед вами пример принципа неопределенности.
Если вы все еще не удовлетворены и считаете это «парадоксом», то покажите, что это действительно парадокс: придумайте такой воображаемый опыт, для которого теория квантовой механики двумя различными рассуждениями предсказывала бы два несогласующихся результата. В противном случае «парадокс» — это всего лишь конфликт между тем, что есть на самом деле, и вашим ощущением того, какой «полагалось бы быть» реальной природе.
Вы считаете, что это не «парадокс», но что это все же очень странно? С этим мы все можем согласиться. Именно это и делает физику столь захватывающе интересной.
§ 4. Матрица поворота для произвольного спина
Сейчас, я надеюсь, вам уже ясно, как важно представление о моменте количества движения для понимания атомных процессов. До сих пор мы рассматривали только системы со спинами (или «полными моментами количества движения») 0, 1/2 и 1. Но бывают, конечно, и атомные системы с большими моментами количества движения. Для анализа таких систем нужны такие же таблицы амплитуд поворота, какие мы привели в гл. 15, § 6. Иными словами, нужна матрица амплитуд для спина 3/2, 2, 5/2, 3 и т. д. Мы не будем подробно рассчитывать эти таблицы, но хотели бы показать, как это делается, чтобы вы, если понадобится, могли сами это проделать.
Как мы видели раньше, любая система со спином, или «полным моментом количества движения», j может существовать в одном из 2j+1 состояний, в которых z-компонента момента количества движения принимает одно из дискретных значений j, j-1, j -2, ..., -(j-1), -j (все в единицах ℏ). Обозначая z-компоненту момента количества движения произвольного выбранного состояния через mℏ, можно определить состояние момента количества движения, задав численные значения двух «квантовых чисел момента количества движения» j и m. Такое состояние можно отметить, указав вектор состояния |j, m>. В случае частиц со спином 1/2 могут быть два состояния |1/2, 1/2> и |1/2, -1/2> a состояния системы со спином 1 в этих обозначениях можно записать как |1, +1>, |1, 0>, |1, -1>. У частицы со спином 0 может быть, конечно, лишь одно состояние |0, 0>.
Теперь мы можем посмотреть, что происходит, когда мы проецируем общее состояние |j, m> на представление, относящееся к повернутой системе осей. Прежде всего известно, что j — это число, которое характеризует систему, поэтому оно не меняется. При повороте осей мы получим просто смесь различных значений m для одного и того же j. В общем случае появится амплитуда того, что система в повернутой системе координат окажется в состоянии |j, m'>, где m' — новая z-компонента момента количества движения. Значит, нам нужны матричные элементы
(16.24)
или, если вам больше нравится,
(16.25)
(где δm,m' равно единице при m'=m, и нулю в прочих случаях).
При поворотах вокруг любой другой оси возникает перемешивание различных m-состояний. Можно было бы, конечно, попытаться подсчитать матричные элементы для произвольных поворотов, описываемых углами Эйлера β,α и γ. Но будет легче, если мы вспомним, что самый общий такой поворот может быть составлен из трех поворотов Rz (γ), Ry (α), Rz (β); так что если мы знаем матричные элементы для поворотов вокруг оси y, то уже располагаем всем необходимым.
Как же нам найти матрицу поворота для поворота частицы со спином j на угол θ вокруг оси у? Опираясь на основные законы (и на то, что уже было), это сделать нелегко. Мы так поступали со спином 1/2: вывели все, что нужно, пользуясь довольно сложными соображениями симметрии. Для спина 1 мы это проделали уже иначе: рассмотрели частный случай, когда система со спином 1 складывается из двух систем со спином 1/2. Если вы последуете за нами и признаете правильным тот факт, что в общем случае ответы зависят только от спина j, а не от того, как скреплены между собой разные части системы со спином j, то мы сможем обобщить рассуждения для спина 1 на произвольный спин. Мы сможем, например, соорудить искусственную систему со спином 3/2 из трех объектов со спином 1/2. Мы сможем даже избежать всяких усложнений, вообразив, что все они суть различные частицы — скажем, протон, электрон и мюон. Преобразуя каждый объект со спином 1/2, мы увидим, что происходит со всей системой — надо только вспомнить, что для комбинированного состояния все амплитуды перемножаются. Давайте посмотрим, как все это проходит.
Допустим, мы расположили все три объекта со спином 1/2 спинами вверх; обозначим такое состояние |+++>. Если мы взглянем на него из системы координат, повернутой относительно оси z на угол φ, то каждый плюс останется плюсом, но умножится на еi φ/2 . Таких множителей у нас тройка, так что
(16.26)
Ясно, что состояние |+++> — это как раз то, что мы называем состоянием m=+3/2, или состоянием |3/2, +3/2>.
Если мы затем повернем эту систему вокруг оси у, то у каждого из объектов со спином 1/2 появится некоторая амплитуда стать плюсом или стать минусом, так что вся система станет теперь смесью восьми возможных комбинаций |+++>, |++->, |+-+>, |-++>, |+-->, |-+->, |--+> или |--->. Ясно, однако, что их можно разбить на четыре группы, чтобы каждая соответствовала своему значению m. Прежде всего мы имеем |+++>, для которого m=3/2. Затем имеется тройка состояний |++->, |+-+> и |-++> — каждое с двумя плюсами и одним минусом. Поскольку каждый из объектов со спином 1/2 имеет равные шансы стать после поворота минусом, то каждая из этих трех комбинаций должна войти на равных паях. Поэтому возьмем комбинацию
(16.27)
где множитель 1/√3 поставлен для нормировки. Если мы повернем это состояние вокруг оси z, то получим множитель ei φ/2 для каждого плюса и e- i φ/2 для каждого минуса. Каждое слагаемое в (16.27) умножится на ei φ/2 , и общий множитель еi φ/2 мы вынесем за скобки. Такое состояние соответствует нашему представлению о состоянии с m=+1/2; мы приходим к выводу, что
(16.8)
Точно так же можно написать
(16.29)
что соответствует состоянию с m=-1/2. Заметьте, что мы берем только симметричные сочетания, у нас нет комбинаций, куда входят слагаемые со знаком минус. Они отвечали бы состояниям с таким же m, но с иным j. Это аналогично случаю спина 1, где (1/√2){|+->+|-+>} было состоянием |1,0>, а (1/√2){|+->-|-+>} было состоянием |0,0>. Наконец, мы имеем
(16.30)
Эта четверка состояний сведена в табл. 16.1.
Таблица 16.1. СВОДКА СОСТОЯНИЙ
Все, что нам теперь нужно сделать, это взять каждое состояние, повернуть его вокруг оси у и посмотреть, сколько новых состояний оно создаст — пользуясь известной нам матрицей поворота для частицы спина 1/2. Можно поступать так же, как мы это делали в случае спина 1 [см. гл. 10, § 6 (вып. 8)]. (Только алгебры будет побольше.) Мы будем строго следовать идеям гл. 10 (вып. 8), так что подробных объяснений давать не будем. Состояния в системе S будут обозначаться
и т. д.; T-системой будет считаться система, повернутая вокруг оси у системы S на угол θ. Состояния в T-системе будут обозначаться |3/2, +3/2, T>, |3/2, +1/2, T> и т. д. Ясно, что |3/2, +3/2, T> это то же самое, что |+'+'+'> (штрихи всегда относятся к T-системе). Точно так же |3/2, +1/2, T> будет равняться
и т. д. Каждое |+'>-состояние в T-системе получается как из |+>-, так и из |->-состояний в системе S с помощью матричных элементов из табл. 10.4 (вып. 8).
Если мы имеем тройку частиц со спином 1/2, то (10.47) надо заменить на
(16.31)
Пользуясь обозначениями табл. 10.4, получим вместо (10.48) уравнение
(16.32)
Это уже дает нам некоторые из наших матричных элементов
(16.33)
Добавляя два сходных выражения для |+—+> и |—++> и деля на √3, найдем
(16.34)
Продолжая этот процесс, мы найдем все элементы
Теперь допустим, что T-система была повернута относительно S-системы на угол θ вокруг ее оси у. Тогда а, b, с и d равны [см. (10.54), вып. 8]: а=d=cosθ/2, с=-b=sinθ/2. Подставляя это в табл. 16.2, получаем формулы, похожие на вторую половину табл. 15.2, но на этот раз для системы со спином 3/2.
Таблица 16.2. МАТРИЦА ПОВОРОТА ДЛЯ ЧАСТИЦЫ СО СПИНОМ 3/2
Коэффициенты а, b, с и d объясняются в табл. 10.4.
Рассуждения, которые мы только что провели, были обобщены на систему с произвольным спином j. Состояния |j, m> можно составить из 2j частиц со спином 1/2 у каждой. (Из них j+m будут в |+>-состоянии, а j-m будут в |->-состоянии.) Проводится суммирование по всем возможным способам, какими их можно сочетать, а затем состояния нормируются умножением на надлежащую постоянную. Если у вас есть способности к математике, то вы сможете доказать, что получается следующий результат:
(16.35)
где k пробегает все те значения, при которых под знаком факториала получаются неотрицательные величины.
Это очень запутанная формула, но с ее помощью вы сможете проверить табл. 15.2 для j=1 и составить ваши собственные таблицы для больших j. Некоторые матричные элементы очень важны и получили особые наименования. Например, матричные элементы для m=m'=0 и целых j известны под названием полиномов Лежандра и обозначаются
(16.36)
Первые из них таковы:
(16.37)
(16.38)
(16.39)
(16.40)
§ 5. Измерение ядерного спина
Продемонстрируем теперь пример, где понадобятся только что описанные коэффициенты. Он связан с проделанными не так давно интересными опытами, которые вы теперь в состоянии будете понять. Некоторым физикам захотелось узнать спин одного из возбужденных состояний ядра Ne20. Для этого они принялись бомбить углеродную мишень пучком ускоренных ионов углерода и породили нужное им возбужденное состояние Ne20 (обозначаемое Ne20*) в реакции
где α1 — это α-частица, или Не4. Кое-какие из создаваемых таким образом возбужденных состояний Ne20 неустойчивы и распадаются таким путем:
Значит, на опыте видны возникающие в реакции две α-частицы. Обозначим их α1 и α2; поскольку они вылетают с разными энергиями, их можно отличить друг от друга. Кроме того, выбирая α1, имеющие нужную энергию, мы можем отобрать любые возбужденные состояния Ne20.
Опыт ставился так, как показано на фиг. 16.9.
Фиг. 16.9. Размещение приборов в опыте по определению спина возбужденных состояний Ne20 .
Пучок ионов углерода с энергией 16 Мэв был направлен на углеродную пленку. Первая α-частица регистрировалась кремниевым детектором, настроенным на прием α-частиц с нужной энергией, движущихся вперед (по отношению к падающему пучку ионов С12). Вторая α-частица регистрировалась счетчиком α2, поставленным под углом θ к α1. Скорость счета сигналов совпадений от α1 и α2 измерялась как функция угла θ.
Идея опыта в следующем. Прежде всего нужно знать, что спины С12, О16 и α-частицы все равны нулю. Назовем направление движения начальных частиц С12 направлением +z; тогда известно, что Ne20* должен обладать нулевым моментом количества движения относительно оси z. Ведь ни у одной из остальных частиц нет спина; кроме того, С12 прилетает вдоль оси z и α1 улетает вдоль оси z, так что у них не может быть момента относительно этой оси. И каким бы ни был спин j ядра Ne20*, мы знаем, что это ядро находится в состоянии |j, 0>. Что же случится, когда Ne20* распадется на О16 и другую α-частицу? Что ж, α-частицу поймает счетчик α2, а О16, чтобы сохранить начальный импульс, вынужден будет уйти в противоположную сторону. Относительно новой оси (оси α2) не может быть тоже никакой компоненты момента количества движения. А раз конечное состояние имеет относительно новой оси нулевой момент количества движения, то у распада Ne20* должна быть некоторая амплитуда того, что m'=0, где m'—квантовое число компоненты момента количества движения относительно новой оси. Вероятность наблюдать α2 под углом θ будет на самом деле равна квадрату амплитуды (или матричного элемента)
(16.41)
Чтобы получить спин интересующего нас состояния Ne20*, вычертим интенсивность наблюдений второй α-частицы как функцию угла и сравним с теоретическими кривыми для различных значений j. Как мы отмечали в конце предыдущего параграфа, амплитуды
Фиг. 16.10. Экспериментальные результаты измерений углового распределения α-частиц, вылетающих при распаде двух возбужденных состояний Ne20 . Они получены на устройстве, показанном на фиг. 16.9.
Вы видите, что угловое распределение для состояния 5,80 Мэв очень хорошо укладывается на кривую [Р1(cosθ)]2, т. е. оно должно быть состоянием со спином 1. С другой стороны, данные для состояния 5,63 Мэв выглядят совершенно иначе; они ложатся на кривую [Р3(cosθ)]2. Спин этого состояния равен 3.
В этом опыте мы измерили момент количества движения двух возбужденных состояний Ne20*. Этой информацией можно воспользоваться, чтобы понять, как ведут себя протоны и нейтроны внутри этого ядра, и это принесет нам добавочные сведения о таинственных ядерных силах.
§ 6. Сложение моментов количества движения
Когда мы изучали сверхтонкую структуру атома водорода в гл. 10 (вып. 8), нам пришлось рассчитывать внутренние состояния системы, составленной из двух частиц — электрона и протона — со спинами 1/2. Мы нашли, что четверка возможных спиновых состояний такой системы может быть разбита на две группы — на тройку состояний с одной энергией, которая во внешнем поле выглядела как частица со спином 1, и на одно оставшееся состояние, которое вело себя как частица со спином 0. Иначе говоря, объединяя две частицы со спином 1/2, можно образовать систему, «полный спин» которой равен либо единице, либо нулю. В этом параграфе мы хотим рассмотреть на более общем уровне спиновые состояния системы, составленной из двух частиц с произвольными спинами. Это другая важная проблема, связанная с моментами количества движения квантовомеханической системы.
Перепишем сперва результаты гл. 10 для атома водорода в форме, которая позволит распространить их на более общий случай. Мы начали с двух частиц, которые теперь обозначим так: частица а (электрон) и частица b (протон). Спин частицы а был равен ja (=1/2), а z-компонента момента количества движения mа могла принимать одно из нескольких значений (на самом деле два, а именно mа =+1/2 или mа =-1/2). Точно так же спиновое состояние частицы b описывалось ее спином jb и z-компонентой момента количества движения mb . Из всего этого можно было составить несколько комбинаций спиновых состояний двух частиц. Например, из частицы а с mа =1/2 и частицы b с mb =-1/2 можно было образовать состояние |а, +1/2; b, -1/2>. Вообще, объединенные состояния образовывали систему, у которой «спин системы», или «полный спин», или «полный момент количества движения» J мог быть равен либо единице, либо нулю, а z-компонента момента количества движения М могла равняться +1, 0 или -1 при J=1 и нулю при J=0. На этом новом языке формулы (10.41) и (10.42) можно переписать так, как показано в табл. 16.3.
Таблица 16.3. СОСТАВЛЕНИЕ МОМЕНТОВ КОЛИЧЕСТВА ДВИЖЕНИЯ ДВУХ ЧАСТИЦ СО СПИНОМ 1/2
Левый столбец таблицы описывает составное состояние через его полный момент количества движения J и z-компоненту М. Правый столбец показывает, как составляются эти состояния из значений m двух частиц а и b.
Мы хотим обобщить этот результат на состояния, составленные из двух объектов а и b с произвольными спинами jа и jb . Начнем с разбора примера, когда jа =1/2 и jb =1, а именно с атома дейтерия, в котором частица а — это электрон е, а частица b — ядро, т. е. дейтрон d. Тогда ja =je =1/2. Дейтрон образован из одного протона и одного нейтрона в состоянии с полным спином 1, так что jb =jd =1. Мы хотим рассмотреть сверхтонкие состояния дейтерия, как мы сделали это для водорода. Поскольку у дейтрона может быть три состояния, mb =md =+1, 0, -1, а у электрона — два, mа =mе =+1/2, -1/2, то всего имеется шесть возможных состояний, а именно (используется обозначение |е, me ; d, md >):
(16.42)
Обратите внимание, что мы разверстали состояния согласно значениям суммы me и md в порядке ее убывания.
Спросим теперь: что случится с этими состояниями, если спроецировать их в другую систему координат? Если эту новую систему просто повернуть вокруг оси z на угол φ, то состояние |е, me ; d, md > умножается на
(16.43)
(Состояние можно считать произведением |е, mе >|d, md >, и каждый вектор состояния независимо привнесет свой собственный экспоненциальный множитель.) Множитель (16.43) имеет форму еiM φ , поэтому z-компонента момента количества движения у состояния |е, mе ; d, md > окажется равной
(16.44)
Иначе говоря, z-компонента полного момента количества движения есть сумма z-компонент моментов количества движения отдельных частей.
Значит, в перечне состояний (16.42) верхнее состояние имеет М=+3/2, два следующих М=+1/2, затем два М=-1/2 и последнее состояние М=-3/2. Мы сразу же видим, что одной из возможностей для спина J объединенного состояния (для полного момента количества движения) должно быть 3/2, это потребует четырех состояний с М=+3/2, +1/2, -1/2 и -3/2. На М=+3/2 есть только один кандидат, и мы сразу видим, что
(16.45)
Но что является состоянием |J=3/2, М=+1/2>? Кандидатов здесь два, они стоят во второй строчке (16.42), и всякая их линейная комбинация тоже даст М=+1/2. Значит, в общем случае можно ожидать, что
(16.46)
где α и β — два числа. Их именуют коэффициенты Клебша—Гордона. Найти их и будет нашей очередной задачей.
И мы их легко найдем, если просто вспомним, что дейтрон состоит из нейтрона и протона, и в явном виде распишем состояния дейтрона, пользуясь правилами табл. 16.3. Если это проделать, то перечисленные в (16.42) состояния будут выглядеть так, как показано в табл. 16.4.
Таблица 16.4. СОСТОЯНИЯ МОМЕНТА КОЛИЧЕСТВА ДВИЖЕНИЯ АТОМА ДЕЙТЕРИЯ
Пользуясь состояниями из этой таблицы, мы хотим образовать четверку состояний с J=3/2. Но ответ нам уже известен, потому что в табл. 16.1 уже стоят состояния со спином 3/2, образованные из трех частиц со спином 1/2. Первое состояние в табл. 16.1 имеет |J=3/2, М=+3/2>, это |+++>, а в наших нынешних обозначениях это |e, +1/2; n, +1/2; p, +1/2>, или первое состояние из табл. 16.4. Но это состояние — то же самое, что первое по списку в (16.42), так что наше выражение (16.45) подтверждается. Вторая строчка в табл. 16.1 утверждает, если воспользоваться нашими теперешними обозначениями, что
(16.47)
То, что стоит в правой части, можно, очевидно, составить из двух членов во второй строчке табл. 16.4, взяв √2/3 от первого члена и √1/3 от второго. Иначе говоря, (16.47) эквивалентно
(16.48)
Мы нашли два наших первых коэффициента Клебша—Гордона α, и β [см. (16.46)]:
(16.49)
Повторяя ту же процедуру, найдем
(16.50)
а также, конечно,
(16.51)
Это и есть правила составления из спина 1 и спина 1/2 полного спина J=3/2. Мы свели (16.45) и (16.50) в табл. 16.5.
Таблица 16.5. СОСТОЯНИЯ С J=3/2 АТОМА ДЕЙТЕРИЯ
Но у нас пока есть только четыре состояния, а у системы, которую мы рассматриваем, их шесть.
Из двух состояний во второй строчке (16.42) мы для образования |J=3/2, М=+1/2> составили только одну линейную комбинацию. Есть и другая линейная комбинация, ортогональная к ней, у нее тоже М=+1/2 и она имеет вид
(16.52)
Точно так же из двух состояний в третьей строке (16.42) можно скомбинировать два взаимно-ортогональных состояния, каждое с М=-1/2. То, которое ортогонально к (16.50), имеет вид
(16.53)
это и есть два оставшихся состояния. У них M=me +md =±1/2; эти состояния должны соответствовать J=1/2. Итак, мы имеем
(16.54)
Можно убедиться, что эти два состояния действительно ведут себя как состояния объекта со спином 1/2; для этого надо выразить дейтронную часть через нейтронные и протонные состояния (при помощи табл. 16.3). Первое состояние в (16.53) превратится в
(16.55)
а это можно переписать так:
(16.56)
Посмотрите теперь на выражение в первых фигурных скобках и подумайте, что получается при объединении е и р. Вместе они образуют состояние с нулевым спином (см. нижнюю строку в табл. 16.3) и не дают вклада в момент количества движения. Остался только нейтрон, значит, вся первая фигурная скобка (16.56) будет вести себя при поворотах как нейтрон, а именно как состояние с J=1/2, M=+1/2.
Повторяя те же рассуждения, убедимся, что во вторых фигурных скобках (16.56) электрон и нейтрон объединяются, чтобы образовать нулевой момент количества движения, и остается только вклад протона — с mp =+1/2. Скобка опять ведет себя как объект с J=+1/2, М=+1/2. Значит, и все выражение (16.56) преобразуется как |J=+1/2, М=+1/2>, чего мы и хотели. Состояние М=-1/2, отвечающее формуле (16.56), можно расписать так (заменив везде, где нужно, +1/2 на -1/2):
(16.57)
Вы легко проверите, что это совпадает со второй строчкой в (16.54), как и полагается, если каждая скобка представляет собой одно из двух состояний системы со спином 1/2. Значит, наши результаты подтвердились. Дейтрон и электрон могут существовать в шести спиновых состояниях, четыре из которых ведут себя как состояния объекта со спином 3/2 (табл. 16.5), а два — как объект со спином 1/2 (16.54).
Результаты табл. 16.5 и уравнения (16.54) мы получили, воспользовавшись тем, что дейтрон состоит из нейтрона и протона. Правильность уравнений не зависит от этого особого обстоятельства. Для любого объекта со спином 1, объединяемого с объектом со спином 1/2, законы объединения (и коэффициенты) одни и те же. Совокупность уравнений в табл. 16.5 означает, что если система координат поворачивается, скажем, вокруг оси у, так что состояния частицы со спином 1/2 и частицы со спином 1 изменяются согласно табл. 16.1 и 16.2, то линейные комбинации по правую сторону знака равенства будут изменяться так, как это свойственно объекту со спином 3/2. При таком же повороте состояния (16.54) будут меняться как состояния объекта со спином 1/2. Результаты зависят только от свойств относительно поворотов (т. е. от спиновых состояний) двух исходных частиц, но отнюдь не от происхождения их моментов количества движения. Мы этим происхождением воспользовались лишь для вывода формул, выбрав частный случай, в котором одна из составных частей сама состоит из двух частиц со спином 1/2 в симметричном состоянии. Все наши результаты мы свели в табл. 16.6, изменив индексы е и d на а и b, чтобы подчеркнуть их общность.
Таблица 16.6. ОБЪЕДИНЕНИЕ ЧАСТИЦЫ СО СПИНОМ 1/2( ja=1/2) С ЧАСТИЦЕЙ СО СПИНОМ 1 (jb =1)
Поставим теперь себе общую задачу найти состояния, которые можно образовать, объединяя два объекта с произвольными спинами. Скажем, у одного спин ja (так что его z-компонента mа пробегает 2jа +1 значений от -ja до +ja , а у другого jb (с z-компонентой mb , пробегающей значения от -jb до+jb ).
Объединенные состояния суть |а, mа ; b, mb >, их всего (2ja +1)(2jb +1). Какие же состояния с полным спином J мы обнаружим?
Полная z-компонента М момента количества движения равняется mа +mb , и все состояния можно перечислить, опираясь на величину М [как в (16.42)]. Наибольшее М является единственным; оно отвечает значениям ma =ja и mb =jb и равно попросту ja +jb . Это означает, что наибольший полный спин J также равен сумме jа +jb :
Следующему значению М, меньшему чем Ммакс на единицу, будут соответствовать два состояния (либо mа , либо mb меньше своих максимальных значений на единицу). Из них должно быть образовано одно состояние, принадлежащее совокупности с J=ja +jb , и останется еще одно, которое будет принадлежать новой совокупности с J=ja +jb -1. Следующее значение М (третье сверху) можно составить тремя путями (из ma =ja — 2, mb =jb , из ma =ja -1, mb =jb -1 и из ma =ja , mb =jb -2). Два из них принадлежат к уже начавшим составляться группам; третье говорит нам, что надо включить в рассмотрение и состояния с J=ja +jb -2. Такие рассуждения будут продолжаться до тех пор, пока уже нельзя будет, меняя то одно, то другое m, получать новые состояния.
Пусть из jа и jb меньшим является jb (а если они одинаковы, возьмите любое из них); тогда понадобятся только 2jb значений полного спина J, идущих единичными шагами от jа +jb вниз к jа -jb . Иначе говоря, когда объединяются два объекта со спинами jа и jb , то полный момент количества движения J их системы может равняться одному из значений:
(16.58)
(Написав |ja -jb | вместо ja -jb , мы можем избежать напоминания о том, что ja ≥jb .)
Для каждого из этих значений J имеется 2J+1 состояний с различными значениями М; М меняется от +J до -J. Каждое из них образовано из линейных комбинаций исходных состояний |а, mа ; b, mb > с соответствующими коэффициентами — коэффициентами Клебша—Гордона для каждого отдельного члена. Можно считать, что эти коэффициенты дают «количество» состояния |ja , ma ; jb , mb >, проявляющегося в состоянии |J,M>. Так что каждый из коэффициентов Клебша—Гордона обладает, если угодно, шестью индексами, указывающими его положение в формулах типа приведенных в табл. 16.3 и 16.6. Иначе говоря, обозначая, скажем, эти коэффициенты С (J, М; ja , ma ; jb , mb ), можно выразить равенство во второй строчке табл. 16.6 так:
Мы не будем здесь подсчитывать коэффициенты для других частных случаев. Но вы обнаружите такие таблицы во многих книжках. Попробуйте сами подсчитать другой случай, например объединение двух объектов со спином 1. Мы же просто привели в табл. 16.7 окончательный результат.
Таблица 16.7. ОБЪЕДИНЕНИЕ ДВУХ ЧАСТИЦ СО СПИНОМ 1 (ja =1, jb =1)
Эти законы объединения моментов количества движения имеют очень важное значение в физике частиц, их приложениям поистине нет конца. К сожалению, у нас нет сейчас больше времени на другие примеры.
Добавление 1. Вывод матрицы поворота
[78]
Для тех, кто хотел бы разобраться в этом поподробнее, мы вычислим сейчас общую матрицу поворота для системы со спином (полным моментом количества движения) j. В расчете общего случая на самом деле большой необходимости нет; важно понять идею, а все результаты вы сможете найти в таблицах, которые приводятся во многих книжках. Но, с другой стороны, вы зашли уже так далеко, что у вас, естественно, может возникнуть желание убедиться, что вы и впрямь в состоянии понять даже столь сложные формулы квантовой механики, как (16.35).
Расширим рассуждения § 4 на систему со спином j, которую будем считать составленной из 2j объектов со спином 1/2. Состояние с m=j имело бы вид |+ + + ... +> (с j плюсами). Для m=j-1 было бы 2j членов типа |+ + ... + + ->, |+ + ... +- +> и т. д. Рассмотрим общий случай, когда имеется r плюсов и s минусов, причем r+s=2j. При повороте вокруг оси z от каждого из r плюсов появится множитель e+ i φ/2 . В итоге фаза изменится на i(r/2-s/2)φ. Мы видим, что
(16.59)
Как и в случае J=3/2, каждое состояние с определенным m должно быть суммой всех состояний с одними и теми же r и s, взятых со знаком плюс, т. е. состояний, отвечающих всевозможным перестановкам с r плюсами и s минусами. Мы считаем, что вам известно, что всего таких сочетаний есть (r+s)!/r!s!. Чтобы нормировать каждое состояние, надо эту сумму разделить на корень квадратный из этого числа. Можно написать
(16.60)
где
(16.61)
Введем еще новые обозначения, они нам помогут в счете. Ну а поскольку мы уж определили состояния при помощи (16.60), то два числа r и s определяют состояние ничуть не хуже, чем j и m. Мы легче проследим за выкладками, если обозначим
(16.62)
где [см.. (16.61)]
Далее, (16.60) мы запишем, пользуясь специальным обозначением
(16.63)
Обратите внимание, что показатель степени в общем множителе мы изменили на +1/2. Это оттого, что внутри фигурных скобок в (16.60) стоит как раз N=(r+s)!/r!s! слагаемых. Если сопоставить (16.63) с (16.60), то ясно, что
— это краткая запись выражения
где N — количество различных слагаемых в скобках. Эти обозначения удобны тем, что каждый раз при повороте все знаки плюс вносят один и тот же множитель, так что в итоге он получается в r-й степени. Точно так же все знаки минус дадут некоторый множитель в s-й степени, в каком бы порядке эти знаки ни стояли.
Теперь положим, что мы повернули нашу систему вокруг оси у на угол θ. Нас интересует Ry (θ)|rs>. Оператор Ry (θ), действуя на каждый |+>, дает
(16.64)
где С=cosθ/2 и S=sin θ/2. Когда же Ry (θ) действует на |->, это приводит к
Так что искомое выражение равно
(16.65)
Теперь надо возвысить биномы в степень и перемножить. Появятся члены со всеми степенями |+> от нуля до r+s. Посмотрим, какие члены дадут r'-ю степень |+>. Они всегда будут сопровождаться множителем типа |->s', где s'=2j-r'. Соберем их вместе. Получится сумма членов типа |+>r' |->s' с численными коэффициентами Аr ' , куда входят коэффициенты биномиального разложения вместе с множителями С и S. Уравнение (16.65) тогда будет выглядеть так:
(16.66)
Теперь разделим каждое Аr ' на множитель [(r'+s')!/r'!s'!]1/2 и обозначим частное через Вr . Тогда (16.66) превратится в
(16.67)
[Можно просто сказать, что требование, чтобы (16.67) совпадало с (16.65), определяет Br ' ]
Если так определить Вr ' , то оставшиеся множители в правой части (16.67) будут как раз состояниями|r's'>. Итак, имеем
(16.68)
где s' всегда равняется r+s-r'. А это, конечно, означает, что коэффициенты Вr ' и есть искомые матричные элементы
(16.69)
Теперь, чтобы найти Br', остается немного: лишь пробиться через алгебру.
Сравнивая (16.67) с (16.65) и вспоминая, что r'+s'=r+s, мы видим, что Br ' — это просто коэффициент при ar ' bs ' в выражении
(16.70)
Осталась лишь нудная работа разложить скобки по биному Ньютона и собрать члены с данными степенями а и b. Если вы все это проделаете, то увидите, что коэффициент при аr ' bs ' в (16.70) имеет вид
(16.71)
Сумма берется по всем целым k, при которых аргументы факториалов больше или в крайнем случае равны нулю. Это выражение и есть искомый матричный элемент.
В конце надо вернуться к нашим первоначальным обозначениям j, m и m', пользуясь формулами
Проделав эти подстановки, получим уравнение (16.34) из § 4.
Добавление 2. Сохранение четности при испускании фотона
В § 1 мы рассмотрели испускание света атомом, который переходит из возбужденного состояния со спином 1 в основное состояние со спином 0. Если спин возбужденного состояния направлен вверх (m=+1), то атом может излучить вверх вдоль оси +z правый фотон или вдоль оси -z левый. Обозначим эти два состояния фотона |Rвв> и |Lвн>. Ни одно из них не обладает определенной четностью. Если оператор четности обозначить ^P, то ^P|Rвв >=|Lвн > и ^P|Lвн >=|Rвв >.
Что же тогда будет с нашим прежним доказательством, что атом в состоянии с определенной энергией должен иметь определенную четность, и с нашим утверждением, что четность в атомных процессах сохраняется? Разве не должно конечное состояние в этой задаче (состояние после излучения фотона) иметь определенную четность? Да, должно, если только мы рассмотрим полное конечное состояние, в которое входят амплитуды излучения фотонов под всевозможными углами. А в § 1 мы рассматривали только часть полного конечного состояния.
Если вы хотите, можно рассмотреть только конечные состояния, у которых действительно определенная четность. Например, рассмотрим конечное состояние |ψk>, у которого есть некоторая амплитуда α оказаться правым фотоном, движущимся вдоль оси +z, и некоторая амплитуда β оказаться левым фотоном, движущимся вдоль оси -z. Можно написать
(16.72)
Оператор четности, действуя на это состояние, дает
(16.73)
Это состояние совпадает с ±|ψк> либо при β=α, либо при β=-α. Так что конечное состояние с положительной четностью таково:
(16.74)
а состояние с отрицательной четностью
(16.75)
Далее, мы хотим рассмотреть распад возбужденного состояния с отрицательной четностью на основное состояние с положительной четностью и на фотон. Если четность должна сохраниться, то конечное состояние фотона должно иметь отрицательную четность. Оно обязано быть состоянием (16.75). Если амплитуда того, что будет обнаружено |Rвв>, есть α, то амплитуда того, что будет обнаружено |Lвн >, есть -α.
Теперь обратите внимание на то, что получается, если мы проводим поворот на 180° вокруг оси у. Начальное возбужденное состояние атома становится состоянием с m=-1 (согласно табл. 15.2, знак не меняется). А поворот конечного состояния дает
(16.76)
Сравнивая это с (16.75), мы увидим, что при выбранной нами четности конечного состояния амплитуда того, что при начальном состоянии с m=-1 будет получен левый фотон, идущий в направлении +z, равна со знаком минус амплитуде того, что при начальном состоянии с m=+1 будет получен правый фотон, идущий в направлении -z. Это согласуется с результатами, полученными в § 1.
Глава 17 АТОМ ВОДОРОДА И ПЕРИОДИЧЕСКАЯ ТАБЛИЦА
§ 1. Уравнение Шредингера для атома водорода
Самым замечательным успехом в истории квантовой механики было объяснение всех деталей спектров простейших атомов, а также периодичностей, обнаруженных в таблице химических элементов. В этой главе в нашем курсе квантовой механики мы наконец-то подойдем к этому важнейшему достижению и расскажем об объяснении спектра атомов водорода. Кроме того, здесь мы расскажем и о качественном объяснении таинственных свойств химических элементов. Для этого мы подробно изучим поведение электрона в атоме водорода: в первую очередь мы рассчитаем его распределения в пространстве, следуя тем представлениям, которые были развиты в гл. 14.
Для полного описания атома водорода следовало бы учесть движения обеих частиц — как протона, так и электрона. В квантовой механике в этой задаче следуют классической идее об описании движения каждой из частиц по отношению к их центру тяжести. Однако мы не будем этого делать. Мы просто используем приближение, в котором протон считается очень тяжелым, настолько тяжелым, что он как бы закреплен в центре атома.
Мы сделаем еще и другое приближение: забудем, что у электрона имеется спин и что его надлежит описывать законами релятивистской механики. Это потребует внесения небольших поправок в наши выкладки, поскольку мы будем пользоваться нерелятивистским уравнением Шредингера и пренебрежем магнитными эффектами. Небольшие магнитные эффекты появляются из-за того, что протон с точки зрения электрона есть циркулирующий по кругу заряд, который создает магнитное поле. В этом поле энергия электрона будет различна, смотря по тому, направлен ли его спин вверх или вниз по полю. Энергия атома должна немного сдвинуться относительно той величины, которую мы вычислим. Но мы пренебрежем этим слабым сдвигом энергии, т. е. вообразим, что электрон в точности подобен волчку, движущемуся в пространстве по кругу и сохраняющему все время одинаковое направление спина. Поскольку речь будет идти о свободном атоме в пространстве, полный момент количества движения будет сохраняться. В нашем приближении будет считаться, что момент количества движения, вызываемый спином электрона, остается неизменным, так что оставшийся момент количества движения атома (то, что обычно называют «орбитальным» моментом количества движения) тоже не будет меняться. В очень хорошем приближении можно считать, что электрон движется в атоме водорода как частица без спина — его орбитальный момент количества движения постоянен.
В этих приближениях амплитуда того, что электрон будет обнаружен в том или ином месте пространства, может быть представлена как функция положения электрона в пространстве и времени. Обозначим амплитуду того, что электрон будет обнаружен в точке х, у, z в момент t через ψ(x, у, z, t). Согласно квантовой механике, скорость изменения этой амплитуды со временем дается гамильтоновым оператором, действующим на ту же функцию. Из гл. 14 мы знаем, что
(17.1)
где
(17.2)
Здесь m—масса электрона, а V(r)— потенциальная энергия электрона в электростатическом поле протона. Считая на больших удалениях от протона V=0, можно написать
Волновая функция ψ должна тогда удовлетворять уравнению
(17.3)
Мы хотим найти состояния с определенной энергией, поэтому попробуем поискать решения, которые бы имели вид
(17.4)
Тогда функция ψ(r) должна быть решением уравнения
(17.5)
где Е — некоторое постоянное число (энергия атома).
Раз потенциальная энергия зависит только от радиуса, то это уравнение лучше решать в полярных координатах.
Лапласиан в прямоугольных координатах определялся так:
Вместо этого мы хотим воспользоваться координатами r,θ, φ, изображенными на фиг. 17.1.
Фиг. 17.1. Сферические координаты r, θ, φ точки Р.
Они связаны с х, у, z формулами
Вас ждут довольно нудные алгебраические выкладки, но в конце концов вы должны будете прийти к тому, что для произвольной функции f(r)=f(r, θ, φ):
(17.6)
Итак, в полярных координатах уравнение, которому должна удовлетворять функция ψ(r, θ, φ), принимает вид
(17.7)
§ 2. Сферически симметричные решения
Попробуем сперва отыскать какую-нибудь функцию попроще, чтобы она удовлетворяла уравнению (17.7). Хотя волновая функция ψ в общем случае будет зависеть как от θ и φ, так и от r, можно все же поискать, не бывает ли такого особого случая, когда ψ не зависит от углов. Если волновая функция от углов не зависит, то при поворотах системы координат ни одна из амплитуд никак не будет меняться. Это означает, что все компоненты момента количества движения равны нулю. Такая функция ψ должна соответствовать состоянию с равным нулю полным моментом количества движения. (На самом деле, конечно, равен нулю только орбитальный момент количества движения, потому что остается еще спин электрона, но мы на эту часть момента не обращаем внимания.) Состояние с нулевым орбитальным моментом количества движения имеет особое название. Его называют «s-состоянием» (можете считать, что s от слова «сферически симметричный»).
Раз ψ не собирается зависеть от θ и φ, то в полном лапласиане останется только один первый член и (17.7) сильно упростится:
(17.8)
Прежде чем заняться решением подобного уравнения, хорошо бы, изменив масштаб, убрать из него все лишние константы вроде е2, m, ℏ. От этого выкладки станут легче. Если сделать подстановки
(17.9)
(17.10)
то уравнение (17.8) обратится (после умножения на ρ) в
(17.11)
Эти изменения масштаба означают, что мы измеряем расстояние r и энергию Е в «естественных» атомных единицах. Например, ρ=r/rB , где rB =ℏ2/me2, называется «боровским радиусом» и равно примерно 0,528 Å. Точно так же ε=E/ER , где ER =me4/2ℏ2. Эта энергия называется «ридбергом» и равна примерно 13,6 эв.
Раз произведение ρψ встречается в обеих частях уравнения, то лучше работать с ним, чем с самим ψ. Обозначив
(17.12)
мы получим уравнение, которое выглядит проще:
(17.13)
Теперь нам предстоит найти функцию f, которая удовлетворяет уравнению (17.13), иными словами, просто решить дифференциальное уравнение. К сожалению, не существует никаких общих, годных во всех случаях жизни методов решения любого дифференциального уравнения. Вы должны просто покрутить его то так, то этак. Хоть уравнение не из легких, но люди все же нашли, что его можно решить при помощи следующей процедуры. Первым делом вы заменяете f, которое является некоторой функцией от ρ, произведением двух функций:
(17.14)
Это просто означает, что вы выносите из f(ρ) множитель е-αρ. Для любого f(ρ) это можно сделать. Задача теперь просто свелась к отысканию подходящей функции g(ρ).
Подставив (17.14) в (17.13), мы получим следующее уравнение для g:
(17.15)
Мы вправе выбрать любое α, поэтому сделаем так, чтобы было
(17.16)
тогда получим
(17.17)
Вы можете подумать, что мы не так уж далеко ушли от уравнения (17.13); но новое уравнение тем хорошо, что его можно легко решить разложением g(ρ) в ряд по ρ. В принципе есть возможность таким же способом решать и (17.13), но только все проходит сложнее. Мы говорим: уравнению (17.17) можно удовлетворить некоторой функцией g(ρ), которая записывается в виде ряда
(17.8)
где ak— постоянные коэффициенты. И нам осталось только найти подходящую бесконечную последовательность коэффициентов! Проверим, годится ли такая запись решения. Первая производная такой функции g(ρ) равна
а вторая
Подставляя это в (17.17), имеем
(17.19)
Пока еще не ясно, вышло ли у нас что-нибудь; но мы рвемся вперед. Если мы первую сумму заменим некоторым ее эквивалентом, то все выражение станет выглядеть лучше. Первый член в сумме равен нулю, поэтому каждое k можно заменить на k+1, от этого ничего в бесконечном ряде не изменится. Значит, первую сумму мы вправе записать и так:
Теперь можно объединить все три суммы в одну:
(17.20)
Этот степенной ряд должен обращаться в нуль при всех мыслимых значениях ρ, что возможно лишь тогда, когда коэффициенты при каждой степени ρ порознь равны нулю. Мы получим решение для атома водорода, если отыщем такую последовательность ak , для которой
(17.21)
при всех k>1. А это, конечно, устроить легко. Выберите какое угодно а1. Затем все прочие коэффициенты образуйте с помощью формулы
(17.22)
Пользуясь ею, вы получите а2, а3, а4 и т. д., и каждая пара будет, конечно, удовлетворять (17.21). Мы получим ряд для g(ρ), удовлетворяющий (17.17). С его помощью мы напишем ψ — решение уравнения Шредингера. Обратите внимание, что решения зависят от того, какова предполагаемая энергия (через α), но для каждого значения ε получается свой ряд.
Решение-то у нас есть, но что оно представляет физически? Понятие об этом мы получим, поглядев, что происходит вдалеке от протона — при больших ρ. Там основное значение приобретают наивысшие степени членов ряда, т. е. нам надо посмотреть, что бывает при больших k. Когда k≫1, то уравнение (17.22) приближенно совпадает с :
а это означает, что
(17.23)
Но это как раз коэффициенты разложения в ряд е+2αρ. Функция g оказывается быстро растущей экспонентой. Даже после умножения на е-αρ получающаяся функция f(ρ) [см. (17.14)] будет при больших ρ меняться как еαρ. Мы нашли математическое решение, но оно не является физическим. Оно представляет случай, когда электрону менее всего вероятно очутиться вблизи протона! Чаще всего он вам повстречается на очень больших расстояниях ρ. А волновая функция для связанного электрона должна при больших ρ стремиться к нулю.
Придется подумать, нельзя ли как-нибудь обмануть решение. Оказывается, можно. Посмотрите! Если бы, по счастью, оказалось, что α=1/n, где n — любое целое число, то уравнение (17.22) привело бы к an+1=0. И все высшие члены обратились бы тоже в нуль. Вышел бы не бесконечный ряд, а конечный многочлен. Любой многочлен растет медленнее, чем еαρ, поэтому множитель е-αρ наверняка забьет его при больших ρ, и функция f при больших ρ будет стремиться к нулю. Единственные решения для связанных состояний это те, для которых α=1/n, где n=1, 2, 3, 4 и т. д.
Оглядываясь на уравнение (17.16), мы видим, что у сферически симметричного волнового уравнения могут существовать решения для связанных состояний лишь при энергиях
Допустимы только те энергии, которые составляют именно такую часть ридберга ЕR =me4/2ℏ2, т. е. энергия n-го уровня равна
(17.24)
Кстати, ничего мистического в отрицательных энергиях нет. Они отрицательны просто потому, что когда мы решили писать V=-е2/r, то тем самым в качестве нуля энергии выбрали энергию электрона, расположенного вдалеке от протона. Когда он ближе, то его энергия меньше, т. е. ниже нуля. Энергия ниже всего (самая отрицательная) при n=1 и возрастает к нулю с ростом n.
Еще до открытия квантовой механики экспериментальное изучение спектра водорода показало, что уровни энергии описываются формулой (17.24), где ЕR , как это следует из измерений, равно примерно 13,6 эв. Затем Бор придумал модель, которая привела к тому же уравнению (17.24) и предсказала, что ER должно равняться me4/2ℏ2. Первым большим успехом теории Шредингера явилось то, что она смогла воспроизвести этот результат прямо из основного уравнения движения электрона.
Теперь, когда мы рассчитали наш первый атом, давайте рассмотрим свойства полученного нами решения. Объединим все выделившиеся по дороге факторы и выпишем окончательный вид решения:
(17.25)
где
(17.26)
и
(17.27)
Пока нас интересует главным образом относительная вероятность обнаружить электрон в том или ином месте, можно в качестве а1 выбирать любое число. Возьмем, например, а1=1. (Обычно выбирают а1 так, чтобы волновая функция была «нормирована», т. е. чтобы полная вероятность обнаружить электрон где бы то ни было в атоме была равна единице. Мы в этом сейчас не нуждаемся.)
В низшем энергетическом состоянии n=1 и
(17.28)
Если атом водорода находится в своем основном (наиболее низком энергетическом) состоянии, то амплитуда того, что электрон будет обнаружен в каком-то месте, экспоненциально падает с расстоянием от протона. Вероятнее всего встретить его вплотную близ протона. Характерное расстояние, на котором он встречается, составляет около одного ρ, или одного боровского радиуса rB .
Подстановка n=2 дает следующий более высокий уровень. В волновую функцию этого состояния входят два слагаемых. Она равна
(17.29)
Волновая функция для следующего уровня равна
(17.30)
Эти три волновые функции начерчены на фиг. 17.2.
Фиг. 17.2. Волновые функции трех первых состояний атома водорода с l=0. Масштабы выбраны так, чтобы полные вероятности совпадали.
Общая тенденция уже видна. Все волновые функции при больших ρ, поколебавшись несколько раз, приближаются к нулю. И действительно, число «изгибов» у ψn как раз равно n, или, если угодно, число пересечений оси абсцисс — число нулей — равно n-1.
§ 3. Состояния с угловой зависимостью
Мы нашли, что в состояниях, описываемых волновой функцией ψn (r), амплитуда вероятности обнаружить электрон сферически симметрична; она зависит только от r — расстояния до протона. Момент количества движения таких состояний равен нулю. Теперь займемся состояниями, у которых какой-то момент количества движения имеется.
Можно было бы, конечно, просто исследовать чисто математическую задачу отыскания функций от r, θ и φ, удовлетворяющих дифференциальному уравнению (17.7), добавив только физическое условие, что единственно приемлемые для нас функции — это такие, которые при больших r стремятся к нулю. Так почти всегда и поступают. Но мы попробуем несколько сократить наш путь и воспользоваться тем, что мы уже знаем, именно тем, что нам известно, как амплитуды зависят от пространственных углов.
Атом водорода в том или ином состоянии — это частица с определенным «спином» j — квантовым числом полного момента количества движения. Часть этого спина возникает от собственного спина электрона, другая — от движения электрона. Поскольку каждая из этих частей действует (в очень хорошем приближении) независимо, то мы по-прежнему будем игнорировать спиновую часть и учтем только «орбитальный» момент. Впрочем, это орбитальное движение в точности подобно спину. Скажем, если орбитальное квантовое число есть l, то z-компонента момента количества движения может быть l, l-1, l-2, ..., -l. (Мы, как обычно, измеряем все в единицах ℏ.) Кроме того, по-прежнему годятся все наши матрицы поворота и прочие известные свойства. (Начиная с этого места, мы действительно начнем пренебрегать спином электрона; говоря о «моменте количества движения», мы будем иметь в виду только орбитальную его часть.)
Поскольку поле с потенциалом V, в котором движется электрон, зависит только от r, а не от θ и не от φ, то гамильтониан симметричен относительно поворотов. Отсюда следует, что и момент количества движения и все его проекции сохраняются. Это не есть особое свойство кулонова потенциала e2/r; оно справедливо при движении в любом «центральном поле» — поле, зависящем только от r.
Представим себе некоторое возможное состояние электрона; внутренняя угловая структура этого состояния будет определяться квантовым числом l. В зависимости от «ориентации» полного момента количества движения относительно оси z его проекция m на ось z может равняться одному из 2l+1 чисел между +l и -l. Пусть, например, m=1. С какой амплитудой электрон окажется на оси z на расстоянии r от начала? С нулевой. Электрон на оси z не может иметь какого-либо орбитального момента относительно этой оси. Но пусть тогда m=0. Вот это другое дело; теперь уже может появиться не равная нулю амплитуда того, что электрон окажется на оси z на таком-то расстоянии от протона. Обозначим эту амплитуду Fl (r). Это — амплитуда того, что электрон будет обнаружен на расстоянии r по оси z, когда атом находится в состоянии |l, 0>, т. е. в состоянии с орбитальным моментом l и его z-компонентой m=0.
А если нам известно Fl (r), то известно все. Теперь уже в любом состоянии |l, m> мы можем узнать амплитуду ψlm (r) того, что электрон обнаружится в произвольном месте атома. Как мы это узнаем? А вот следите. Пусть у нас есть атом в состоянии |l, m>. Какова амплитуда того, что электрон обнаружится под углом θ, φ и на расстоянии r от начала? Проведите новую ось z, скажем z', под этим углом (фиг. 17.3) и задайте вопрос: какова амплитуда того, что электрон окажется на новой оси z на расстоянии r?
Фиг. 17.3. Точка (х, у, z) лежит на оси z' системы координат х', у', z'.
Мы знаем, что он не сможет оказаться на оси z', если только m — его z'-компонента момента количества движения — не равна нулю. Когда же m'=0, то амплитуда того, что электрон обнаружится на оси z', есть Fl (r). Значит, результат получится перемножением двух амплитуд. Первая это амплитуда того, что атом, находящийся в состоянии |l, m> относительно оси z, окажется в состоянии |l, m'=0> относительно оси z'. Умножьте эту амплитуду на Fl (r) и вы получите амплитуду ψl,m(r) того, что электрон обнаружится в точке (r, θ, φ) относительно первоначальной системы осей.
Давайте все это распишем. Матрицы преобразования для поворотов мы уже вычислили. Чтобы перейти от системы х, у, z к системе х', у', z' (см. фиг. 17.3), можно сперва сделать поворот вокруг оси z на угол φ, а потом сделать поворот вокруг новой оси у (оси у') на угол θ. Совместный поворот выразится произведением
Амплитуда того, что после поворота обнаружится состояние |l, m'=0>, есть
(17.31)
В итоге получаем
(17.32)
Орбитальное движение может обладать только целыми значениями l. (Если электрон может быть обнаружен в любом месте, где r≠0, то имеется некоторая амплитуда того, что в этом направлении будет m=0. А состояния с m=0 бывают только при целых спинах.) Матрицы поворота для l=1 приведены в табл.15.2. Для больших l вы можете воспользоваться общими формулами, выведенными в гл. 16. Матрицы Rz (φ) и Ry (θ) написаны по отдельности, но как их комбинировать, вы знаете. В общем случае вы начнете с состояния |l, m> и подействуете на него оператором Rz (φ), получив новое состояние Rz (φ)|l, m> (которое просто равно eim φ |l, m>). Затем вы подействуете на это состояние оператором Ry (θ) и получите состояние Ry (θ) Rz (φ) |l, m>. Умножение на
Матричные элементы операции поворота — это алгебраические функции от θ и φ. Те частные виды функций, которые появляются в (17.31), возникают и во многих других задачах, связанных с волнами на сфере. Им присвоили особое имя. Правда, не у всех авторов обозначения одинаковы; чаще всего все же пишут
(17.33)
Функции Yl,m (θ, φ) называют сферическими гармониками, а a — просто численный множитель, который зависит от того, как определено Yl,m . При обычном определении
(17.34)
В этих обозначениях волновые функции водорода записываются так:
(17.35)
Угловые функции Yl,m (θ,φ) важны не только во многих квантовомеханических задачах, но и во многих областях классической физики, в которых встречается оператор ∇2, например в электромагнетизме. В качестве другого примера их применения в квантовой механике рассмотрим распад возбужденного состояния Ne20 (о котором говорилось в предыдущей главе), которое испускает α-частицу и превращается в О16:
Допустим, что возбужденное состояние имеет спин l (обязательно целый), а z-компонента момента количества движения есть т. Спросим вот о чем: если даны l и m, то какова амплитуда того, что α-частица вылетит в направлении, составляющем с осью z угол θ и с плоскостью xz угол φ (фиг. 17.4)?
Фиг. 17.4. Распад возбужденного состояния Ne20 .
Решить эту задачу нам поможет следующее наблюдение. Распад, в котором α-частица вылетает прямо вдоль оси z, должен происходить из состояния с m=0. Это потому, что у самих О16 и α-частицы спин равен нулю, а за счет движения вдоль оси z момента вокруг этой оси не создашь. Обозначим эту амплитуду а (на единицу телесного угла). Тогда, чтобы найти амплитуду распада под произвольным углом (см. фиг. 17.4), остается только узнать, с какой амплитудой данное начальное состояние будет обладать нулевым моментом относительно направления распада. Амплитуда того, что распад будет в направлении (θ, φ), тогда будет равна произведению а на амплитуду того, что состояние |l, m> относительно оси z окажется в состоянии |l, 0> относительно z' (направления распада). Эта последняя амплитуда как раз и есть то, что мы писали в (17.31). Вероятность увидеть α-частицу под углом (θ, φ), стало быть, равна
Для примера рассмотрим начальное состояние с l=1 и различными т. Из табл. 15.2 мы знаем все нужные амплитуды:
(17.36)
Это и есть три возможные амплитуды угловых распределений, в зависимости от того, какое m у первоначального ядра.
Такие амплитуды, как (17.36), встречаются так часто и так важны, что им дали несколько названий. Если амплитуда углового распределения пропорциональна любой из этих трех функций или любой их линейной комбинации, то мы говорим: «орбитальный момент системы равен единице». Или можно сказать: «Ne20* испускает р-волну». Или говорят: «α-частица испускается в состоянии с l=1». Выражений так много, что даже стоит составить словарик. Если вы хотите понимать разговор физиков, то вам просто нужно выучить их язык. В табл. 17.1 приведен словарь орбитальных моментов количества движения.
Таблица 17.1. СЛОВАРИК ОРБИТАЛЬНЫХ МОМЕНТОВ (l=j-ЦЕЛЫЕ ЧИСЛА)
Если орбитальный момент равен нулю, то повороты системы координат ничего не меняют и зависимости от угла нет: «зависимость» от угла имеет вид постоянной, скажем 1. Это называют «s-состоянием». Есть только одно такое состояние, пока дело касается только зависимости от угла. Если орбитальный момент равен 1, то амплитуда зависимости от углов может быть одной из трех приведенных функций, смотря по тому, чему равно m, или их линейной комбинацией. Их называют «р-состояниями». Таких состояний три. Если орбитальный момент равен 2, то подобных функций пять (см. таблицу). Любая их линейная комбинация называется «l=2»-амплитудой, или амплитудой «d-волны». Теперь вы сразу догадаетесь, какая будет следующая буква. Что должно идти после s, p, d? Ну, конечно же, f, g, h и т. д. по алфавиту. Буквы эти ничего не значат. [Когда-то они что-то значили: «резкая» (sharp), «главная» (principal), «диффузная» (diffuse) и «фундаментальная» (fundamental) серии линий оптического спектра атомов. Но это было тогда, когда еще не было известно, откуда эти серии линий берутся. После f особых названий уже не было, так что мы сейчас просто продолжаем g, h и т. д.]
Угловые функции в таблице проходят под несколькими именами и определяются порой с небольшими вариациями в численных множителях, стоящих впереди. Иногда их называют «сферические гармоники» и обозначают Yl,m (θ,φ). Иногда их пишут Рl m (cosθ)eim φ , а при m=0 просто Рl (cosθ). Функции Pl (cosθ) называются «полиномы Лежандра» по cosθ, а функции Pl m (cosθ) именуют «присоединенными функциями Лежандра». Таблицы этих функций встречаются во многих книгах.
Обратите, кстати, внимание, что все функции с данным l имеют одну и ту же четность — при нечетных l они от инверсии меняют свой знак, при четных l — нет. Поэтому можно написать, что четность состояния с орбитальным моментом l равна (-1)l .
Как мы видели, одни и те же угловые распределения могут относиться к разным вещам: к ядерному распаду, к другим ядерным процессам, к распределению амплитуд наблюдения электрона в том или ином месте атома водорода. Например, если электрон находится в р-состоянии (l=1), то амплитуда того, что он обнаружится в каком-то месте, зависит от угла определенным образом, но всегда представляет собой линейную комбинацию трех функций для l=1 из табл. 17.1. Возьмем очень интересный случай cosθ. Он означает, что амплитуда, скажем, положительна в верхней части (θ<π/2), отрицательна в нижней (θ>π/2) и равна нулю при θ=90°. Возводя ее в квадрат, видим, что вероятность встретить электрон меняется с θ так, как показано на фиг. 17.5, и не зависит от φ.
Фиг. 17.5. График cos2 θ в полярных координатах, дающий относительную вероятность обнаружения электрона под различными углами к оси z (для данного r) в состоянии атома с l=1 и m=0.
Такое угловое распределение ответственно за то, что в молекулярной связи притяжение электрона в состоянии l=1 к другому атому зависит от направления. Отсюда ведет свое начало направленная валентность химического притяжения.
§ 4. Общее решение для водорода
В уравнении (17.35) мы записали волновые функции атома водорода в виде
(17.37)
Эти волновые функции должны быть решениями дифференциального уравнения (17.7). Посмотрим, что это означает. Подставим (17.37) в (17.7); получим
(17.38)
Помножим все на r2/Fl и переставим члены; результат будет таков:
(17.39)
Левая часть этого уравнения зависит от θ и φ, а от r не зависит. Какое бы значение r мы ни взяли, от этого левая часть не изменится. Значит, то же должно быть выполнено и для правой части. Хотя в выражении в квадратных скобках там и сям попадаются разные r, все выражение от r зависеть не может, иначе бы не получилось уравнение, которое годится для всех r. Кроме того, как вы видите, эта скобка не зависит ни от θ, ни от φ. Она должна быть постоянным числом. Его величина имеет право зато зависеть от значения l того состояния, которое мы изучаем, поскольку этому состоянию принадлежит функция Fl ; поэтому постоянное число мы обозначим Kl . Уравнение (17.35), стало быть, равнозначно двум уравнениям
(17.40)
(17.41)
Теперь взглянем на то, что мы сделали. Для каждого состояния, описываемого числами l и m, мы знаем функции Yl,m ; тогда из уравнения (17.40) можно определить Kl Затем, подставив Kl в (17.41), мы получим дифференциальное уравнение для функции Fl (r). Если мы его сможем решить, то все множители, входящие в (17.37), нам станут известны, и мы узнаем ψ(r).
Чему же равно Кl ? Ну, во-первых, заметьте, что при всех m (входящих в данное l) оно должно быть одним и тем же, поэтому мы вправе выбрать в Yl,m то m, какое нам нравится, и вставить его в (17.40). Пожалуй, проще всего взять Yl,l . Из уравнения (16.24)
(17.42)
Матричный элемент Ry (θ) тоже совсем прост:
(17.43)
где b — некоторое число. Объединяя их, получаем
(17.44)
Подстановка этой функции в (17.40) даст
(17.45)
Теперь, когда мы определили Кl , уравнение (17.41) даст нам радиальную функцию Fl (r). Перед нами обычное уравнение Шредингера, у которого угловая часть заменена ее эквивалентом Kl Fl /r2. Перепишем (17.41) в той форме, в какой мы писали уравнение (17.8):
(17.46)
У потенциальной энергии появилась какая-то таинственная добавка. Хотя она появилась на свет после длинной серии математических шагов, тем не менее у нее простое физическое происхождение. Мы беремся рассказать о ее происхождении при помощи полуклассических аргументов. После этого она уже не покажется вам такой таинственной.
Представим классическую частицу, вращающуюся вокруг некоторого силового центра. Полная энергия сохраняется и является суммой потенциальной и кинетической энергий
В общем случае v разлагается на радиальную компоненту vr и на касательную компоненту r.θ, т. е.
Момент количества движения mr2.θ тоже сохраняется; пусть он равняется L. Тогда можно написать
т. е. энергия равна
Если бы момента количества движения не было, у нас осталось бы только два первых члена. Добавление момента количества движения L изменяет энергию как раз так, как если бы к потенциальной энергии добавился член L2/2mr2. Но он почти точно совпадает с добавкой (17.46). Единственная разница в том, что вместо ожидаемого числителя l2ℏ2 (этого можно было бы ожидать) появляется комбинация l(l+1)ℏ2 Но мы еще раньше видели [например, в гл. 34, § 7 (вып. 7)], что это обычная замена, к которой всегда приходится прибегать, если хотят, чтобы квазиклассические рассуждения совпали с правильным квантовомеханическим расчетом. Поэтому новый член можно понимать как своего рода «потенциал», определяющий «центробежную силу» и возникающий в уравнениях радиального движения вращающейся системы [см. гл. 12, § 5 (вып. 1)].
Теперь мы уже можем решить уравнение (17.46) относительно Fl (r). Оно очень похоже на (17.8), так что прибегнем к той же технике. Все повторяется вплоть до уравнения (17.19), в котором появится добавочный член
(17.47)
Его можно записать еще и так:
(17.48)
(Мы выделили первый член, а затем текущий индекс k сдвинули на единицу.) Вместо (17.20) появится
(17.49)
Поскольку член с ρ-1 только один, то он должен обратиться в нуль. Коэффициент a1 должен быть равен нулю (если только l не равно нулю, но тогда мы приходим к нашему прежнему решению). А когда все квадратные скобки при любых k обратятся в нуль, то и все следующие члены станут равны нулю. Из-за этого условие (17.21) переходит в
(17.50)
Это единственное существенное видоизменение по сравнению со сферически симметричным случаем.
Как и раньше, ряд должен оборваться, если мы хотим, чтобы решения представляли связанные электроны. Если αn=1, то ряд оборвется на k=n. Условие на α получается таким же: α должно быть равно 1/n, где n — целое число. Однако (17.50) приводит и к новому ограничению. Индекс k не может быть равен l, в противном случае знаменатель обратится в нуль, а аl +1 — в бесконечность. Иначе говоря, поскольку a1=0, то (17.50) подразумевает, что все последовательные ak обращаются в нуль, пока мы не придем к аl +1 , которое может быть и не нулем. Это означает, что k должно начинаться с l+1 и кончаться на n.
Окончательный итог таков: при любом l имеется набор возможных решений, которые мы обозначим Fn,l , где n>l+1. Каждое решение обладает энергией
(17.51)
Волновая функция состояния с такой энергией и с угловыми квантовыми числами l и m имеет вид
(17.52)
где
(17.53)
Коэффициенты ak получаются из (17.50). Наконец-то в наших руках полное описание состояний атома водорода.
§ 5. Волновые функции водорода
Посмотрим же, что мы открыли. Состояния, которые удовлетворяют уравнению Шредингера для электрона в кулоновом поле, характеризуются тремя (причем целыми) квантовыми числами n, l, m. Угловое распределение амплитуды электрона может обладать только определенными формами, которые мы обозначим Yl,m . Они нумеруются числом l — квантовым числом полного момента количества движения и m — «магнитным» квантовым числом, которое может меняться от -l до +l. При каждой угловой конфигурации возможны различные радиальные распределения Fn,l (r) амплитуды электрона; они нумеруются главным квантовым числом n, которое может меняться от l+1 до ∞. Энергия состояния зависит только от n и растет с n.
Состояние наинизшей энергии, или основное, является s-состоянием. У него l=0, n=1 и m=0. Это «невырожденное» состояние: имеется только одно состояние с такой энергией, а волновая функция у него сферически симметрична. Амплитуда того, что электрон обнаружится, достигает максимума в центре и монотонно спадает с удалением от центра. Эту электронную амплитуду можно изобразить этаким комочком (фиг. 17.6,а).
Фиг. 17.6. Наброски, отражающие общий характер волновых функций водорода. В заштрихованных местах амплитуды велики. Знаки плюс и минус — это относительные знаки амплитуд в каждой области.
Имеются и другие s-состояния, с большими энергиями; у них n=2, 3, 4, ... и l=0. Каждой энергии соответствует только одно состояние m=0, и все они сферически симметричны. Амплитуды этих состояний с ростом r один или несколько раз меняют знак. Имеется n-1 сферических узловых поверхностей, или мест, где ψ проходит через нуль. Например, 2s-состояние (l=0, n=2) выглядит так, как показано на фиг. 17.6, б. (Темные области указывают те места, где амплитуда велика, а знаки плюс и минус отмечают относительные фазы амплитуды.) Уровни энергии s-состояний показаны в первом столбце фиг. 17.7.
Фиг. 17.7. Диаграмма уровней энергии водорода.
Затем бывают р-состояния с l=1. Для каждого n (n равно или больше 2) существует тройка состояний с одинаковой энергией, одно с m=+1, другое с m=0, третье с m=-1. Уровни энергии отмечены на фиг. 17.7. Угловые зависимости этих состояний приведены в табл. 17.1. Так, при m=0, если амплитуда положительна для углов θ, близких к нулю, то при углах θ, близких к 180°, она окажется отрицательной. Имеется узловая плоскость, совпадающая с плоскостью ху. При n>1 бывают также конические узловые поверхности. Амплитуда n=2, m=0 намечена на фиг. 17.6,в, а волновая функция n=3, m=0 — на фиг. 17.6, г.
Могло бы показаться, что поскольку m дает, так сказать, «ориентацию» в пространстве, то должны наблюдаться еще такие же распределения, но с пиками вдоль оси х или вдоль оси у. Можно подумать, что это скорее всего состояния с m=+1 и с m=-1. Однако это не так! Но зато раз у нас есть тройка состояний с одинаковыми энергиями, то любая линейная комбинация из этой тройки тоже будет стационарным состоянием с той же энергией. Оказывается, что «x»-состояние (по аналогии с «z»-состоянием, или состоянием с m=0, см. фиг. 17.6, в) это линейная комбинация состояний с m=+1 и с m=-1. Другая комбинация дает «y»-состояние. Точнее, имеется в виду, что состояния
если отнести их к своим осям, выглядят одинаково.
У d-состояний (l=2) для каждой энергии есть пять возможных значений m; наинизшей энергией обладает n=3. Уровни показаны на фиг. 17.7. Угловые зависимости усложняются. К примеру, состояния с m=0 обладают двумя коническими узловыми поверхностями, так что при переходе от северного полюса к южному волновая функция меняет фазы с + на — и обратно на +. Примерная форма амплитуды нарисована на фиг. 17.6,д и е для состояний с m=0 и n=3 и 4. И снова при больших n появляются конические узловые поверхности.
Мы не будем пытаться описывать другие последующие состояния. Подробное изложение волновых функций водорода вы найдете во многих книгах. Рекомендую вам особенно; L. Pauling, E.B.Wilson, Introduction to Quantum Mechanics, New York, 1935; R. B. Leightоn, Principles of Modern Physics, New York, 1959. В этих книгах вы найдете графики некоторых функций и графическое изображение многих состояний.
Хотелось бы упомянуть об одном особом свойстве волновых функций при высших l: при l>0 амплитуды обращаются в центре в нуль. Ничего в этом удивительного нет, ведь электрону трудно иметь большой момент, когда плечо момента очень мало. По этой причине чем l больше, тем дальше амплитуды «отталкиваются» от центра. Если вы посмотрите, как радиальные функции F(r) меняются при малых r, то из (17.53) окажется, что
Такая зависимость от r означает, что при больших l вам придется дальше отойти от r=0, чтобы получить заметную амплитуду. Такое поведение, кстати, определяется членом с центробежной силой в радиальном уравнении, так что все это применимо к любому потенциалу, который при малых r меняется медленнее, чем 1/r2, а таково большинство атомных потенциалов.
§ 6. Периодическая таблица
Теперь мы хотели бы применить теорию атома водорода к объяснению химической периодической таблицы элементов. В атоме элемента с атомным номером Z имеется Z электронов, которые удерживаются электрическим притяжением ядра, но при этом взаимно отталкиваются друг от друга. Чтобы получить точное решение, пришлось бы решить уравнение Шредингера для Z электронов в кулоновом поле. Для гелия уравнение имеет вид
где ∇21 — лапласиан, который действует на r1, координату первого электрона; ∇22 действует на r2, а r12=|r1-r2|. (Мы опять пренебрегаем спинами электронов.) Чтобы найти стационарные состояния и уровни энергии, следовало бы отыскать решения вида
Геометрическая зависимость заключена в f — функции шести переменных — одновременных положений двух электронов. Аналитического решения никто не знает, хотя решения для низших энергетических состояний и были найдены численными методами.
Когда электронов 3, 4 или 5, безнадежно пытаться получить точные решения. Поэтому было бы опрометчиво утверждать, что квантовая механика до конца объяснила периодическую таблицу. Но все же можно сказать, что даже с помощью довольно сомнительных приближений (и кое-какой последующей отделки) удается, по крайней мере качественно, понять многие химические свойства, проявляющиеся в периодической таблице.
Химические свойства атомов определяются в первую очередь их низшими энергетическими состояниями. Для отыскания этих состояний и их энергий мы воспользуемся следующей приближенной теорией. Во-первых, пренебрежем спином электрона, разве только что принцип запрета будет принят нами во внимание и мы будем считать, что каждое частное электронное состояние может быть занято только одним электроном. Это означает, что на одной орбите не может оказаться больше двух электронов — один со спином, направленным вверх, другой — вниз. Затем мы в первом приближении пренебрежем деталями взаимодействия электронов и будем считать, что каждый электрон движется в центральном поле, образуемом полями ядра и всех прочих электронов. Про неон, у которого 10 электронов, мы скажем, например, что каждый электрон в атоме неона испытывает влияние среднего потенциала ядра и оставшейся девятки электронов. Мы вообразим далее, что в уравнение Шредингера для каждого электрона мы подставляем V(r) — то же поле 1/r, но только видоизмененное за счет сферически симметричной плотности заряда, возникшей от остальных электронов.
В такой модели каждый электрон ведет себя как независимая частица. Угловые зависимости его волновой функции будут попросту такими же, какие были у атома водорода. Это будут те же s-состояния, р-состояния и т. п., и у них будут различные значения m. Раз V(r) больше не следует закону 1/r, то радиальная часть волновых функций слегка перекраивается, но качественно останется прежней, так что по-прежнему будет существовать радиальное квантовое число n. Энергии состояний тоже станут немного иными.
Н
Что же при таких представлениях у нас получится с водородом? У основного состояния водорода l=m=0 и n=1; мы говорим, что у него электронная конфигурация 1s. Энергия равна -13,6 эв. Это значит, что для отрыва электрона от атома нужно 13,6 эв энергии. Ее называют «энергией ионизации», W1. Большая энергия ионизации означает, что оторвать электрон трудно, но водород может отнять электрон у другого атома, а потому он химически активен.
Не
Теперь обратимся к гелию. Оба электрона в гелии могут находиться в одном и том же нижнем состоянии (только у одного спин направлен вверх, у другого — вниз). В своем наинизшем состоянии электрон движется в поле с потенциалом, который при малых r походит на кулонов потенциал с Z=2, а при больших r — на кулонов потенциал с Z=1. В результате возникает «водородоподобное» 1s-состояние с несколько более низкой энергией. Оба электрона занимают одни и те же 1s-состояния (l=0, m=0). Наблюдаемая энергия ионизации (требуемая на отрыв одного электрона) равна 24,6 эв. Поскольку теперь «оболочка» 1s заполнена (больше двух электронов в нее не втиснешь), то практически не возникает тенденции уводить у других атомов электроны. Гелий химически инертен.
Li
Ядро лития имеет заряд 3. Состояния электрона опять будут водородоподобны, и тройка электронов займет три нижних уровня энергии. Два попадут в состояния 1s, а третий пойдет в состояние n=2. Но вот с l=0 или с l=1? В водороде у этих состояний энергия одна и та же, в других же атомах это не так, и вот по какой причине. Вспомним, что у 2s-состояния есть некоторая амплитуда того, что оно окажется вблизи ядра, а у 2р такой амплитуды нет. Это означает, что 2s-электрон как-то ощутит тройной электрический заряд ядра Li, а 2р-электрон останется там, где поле выглядит как кулоново поле единичного заряда. Добавочное притяжение понизит энергию 2s-состояния по сравнению с энергией 2р-состояния. Уровни энергии примерно окажутся такими, как показано на фиг. 17.8 (сравните с соответствующей диаграммой на фиг. 17.7 для водорода).
Фиг. 17.8. Схематическая диаграмма уровней энергии атомного электрона в присутствии других электронов. Масштаб иной, нежели на фиг. 17.7.
Значит, в атоме лития два электрона будут в 1s-состояниях, а один — в 2s-состоянии. Поскольку электрон в 2s-состоянии обладает более высокой энергией, чем электрон в 1s-состоянии, то его сравнительно легко удалить. Ионизационная энергия лития всего 5,4 эв, и он весьма активен химически.
Так постепенно перед вами развертывается вся картина; в табл. 17.2 мы привели список первых 36 элементов, отметив состояния, занимаемые электронами в основном состоянии каждого атома. Таблица дает энергию ионизации для наиболее слабо связанного электрона и количество электронов, занимающих каждую «оболочку», т. е. состояние с одним и тем же n.
Таблица 17.2. ЭЛЕКТРОННЫЕ КОНФИГУРАЦИИ ПЕРВЫХ 36 ЭЛЕМЕНТОВ (число электронов в разных состояниях)
Поскольку разные l-состояния обладают разными энергиями, то каждое значение l отвечает некоторой подоболочке из 2(2l+1) возможных состояний (с различными m и различными направлениями спина). У всех у них энергия одинакова с точностью до некоторых слабых эффектов, которыми мы пренебрежем.
Be
Бериллий похож на литий, только у него в 2s-состоянии находятся два электрона, а в заполненной 1s-оболочке тоже два.
От B до Ne
У бора 5 электронов. Пятый должен уйти в 2p-состояние. Всего бывает 2x3=6 разных 2p-состояний, поэтому можно продолжать добавлять по электрону, пока не дойдем до 8. Так мы доберемся до неона. Добавляя эти электроны, мы увеличиваем также Z, поэтому все электронное распределение все теснее и теснее стягивается к ядру и энергия 2p-состояний все снижается и снижается. К тому времени, когда мы достигнем неона, энергия ионизации возрастет до 21,6 эв. Неон легко своего электрона не отдает. У него к тому же больше нет пустых мест на орбите, которые можно заполнить, так что и чужие электроны ему не нужны. Стало быть, неон химически инертен. У фтора есть пустое место, попав на которое, электрон может оказаться в состоянии с низкой энергией, поэтому в химических реакциях фтор очень активен.
От Na до Ar
В натрии одиннадцатый электрон вынужден начать новую оболочку, переходя в 3s-состояние. Уровень энергии этого состояния намного выше; энергия ионизации резко спадает; натрий химически очень активен. От натрия до аргона s- и p-состояния с n=3 заполняются в той же последовательности, как от лития до неона. Угловые конфигурации электронов во внешней незаполненной оболочке идут в той же последовательности, и прогрессирующий рост энергии ионизации тоже весьма схож с тем, что было раньше. Вы теперь понимаете, почему химические свойства с ростом атомного числа повторяются. Химическое действие магния очень похоже на бериллий, кремния — на углерод, хлора — на фтор. Аргон, подобно неону, инертен.
Быть может, вы уже обратили внимание на то, что в последовательности энергий ионизации от лития до неона есть небольшая особенность, и такая же особенность наблюдается между натрием и аргоном. Последний электрон прикреплен к атому кислорода чуть слабее, чем можно было ожидать. Тем же самым отличается сера. Отчего бы это? Это можно понять, если чуть внимательнее вдуматься в эффекты взаимодействия между электронами. Подумаем о том, что бывает, когда мы помещаем в атом бора первый 2p-электрон. Он имеет шесть возможностей — три возможных р-состояния, в каждом по два спина. Представим, что электрон со спином вверх попадает в состояние с m=0, которое мы также будем называть «z»-состоянием, потому что оно облегает ось z. Ну, а что произойдет в углероде? Теперь уже 2p-электронов два. Если один из них попал в «z»-состояние, то куда попадет второй? Ниже всего его энергия будет тогда, когда он расположится подальше от первого электрона. Этого можно достичь, попав, скажем, в «x»-состояние 2p-оболочки. (Это состояние, как вы помните,— просто линейная комбинация состояний с m=+1 и с m=-1.) Дальше, когда мы перейдем к азоту, то у тройки 2p-электронов наименьшая энергия взаимного отталкивания будет тогда, когда один из них попадет в «x»-конфигурацию, другой — в «у», третий — в «z». Весь этот хоровод, однако, для кислорода не проходит. Четвертому электрону уже ничего не остается, как попасть в одно из заполненных состояний, держа при этом спин вниз. Тот электрон, который уже находится в этом состоянии, начнет его сильно отталкивать, так что его энергия не будет такой низкой, какой она была бы в противном случае, поэтому его легче будет удалить. Этим и объясняется разрыв в последовательности энергий связи, который появляется между азотом и кислородом, и между фосфором и серой.
От К до Zn
Можно было бы подумать, что за аргоном новые электроны начнут заполнять состояние 3d. Но нет! Как мы уже говорили (и иллюстрировали фиг. 17.7), состояния с высшими моментами сдвинуты по энергии вверх. К моменту, когда мы подошли к 3d-состояниям, они по энергии оказываются задвинутыми немножко выше энергии 4s-состояния. Поэтому в калии последний электрон попадет в 4s-состояние. После этого в кальции оболочка заполнится (двумя электронами), а 3d-состояния начнут заполняться у скандия, титана и ванадия.
Энергии 3р- и 4s-состояний так близки друг к другу, что малозаметные эффекты легко сдвигают равновесие в ту или иную сторону. К моменту, когда придет время поместить в Зd-состояния четыре электрона, их отталкивание так подымет энергию 4s-состояния, что она станет чуть выше энергии Зd-состояния, поэтому один электрон из s уходит в d. И для хрома не получается ожидавшаяся комбинация 4, 2, а вместо этого выступает комбинация 5, 1. Новый электрон, добавляемый, чтобы получить марганец, опять заполняет оболочку 4s и затем одно за другим идет заполнение Зd-оболочки, пока мы не доберемся до меди.
Но так как самая внешняя оболочка марганца, железа, кобальта и никеля имеет одну и ту же конфигурацию, то все они обладают близкими химическими свойствами. (Этот эффект еще сильнее выражен у редкоземельных элементов. У них внешняя оболочка одинакова, а заполняется постепенно внутренняя ячейка, что меньше сказывается на их химических свойствах.) То же и в меди. В ней тоже построение Зd-оболочки завершается грабежом: из 4s-оболочки уводится один электрон. Энергия комбинации 10, 1, однако, настолько близка у меди к энергии комбинации 9, 2, что равновесие может сместиться уже оттого, что поблизости стоит другой атом. По этой причине два последних электрона меди примерно равноценны, и валентность меди равна то 1, то 2. (Временами она проявляет себя так, как если бы ее электроны были в комбинации 9, 2.) Похожие вещи случаются и в других местах таблицы; они-то и ответственны за то, что другие металлы, такие, как железо, соединяются химически то с той, то с другой валентностью. Наконец, у цинка обе оболочки 3d и 4s заполняются раз и навсегда.
От Ga до Kr
От галлия до криптона последовательность опять продолжается нормально, заполняя 4p-оболочку. Внешние оболочки, энергии и химические свойства повторяют картину изменений на участке от бора до неона и от алюминия до аргона.
Криптон, как и аргон или неон, известен как «благородный» газ. Все эти три «благородных» газа химически «инертны». Это означает только то, что после того, как они заполнили оболочки со сравнительно низкими энергиями, редки будут случаи, когда им станет энергетически выгодно соединиться в простые сочетания с другими элементами. Но для «благородства» недостаточно просто обладать заполненной оболочкой. У бериллия, например, или у магния заполнены s-оболочки, но энергия этих оболочек чересчур высока, чтобы можно было говорить об устойчивости. Точно так же можно было бы ожидать появления другого «благородного» элемента где-то возле никеля, если бы энергия у 3d-оболочки была бы чуть пониже (или у 4s-оболочки повыше). С другой стороны, криптон не вполне инертен; он образует с хлором слабо связанное соединение.
Поскольку в рассмотренной нами части таблицы уже проявились все основные черты периодической системы, мы обрываем наше изложение на элементе № 36 (их остается еще штук 70, а то и больше!).
Мы хотим отметить еще один момент: мы в состоянии понять в какой-то степени не только валентности, но можем кое-что сказать и о направлениях химических связей. Возьмем такой атом, как кислород. В нем четыре 2р-электрона. Первые три попадают в состояния «x», «у» и «z», а четвертый вынужден заполнить одно из них, оставив два других — скажем, «x» и «у» — вакантными. Посмотрите теперь, что происходит в Н2O. Каждый из двух водородов желает разделить свой электрон с кислородом, помогая кислороду заполнить оболочку. Эти электроны будут стремиться попасть на вакансии в состояниях «x» и «y». Поэтому два водорода в молекуле воды обязаны расположиться под прямым углом друг к другу, если смотреть из центра атома кислорода. На самом деле угол равен 105°. Можно даже понять, почему угол больше 90°. Обобществив свои электроны с кислородом, водороды остаются в конце концов с избытком положительного заряда. Электрическое отталкивание «растягивает» волновые функции и разводит угол до 105°. Так же обстоит дело и у H2S. Но атом серы крупнее, атомы водорода оказываются дальше друг от друга, и угол расходится только до 93°. А селен еще крупнее, поэтому в H2Se угол уже совсем близок к 90°.
Аналогичные рассуждения позволяют разобраться в геометрии аммиака H3N. В азоте есть место еще для трех 2р-электронов, по одному на каждое состояние типа «x», «у» и «z». Три водорода будут вынуждены подсоединиться под прямыми углами друг к другу. Углы снова окажутся чуть больше 90°, опять-таки из-за электрического отталкивания, но по крайней мере теперь ясно, отчего молекула H3N не плоская. Углы в фосфине Н3Р уже ближе к 90°, а в H3As еще ближе. Мы не зря предположили, что NH3 не плоский, когда говорили о нем как о системе с двумя состояниями. Именно из-за этой объемности аммиака и возможен аммиачный мазер. Вы видите, что сама форма молекулы аммиака тоже следует из квантовой механики.
Уравнение Шредингера явилось одним из величайших триумфов физики. Снабдив нас ключом к механизму, лежащему в основе строения атома, оно объяснило атомные спектры и всю химию, благодаря чему стала понятна физическая природа материи.
Глава 18 ОПЕРАТОРЫ
§ 1. Операции и операторы
Для того чтобы управиться со всем, что мы до сих пор делали в квантовой механике, достаточно было бы обычной алгебры, но мы все же время от времени демонстрировали особые способы записи квантовомеханических величин и уравнений. Мы хотели бы рассказать теперь немного больше о некоторых интересных и полезных способах описания квантовомеханических величин.
К предмету квантовой механики можно подойти разными способами, и во многих книгах прибегают совсем к иному подходу, чем у нас. Когда вы начнете читать другие книжки, то может оказаться, что вам не удастся сразу связать то, что в них говорится, с тем, что делали мы. Хотя в этой главе мы и получим кое-какие новые результаты, она не похожа на другие главы. У нее совсем иная цель: рассказать о других способах выражения тех же самых физических представлений. Зная это, вы легче поймете, о чем говорится в других книжках.
Когда люди впервые начали разрабатывать классическую механику, они неизменно расписывали свои уравнения через х-, у- и z-компоненты. Затем кто-то сделал шаг вперед и указал, что все можно упростить, введя векторные обозначения. Правда, очень часто, чтобы представить себе задачу конкретнее, вы разбиваете векторы обратно на их компоненты. Но обычно все же куда легче делать расчеты и разбираться в существе дела, работая с векторами. В квантовой механике нам тоже удалось упростить запись многих вещей, воспользовавшись идеей «вектора состояния». Вектор состояния |ψ> ничего общего, конечно, не имеет с геометрическими векторами в трехмерном пространстве; это просто отвлеченный символ, который обозначает физическое состояние, отмечаемое своим «значком» или «названием» ψ. Представление это весьма и весьма полезно, потому что на языке этих символов законы квантовой механики выглядят как алгебраические уравнения. К примеру, тот наш фундаментальный закон, что всякое состояние можно составить из линейной комбинации базисных состояний, записывается так:
(18.1)
где Сi — совокупность обычных (комплексных) чисел, амплитуд Ci =, а |1>, |2>, |3> и т. д. обозначают базисные состояния в некотором базисе, или представлении.
Если вы берете какое-то физическое состояние и что-то проделываете над ним (поворачиваете или ждете в течение времени Δt или еще что-то), то вы получаете уже другое состояние. Мы говорим: «производя над состоянием операцию, получаем новое состояние». Эту же идею можно выразить уравнением
(18.2)
Операция над состоянием создает новое состояние. Оператор А обозначает некоторую определенную операцию. Когда эта операция совершается над каким-то состоянием, скажем над |ψ>, то она создает какое-то другое состояние |φ>.
Что означает уравнение (18.2)? Мы определяем его смысл так. Умножив уравнение на по (18.1), вы получите
(18.3)
(|j> — это состояния из той же совокупности, что и |i>. Теперь это просто алгебраическое уравнение. Число показывает, какое количество базисного состояния |i> вы обнаружите в |φ>, и оно определяется через линейную суперпозицию амплитуд
(18.4)
Значит, (18.2) это запись уравнения (18.3) на высшем уровне. А на самом деле даже немножко и сверх того: в нем подразумевается нечто большее. В (18.2) нет ссылки на ту или иную систему базисных состояний. Уравнение (18.3) — это образ уравнения (18.2) в некоторой системе базисных состояний. Но, как известно, система годится любая. Именно это и имеется в виду в (18.3). Операторная манера записи, стало быть, уклоняется от того или иного выбора системы. Конечно, если вам хочется определенности, вы вольны избрать одну из систем. И когда вы делаете этот выбор, вы пишете уравнение (18.3). Значит, операторное уравнение (18.2) — это более отвлеченный способ записи алгебраического уравнения (18.3). Это очень походит на разницу между записью
и записью
Первый способ нагляднее. Но если вам понадобятся числа, вы наверняка зададите сперва компоненты относительно некоторой системы осей. Точно так же, если вы хотите дать понять, что за штука А, вам нужно быть готовыми задать матрицу Аij через некоторую совокупность базисных состояний. И пока вы имеете в виду определенную совокупность чисел Aij , уравнение (18.2) означает то же, что и (18.3). (И нужно еще помнить, что если уж вы знаете матрицу для одной частной совокупности базисных состояний, то всегда сможете подсчитать матрицу, соответствующую любому другому базису. Матрицу всегда можно преобразовать от одного представления к другому.)
Операторное уравнение (18.2) допускает и другие возможности. Если мы представили себе некоторый оператор А, то его можно применить к любому состоянию |ψ> и он создаст новое состояние ^A |ψ>. Временами получаемое таким путем «состояние» может оказаться очень своеобразным — оно может уже не представлять собой никакой физической ситуации, с которой можно встретиться в природе. (Например, может получиться состояние, которое не нормировано на вероятность получить один электрон.) Иными словами, временами мы можем получить «состояния», которые есть математически искусственные образования. Эти искусственные «состояния» могут все равно оказаться полезными, чаще всего в каких-либо промежуточных вычислениях.
Мы уже приводили много примеров квантовомеханических операторов. Встречался нам оператор поворота ^Rу(θ), который, взяв состояние |ψ>, делает из него новое состояние, представляющее собой старое состояние с точки зрения повернутой системы координат. Встречался оператор четности (или инверсии) ^P, создающий новое состояние обращением всех координат. Встречались и операторы ^σх , ^σу и ^σz для частиц со спином 1/2.
Оператор ^Jz определялся в гл. 15 через оператор поворота на малые углы ε:
(18.5)
Это, конечно, попросту означает, что
(18.6)
В этом примере ^Jz|ψ> — это умноженное на ℏ/iε состояние, получаемое тогда, когда вы повернете |ψ> на малый угол ε и затем вычтете прежнее состояние. Оно представляет «состояние», являющееся разностью двух состояний.
Еще один пример. Мы имели оператор ^pх , он назывался оператором (x-компоненты) импульса и определялся уравнением, похожим на (18.6). Если ^Dx (L) — оператор, который смещает состояние вдоль х на длину L, то ^pх определялось так:
(18.7)
где δ — малое смещение. Смещение состояния |ψ> вдоль оси х на небольшое расстояние δ дает новое состояние |ψ'>. Мы говорим, что это новое состояние есть старое состояние плюс еще новый кусочек
Операторы, о которых мы говорим сейчас, действуют на вектор состояния, скажем на |ψ>, являющийся абстрактным описанием физической ситуации. Это совсем не то, что алгебраические операторы, действующие на математические функции. Например, d/dx это «оператор», действие которого на f(x) создает из f(x) новую функцию f'(x)=df/dx. Другой пример алгебраического оператора — это ∇2. Можно понять, отчего в обоих случаях пользуются одним и тем же словом, но нужно помнить, что это разные типы операторов. Квантовомеханический оператор А действует не на алгебраическую функцию, а на вектор состояния, скажем на |ψ>. В квантовой механике употребляются и те и другие операторы, и часто, как вы увидите, в уравнениях сходного типа.
Когда вы впервые изучаете предмет, то все время надо иметь в виду эту разницу. А позднее, когда предмет вам станет ближе, вы увидите, что не так уж важно делать резкое различие между одними операторами и другими. И во многих книгах, как вы убедитесь, оба типа операторов обозначаются одинаково!
Теперь нам пора продвинуться вперед и узнать о многих полезных вещах, которые можно проделывать с помощью операторов. Но для начала небольшое замечание. Пускай у нас имеется оператор ^A, матрица которого в каком-то базисе есть Aij ≡. Амплитуда того, что состояние ^A|ψ> находится также в некотором другом состоянии |φ>, есть <φ|^A|ψ>. Имеет ли смысл комплексное сопряжение этой амплитуды? Вы, вероятно, сможете показать, что
(18.8)
где ^A† (читается «А с крестом») это оператор, матричные элементы которого равны
(18.9)
Иначе говоря, чтобы получить i, j-й элемент матрицы А†, вы обращаетесь к j, i-му элементу матрицы А (индексы переставлены) и комплексно его сопрягаете. Амплитуда того, что состояние ^A†|φ> находится в состоянии |ψ>, комплексно сопряжена амплитуде того, что ^A|ψ> находится в |φ>. Оператор ^A† называется «эрмитово сопряженным» оператору ^A. Многие важные операторы квантовой механики имеют специальное свойство: если вы их эрмитово сопрягаете, вы опять возвращаетесь к тому же оператору. Если В как раз такой оператор, то ^В†=^В; его называют «самосопряженным», или «эрмитовым», оператором.
§ 2. Средние энергии
До сих пор мы в основном напоминали вам о том, что вы уже знаете. А теперь перейдем к новому. Как бы вы подсчитали среднюю энергию системы, скажем, атома? Если атом находится в определенном состоянии с определенной энергией и вы эту энергию измеряете, то вы получите определенную энергию Е. Если вы начнете повторять измерения с каждым из множества атомов, которые отобраны так, чтобы быть всем в одинаковом состоянии, то все измерения дадут вам Е, и «среднее» изо всех ваших измерений тоже, конечно, окажется Е.
Но что случится, если вы проделаете свои измерения над состоянием |ψ>, которое не является стационарным? Раз у системы нет определенной энергии, то одно измерение даст одну энергию, то же измерение над другим атомом в том же состоянии даст другую и т. д. Каким же окажется среднее всей серии измерений энергии?
На этот вопрос мы ответим, если возьмем проекцию состояния |ψ> на систему состояний с определенной энергией. Чтобы помнить, что это особый базис, будем обозначать эти состояния |ηi >. Каждое из состояний |ηi > обладает определенной энергией Ei . В этом представлении
(18.10)
Когда вы проделываете измерение энергии и получаете некоторое число Еi , вы тем самым обнаруживаете, что система была в состоянии |ηi >. Но в каждом новом измерении вы можете получить новое число. Иногда вы получите E1, иногда Е2, иногда Е3 и т. д. Вероятность, что вы обнаружите энергию E1, равна попросту вероятности обнаружить систему в состоянии |η1>, т. е. квадрату модуля амплитуды С1=<η1|ψ>. Вероятность обнаружить то или иное возможное значение энергии Ei есть
(18.11)
Как же связать эти вероятности со средним значением всей последовательности измерений энергий? Вообразим, что мы получили ряд результатов измерений, например E1, Е7, E11, Е9, E1, E10, Е7, E2, Е3, Е9, Е6, E4 и т. д., всего тысяча измерений. Сложим все энергии и разделим на 1000. Это и есть среднее. Можно сложение проделать и покороче. Посчитайте, сколько раз у вас вышло E1 (скажем, оно вышло N1 раз), сколько раз вышло Е2 (скажем, N2 раз) и т. д. Ясно, что сумма всех энергий равна
Средняя энергия равна этой сумме, деленной на полное число измерений, т. е. на сумму всех Ni , которую мы обозначим N:
(18.12)
Мы почти у цели. Под вероятностью какого-нибудь события мы понимаем как раз число случаев, когда ожидается наступление этого события, деленное на общее число испытаний. Отношение Ni /N должно (при больших N) мало отличаться от Pi — вероятности обнаружить состояние |ηi >, хоть и не будет точно совпадать с Рi из-за статистических флуктуации. Обозначим предсказываемую (или «ожидаемую») среднюю энергию
(18.13)
Те же рассуждения подойдут к измерениям каких угодно величин. Среднее значение измеряемой величины А должно равняться
где Ai —различные допустимые значения наблюдаемой величины, а Рi — вероятность получения этого значения.
Вернемся теперь к нашему квантовомеханическому состоянию |ψ>. Его средняя энергия равна
(18.14)
А теперь следите внимательно! Сначала перепишем эту сумму так:
(18.15)
Теперь будем рассматривать левое <ψ| как общий множитель.
Вынесем его за знак суммы и напишем
Это выражение имеет вид <ψ|φ>, где |φ> — некоторое «придуманное» состояние, определяемое равенством
(18.16)
Иными словами, это то состояние, которое у вас получится, если вы возьмете каждое базисное состояние |ηi > в количестве Еi <ηi |ψ>.
Но вспомним теперь, что такое |ηi >. Состояния |ηi > считаются стационарными, т. е. для каждого из них
А раз Еi —просто число, то правая часть совпадает с |ηi >Еi , а сумма в (18.16) — с
Теперь приходится просуммировать по i общеизвестную комбинацию, приводящую к единице:
Чудесно, уравнение (18.16) совпало с
(18.17)
Средняя энергия состояния |ψ> записывается, стало быть, в очень привлекательном виде
(18.18)
Чтобы получить среднюю энергию, подействуйте на |ψ> оператором ^H и затем умножьте на <ψ|. Очень простой результат. Наша новая формула для средней энергии не только привлекательна, но и полезна. Теперь нам уже не надо ничего говорить об особой системе базисных состояний. И даже всех уровней энергии знать не нужно. При расчете достаточно выразить наше состояние через какую угодно совокупность базисных состояний, и, если мы знаем гамильтонову матрицу Нij для этой совокупности, мы уже сможем узнать среднюю энергию. Уравнение (18.18) говорит, что при любой совокупности базисных состояний |i> средняя энергия может быть вычислена из
(18.19)
где амплитуды как раз и есть элементы матрицы Hij .
Проверим это на том частном примере, когда состояния |i> суть состояния с определенной энергией. Для них ^H|j>=E|j>, так что =Ej δij и
что вполне естественно.
Уравнение (18.19) можно, кстати, обобщить и на другие физические измерения, которые вы в состоянии выразить в виде оператора. Например, пусть ^Lz есть оператор z-компоненты момента количества движения L. Средняя z-компонента для состояния |ψ> равна
Один из способов доказательства этой формулы — придумать такую задачу, в которой энергия пропорциональна моменту количества движения. Тогда все рассуждения просто повторятся. Подытоживая, скажем, что если физически наблюдаемая величина А связана с соответствующим квантовомеханическим оператором ^A, то среднее значение А в состоянии |ψ> дается формулой
(18.20)
Под этим подразумевается
(18.21)
где
(18.22)
§ 3. Средняя энергия атома
Пусть мы хотим узнать среднюю энергию атома в состоянии, описываемом волновой функцией ψ(r); как же ее найти? Рассмотрим сперва одномерную задачу, когда состояние |ψ> определяется амплитудой
(18.23)
Этот интеграл можно при желании записывать иначе:
где
(18.25)
Интеграл по х' в (18.25) тот же самый, что встречался нам в гл. 14 [см. (14.50) и (14.52)]. Он равен
Поэтому можно написать
(18.26)
Вспомним, что <ψ|x>=
(18.27)
Если волновая функция ψ(x) известна, то, взяв этот интеграл, вы получите среднюю энергию. Вы теперь начинаете понимать, как от представлений о волновом векторе можно перейти к представлению о волновой функции и обратно.
Величина в фигурных скобках в (18.27) это алгебраический оператор. [«Оператор» V(x) означает «умножь на V(x)».] Мы обозначим его ^ℋ
В этих обозначениях (18.23) превращается в
(18.28)
Определенный здесь алгебраический оператор ^ℋ, конечно, не тождествен с квантовомеханическим оператором ^H. Новый оператор действует на функцию координаты ψ(x)=
Наши результаты нуждаются в одном уточнении. Мы предположили, что амплитуда ψ(x)=
и вероятность увидеть электрон все равно где равна единице. Но вы могли бы, если бы захотели работать с ненормированной ψ(х), следовало бы только писать
(18.29)
Это одно и то же.
Обратите внимание на сходство между (18.28) и (18.18). Оба эти способа записи одного и того же результата при работе в x-представлении часто встречаются. От первого можно перейти ко второму, если ^A — локальный оператор, т. е. такой, для которого интеграл
может быть записан в виде ^A[ script ] ψ(x), где ^A[ script ] — дифференциальный алгебраический оператор. Однако встречаются операторы, для которых это неверно. Тогда приходится работать с исходными уравнениями (18.21) и (18.22).
Наш вывод легко обобщается на три измерения. Итог таков:
(18.30)
где
(18.31)
причем подразумевается, что
(18.32)
Такие же уравнения получаются довольно очевидным образом и при обобщении на системы с несколькими электронами, но мы не будем сейчас заниматься выписыванием результатов.
С помощью (18.30) можно рассчитать среднюю энергию атомного состояния, даже не зная уровней энергии. Нужна только волновая функция. Это очень важный закон. Расскажем об одном интересном его применении. Пусть вам нужно узнать энергию основного состояния некоторой системы, скажем атома гелия, но вы затрудняетесь решить уравнение Шредингера для волновой функции из-за большого числа переменных. Положим, однако, что вы решили попробовать какую-то волновую функцию (выбрав ее по своему желанию) и подсчитать среднюю энергию. Иначе говоря, вы пользуетесь уравнением (18.29), обобщенным на три измерения, чтобы узнать, какова была бы средняя энергия, если бы атом был на самом деле в состоянии, описываемом этой волновой функцией. Эта энергия, бесспорно, окажется выше энергии основного состояния — самой низкой энергии, какую может иметь атом. Возьмем теперь новую функцию и вычислим новую среднюю энергию. Если она ниже, чем было при первом вашем выборе, значит, вы подошли ближе к истинной энергии основного состояния. Если вы немного поразмыслите, вы, конечно, начнете пробовать такие функции, в которых есть несколько свободных параметров. Тогда энергия выразится через эти параметры. Варьируя параметры так, чтобы получить наинизшую мыслимую энергию, вы тем самым перепробуете за один раз целый класс функций. Скорее всего вы обнаружите, что понижать энергию становится все труднее и труднее, т. е. начнете убеждаться в том, что уже довольно близко подошли к наинизшей возможной энергии. Именно так и был решен атом гелия — никаких дифференциальных уравнений не решали, а составили особые функции со множеством поддающихся подгонке параметров, которые были подобраны так, чтобы дать средней энергии наинизшее значение.
§ 4. Оператор места
Каково среднее местоположение электрона в атоме? В данном состоянии |ψ> каково среднее значение координаты х? Разберем одномерный случай, а обобщение на трехмерный или на системы с большим числом частиц останется на вашу долю. Мы имеем состояние, описываемое функцией ψ(x), и продолжаем раз за разом измерять х. Что получится в среднем? Очевидно, ∫xP(x)dx, где Р(х)—вероятность обнаружить электрон в небольшом элементе длины dx возле х. Пусть плотность вероятности Р(х) меняется с х так, как показано на фиг. 18.1.
Фиг. 18.1. Кривая плотности вероятности, представляющей локализованную частицу.
Вероятнее всего вы обнаружите электрон где-то возле вершины кривой. Среднее значение х тоже придется куда-то на область невдалеке от вершины, а точнее, как раз на центр тяжести площади, ограниченной кривой.
Мы видели раньше, что P(x)=|ψ(x)|2=ψ*(x)ψ(х), значит, среднее х можно записать в виде
(18.33)
Наше уравнение для
(18.34)
где
(18.35)
и смотрим, не удастся ли найти такой оператор х, чтобы он создавал состояние |α>, при котором уравнение (18.34) не противоречит уравнению (18.33). Иначе говоря, мы должны найти такое |α>, чтобы было
(18.36)
Разложим сперва <ψ|α> по x-представлению:
(18.37)
Сравним затем интегралы в (18.36) и (18.37). Вы видите, что в х-представлении (и только в этом представлении)
(18.38)
Воздействие на |ψ> оператора ^x для получения |α> равнозначно умножению ψ(x)=
(Мы не задавались целью получить x-представление матрицы оператора ^x. Если вы честолюбивы, попытайтесь показать, что
(18.39)
Тогда вы сможете доказать поразительную формулу
(18.40)
т. е. что оператор ^x обладает интересным свойством: когда он действует на базисное состояние |x>, то это равнозначно умножению на х.)
А может, вы хотите знать среднее значение x2? Оно равно
(18.41)
Или, если желаете, можно написать и так:
где
(18.42)
Под ^x2 подразумевается ^x^x — два оператора применяются друг за другом. С помощью (18.42) можно подсчитать
§ 5. Оператор импульса
Теперь мы хотим рассчитать средний импульс электрона, опять начав с одномерного случая. Пусть Р(р)dp — вероятность того, что измерение приведет к импульсу в интервале между р и p+dp. Тогда
(18.43)
Обозначим теперь через <р|ψ> амплитуду того, что состояние |ψ> есть состояние с определенным импульсом |р>. Это та же самая амплитуда, которую в гл. 14, § 3, мы обозначали <имп.р|ψ>; она является функцией от р, как
(18.44)
Тогда получится
(18.45)
что очень похоже на то, что мы имели для
При желании можно продолжить ту же игру, которой мы предавались с
(18.46)
Теперь вы должны узнать в этом уравнении разложение амплитуды <ψ|β> — разложение по базисным состояниям с определенным импульсом. Из (18.45) следует, что состояние |β> определяется в импульсном представлении уравнением
(18.47)
Иначе говоря, теперь можно писать
(18.48)
причем
(18.49)
где оператор ^p определяется на языке p-представления уравнением (18.47).
[И опять при желании можно показать, что матричная запись ^p такова:
(18.50)
и что
(18.51)
Выводится это так же, как и для х.
Теперь возникает интересный вопрос. Мы можем написать <р>ср так, как мы это сделали в (18.45) и (18.48); смысл оператора ^p в импульсном представлении нам тоже известен. Но как истолковать ^p в координатном представлении? Это бывает нужно знать, если у нас есть волновая функция ψ(x) и мы собираемся вычислить ее средний импульс. Позвольте более четко пояснить, что имеется в виду. Если мы начнем с того, что зададим
cp уравнением (18.48), то это уравнение можно будет разложить по p-представлению и вернуться к (18.45). Если нам задано p-представление состояния, а именно амплитуда
как алгебраическая функция импульса p, то из (18.47) можно получить
и продолжить вычисление интеграла. Вопрос теперь в следующем: а что делать, если нам задано описание состояния в x-представлении, а именно волновая функция ψ(x)=
Ну что ж, начнем раскладывать (18.48) в x-представлении.
Напишем
(18.52)
Но теперь надо знать другое: как выглядит состояние |β> в x-представлении. Если мы узнаем это, мы сможем взять интеграл. Итак, наша задача — найти функцию β(x)=
(18.53)
Если нам известно <р|β>, то, решив это уравнение, мы найдем
(18.54)
Интеграл берется по х, поэтому р можно внести под интеграл
(18.55)
Теперь сравним это с (18.53). Может быть, вы подумали, что
К счастью, кто-то заметил, что интеграл в (18.55) можно проинтегрировать по частям. Производная e- ipx / ℏ по х равна (-i/ℏ)pe- ipx / ℏ , поэтому интеграл (18.55) это все равно, что
Если это проинтегрировать по частям, оно превратится в
Пока речь идет только о связанных состояниях, ψ(x) стремится к нулю при х→±∞, скобка равна нулю и мы имеем
(18.56)
А вот теперь сравним этот результат с (18.53). Вы видите, что
(18.57)
Все необходимое, чтобы взять интеграл в (18.52), у нас уже есть. Окончательный ответ таков:
(18.58)
Мы узнали, как выглядит (18.48) в координатном представлении. Перед нами начинает постепенно вырисовываться интересная картина. Когда мы задали вопрос о средней энергии состояния |ψ>, то ответ был таков:
То же самое в координатном мире записывается так:
Здесь ^ℋ — алгебраический оператор, который действует на функцию от х.
Когда мы задали вопрос о среднем значении х, то тоже обнаружили, что ответ имеет вид
В координатном мире соответствующие уравнения таковы:
Когда мы задали вопрос о среднем значении р, то ответ оказался
В координатном мире эквивалентные уравнения имели бы вид
Во всех наших трех примерах мы исходили из состояния |ψ> и создавали новое (гипотетическое) состояние с помощью квантовомеханического оператора. В координатном представлении мы генерируем соответствующую волновую функцию, действуя на волновую функцию ψ(x) алгебраическим оператором. Можно говорить о взаимнооднозначном соответствии (для одномерных задач) между
(18.59)
В этом перечне мы ввели новый символ ^℘x для алгебраического оператора (ℏ/i)∂/∂x:
(18.60)
и поставили под ^℘ значок х, чтобы напомнить, что имеем пока дело с одной только x-компонентой импульса.
Результат этот легко обобщается на три измерения. Для других компонент импульса
При желании можно даже говорить об операторе вектора импульса и писать
где ех , еy и еz — единичные векторы в трех направлениях. Можно записать это и еще изящнее:
(18.61)
Окончательный вывод наш таков: по крайней мере для некоторых квантовомеханических операторов существуют соответствующие им алгебраические операторы в координатном представлении. Все, что мы до сих пор вывели (с учетом трехмерности мира), подытожено в табл. 18.1.
Таблица 18.1. АЛГЕБРАИЧЕСКИЕ ОПЕРАТОРЫ В КООРДИНАТНОМ ПРЕДСТАВЛЕНИИ
Каждый оператор может быть представлен в двух равноценных видах:
либо
(18.62)
либо
(18.63)
Теперь мы дадим несколько иллюстраций применения этих идей. Для начала выявим связь между ^℘ и ^ℋ.
Если применить ^℘x дважды, получим
Это означает, что можно написать равенство
Или, в векторных обозначениях,
(Члены в алгебраическом операторе, над которыми нет символа оператора ^, означают простое умножение.) Это уравнение очень приятно, потому что его легко запомнить, если вы еще не забыли курса классической физики. Хорошо известно, что энергия (нерелятивистская) состоит из кинетической энергии р2/2m плюс потенциальная, а у нас ^ℋ — тоже оператор полной энергии.
Этот результат произвел на некоторых деятелей столь сильное впечатление, что они начали стремиться во что бы то ни стало вбить студенту в голову всю классическую физику, прежде чем приступить к квантовой. (Мы думаем иначе!) Параллели очень часто обманчивы. Если у вас есть операторы, то важен порядок различных множителей, а в классическом уравнении он безразличен.
В гл. 15 мы определили оператор ^pх через оператор смещения ^Dx [см. формулу (15.27)]:
(18.65)
где δ — малое смещение. Мы должны показать, что это эквивалентно нашему новому определению. В соответствии с тем, что мы только что доказали, это уравнение должно означать то же самое, что и
Но в правой части стоит просто разложение ψ(x+δ) в ряд Тэйлора, а ψ(x+δ)— то, что получится, если сместить состояние влево на δ (или сдвинуть на столько же вправо систему координат). Оба наши определения ^p согласуются!
Воспользуемся этим, чтобы доказать еще кое-что. Пусть у нас в какой-то сложной системе имеется множество частиц, которым мы присвоим номера 1, 2, 3, ... . (Для простоты остановимся на одномерном случае.) Волновая функция, описывающая состояние, является функцией всех координат х1, х2, x3,... . Запишем ее в виде ψ(x1, х2, х3, ...). Сдвинем теперь систему (влево) на δ. Новая волновая функция
может быть записана так:
(18.66)
Согласно уравнению (18.65), оператор импульса состояния |ψ> (назовем его полным импульсом) равняется
Но это все равно, что написать
(18.67)
Операторы импульса подчиняются тому правилу, что полный импульс есть сумма импульсов отдельных частей. Здесь, как видите, все чудесным образом переплетено и разные вещи взаимно согласуются.
§ 6. Момент количества движения
Для интереса рассмотрим еще одну операцию — операцию орбитального момента количества движения. В гл. 15 мы определили оператор ^Jz через ^Rz (φ) — оператор поворота на угол φ вокруг оси z. Рассмотрим сейчас систему, описываемую всего лишь одной-единственной волновой функцией ψ(r), которая является функцией одних только координат и не учитывает того факта, что спин у электрона должен быть направлен либо вверх, либо вниз. Это значит, что мы собираемся пока пренебречь внутренним моментом количества движения и намерены думать только об орбитальной части. Чтобы подчеркнуть различие, обозначим орбитальный оператор ^Lz и определим его через оператор поворота на бесконечно малый угол ε формулой
(напоминаем: это определение применимо только к состоянию |ψ>, у которого нет внутренних спиновых переменных, а есть только зависимость от координат r: х, у, z). Если мы взглянем на состояние |ψ> из новой системы координат, повернутой вокруг оси z на небольшой угол ε, то увидим новое состояние:
Если мы решили описывать состояние |ψ> в координатном представлении, т. е. с помощью его волновой функции ψ(r), то следует ожидать такого равенства:
(18.68)
Что же такое ^ℒ? А вот что. Точка Р(х, у) в новой системе координат (на самом деле х', у', но мы убрали штрихи) раньше имела координаты x-εy и y+εx (фиг. 18.2).
Фиг. 18.2. Поворот осей вокруг оси z на малый угол ε.
Поскольку амплитуда того, что электрон окажется в точке Р, не меняется от поворота системы координат, то можно писать
(напоминаем, что ε — малый угол). Это означает, что
(18.69)
Это и есть наш ответ. Обратите, однако, внимание, что это определение эквивалентно такому:
(18.70)
Или, если вернуться к нашим квантовомеханическим операторам, можно написать
(18.71)
Эту формулу легко запомнить, потому что она похожа на знакомую формулу классической механики: это z-компонента векторного произведения
(18.72)
Одна из забавных сторон манипуляций с операторами заключается в том, что многие классические уравнения переносятся в квантовомеханическую форму. А какие нет? Ведь должны же быть такие, которые не получаются, потому что если бы все повторялось, то в квантовой механике не было бы ничего отличного от классической, не было бы новой физики.
Вот вам уравнение, которое отличается. В классической физике
А что в квантовой механике?
Подсчитаем это в x-представлении. Чтобы было видно, что мы делаем, приложим это к некоторой волновой функции ψ(x). Пишем
или
Вспомним теперь, что производные действуют на всё, что справа. Получаем
(18.73)
Ответ не нуль. Вся операция попросту равнозначна умножению на -ℏ/i:
(18.74)
Если бы постоянная Планка была равна нулю, то квантовые и классические результаты стали бы одинаковыми и не пришлось бы нам учить никакой квантовой механики!
Отметим, что если два каких-то оператора А и В, взятые в сочетании
не дают нуля, то мы говорим, что «операторы не перестановочны», или «операторы не коммутируют». А уравнение наподобие (18.74) называется «перестановочным соотношением». Вы можете сами убедиться, что перестановочное соотношение для pх и у (или коммутатор рх и у) имеет вид
Существует еще одно очень важное перестановочное соотношение. Оно относится к моментам количества движения. Вид его таков:
(18.75)
Если вы хотите приобрести некоторый опыт работы с операторами ^x и ^p, попробуйте доказать эту формулу сами.
Интересно заметить, что операторы, которые не коммутируют, можно встретить и в классической физике. Мы с этим уже сталкивались, когда говорили о поворотах в пространстве. Если вы повернете что-нибудь, например книжку, сперва на 90° вокруг оси х, а затем на 90° вокруг оси у, то получится совсем не то, что было бы, если бы сначала вы повернули ее на 90° вокруг оси у, а после на 90° вокруг оси х. Именно это свойство пространства и ответственно за уравнение (18.75).
§ 7. Изменение средних со временем
Теперь мы познакомим вас с еще одной интересной вещью: вы узнаете, как средние изменяются во времени. Представим на минуту, что у нас есть оператор ^A, в который время явным образом не входит. Имеется в виду такой оператор, как ^x или ^p. [А исключаются, скажем, такие вещи, как оператор внешнего потенциала V(x, t), меняющийся во времени.] Теперь представим, что мы вычислили ср в некотором состоянии |ψ>, т. е.
(18.76)
Как ср будет зависеть от времени? Но почему оно вообще может зависеть от времени? Ну, во-первых, может случиться, что оператор сам явно зависит от времени, например, если он был связан с переменным потенциалом типа V(x, t). Но даже если оператор от t не зависит, например оператор ^A=^x, то соответствующее среднее может зависеть от времени. Ведь среднее положение частицы может перемещаться. Но как может такое движение получиться из (18.76), если А от времени не зависит? Дело в том, что во времени может меняться само состояние |ψ>. Для нестационарных состояний мы часто даже явно отмечали зависимость от времени, записывая их как |ψ(t)>. Теперь мы хотим показать, что скорость изменения ср дается новым оператором, который мы обозначим ^A. Напомним, что ^A это оператор, так что точка над А вовсе не означает дифференцирования по времени, а является просто способом записи нового оператора ^A, определяемого равенством
(18.77)
Задачей нашей будет найти оператор ^.A.
Прежде всего, нам известно, что скорость изменения состояния дается гамильтонианом. В частности,
(18.78)
Это всего-навсего абстрактная форма записи нашего первоначального определения гамильтониана
(18.79)
Если мы комплексно сопряжем это уравнение, оно будет эквивалентно
(18.80)
Посмотрим теперь, что случится, если мы продифференцируем (18.76) по t. Поскольку каждое ψ зависит от t, мы имеем
(18.81)
Наконец, заменяя производные их выражениями (18.78) и (18.80), получаем
а это то же самое, что написать
Сравнивая это уравнение с (18.77), мы видим, что
(18.82)
Это и есть то интересное соотношение, которое мы обещали; и оно справедливо для любого оператора А.
Кстати заметим, что, если бы оператор А сам зависел от времени, мы бы получили
(18.83)
Проверим (18.82) на каком-либо примере, чтобы посмотреть, имеет ли оно вообще смысл. Какой, например, оператор соответствует х? Мы утверждаем, что это должно быть
(18.84)
Что это такое? Один способ установить, что это такое — перейти в координатное представление и воспользоваться алгебраическим оператором ^ℋ. В этом представлении коммутатор равен
Если вы подействуете всем этим выражением на волновую функцию ψ(х) и вычислите везде, где нужно, производные, вы в конце концов получите
Но это то же самое, что и
так что мы обнаруживаем, что
(18.85)
или что
(18.86)
Прелестный результат. Он означает, что если среднее значение х меняется со временем, то перемещение центра тяжести равно среднему импульсу, деленному на массу m. Точно как в классической механике.
Другой пример. Какова скорость изменения среднего импульса состояния? Правила игры прежние. Оператор этой скорости равен
(18.87)
Опять все можно подсчитать в x-представлении. Напомним, что ^p обращается в d/dx, а это означает, что вам придется дифференцировать потенциальную энергию V (в ^ℋ), но только во втором слагаемом. В конце концов остается только один член, и вы получаете
или
(18.88)
Опять классический результат. Справа стоит сила, так что мы вывели закон Ньютона! Но помните — это законы для операторов, которые дают средние величины. Они не описывают в деталях, что происходит внутри атома.
Существенное отличие квантовой механики в том, что ^p^x не равно ^x^p. Они отличаются на самую малость — на маленькое число ℏ. Но все поразительные сложности интерференции волн и тому подобного проистекают из того небольшого факта, что ^x^p-^p^x не совсем нуль.
История этой идеи тоже интересна. С разницей в несколько месяцев в 1926 г. Гейзенберг и Шредингер независимо отыскали правильные законы, описывающие атомную механику. Шредингер изобрел свою волновую функцию ψ(х) и нашел уравнение для нее, а Гейзенберг обнаружил, что природу можно было бы описывать и классическими уравнениями, лишь бы хр-рх было равно ℏ/i, чего можно было добиться, определив их с помощью особого вида матриц. На нашем теперешнем языке он пользовался энергетическим представлением и его матрицами. И то и другое — и матричная алгебра Гейзенберга и дифференциальное уравнение Шредингера — объясняли атом водорода. Несколькими месяцами позднее Шредингер смог показать, что обе теории эквивалентны — мы только что это видели. Но две разные математические формы квантовой механики были открыты независимо.
Глава 19 УРАВНЕНИЕ ШРЕДИНГЕРА В КЛАССИЧЕСКОМ КОНТЕКСТЕ. СЕМИНАР ПО СВЕРХПРОВОДИМОСТИ
§ 1. Уравнение Шредингера в магнитном поле
Эту лекцию я читаю вам для развлечения. Захотелось посмотреть, что получится, если начать читать в немного ином стиле. В курс она не входит, и не думайте, что это попытка обучить вас в последний час чему-то новому. Я скорее воображаю, будто провожу семинар или будто делаю отчет об исследованиях перед более подготовленной аудиторией, перед людьми, которые в квантовой механике уже многое понимают. Основное различие между семинаром и регулярной лекцией в том, что на семинаре докладчик не приводит все стадии, всю алгебру выкладок. Он просто говорит: «Если вы проделаете то-то и то-то, то получится вот что», а в детали не входит. Вот и в этой лекции будут только высказываться идеи и приводиться результаты расчетов. А вы должны понимать, что вовсе не обязательно во всем немедленно и до конца разбираться, надо только верить, что если проделать все выкладки, то все так и получится.
Но это не все. Главное — что об этом мне хочется говорить. Это такая свежая, актуальная, современная тема, что вполне законно вынести ее на семинар. Тема эта — классический аспект уравнения Шредингера, явление сверхпроводимости.
Обычно та волновая функция, которая появляется в уравнении Шредингера, относится только к одной или к двум частицам. И сама волновая функция классическим смыслом не обладает в отличие от электрического поля, или векторного потенциала, или других подобных вещей. Правда, волновая функция отдельной частицы — это «поле» в том смысле, что она есть функция положения, но классического значения она, вообще говоря, не имеет. Тем не менее бывают иногда обстоятельства, в которых квантовомеханическая волновая функция действительно имеет классическое значение, именно их я и хочу коснуться. Своеобразие квантовомеханического поведения вещества в мелких масштабах обычно не дает себя чувствовать в крупномасштабных явлениях, если не считать стандартных выводов о том, что оно вызывает к жизни законы Ньютона, законы так называемой классической механики. Но существуют порой обстоятельства, в которых особенности квантовой механики могут особым образом сказаться в крупномасштабных явлениях.
При низких температурах, когда энергия системы очень-очень сильно убывает, вместо прежнего громадного количества состояний в игру включается только очень-очень малое количество состояний — тех, которые расположены неподалеку от основного. При таких условиях квантовомеханический характер этого основного состояния может проявиться на макроскопическом уровне. Вот целью этой лекции и будет продемонстрировать связь между квантовой механикой и крупномасштабными эффектами — не обычное обсуждение пути, по которому квантовая механика в среднем воспроизводится ньютоновой механикой, а специальный случай, когда квантовая механика вызывает свои собственные, характерные для нее эффекты в крупных, «макроскопических» размерах.
Начну с того, что напомню вам кое-какие свойства уравнения Шредингера. Я хочу с помощью уравнения Шредингера описать поведение частицы в магнитном поле, потому что явления сверхпроводимости связаны с магнитными полями. Внешнее магнитное поле описывается векторным потенциалом, и вопрос состоит в том, каковы законы квантовой механики в поле векторного потенциала. Принцип, определяющий квантовомеханическое поведение частицы в поле векторного потенциала, очень прост.
Фиг. 19.1. Амплитуда перехода из а в b по пути r пропорциональна exp[(-iq/ℏ)∫Ads].
Амплитуда того, что частица при наличии поля перейдет по некоторому пути из одного места в другое (фиг. 19.1), равна амплитуде того, что она прошла бы по этому пути без поля, умноженной на экспоненту от криволинейного интеграла от векторного потенциала, умноженного в свою очередь на электрический заряд и деленного на постоянную Планка [см. гл. 15, § 2 (вып. 6)]:
(19.1)
Это исходное утверждение квантовой механики.
И вот в отсутствие векторного потенциала уравнение Шредингера для заряженной частицы (нерелятивистской, без спина) имеет вид
(19.2)
где φ — электрический потенциал, так что qφ — потенциальная энергия. А уравнение (19.1) равнозначно утверждению, что в магнитном поле градиенты в гамильтониане нужно каждый раз заменять на градиент минус (iq/ℏ)А, так что (19.2) превращается в
(19.3)
Это и есть уравнение Шредингера для частицы с зарядом q (нерелятивистской, без спина), движущейся в электромагнитном поле А, φ.
Чтобы стало ясно, что оно правильно, я хочу проиллюстрировать это простым примером, когда вместо непрерывного случая имеется линия атомов, расставленных на оси x на расстоянии b друг от друга, и существует амплитуда —К того, что электрон перепрыгнет в отсутствие поля от одного атома к другому. Тогда, согласно уравнению (19.1), если имеется вектор-потенциал Аx (х, t) в x-направлении, то амплитуда перескока по сравнению с тем, что было раньше, изменится, ее придется домножить на exp[(iq/ℏ)Ax b] — экспоненту с показателем, равным произведению iq/ℏ на векторный потенциал, проинтегрированный от одного атома до другого. Для простоты мы будем писать (q/ℏ)Ax ≡f(x), поскольку Ах , вообще говоря, зависит от х. Если обозначить через С(х)≡Сn амплитуду того, что электрон обнаружится возле атома n, расположенного в точке х, то скорость изменения этой амплитуды будет даваться уравнением
(19.4)
В нем три части. Во-первых, у электрона, который находится в точке х, есть некоторая энергия Е0. Это, как обычно, дает член Е0С(х). Затем имеется член — КС(х+b), т. е. амплитуда того, что электрон от атома n+1, расположенного в х+b, отпрыгнул на шаг назад. Однако если это происходит в присутствии векторного потенциала, то фаза амплитуды обязана сместиться согласно правилу (19.1). Если Ах на расстоянии между соседними атомами заметно не изменяется, то интеграл можно записать попросту в виде значения Ах посредине, умноженного на расстояние. Итак, произведение (iq/ℏ) на интеграл равно ibf(x+b/2). А раз электрон прыгал назад, я этот сдвиг фазы отмечаю знаком минус. Это дает вторую часть. И точно так же имеется некоторая амплитуда того, что будет прыжок вперед, но на этот раз уже берется векторный потенциал с другой стороны от х, на расстоянии b/2, и умножается на расстояние b. Это дает третью часть. В сумме получается уравнение для амплитуды того, что частица в поле, характеризуемом векторным потенциалом, окажется в точке х.
Но дальше мы знаем, что если функция С(х) достаточно плавная (мы берем длинноволновый предел) и если мы сдвинем атомы потеснее, то уравнение (14.4) будет приблизительно описывать поведение электрона в пустоте. Поэтому следующим шагом явится разложение обеих сторон (19.4) по степеням b, считая b очень малым. К примеру, если b=0, то правая часть будет равна просто (Е0-2К)С(х), так что в нулевом приближении энергия равняется Е0-2К. Затем пойдут степени b, но из-за того, что знаки показателей экспонент противоположны, останутся только четные степени. В итоге, если вы разложите в ряд Тэйлора С(х), f(x) и экспоненты и соберете затем члены с b2, вы получите
(19.5)
(штрихи обозначают дифференцирование по х).
Это ужасное нагромождение разных букв выглядит очень сложно. Но математически оно в точности совпадает с
(19.6)
Вторая скобка, действуя на С(х), даст С'(х) минус if(x)C(x). Первая скобка, действуя на эти два члена, даст член с С", члены с первыми производными f(x) и с первой производной С(х). А теперь вспомните, что решения в нулевом магнитном поле (см. гл. 11, §3) изображают частицу с эффективной массой mэфф, даваемой формулой
Если вы затем положите Е0=+2К и снова вернетесь к f(x)=(q/ℏ)Ax , то легко убедитесь, что (19.6) это то же самое, что первая часть (19.3). (Происхождение члена с потенциальной энергией хорошо известно, и я не буду им заниматься.) Утверждение (19.1) о том, что векторный потенциал умножает все амплитуды на экспоненциальный множитель, равнозначно правилу, что оператор импульса (ℏ/i)∇ заменяется на (ℏ/i)∇-qA, как мы и сделали в уравнении Шредингера (19.3).
§ 2. Уравнение непрерывности для вероятностей
Перехожу теперь ко второму пункту. Важную сторону уравнения Шредингера отдельной частицы составляет идея о том, что вероятность обнаружить частицу в каком-то месте определяется квадратом абсолютной величины волновой функции. Для квантовой механики характерно также то, что вероятность сохраняется локально (т. е. в каждом отдельном месте). Когда вероятность обнаружить электрон в таком-то месте убывает, а вероятность обнаружить его в каком-то другом месте возрастает (так что полная вероятность не меняется), то что-то в промежутке между этими местами должно было произойти. Иными словами, электрон обладает непрерывностью в том смысле, что если вероятность спадает в одном месте и возрастает в другом, то между этими местами должно что-то протекать. Так, если вы между ними поставите стенку, то это скажется на вероятностях и они станут не такими, как были. Следовательно, одно только сохранение вероятности не есть полная формулировка закона сохранения, все равно как одно только сохранение энергии не обладает такой глубиной и не представляет такой важности, как локальное сохранение энергии [см. гл. 27, § 1 (вып. 6)]. Если энергия исчезает, то этому должен соответствовать отток энергии от этого места. Вот и у вероятности хотелось бы обнаружить такой же «ток». Хотелось бы, чтобы было так: если где-нибудь переменится плотность вероятности (вероятность обнаружить что-то там такое в единице объема), то чтобы можно было считать, что вероятность откуда-то сюда притекла (или утекла отсюда куда-то еще). Такой ток был бы вектором, который можно было бы толковать следующим образом: его x-компонента была бы чистой вероятностью (в секунду и на единицу объема) того, что частица пройдет в направлении х через плоскость, параллельную плоскости yz. Проход в направлении +x считается положительным потоком, а проход в обратную сторону — отрицательным потоком.
Существует ли такой ток? Вы знаете, что плотность вероятности P(r, t) выражается через волновую функцию
(19.7)
И вот, я спрашиваю: существует ли такой ток J, что
(19.8)
Если я продифференцирую (19.7) по времени, то получу два слагаемых
(19.9)
Теперь для ∂ψ/∂t возьмите уравнение Шредингера — уравнение (19.3); кроме того, комплексно его сопрягите, т. е. перемените знак при каждом i, чтобы получить ∂ψ*/∂t. У вас выйдет
(19.10)
Члены с потенциальной энергией и многие другие члены взаимно уничтожатся. А то, что останется, оказывается, действительно можно записать в виде полной дивергенции. Все уравнение целиком эквивалентно уравнению
(19.11)
Не так уж сложно, как кажется на первый взгляд. Это симметричная комбинация из ψ*, умноженного на некоторую операцию над ψ, плюс ψ, умноженное на комплексно сопряженную операцию над ψ*. Это просто некоторая величина плюс комплексно сопряженная ей величина, так что все вместе (как и положено быть) вещественно. Операция запоминается так: это попросту оператор импульса ^℘ минус qA.. Ток из (19.8) я могу записать в виде
(19.12)
Тогда это и есть тот ток J, который удовлетворяет уравнению (19.8).
Уравнение (19.8) показывает, что вероятность сохраняется локально. Если частица исчезает из одной области, то она не может оказаться в другой без того, чтобы что-то не протекло в промежутке между областями. Вообразите, что первая область окружена замкнутой поверхностью, которая проведена так далеко, что имеется нулевая вероятность обнаружить на ней электрон. Полная вероятность обнаружить электрон где-то внутри поверхности равна объемному интегралу от Р. Но, согласно теореме Гаусса, объемный интеграл от дивергенции J равняется поверхностному интегралу от J. Если ψ на поверхности равно нулю, то (19.12) утверждает, что и J есть нуль; значит, полная вероятность отыскать частицу внутри поверхности не может измениться. Только тогда, когда часть вероятности достигает границы, какая-то ее часть может вытечь наружу. Мы вправе говорить, что она выбирается наружу только через поверхность— это и есть локальная сохраняемость.
§ 3. Два рода импульсов
Уравнение для тока довольно интересно, хотя порой причиняет немало забот. Ток можно было бы считать чем-то вроде произведения плотности частиц на скорость. Плотность выглядела бы как ψψ*, так что здесь все в порядке. Каждый член в (19.12) напоминает типичное выражение для среднего значения оператора
(19.13)
Поэтому, быть может, следовало бы рассматривать его как скорость потока? Но тогда получается, что скорость с импульсом можно связать двояким образом, ведь с равным правом можно было бы считать, что скоростью должно быть отношение импульса к массе ^℘/m. Эти две возможности разнятся на вектор-потенциал.
Оказывается, те же две возможности имелись еще в классической физике, и в ней тоже было найдено, что импульс можно определить двумя путями. Один можно назвать «кинематическим импульсом», но для абсолютной ясности я в этой лекции буду его называть «mv-импульсом». Это импульс, получаемый от перемножения массы на скорость. Другой, более математичный, более отвлеченный импульс, именуемый иногда «динамическим импульсом», а я его буду называть «р-импульс». Итак, у нас есть две возможности:
(19.14)
(19.15)
И вот оказывается, что в квантовой механике, включающей магнитные поля, с оператором градиента ^℘ связан именно р-импульс, так что оператор скорости это (19.13).
Здесь я хотел бы немного отклониться от темы и пояснить, почему так получается—отчего в квантовой механике должно быть нечто похожее на (19.15). Волновая функция меняется со временем, следуя уравнению Шредингера (19.3). Если бы я внезапно изменил векторный потенциал, то в первое мгновение волновая функция не изменилась бы, а изменилась бы только скорость ее изменения. Теперь представьте себе, что случится в следующих обстоятельствах. Пусть имеется длинный соленоид, в котором я создаю поток магнитного поля (поля В), как показано на фиг. 19.2.
Фиг. 19.2. Электрическое поле снаружи соленоида, ток в котором увеличивается.
А поблизости сидит заряженная частица. Допустим, что этот поток почти мгновенно с нуля вырастает до какого-то значения. Сперва векторный потенциал равен нулю, а потом я его включаю. Это означает, что я внезапно создаю круговой вектор-потенциал А. Вы помните, что криволинейный интеграл от А вдоль петли это то же самое, что поток поля В сквозь петлю [см. гл. 14, § 1 (вып. 5)]. И что же происходит, когда я мгновенно включаю векторный потенциал? Согласно квантовомеханическому уравнению, внезапное изменение А не вызывает внезапного изменения ψ; волновая функция пока та же самая. Значит, и градиент не изменился.
Но вспомните, что происходит электрически, когда я внезапно включаю поток. В течение краткого времени, пока поток растет, возникает электрическое поле, контурный интеграл от которого равен скорости изменения потока во времени
(19.16)
Если поток резко меняется, то электрическое поле достигает огромной величины и оказывает сильное воздействие на частицу. Эта сила равна произведению заряда на электрическое поле; стало быть, в момент появления потока частица получает полный импульс (т. е. изменение в mv), равный -qА. Иными словами, если вы подействуете на заряд векторным потенциалом, включив его внезапно, то этот заряд немедленно схватит mv-импульс, равный -qА. Но имеется нечто, не меняющееся немедленно,— это разность между mv и -qА. Стало быть, сумма p=mv+qA и есть то, что не меняется, если вы подвергаете вектор-потенциал внезапному изменению. Именно эту величину мы именуем p-импульсом, именно она играет важную роль в классической динамике; она же оказывается существенной и в квантовой механике. Эта величина зависит от характера волновой функции и является преемником оператора
при наличии магнитного поля.
§ 4. Смысл волновой функции
Когда Шредингер впервые открыл свое уравнение, он открыл заодно, что закон сохранения (19.8) есть следствие этого уравнения. Но он неправильно решил, что Р это плотность электрического заряда электрона, а J — плотность электрического тока, т. е. он думал, что электроны взаимодействуют с электромагнитным полем через эти заряды и токи. Решая свои уравнения для атома водорода и вычисляя ψ, он не вычислял никакой амплитуды (в то время еще не было амплитуд), а толковал это совершенно иначе. Атомное ядро было стационарно, вокруг же него текли токи; заряды Р и токи J генерировали электромагнитные поля, и все вместе это излучало свет. Но вскоре, решая задачу за задачей, он понял, что рассуждает не вполне правильно. И именно в этот момент Борн выдвинул весьма нетривиальную идею. Именно Борн правильно (насколько нам известно) отождествил ψ в уравнении Шредингера с амплитудой вероятности, предположив, что квадрат амплитуды — это не плотность заряда, а всего лишь вероятность (на единицу объема) обнаружить там электрон и что если вы находите электрон в некотором месте, то там окажется и весь его заряд. Вся эта идея принадлежит Борну.
Волновая функция ψ(r) электрона в атоме не описывает, стало быть, размазанного электрона с плавно меняющейся плотностью заряда. Электрон может быть либо здесь, либо там, либо где-то еще, но где бы он ни был, он всегда—точечный заряд. Но, с другой стороны, представим себе случай, когда огромное число частиц находится в одном и том же состоянии, очень большое их число с одной и той же волновой функцией. Что тогда? Одна из них будет здесь, другая — там, и вероятность обнаружить любую из них в данном месте пропорциональна ψψ*. Но поскольку частиц так много, то, если я посмотрю в какой-нибудь объем dxdydz, я, вообще говоря, обнаружу там примерно ψψ*dxdydz частиц. Итак, когда ψ— волновая функция каждой из огромного количества частиц, поголовно пребывающих в одном и том же состоянии, то в этом случае ψψ* можно отождествлять с плотностью частиц. Если в этих условиях все частицы несут одинаковые заряды q, то мы можем пойти дальше и отождествить ψ*ψ с плотностью электричества. Обычно, если ψψ* имеет размерность плотности вероятности, то ψψ* надо умножить на q, чтобы получить размерность плотности заряда. Для наших теперешних целей мы можем включить этот постоянный множитель в ψ и принять за плотность электрического заряда само ψψ*. Если помнить об этом, то ^J (тот ток вероятности, который я вычислил) можно будет считать просто плотностью электрического тока.
Итак, когда в одном и том же состоянии может находиться очень много частиц, возможно иное физическое толкование волновых функций. Плотность заряда и электрический ток могут быть вычислены прямо из волновых функций, и волновые функции приобретают физический смысл, который распространяется на классические, макроскопические ситуации.
Нечто подобное может случиться и с нейтральными частицами. Если у нас имеется волновая функция отдельного фотона, то это — амплитуда того, что он будет обнаружен где-то. Хотя мы и не писали его, однако существует уравнение для фотонной волновой функции, аналогичное уравнению Шредингера для электрона. Фотонное уравнение попросту совпадает с уравнениями Максвелла для электромагнитного поля, а волновая функция — с векторным потенциалом А. Волновая функция оказывается обычным векторным потенциалом. Физика квантов света совпадает с классической физикой, потому что фотоны суть невзаимодействующие бозе-частицы и многие из них могут пребывать в одинаковом состоянии; более того, как вы знаете, они любят бывать в одинаковом состоянии. В момент, когда мириады их окажутся в одном и том же состоянии (т. е. в одной и той же электромагнитной волне), вы сможете непосредственно измерить волновую функцию (т. е. векторный потенциал). Конечно, исторически все шло иным путем. Первые наблюдения были проведены при таких обстоятельствах, когда было много фотонов в одинаковом состоянии, и тем самым удалось открыть правильные уравнения для отдельного фотона, наблюдая непосредственно своими глазами природу волновой функции на макроскопическом уровне.
Трудность с электроном состоит в том, что вы не можете поместить в одно и то же состояние больше одного электрона. Поэтому очень долго считалось, что волновая функция уравнения Шредингера никогда не будет иметь макроскопического представления, подобного макроскопическому представлению амплитуды для фотонов. Но теперь стало ясно, что явление сверхпроводимости представляет именно такой случай.
§ 5. Сверхпроводимость
Вы знаете, что очень многие металлы ниже определенной температуры (температура у каждого металла своя) становятся сверхпроводящими. Если вы как следует снизите температуру то металлы начинают проводить электричество без всякого сопротивления. Это явление наблюдалось у очень многих металлов, но не у всех, и теория этого явления причинила немало хлопот. Понадобилось довольно долгое время, чтобы разобраться, что происходит внутри сверхпроводников, и я опишу здесь только то, что будет нужно для наших нынешних целей. Оказывается, что из-за взаимодействия электронов с колебаниями атомов в решетке возникает слабое эффективное притяжение между электронами. Грубо говоря, электроны в итоге взаимодействия образуют связанные пары.
Известно также, что каждый отдельный электрон является ферми-частицей. Но связанная пара уже будет вести себя как бозе-частица, потому что, если я переставляю местами два электрона в паре, я дважды меняю знак волновой функции, а это означает, что я ничего не меняю. Пара является бозе-частицей.
Энергия спаривания (энергия притяжения электронов) очень-очень слаба. Незначительной температуры достаточно, чтобы тепловое возбуждение разбросало электроны и обратило их в «нормальные» электроны. Но если снизить температуру достаточно сильно, то эти электроны сделают все от них зависящее, чтобы прийти в самое наинизшее состояние, и уж тогда-то действительно разберутся попарно.
Мне не хотелось бы, чтобы вы вообразили, будто пары и впрямь скреплены очень тесно, словно точечные частицы. В действительности, именно в этом пункте лежала наибольшая трудность в понимании этого явления на первых порах. Два электрона, образующие пару, в действительности расходятся на заметные расстояния; и среднее расстояние между парами меньше размера отдельной пары. Несколько пар одновременно занимают один и тот же объем. Объяснение причины образования электронами в металле пар и оценка энергии, выделяемой при образовании пар, стало триумфом современной науки. Этот фундаментальный факт в явлении сверхпроводимости впервые разъяснен в теории, созданной Бардином, Купером и Шриффером. Но не это будет темой нашего семинара. Мы попросту примем как данное представление о том, что электроны так или иначе действуют попарно, что можно считать, что эти пары ведут себя более или менее как частицы и что поэтому можно говорить о волновой функции «пары».
Уравнение Шредингера для пары более или менее похоже на (19.3). Единственная разница состоит в том, что заряд q будет удвоенным зарядом электрона. Кроме того, мы не знаем инерции (или эффективной массы) пары в кристаллической решетке, поэтому неизвестно, какое число поставить вместо m. Не следует также считать, что если перейти к очень высоким частотам (или коротким волнам), то форма уравнения останется правильной, ведь кинетическая энергия, которая отвечает очень резко меняющимся волновым функциям, может стать столь большой, что разрушит пары. При конечных температурах в соответствии с теорией Больцмана всегда встречается сколько-то разрушенных пар. Вероятность того, что пара разрушится, пропорциональна ехр(-Eпары /kT). Не связанные попарно электроны называются «нормальными» и движутся по кристаллу обычным образом. Я буду, однако, рассматривать только случай истинно нулевой температуры или, во всяком случае, пренебрегу усложнениями, вызываемыми теми электронами, у которых нет пары.
Раз пары электронов—это бозоны, то когда множество их собирается в одном состоянии, амплитуда перехода других пар в то же состояние становится особенно велика. Значит, почти все пары должны скопиться при наинизшей энергии в точности в одинаковом состоянии, сбежать кому-либо из них в другое состояние очень нелегко. У каждой пары амплитуда того, что она перейдет в занятое состояние в √n раз больше, чем в незанятое (где хорошо известный фактор √n определяется населенностью n наинизшего состояния). Значит, мы вправе ожидать, что все пары будут двигаться в одном состоянии.
Как же тогда будет выглядеть наша теория? Я обозначу через ψ волновую функцию пары в наинизшем энергетическом состоянии. Однако из-за того, что ψψ* окажется пропорциональным плотности заряда ρ, я с равным правом могу записать ψ как квадратный корень из плотности заряда, умноженный на некоторый фазовый множитель
(19.17)
где ρ и θ — действительные функции от r. (В таком виде можно, конечно, записать любую комплексную функцию.) Что мы подразумеваем, говоря о плотности заряда,— это ясно, но каков физический смысл фазы θ волновой функции? Ну что же, давайте поглядим, что получится, если мы подставим ψ(r) в (19.12) и выразим плотность тока через эти новые переменные ρ и θ. Это простая замена переменных, и, не повторяя всех выкладок, я приведу результат:
(19.18)
Поскольку и плотность тока и плотность заряда имеют для сверхпроводящего электронного газа прямой физический смысл, то и ρ и θ — вполне реальные вещи. Фаза столь же наблюдаема, как и ρ: это часть плотности тока J. Абсолютная фаза ненаблюдаема, но если градиент фазы известен во всех точках, то фаза известна с точностью до константы. И если вы определите по своему желанию фазу в одной точке, то во всех остальных точках она уже определится сама собой.
Кстати заметим, что уравнение для тока можно проанализировать и изящнее, если представить себе, что плотность тока и впрямь совпадает с произведением плотности заряда на скорость тока электронной жидкости, т. е. что J=ρv. Тогда (19.18) равнозначно уравнению
(19.19)
Мы замечаем, что в mv-импульсе есть две части: одна связана с векторным потенциалом, а другая с поведением волновой функции. Иными словами, величина ℏ∇θ— это как раз то, что мы называли р-импульсом.
§ 6. Явление Мейсснера
Теперь уже можно кое-что рассказать и о явлении сверхпроводимости. Прежде всего здесь отсутствует электрическое сопротивление. А нет сопротивления оттого, что все электроны коллективно пребывают в одинаковом состоянии. При обычном течении тока то один электрон, то другой выбивается из равномерного потока, постепенно разрушая полный импульс. Здесь же не так-то просто помешать одному электрону делать то, что делают другие, ибо все бозе-частицы стремятся попасть в одинаковое состояние. Ток, если уж он пошел, то это навеки.
Легко также понять, что если имеется кусок металла в сверхпроводящем состоянии и вы включите не очень сильное магнитное поле (что будет, когда оно сильное, мы обойдем молчанием), то оно не сможет проникнуть в металл. Если бы в момент создания магнитного поля хоть какая-то его часть возросла внутри металла, то в нем появилась бы скорость изменения потока, а в результате и электрическое поле, которое в свою очередь немедленно вызвало бы электрический ток, который, по закону Ленца, был бы направлен на уменьшение потока. А раз все электроны будут двигаться совместно, то бесконечно малое электрическое поле уже вызовет достаточный ток, чтобы полностью воспротивиться наложению любого магнитного поля. Значит, если вы включите поле после того как охладили металл до сверхпроводящего состояния, внутрь оно допущено ни за что не будет.
Еще интереснее другое связанное с этим явление, экспериментально обнаруженное Мейсснером. Если имеется кусок металла при высокой температуре (т. е. обычный проводник) и в нем вы создали магнитное поле, а затем снизили температуру ниже критического уровня (когда металл становится сверхпроводником), то поле будет вытолкнуто. Иными словами, в сверхпроводнике возникает свой собственный ток, и как раз в таком количестве, чтобы вытолкнуть поле наружу.
Причину этого можно понять из уравнений, и сейчас я объясню как. Пусть у нас имеется сплошной кусок сверхпроводящего материала (без отверстий). Тогда в любом установившемся положении дивергенция тока должна быть равна нулю, потому что ему некуда течь. Удобно будет выбрать дивергенцию А равной нулю. (Конечно, полагалось бы объяснить, отчего принятие этого соглашения не означает потери общности, но я не хочу тратить на это время.) Если взять дивергенцию от уравнения (19.18), то в итоге окажется, что лапласиан от θ должен быть равен нулю. Но погодите, а как же с вариацией ρ? Я забыл упомянуть об одном важном пункте. В металле существует фон положительных зарядов (из-за наличия атомных ионов решетки). Если плотность заряда ρ однородна, то не будет ни остаточного заряда, ни электрического поля. Если бы в каком-то месте электроны и скопились, то их заряд не был бы нейтрализован и возникло бы сильнейшее отталкивание, которое растолкало бы электроны по всему металлу. Значит, в обычных обстоятельствах плотность электронного заряда в сверхпроводниках почти идеально однородна, и я вправе считать ρ постоянным. Далее, единственная возможность, чтобы ∇2θ было равно нулю всюду внутри сплошного куска металла,— это постоянство θ. А это означает, что в J не входит член с р-импульсом. Согласно выражению (19.18), ток пропорционален ρ, умноженному на А. Значит в куске сверхпроводящего материала ток с необходимостью будет пропорционален вектор-потенциалу
(19.20)
Знаки ρ и q одинаковы (отрицательны), и поскольку ρ — величина постоянная, то я могу положить ρq/m=-(некоторая постоянная). Тогда
(19.21)
Это уравнение впервые предложили братья Лондон, чтобы объяснить экспериментальные наблюдения над сверхпроводимостью, задолго до того, как люди уяснили себе квантовомеханическое происхождение эффекта.
Мы теперь можем подставить (19.20) в уравнения электромагнетизма и определить поля. Векторный потенциал связан с плотностью тока уравнением
(19.22)
Если вместо J я подставлю (19.21), то получу
(19.23)
где λ2—просто новая постоянная
(19.24)
Теперь можно попробовать решить это уравнение относительно А и детальнее посмотреть, что там происходит. Например, в одномерном случае у (19.23) имеются экспоненциальные решения вида е-λ x и е+λ х . Эти решения означают, что векторный потенциал обязан экспоненциально убывать по мере удаления от поверхности внутрь образца. (Возрастать он не может — будет взрыв.) Если кусок металла очень велик по сравнению с 1/λ, то поле проникнет внутрь только в тонкий слой у поверхности толщиной около 1/λ. Все остальное место внутри проводника будет свободно от поля, как показано на фиг. 19.3.
Фиг. 19.3. Сверхпроводящий цилиндр в магнитном поле (а) и магнитное поле В как функция от r (б).
Этим и объясняется явление Мейсснера.
Какова же эта «глубина проникновения» 1/λ? Вы помните, что r0 — «электромагнитный радиус» электрона (2,8·10-13см) — выражается формулой
Вы помните также, что q вдвое больше заряда электрона, так что
Записав ρ в виде qe N, где N — число электронов в кубическом сантиметре, мы получим
(19.25)
У такого металла, как свинец, на каждый кубический сантиметр приходится 3·1022 атомов, и если каждый атом снабдит нас одним электроном проводимости, то 1/λ будет порядка 2·10-5 см. Это дает вам порядок величины эффекта.
§ 7. Квантование потока
Уравнение Лондонов (19.21) было предложено, чтобы объяснить наблюдавшиеся при сверхпроводимости явления, включая эффект Мейсснера. Однако в последнее время прозвучали и более поразительные предсказания. Одно из предсказаний Лондонов было таким своеобразным, что никто даже не обратил на него особого внимания. Об этом я и расскажу. На сей раз возьмем сверхпроводящее кольцо, толщина которого по сравнению с 1/λ велика, и посмотрим, что случится, если мы сперва наложим на кольцо магнитное поле, затем охладим кольцо до сверхпроводящего состояния, а потом уберем первоначальный источник поля В. Последовательность этих событий изображена на фиг. 19.4.
Фиг. 19,4. Кольцо в магнитном поле. а — в нормальном, состоянии; б — в сверхпроводящем состоянии; в — после того, как внешнее поле убрали.
В нормальном состоянии (фиг. 19.4,а) в теле кольца имеется магнитное поле. Когда кольцо становится сверхпроводящим, поле (как мы уже знаем) выталкивается из вещества кольца. Но тогда, как показано на фиг. 19.4,б, останется некоторый поток поля сквозь отверстие кольца. Если теперь убрать внешнее поле, то те линии поля, которые шли через отверстие, будут «заморожены» (фиг. 19.4,в). Поток Ф через центр сойти на нет не может, потому что ∂Ф/∂t должно быть все время равно контурному интегралу от Е вдоль кольца, а Е внутри сверхпроводника равно нулю. И вот, когда мы убираем внешнее поле, то по кольцу начинает течь сверхпроводящий ток, цель которого — сохранить поток через кольцо неизменным. (Это старая идея о вихревых токах, только с нулевым сопротивлением.) Но все эти токи будут течь только у самой поверхности (на глубине не более 1/λ), что следует из такого же анализа, как и проделанный для сплошного куска. Эти токи в состоянии сделать так, чтобы магнитное поле не попадало внутрь кольца, но зато все время держалось вокруг него.
Но здесь имеется существенное различие, и наши уравнения предсказывают поразительный эффект. Рассуждение о том, что фаза θ в сплошном куске должна быть постоянной, к кольцу неприменимо; в этом вам помогут убедиться следующие рассуждения.
Далеко в глубине тела кольца плотность тока J равна нулю; значит, (19.18) означает, что
(19.26)
Теперь посмотрим, что получится, если мы возьмем контурный интеграл от А по кривой Г, которая проходит по самому центру поперечного сечения кольца, нигде не подходя близко к поверхности (фиг. 19.5).
Фиг. 19.5. Кривая Г внутри сверхпроводникового кольца.
Из (19.26)
(19.27)
Вы знаете, что контурный интеграл от А по любой петле равен потоку В через петлю
Стало быть, уравнение (19.27) превращается в
(19.28)
Криволинейный интеграл от одной точки до другой (скажем, от точки 1 до точки 2) от градиента равен разности значений функции в этих двух точках:
Если начать сближать точки 1 и 2, чтобы петля стала замкнутой, то на первый взгляд могло бы показаться, что θ1 станет равно θ2, так что интеграл в (19.28) обратится в нуль. Так оно и было бы для замкнутых петель в односвязном куске сверхпроводника, но для кольцеобразного куска это не обязательно. Единственное физическое требование, которое мы вправе предъявить, это чтобы в каждой точке волновая функция могла принимать только одно значение. Что бы ни делала фаза θ, когда вы движетесь по кольцу, но когда вы возвращаетесь к начальной точке, фаза θ обязана обеспечить вам прежнее значение волновой функции ψ=√(ρeiθ). Так будет, если θ меняется на 2πn, где n — любое целое число. Итак, если мы делаем один полный оборот вокруг кольца, то левая часть (19.27) должна быть равна ℏ·2πn. Подставляя сюда (19.28), получаем
(19.29)
Захваченный поток всегда обязан быть кратным числу 2πℏ/q! Если бы кольцо было классическим объектом с идеальной (т. е. бесконечной) проводимостью, то можно было бы подумать, что в кольце обязан остаться весь проходивший через него поток, какой бы величины он ни был, т. е. можно заморозить любое количество потока. Но квантовомеханическая теория сверхпроводимости утверждает, что поток может быть либо нулем, либо 2πℏ/q, либо 4πℏ/q, либо 6πℏ/q и т. д., но только не промежуточным числом! Он обязан быть кратным фундаментальной квантовомеханической константе.
Лондон предсказывал, что поток, захватываемый сверхпроводящим кольцом, окажется квантованным и допустимая величина потока будет дана уравнением (19.29), где q=qe — заряду электрона. Согласно Лондону, фундаментальная единица потока должна быть равна 2πℏ/qе, т. е. около 4·10-7гс·см2. Чтобы представить себе эту величину, вообразите тонкий цилиндрик толщиной в одну десятую долю миллиметра; магнитное поле внутри него, если он содержит такую величину потока, составит около одного процента магнитного поля Земли. С помощью чувствительных магнитных измерений такой поток можно зарегистрировать.
В 1961 г. Дивер и Фейрбэнк из Станфордского университета предприняли поиски такого квантованного потока и нашли его; примерно в то же время это проделали Долл и Набауэр в Германии.
В опыте Дивера и Фейрбэнка сверхпроводящий цилиндрик был изготовлен электроосаждением тонкого слоя олова на кусочке медной проволоки диаметром 1,3·10-3 см (длиной 1 см). Ниже 3,8° К олово становится сверхпроводящим, а медь остается нормальным металлом. Проволока была помещена в небольшое регулируемое магнитное поле и температура снижалась до тех пор, пока олово не стало сверхпроводником. Затем убрали внешний источник поля. Вы понимаете, что по закону Ленца это вызвало появление тока, стремившегося погасить эффект убывания потока внутри цилиндра. Цилиндрик приобрел магнитный момент, пропорциональный потоку внутри него. Этот магнитный момент измеряли, для чего водили проволочкой вверх и вниз (как иглой в швейной машинке, но со скоростью 100 раз в секунду) внутри пары маленьких катушечек, помещенных у концов оловянного цилиндрика. Мерой магнитного момента было наводимое в катушках напряжение.
Дивер и Фейрбэнк, проделав свой опыт, обнаружили, что поток действительно квантуется, но фундаментальная единица равна половине той, которую предсказал Лондон. Тот же результат получили Долл и Набауэр. Сперва это выглядело очень таинственно, но теперь стало ясно, отчего так вышло. Согласно теории сверхпроводимости Бардина, Купера и Шриффера, то q, которое стоит в (19.29), это заряд пары электронов, т. е. равно 2qe . Фундаментальная единица потока равна
(19.30)
т. е. равна половине того, что было предсказано Лондоном. Теперь все сходится, и измерения свидетельствуют о существовании предсказанного чисто квантовомеханического, но крупномасштабного явления.
§ 8. Динамика сверхпроводимости
Эффект Мейсснера и квантование потока подтверждают наши общие представления. Для полноты стоит еще продемонстрировать, как с этой точки зрения выглядели бы полные уравнения сверхпроводящей жидкости,— получается довольно интересно. До сих пор я подставлял выражение для ψ только в уравнения плотности заряда и тока. Но если я их подставлю в полное уравнение Шредингера, то получу уравнения для ρ и θ. Интересно поглядеть, что из этого выйдет, потому что перед нами сейчас «жидкость» электронных пар с плотностью заряда ρ и с таинственной θ; мы можем посмотреть, как выглядят уравнения такой «жидкости»! Итак, подставим волновую функцию (19.17) в уравнение Шредингера (19.3) и вспомним, что ρ и θ это вещественные функции от х, у и z. Если мы отделим вещественную часть от мнимой, то уравнений станет два. Чтобы запись была короче, я, следуя уравнению (19.19), напишу
(19.31)
Тогда одно из двух уравнений примет вид
(19.32)
Поскольку ρv это и есть J [см. (19.18)], то мы просто еще раз получили уравнение непрерывности. Второе же уравнение говорит об изменении θ:
(19.33)
Те из вас, кто хорошо знаком с гидродинамикой (думаю, очень немногие), в этом уравнении узнают уравнение движения электрически заряженной жидкости, если только отождествить ℏθ с «потенциалом скоростей»; но только в последнем члене, который должен быть энергией сжатия жидкости, имеется довольно странная зависимость от плотности ρ. Во всяком случае, это уравнение утверждает, что скорость изменения величины ℏθ дается членом с кинетической энергией (m/2)v2 плюс член с потенциальной энергий qφ плюс добавочный член с множителем ℏ2, который мы назовем «квантовомеханической энергией». Мы видели, что внутри сверхпроводника электростатические силы поддерживают ρ очень однородным, поэтому во всех практических применениях этим членом почти наверняка можно пренебречь при условии, что имеется только одна сверхпроводящая область. Если между двумя сверхпроводниками имеется граница (или есть другие обстоятельства, за счет которых ρ может начать резко меняться), то этот член может стать существенным. Для тех, кто не так уж знаком с уравнениями гидродинамики, я попробую переписать (19.33) в том виде, который позволит яснее видеть физику. Я использую (19.31), чтобы θ выразить через v. Беря от всего уравнения (19.33) градиент и выражая с помощью (19.31) ∇θ через А и v, я получу
(19.34)
Что же означает это уравнение? Вспомним, во-первых, что
(19.35)
Затем заметим, что если взять ротор от уравнения (19.19), то получится
(19.36)
поскольку ротор градиента всегда нуль. Но ∇×A — это магнитное поле В, так что два первых члена можно записать в виде
Наконец, вы должны уяснить себе, что ∂v/∂t обозначает скорость изменения скорости жидкости в данной точке. Если же вас интересует отдельная частица, то ее ускорение выразится полной производной от v (или, как иногда говорят в динамике жидкостей, «сопутствующим ускорением»), связанной с ∂v/∂t формулой [см. гл. 40, § 2 (вып. 7)]
(19.37)
В правой части (19.34) стоит тот же член (v·∇)v. Если перенести его влево, то (19.34) перепишется так:
(19.380
Затем из (19.36) следует
(19.39)
Это и есть уравнения движения сверхпроводящей электронной жидкости. Первое уравнение — это просто закон Ньютона для заряженной жидкости в электромагнитном поле. Оно утверждает, что ускорение каждой частицы жидкости с зарядом q вызывается действием обычной лоренцевой силы q(E+v×B) плюс добавочная сила, являющаяся градиентом какого-то таинственного квантовомеханического потенциала; эта сила обычно мала и становится заметной только при соприкосновении двух разных сверхпроводников. Второе уравнение утверждает, что жидкость «идеальна» — ротор обладает нулевой дивергенцией (у В дивергенция всегда нуль). Это означает, что скорость может быть выражена через потенциал скоростей. Обычно для идеальной жидкости пишут ∇×v=0, но для идеальной заряженной жидкости в магнитном поле это уравнение обращается в (19.39).
Итак, уравнение Шредингера для электронных пар в сверхпроводнике дает нам уравнения движения электрически заряженной идеальной жидкости. Теория сверхпроводимости совпадает с задачей гидродинамики заряженной жидкости. Если вы хотите решить какую-либо задачу, касающуюся сверхпроводников, вы берете эти уравнения для жидкости [или равноценную им пару (19.32) и (19.33)] и сочетаете их с уравнениями Максвелла, чтобы получить поля. (Заряды и токи, которыми вы пользуетесь, чтобы узнать поля, должны, естественно, включать как заряды и токи от сверхпроводника, так заряды и токи от внешних источников.)
Кстати, я считаю, что уравнение (19.38) не очень-то правильно, в него следует добавить член с плотностью. Он определяется не квантовой механикой, а вытекает из обычной энергии, связанной с вариациями плотности, так же как в уравнении для обычной жидкости должна стоять плотность потенциальной энергии, пропорциональная квадрату отклонения ρ от ρ0 (невозмущенной плотности, которая в нашем случае равна также плотности заряда кристаллической решетки). Поскольку должны наблюдаться силы, пропорциональные градиенту этой энергии, то в (19.38) обязан стоять еще один член, пропорциональный ∇(ρ-ρ0)2. В нашем анализе он не появился, потому что возникает он от взаимодействия между частицами, которым я, применяя приближение независимых частиц, пренебрег. Но это та самая сила, на которую я сослался, когда делал качественное утверждение о том, что электростатические силы стремятся сохранить ρ вдоль сверхпроводника почти неизменным.
§ 9. Переходы Джозефсона
И вот напоследок я перехожу к разбору очень интересного случая, впервые отмеченного Джозефсоном, к анализу того, что бывает при контакте двух сверхпроводников. Пусть у нас есть два сверхпроводника, связанные тонким слоем изолятора (фиг. 19.6).
Фиг. 19.6. Два сверхпроводника, разделенных тонким изолятором.
Теперь такое устройство называется «переходом Джозефсона». Если изолирующий слой толст, электроны не могут пройти через него, но если он достаточно тонок, то электроны могут иметь заметную квантовомеханическую амплитуду перескока. Это попросту новый пример квантовомеханического проникновения через барьер. Джозефсон проанализировал такой случай и выяснил, что при этом должно происходить немало странных явлений.
Для анализа такого контакта я обозначу амплитуду того, что электрон окажется на одной стороне, через ψ1, а того, что на другой,— через ψ2. В сверхпроводящем состоянии волновая функция ψ1 — это общая волновая функция всех электронов с одной стороны, а ψ2 — соответствующая функция с другой стороны. Эту задачу можно решать для сверхпроводников разного сорта, но мы ограничимся самым простым случаем, когда вещество по обе стороны одно и то же, — так что соединение самое простое и симметричное. И пусть пока никакого магнитного поля нет. Тогда связь между этими двумя амплитудами должна быть такой:
Постоянная К характеризует данный переход. Если бы К была равна нулю, то эта пара уравнений попросту описывала бы наинизшее энергетическое состояние (с энергией U) каждого сверхпроводника. Но обе стороны связаны амплитудой К, выражающей возможность утечки из одной стороны в другую (это как раз известная нам по двухуровневым системам амплитуда «переброса»). Если обе стороны одинаковы, то U1 будет равно U2, и я имею право их просто вычесть. Но теперь предположим, что мы подсоединили две сверхпроводящие области к двум полюсам батарейки, так что к переходу оказалась приложенной разность потенциалов V. Тогда U1-U2=qV. Для удобства я могу выбрать нуль энергии посредине между U1 и U2, и тогда уравнения обратятся в
(19.40)
Это стандартные уравнения двух связанных квантовомеханических состояний. На этот раз давайте проанализируем их по-иному. Сделаем подстановки:
(19.41)
где θ1 и θ2— фазы по обе стороны контакта, а ρ1 и ρ2— плотности электронов в этих двух точках. Вспомним, что на практике ρ1 и ρ2 почти точно совпадают друг с другом и равны ρ0 — нормальной плотности электронов в сверхпроводящем материале. Если вы теперь подставите эти формулы для ψ1 и ψ2 в (19.40) и приравняете вещественные части вещественным, а мнимые — мнимым, то получится четверка уравнений (для краткости обозначено θ2-θ1=δ):
(19.42)
(19.43)
Первая пара уравнений говорит, что ρ1=-ρ2 «Но,— скажете вы,— они ведь обе должны быть равны нулю, раз ρ1 и ρ2 обе постоянны и равны ρ0». Не совсем. Эти уравнения описывают не все. Они говорят, какими были бы ρ1 и ρ2, если бы не было добавочных электрических сил за счет того, что нет баланса между электронной жидкостью и фоном положительных ионов. Они сообщают, как начали бы меняться плотности, и поэтому описывают тот ток, который начал бы течь. Этот ток, текущий от стороны 1 к стороне 2, был бы как раз равен ρ1 (или -ρ2), или
(19.44)
Такой ток вскоре зарядил бы сторону 2, если можно было бы забыть, что обе стороны соединены проводами с батареей. Однако он не зарядит область 2 (и не разрядит область 1), потому что возникнут токи, которые выровняют потенциал. В наши уравнения эти токи от батареи не входят. Если бы их добавить, то ρ1 и ρ2 оставались бы фактически постоянными, а ток через переход определялся бы формулой (19.44).
Поскольку ρ1 и ρ2 действительно остаются постоянными и равными ρ0, давайте положим 2Kρ0/ℏ=J0 и напишем
(19.45)
Тогда J0, подобно К, есть число, характеризующее данный переход.
Другая пара уравнений (19.43) дает нам θ1 и θ2. Нас интересует разность δ=θ2-θ1, которую мы хотим подставить в (19.45); из уравнений же мы имеем
(19.46)
Это значит, что можно написать
(19.47)
где δ0 — значение δ при t=0. Не забывайте также, что q — это заряд пары, q=2qe . В уравнениях (19.45) и (19.47) содержится важный результат — общая теория переходов Джозефсона.
Так что же из них следует? Сначала приложим постоянное напряжение. Если приложить постоянное напряжение V0, то аргумент синуса примет вид δ0+(q/ℏ)V0t. Поскольку ℏ/q—число маленькое (по сравнению с обычными напряжениями и временами), то синус будет колебаться довольно быстро и в итоге никакой ток не пойдет. (Практически, поскольку температура не равна нулю, небольшой ток все же будет из-за проводимости «нормальных» электронов.) С другой стороны, если напряжение на переходе равно нулю, то ток может пойти! Если нет напряжения, то ток может равняться любой величине между +J0 и -J0 (в зависимости от того, каково значение δ0). Но попробуйте приложить напряжение — и ток обратится в нуль. Это странное поведение недавно наблюдалось экспериментально.
Ток можно получить и другим способом: кроме постоянного напряжения — приложить еще и высокую частоту. Пусть
где v≪V. Тогда
Но при малых Δx
Разложив по этому правилу sinδ, я получу
Первый член в среднем дает нуль, но второй в нуль не обращается, если
Значит, если частота переменного напряжения равна (q/ℏ)V0, то через контакт пойдет ток. Шапиро сообщил, что он наблюдал такой резонансный эффект.
Если вы просмотрите работы на эту тему, то заметите, что в них формула для тока часто записывается в виде
(19.48)
где интеграл берется по пути, ведущему через переход. Причина здесь в том, что если переход находится в поле векторного потенциала, то фаза амплитуды переброса видоизменяется так, как было объяснено вначале [уравнение (19.1)]. Если вы всюду включите такой сдвиг фазы, то получите нужные формулы.
Наконец, я хотел бы описать очень эффектный и интересный опыт по интерференции токов, проходящих через два перехода, который был недавно проделан. Мы привыкли встречаться в квантовой механике с интерференцией амплитуд от двух щелей. Сейчас мы будем иметь дело с интерференцией двух токов, текущих через два перехода между сверхпроводниками. Она вызывается различием в фазах, с которыми сливаются токи, прошедшие по двум разным путям. На фиг. 19.7 показано параллельное соединение двух переходов а и b между сверхпроводниками.
Фиг. 19.7. Два параллельных перехода Джозефсона.
Концы сверхпроводников Р и Q подключены к приборам, которыми мы измеряем ток. Внешний ток Jполн будет суммой токов через каждый из переходов. Пусть Ja и Jb это токи через переходы, и пусть их фазы будут δа и δb . Разность фаз волновых функций в точках Р и Q должна быть одинаковой, по какому бы пути вы ни пошли. На том пути, который следует через переход а, разность фаз между Р и Q равна δа плюс криволинейный интеграл от векторного потенциала вдоль верхнего пути:
(19.49)
Почему? Потому что фаза θ связана с А уравнением (19.26). Если вы это уравнение проинтегрируете вдоль какого-то пути, то левая часть даст изменение фазы, которое тем самым как раз окажется пропорциональным криволинейному интегралу от А, что и написано. Изменение фазы по нижнему пути может быть записано подобным же образом:
(19.50)
Эти величины должны быть равны; если я их вычту, то получу, что разность дельт должна быть равна контурному интегралу от А по замкнутому пути
Здесь интеграл берется по замкнутому контуру Г (см. фиг. 19.7), проходящему через оба перехода. Интеграл от А это магнитный поток Ф через контур. Итак, две дельты оказываются отличающимися на 2qe /ℏ, умноженное на магнитный поток Ф, который проходит между двумя ветвями схемы:
(19.51)
Изменяя магнитное поле в схеме, я смогу контролировать эту разность фаз. Я ее прилажу так, чтобы посмотреть, проявится ли в полном токе, текущем сквозь оба перехода, интерференция между его частями. Полный ток равен сумме Ja и Jb . Для удобства я приму
Тогда
(19.52)
Мы не знаем, каково значение δ0, и природа здесь может, в зависимости от обстоятельств, вытворять все, что ей заблагорассудится. В частности, δ0 может зависеть от прилагаемого к переходам внешнего напряжения. Но что бы мы ни делали, sinδ0 не окажется больше единицы. Значит, предельно сильный ток для каждого данного Ф дается формулой
Этот предельный ток меняется, смотря по тому, каково Ф, и сам достигает максимума всякий раз, когда
где n — целое число. Иными словами, ток достигает своего максимума, когда зацепляющийся за схему поток принимает те самые квантованные значения, которые мы получили в уравнении (19.30)!
Ток Джозефсона через двойной переход недавно был измерен как функция магнитного поля в области между ветвями. Результаты приведены на фиг. 19.8.
Фиг. 19.8. Запись тока через два параллельных перехода Джозефсона как функции магнитного поля в области между двумя переходами.
Здесь мы видим общий фон от токов, вызываемых различными эффектами, которыми мы пренебрегли, но быстрые колебания тока при изменении магнитного поля объясняются наличием интерференционного члена cos(qe Ф/ℏ) в (19.52).
Один из самых интригующих вопросов квантовой механики— это вопрос о том, существует ли векторный потенциал в том месте, где нет поля. Опыт, который я только что описал, был проделан тоже с узеньким соленоидом, помещенным между двумя переходами, так что заметное магнитное поле В было только внутри соленоида, а на сверхпроводящие провода его попадало пренебрежимо мало. И вот оказалось, что сила тока колеблется с изменением потока магнитного поля внутри этого соленоида, даже если само поле и не касается проводов. Это еще одно доказательство «физической реальности» векторного потенциала [см. гл. 15, § 5 (вып. 6)].
Я не знаю, что теперь на очереди. Но посмотрите-ка, что можно было бы сделать. Во-первых, заметьте, что интерференция между двумя переходами может быть применена для создания чувствительного магнитометра. Если площадь, охватываемая двумя переходами, равна, скажем, 1 мм2, то максимумы на кривой фиг. 19.8 будут отстоять друг от друга на 2·10-5 гс. Одну десятую промежутка между пиками запросто можно заметить; значит, таким соединением можно будет измерять поля величиной в 2·10-6гс, или замерять большие поля со столь же хорошей точностью. Можно даже пойти дальше. Представим, например, что мы вплотную друг к другу на равных расстояниях расставили 10—20 переходов. Тогда получится интерференция на 10—20 щелях, и при изменении магнитного поля мы получим очень резкие максимумы и минимумы. Вместо интерференции на двух щелях у нас будет двадцати-, а может быть, и стощелевой интерферометр для измерения магнитного поля. Вероятно, можно предсказать, что измерения магнитных полей при использовании квантовомеханической интерференции станут почти такими же точными, как измерения длин световых волн.
Это еще одна иллюстрация к тому, что происходит в физике в последнее время — появление транзистора, лазера, а теперь эти переходы сверхпроводников, практическое значение которых пока еще не раскрыто полностью. Квантовая механика, открытая в 1926 г., имела за своими плечами почти 40 лет развития, когда вдруг внезапно она получила множество реальных практических применений. Как-то сразу появилась возможность крайне деликатно и тонко управлять природой.
И должен вам сообщить, джентльмены, как это ни прискорбно, что для того, чтобы принять в этом участие, вам абсолютно необходимо как можно быстрее изучить квантовую механику. В этом курсе мы попытались отыскать путь, на котором тайны этой области физики стали бы вам понятными как можно раньше.
КОНЕЦ ТРЕТЬЕГО ТОМА