Теория передачи электрических сигналов при наличии помех

ПРЕДИСЛОВИЕ

вогвременный этап развития радиотехники характеризуется широкие применением методов теории вероятностей для решения многих радиотехнических задач. В связи с этим представляет интерес попытка создания общей статистической теории передачи электрических сигналов в системах связи, радиолокации, телемеханики при наличии помех.

Характерной особенностью этой теории является то, что сигналы на входе канала рассматриваются не как заданные функции времени, а как множество возможных функций времени, определенных вместе с вероятностями их появления. Другой отличительной чертой теории является то, что воздействие помех оце-

сигнал

нивается не по отношению- на выходе канала, а по некоторо-

помеха

му статистическому параметру, характеризующему достоверность полученных данных.* Так, например, процесс радиолокационного измерения дальности оценивается ненадежностью измерения, под которой понимается вероятность того, что во множестве результатов наблюдения измеренное значение дальности не лежит вблизи истинного значения. v

Основные результаты теории сводятся к установлению предельных соотношений для пропускной способности "Канала, ограниченной отношением интенсивностей сигн^а и помех, а также полосой радиочастот, занимаемой каналом. Утверждается, что предельная пропускная способность может быть достигнута при сколь угодно малой частоте ошибок в воспроизведении переданных сигналов. Это обеспечивается выбором «надлежащего метода кодирования передаваемых сообщений.'

Таким образом, открывается возможность оценки различных систем передачи электрических сигналов при наличии помех путем сравнения действительно достигаемой пропускной способности с предельно возможной.

Предлагаемый вниманию читателя сборник состоит из трех частей. Первая часть посвящена статистической теории передачи электрических сигналов при наличии помех различных типов. Рассматривается как система с дискретными сигналами, так и система с непрерывными сигналами.

предисловие

Во второй части излагается теория внутренних помех радиоканала — флуктуационных «шумов», ограничивающих предельную пропускную способность радиоканала. Эти материалы не только необходимы для изучения I и III частей сборника,но и представляют также самостоятельный интерес.

Третья часть сборника служит иллюстрацией применения статистических методов к практическим задачам радиолокации — исследованию точности и достоверности измерений дальности до стационарной цели, проектированию радиолокационных приемников на основе статистических методов и т. д.

Следует отметить, что в развитии статистических методов исследования процессов передачи и приема электрических сигналов при наличии помех вклад нашей отечественной науки исключительно велик. Необходимый для этого математический аппарат был создан трудами знаменитых русских⁴ математиков П. Л. Че-бышева, А. А/ Маркова, А. М. Ляпунова, трудами советских ученых А. Н. Колмогорова, А. Я. Хинчина, С. Н. Бернштейна и др. Значение этих работ настолько велико, что без них ,нельзя себр представить современной теории вероятностей.

При изучении системы с дискретными сигналами используются случайные процессы с прерывным временем (цепи Маркова), на| званные по имени создателя теории цепей А. А. Маркова. |

Исключительное значение в радиотехнике имеют стационарны^ случайные процессы, теория которых была разработана А. Я. Хин-чиным и А. Н. Колмогоровым. В принадлежащей А. Я. Хинч^ну теории корреляции стационарных случайных процессов содержится мощный математический аппарат, широко используемый при ре-л шении разнообразных радиотехнических задач. Большое значение имеет, например, теорема о связи между спектральной плотно-! стью случайного процесса и его функцией корреляции, лежащая в основе теории внутренних помех радиоканала.

Применение статистических методов к задачам помехоустойчивости радиоприема было заложено работами В. И. Сифорова, выполненными в середине 30-х годов.

Проблема пропускной способности канала связи была поставлена В. А. _:Котельниковым еще в 1933 г. Тогда же В. А. Котельников доказал теорему о том, что непрерывная функция времени с огра- ■ ничейным спектром полностью определяется заданием ряда чисел, связанных со значениями этой функции в дискретные моменты времени. Эта замечательная теорема имеет фундаменталь- j ное значение для современной теории передачи электрических сигналов. Следует заметить, что в иностранной технической ли-, гературе она была сформулирована значительно позднее.

Вопрос о пропускной способности канала получил дальнейшее развитие в работах Д. В. Агеева (1938 г.), указавшего на существенную роль помех в ограничении пропускной способности.

предисловие

Идеи о геометрической трактовке процессов передачи и приема сигналов при наличии в канале внутренних шумов, широко используемые в статистической теории связи, также были впервые рысказаны и применены для рассмотрения практических вопросов В. А. Котельниковым еще в 1946 г.

Большое значение для развития теории внутренних помех в (радиоканале имела монография В. Л. Грановского «Электрические флуктуации», вышедшая в свет в 1936 г.

Существенным вкладом в теорию флуктуационных шумов явились труды М. А. Леонтовича, В. И. Бунимовича и других советских ;|уЧеных. В работах В. И. Бунимовича, начатых в 1940 г., полуЙил развитие метод исследования преобразования сигнала и румов нелинейной системой.

Нужно сказать, что статистическая теория передачи электрических сигналов при наличии помех находится еще на начальном атапе своего развития, однако это новое направление в современной радиотехнике представляет безусловный интерес. Можно не сомневаться, что статистические методы сыграют важную роль в решении основной проблемы современной радиотехники — разработке способов передачи и приема сигналов, обеспечивающих большую помехоустойчивость, чем существующие методы.

Следует отметить, что включенные в этот сборник работы иностранных авторов не лишены недостатков.

Прежде всего нужно указать на тенденциозное замалчивание работ советских авторов, значение которых для развития статистических методов в радиотехнике исключительно велико. Только у Райса имеется ссылка на статью А. Я. Хинчина по теории корреляции стационарных случайных процессов, другие труды советских ученых обойдены молчанием.

В работе Шэннона проявляется стремление автора придать изложению формальный характер, оторванный от практических задач. Это в известной мере затрудняет усвоение материала и Применение его на практике.

I Терминология Шэннона тоже в ряде случаев вызывает возражения. Так, автор на основании чисто внешнего сходства математической формулы называет величину H_t через которую определяется пропускная способность канала, «энтропией». Таким образом, понятие энтропии отрывается от конкретного физического содержания, которое в него вкладывается в статистической физике. Это открывает дорогу различным формалистическим построениям, чем действительно и занялись вскоре после опубликования работы Шэнйрна некоторые иностранные авторы.

р В работах Вудворда и Девиса по применению статистических методов в радиолокации проявляется субъективное понимание климатической вероятности. Некоторые рассуждения в тексте Щ части свидетельствуют о том, что авторы иногда пытаются

предисловие

трактовать вероятность как величину, характеризующую «степень уверенности» наблюдателя.

Искусственность такого подхода очевидна из самого характера рассматриваемого физического процесса радиолокационного измерения дальности при наличии помех. Распределение апостериорных вероятностей для различных значений дальности до цели после приема сигнала характеризует объективный характер связи между приемом сигнала и результатами измерения дальности, а вовсе не субъективные впечатления наблюдателя. Это подтверждается хотя бы тем, что можно построить систему измерения дальности до цели, которая на основании расчета распределения апостериорных вероятностей выдает наивероятнейшее значение дальности, полностью исключая субъективную оценку наблюдателя.

Необходимо отметить, что терминология статистической теории передачи электрических сигналов и ряд ее понятий используются некоторыми зарубежными математиками и инженерами для спекуляций, связанных с пресловутой «кибернетикой». ^ф

Так, например, Н. Винер, С. Гольдман и др., исходя из внешней, поверхностной аналогии и спекулируя на нечеткости и двусмысленности некоторых терминов и понятий, пытаются перенести закономерности радиосвязи на биологические и психологические явления, говорят о «пропускной способности» человеческого мозга и т. д. Естественно, что все эти попытки придать кибернетике-наукообразный характер с помощью заимствованных из другой области терминов и понятий отнюдь не делают кибернетику наукой — она остается лжетеорией, созданной реакционерами от науки и философствующими невеждами, находящимися в плену идеализма и метафизики. В то же время досужие упражнения философствующих лжеученых набрасывают тень йа статистическую теорию передачи сигналов при наличии помех, результаты и выводы которой сами по себе имеют большое научное и прикладное значение.

Это обстоятельство пришлось учесть при подготовке к печати настоящего сборника. При редактировании сборника были произведены небольшие сокращения, причем текст был освобожден от некоторых ненаучных идеалистических построений, никак не связанных с основным материалом. Ряд неудачных и двусмысленных терминов был заменен с целью устранения возможности неправильного толкования некоторых понятий.

Из текста статей исключены исторические справки, носящие тенденциозный и поверхностный характер. Ссылки авторов на книги, имеющиеся в русском переводе, заменены ссылками на соответствующие советские издания. Кроме того, сборник дополнен кратким указателем литературы, составленным редактором.

Ленинград Я. А. Железное.

Сентябрь 1952 г.

ЧАСТЬ I

СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ ЭЛЕКТРИЧЕСКИХ СИГНАЛОВ¹*

к. шэнной

ВВЕДЕНИЕ

Развитие различных методов модуляции, таких, как импульсно-кодовая и временная импульсная модуляции, которые уменьшают требования к отношению сигнал/шум за счет расширения полосы частот, повысило интерес к общей теории связи ²K

В настоящей работе мы расширим теорию с тем, чтобы включить в нее некоторое число новых факторов, в частности влияние шумов в канале и возможность улучшения связи за счет использования статистической структуры исходного сообщения и свойств оконечного получателя сообщений.

Основная задача связи заключается в точном или приближенном воспроизведении в одной точке сообщения, выбранного в некоторой другой точке. Существенно, что действительное сообщение является одним, выбранным из определенного множества возможных сообщений. Система должна быть спроектирована таким образом, чтобы она обеспечивала передачу любого возможного сообщения, а не только того, которое действительно будет выбрано, так как последнее в момент проектирования еще не известно.

Если число сообщений во множестве конечно, то это число или некоторая мано^нная функция от него может быть принята за меру количества д^ных⁵^передаваемых тогда,когда из множества выбирается одно сообщение, причем все возможности выбора равновероятны.

¹I С Е. Shannon and W. Weaver «The Mathematical Theory of Communication», The University of Illinois Press, 3—89, 1949.

²) Термины «связь» и «система связи» понимаются автором весьма широко. Системой связи может быть любая система, предназначенная для передачи и приема сигналов, будь то система радиосвязи, радиолокации, телемеханики и пр. (Прим. ред.) ⁱ

⁸) В оригинале применяется термин «информация». Поскольку, однако, автор в дальнейшем придает ему специальное значение, устраняя семантические аспекты этого термина, мы от него отказались. (Прим. ред.)

часть i. статистическая теория передачи сигналов

Как было указано Хартлеем ^г), наиболее естественно выбрать логарифмическую функцию. Хотя это определение должно быть существенно обобщено при рассмотрении статистических свойств сообщений, а также при наличии непрерывной совокупности сообщений, мы будем во всех случаях пользоваться логарифмической мерой.

Логарифмическая мера обладает рядом существенных преимуществ.

1. Она практически наиболее удобна. Параметры, имеющие техническое значение, как, например, время, ширина полосы частот, число реле и т. п., имеют тенденцию изменяться линейно с логарифмом числа возможностей. Например, добавление одного реле к существующей группе удваивает число возможных положений реле. Это прибавляет единицу к логарифму этого числа при основании 2. Удвоение времени, грубо говоря, возводит число возможных сообщений в квадрат, т. е. удваивает логарифм и т. д.

2. Она ближе к нашему интуитивному представлению о подходящей мере. Это обстоятельство тесно связано с первым, так как мы интуитивно измеряем величины путем линейного сравнения с принятыми эталонами. Каждый, например, чувствует, что две перфорированные карточки содержат вдвое больший запас сведений, а два идентичных канала имеют удвоенную пропускную способность.

3. Она более удобна с математической точки зрения. Многие предельные переходы весьма просты при применении логарифмов, но потребовали бы сложных приемов при использовании самого числа возможностей.

соответствует выбору единицы

ерения количества данных. При основании 2 получаются

изм

единицы, которые могут быть названы «двоичными единицами». Прибор с двумя состояниями равновесия, например реле или спусковая схема, может запасти одну двоичную единицу. N таких приборов могут запасти N единиц, так как общее число возможных состояний равно 2 ^V и Iog₂ 2^V = N. Если же выбрано основание IO_rто единицы могут быть названы «десятичными единицами». Так как

Iog₂AI =

Iogio M Iogi₀ 2

= 3,32 Iog₁₀M,

то десятичная единица равна примерно Щ двоичных единиц. Числовое колесо арифмометра имеет десять положений равновесия и поэтому обладает способностью запасти одну десятичную единицу. При аналитических расчетах, когда приходится интегрировать и дифференцировать, иногда удобнр применять основание е. Полу-ча лциеся при этом единицы могут быть названы «натуральными

1) BSTJ_t 535, July 1928.

введение

единицами». Переход от основания а к основанию Ь требует лишь умножения на log^a.

В дальнейшем под системой связи будем подразумевать систему, схематически показанную на фиг. 1. Она состоит из пяти основных частей:

1. Источнику создающий сообщение или последовательность сообщений, .которые должны быть переданы на приемный конец. (Сообщение может быть различного типа, например: а) последовательность букв, как в системах телеграфа или телетайпа; б) одиночная функция времени /(/), как в телефонии или радиотелефонии;

Источник Передатчик

Приемник Получатель



				*Сигнал [*



	*] Приним. сигнал*

Сообщения

Сообщения

Источник шумов

Фиг. 1. Схема общей системы связи.

в) функция времени и других переменных, как в черно-белом телевидении, где сообщение можно рассматривать как функцию f(x,y,'t) от двух пространственных координат и времени (интенсивность света в точке (х, у) в момент t на экране приемной трубки);

г) две (или более) функции времени, скажем,/(/), g(t)₉ h(t)_f как это бывает в случае передачи «трехмерного» звука, или если система рассчитана на обслуживание нескольких индивидуальных каналов по многократному способу; д) несколько функций от нескольких переменных — в цветном телевидении сообщение состоит из трех функций f(x_tyyt)y g(x_fyyt)_f h(x_yyyt)y определенных в трехмерном континууме. Мы можем рассматривать эти три функции как составляющие векторного поля в некоторой области; подобно этому несколько источников черно-белого телевидения будут давать сообщения, состоящие из нескольких функций от трех переменных; е) различные комбинации перечисленных случаев, например, в телевидении с каналом звукового сопровождения.

2. ПереЭлтчиКу который преобразует сообщение таким образом, что получается сигнал, пригодный для передачи по каналу. В лефонии эта операция состоит просто в преобразовании звукового-давления в пропорционально изменяющийся электрический ток.

часть i. статистическая теория передачи сигналов

В телеграфии имеется операция кодирования, которая дает последовательность точек, тире и пробелов, соответствующих сообщению. В системах многоканальной кодовой импульсной модуляции значения различных речевых функций должны быть зафиксированы в некоторые дискретные моменты времени, компрессированы, квантованы по амплитудам, закодированы и, наконец, соответствующим образом смешаны для образования сигнала. Системы с вокодером ¹>, телевидение и частотная модуляция являются другими примерами сложных операций — преобразования сообщения в сигнал.

3. Канал — среда, используемая для передачи сигнала от передатчика к приемнику. Это может быть пара проводов, коаксиальный кабель, полоса радиочастот, луч света и т. д.

4. Приемник обычно выполняет операции, обратные осуществленным в передатчике, восстанавливая сообщение из сигнала.

5. Получатель — это лицо (или аппарат), для которого предназначено сообщение.

В дальнейшем будет рассмотрено несколько общих проблем, относящихся к системам связи. Для этого прежде всего необходимо описать различные элементы при помощи математических величин, должным образом идеализированных по сравнению со своими физическими оригиналами.

Системы связи можно грубо подразделить на три главные категории: дискретные, непрерывные и смешанные. Под дискретной системой будем понимать систему, в которой как сообщение, так и сигнал представляют собой последовательность дискретных символов²^. Типичным случаем является телеграфия,где сообщение — последовательность букв, а сигнал — последовательность точек, тире и пробелов. В непрерывной системе как сигнал, так и сообщение рассматриваются как непрерывные функции, например в радиотелефонии и телевидении. В смешанных системах имеются как непрерывные, так и дискретные переменные, примером чего может служить передача речи посредством кодовой импульсной модуляции.

Рассмотрим сначала дискретный случай. Он имеет применение не только в теории связи, но также в теории счетных машин и в других областях. Кроме того, дискретный случай является основой для рассмотрения непрерывного и смешанного случаев, которые исследуются во второй половине работы.

¹I Вокодер — устройство «синтетической телефонии», в которой подлежащие передаче сигналы синтезируются на приемном конце. По каналу передаются только «командные сигналы», получаемые в результате анализа звуков передаваемой естественной речи. Эти сигналы управляют процессом синтеза (высотой, силой тонов, ритмом речи и т. д.) (Прим. ред.)

²) Символами здесь и в дальнейшем автор называет элементы сообщения или сигнала, например буквы, точки, тире и т. д. (Прим. ред.)

Глава I ДИСКРЕТНЫЕ СИСТЕМЫ БЕЗ ШУМОВ

1. ДИСКРЕТНЫЙ КАНАЛ БЕЗ ШУМОВ

Телеграф и телетайп являются двумя простейшими примерами дискретного канала. Вообще же дискретный канал означает систему, в которой может быть передана из одной точки в другую последовательность наборов из конечного ряда элементарных символов S_i,...,S„. Предполагается, что символ S_i имеет длительность во времени t_£ секунд (не обязательно, чтобы все символы обладали одинаковой длительностью, например точки и тире в телеграфии). Не обязательно также, чтобы все возможные последовательности символов S_i могли передаваться системой; могут допускаться только некоторые последовательности. Это будут возможные сигналы для канала. Например, в телеграфии предполагаются следующие символы:

1. Точка, состоящая из замыкания линии на некоторую единицу времени и последующего размыкания на такое же время. • 2. Тире, состоящее из замыкания на три единицы времени и размыкания на одну единицу.

3. Пробел между буквами, состоящий, скажем, из размыкания на три единицы.

4. Пробел между словами — размыкание линии на шесть единиц времени.

Необходимо наложить ограничения на допустимые последовательности, чтобы пробелы не следовали друг за другом, так как два промежутка между буквами дают промежуток между словами.

Теперь рассмотрим вопрос о том, каким образом можно измерить пропускную способность такого канала.

В случае телетайпа, где все символы обладают одинаковой длительностью и допустимы все последовательности из 32 символов, ответ очень прост. Каждый символ представляет собой пять двоичных единиц. Если система передает п символов в 1 сек., естественно сказать, что канал обладает способностью передачи в 5 п двоичных единиц в секунду. Это не означает, что канал телетайпа будет всегда передавать сообщения с такой скоростью. Это — максимально возможная скорость, и будет ли в действительности достигнут этот максимум, зависит от источника сообщений на входе канала.

часть i. статистическая теория передачи сигналов

В более общем случае символов различной длительности и при ограничении допустимых последовательностей можно дать следующее определение:

Определение: Пропускная способность С дискретного канала выражается формулой

г-оо ¹

M(T) — число допустимых сигналов длительностью Т. Легко видеть, что в случае телетайпа это определение сводится к предыдущему. Можно показать, что рассматриваемый предел существует как конечное число в большинстве представляющих интерес случаев. Предположим, что допустимы все последовательности символов S_itS_2t S_n и что эти символы имеют длительности Z,, Z₂ ,...,Z_rr Какова тогда пропускная способность канала? Если N(I) означает число последовательностей длительностью t_yто

N(f) = N(t -Z₁)+N (Z -1₂) +... + N(t - Z _n),

т. е. общее число равно сумме чисел последовательностей, оканчивающихся символами S₁, S₂,..., S_nt а эти числа соответственно равны /V(Z-Z₁), N{t—Z.),..., N(t—t_n).

Согласно хорошо известному положению исчисления конечных разностей AZ(Z) при больших Z асимптотически приближается к AX^t_ot где А—постоянная, а X₀—наибольший вещественный корень характеристического уравнения

X''¹ +Х~'² +. ..+Х~'^л =1

и, следовательно:

C=I_im ISiJiL=Icg X₀.

t-* оо ¹

При наличии ограничений, наложенных на допустимые последовательности, часто все же можно получить уравнение в конечных, разностях того же типа и найти С из характеристического уравнения. В упомянутом случае телеграфии

^ [N (t)=N (Z —2)+N (Z —4)+/V (Z — 5)+N (t — 7)+

+ /V(Z-8)+/V(Z-10),

в чем можно убедиться, подсчитывая последовательности символов с учетом последнего или следующего за последним символа. Отсюда С есть — Iog [х₀, где [л₀— положительный корень уравнения

1₌₁12 ₊ _[А4 ₊ _(А5_+Г17 ₊ _|А8 ₊ _1А10.

Решая это уравнение, найдем C=O,539.

гл. i. дискретные системы без шумов

Весьма общий вид ограничений, которые могут быть наложены на допустимые последовательности, состоит в следующем. Вообразим некоторое число возможных состояний а_ъа₂ ...,а_т.В каждом состоянии могут быть переданы только некоторые символы из ряда Si,...,S_n (различные наборы для разных состояний). Когда один из этих символов передан, состояние переходит в некоторое новое состояние в зависимости как от старого состояния, так и от переданного символа. Простейшим примером этого является телеграфия. Имеются два состояния в зависимости от того, был ли последним

Тире

^пРо6ел между словами

Фиг. 2. Графическое представление ограничений, наложенных на телеграфные символы.

переданным символом пробел или нет. Если был пробел, то после этого могут быть переданы только точка или тире, и состояние непременно изменится. Если нет, то может быть передан любой символ и состояние либо изменится, если передан пробел, либо в прртивном случае не изменится.

Все это может быть иллюстрировано графиком, показанным на фиг. 2. Точки разветвления соответствуют состояниям, а линии указывают символы, возможные в данном состоянии, а также результирующие состояния. В Приложении 1 показывается, что если условие относительно допустимых последовательностей может быть задано в такой форме, то существует определенное значение пропускной способности, которое может быть вычислено согласно следующей теореме.

часть i. статистическая теория передачи сигналов

Теорема 1

Пусть Ь'$ означает длительность s-ro символа, который возможен в состоянии / и ведет к состоянию /. Тогда пропускная способность канала С равна Iog W_f где W— наибольший вещественный корень уравнения в виде определителя

V» As)

=O_f

где 8^ = 1, если /=/, и нуль в противном "случае.

Например, в случае телеграфии определитель имеет еид

I — 1 (W-*+W-*) {W-*+W-*) (W-*+W~*—])

=0.

Разложение этого определителя дает уравнение, которое приводилось выше для этого случая.

2. ИСТОЧНИК ДИСКРЕТНЫХ СООБЩЕНИЙ

Мы уже видели, что при весьма общих условиях логарифм числа возможных сигналов в дискретном канале линейно возрастает со временем. Пропускная способность может быть определена указанием скорости этого возрастания: числа двоичных единиц в секунду, требуемого для задания отдельного применяемого сигнала.

Рассмотрим теперь источник сообщений. Как следует математически описывать источник и какое количество данных, измеренное в двоичных единицах в секунду, создает такой источник? Знание статистических свойств источников имеет большое значение для уменьшения необходимой пропускной способности канала путем рационального кодирования сообщений. Например, в телеграфии передаваемые сообщения состоят из последовательностей букв. Эти последовательности, однако, не вполне хаотичны. Вообще говоря, они образуют фразы и имеют статистическую структуру,, скажем, английского языка. Буква E появляется много чаще, чем Q_yпоследовательность TH чаще, чем XP_y и т. д. Наличие такой структуры позволяет экономить время (или пропускную способность канала) путем рационального кодирования последовательностей сообщений в последовательности сигналов.

В ограниченных пределах это всегда делается в телеграфии: самый короткий символ в канале — точка применяется для наиболее частой в английском языке буквы E_y в то время как редкие буквы Q_y X_y Z выражаются более длинными последовательностями тире и точек. Еще отчетливее проводится этот принцип в некоторых коммерческих кодах, где наиболее обычные слова и фразы изображаются кодовыми группами из четырех или пяти букв, что дает значительную экономию среднего времени.

гл. i. дискретные системы без шумов

Можно себе представить, что дискретный источник создает сообщение символ за символом. Последовательные символы выбираются соответственно некоторым вероятностям, зависящим, вообще говоря, как от предыдущего выбора, так и от данного рассматриваемого символа, о котором идет речь.

Математическая модель системы, которая создает такую последовательность символов, управляемую совокупностью вероятностей, известна под названием стохастического процесса. Поэтому можно считать, что дискретный источник может быть представлен некоторым стохастическим процессом. Обратно, любой стохастический процесс, который дает дискретную последовательность символов, выбираемых иаг конечного ряда, может рассматриваться как описывающий некоторый дискретный источник. Это включает такие случаи, как:

1. Источники непрерывных сообщений, которые превращены в дискретные путем квантования. Например, квантованная речь от передатчика с кодовой импульсной модуляцией или квантованный телевизионный сигнал.

2. Математические случаи, когда просто абстрактно определяется некоторый стохастический процесс, создающий последовав телыюсть символов\Приведем примеры источников последнего типа.

A. Пусть имеются пять букв Л, B_y C_y D_y E_y которые выбираются с вероятностью 0,2 каждая, независимо от предыдущей буквы. Это привело бы к последовательности такого примерно вида:

BDCBCECCCADCBDDAECEEA ABBDAEECACEEBAE ЕС BCEAD

Этот пример был построен при помощи таблицы случайных чисел.

Б. Используются те же пять букв, но с вероятностями 0,4, 0,1, 0,2, 0,2, 0,1 соответственно. Следующие друг за другом буквы выбираются "независимо от предыдущих. Типичное сообщение от такого источника имеет вид

AAACDCBDCEAADADACEDA EADCABEDADDCECAAAAAD

B. Ъолее сложная структура получается, если последующие символы не выбираются независимо, так что их вероятности зависят от предшествующих букв. В простейшем случае выбор зависит только от непосредственно предшествующей буквы, а не от ранее стоящих букв.Тогда статистическая структура может быть описана набором вероятностей перехода P_iH) ₉ т. е. вероятностей того, что за буквой i последует буква /. Индексы / и / охватывают все возможные символы. Другой эквивалентный способ описания структуры состоит в задании вероятностей двухбуквенных сочета-

часть i. статистическая теория передачи сигналов

ний р (/,/), т. е. относительных частот двухбуквенного сочетания {/, /). Частоты появления букв р(1) (вероятность буквы вероятности переходов р,(/) и вероятности двухбуквенных сочетаний p{ij) связаны следующими соотношениями:

р(0= ZpC /)= 2 р(/>0=2р(/)ру(0>

JJj P(Ij) =P(I) PiU),

2л(У)=2р(0=2р(/./)=1.

J i U

В качестве частного примера предположим, что имеются три буквы с таблицами вероятностей


P_i(I)	А	/ В	С	/
А	0	4 5	1 5	А
; в	1 2	1 2	0	В
с	1 2	2 5	1 10	С


	P(i) 9	P(U)
	27	А
	16
	27	i В
	2
	27	С

В С

о -1 -L

^и 15 15

-L А

27 27 ⁰

27 135 135

Типичное сообщение от этого источника имеет вид

АВВАВАВАВАВАВАВВВАВВ ВВВАВАВАВАВАВВВАСАСА ВВАВВВВАВВАВАСВВВАВА

Следующее повышение сложности состоит в учете частот появления трехбуквенных сочетаний, но не более. Выбор буквы будет зависеть от предшествующих двух букв, но не от того, что было до этих букв. При этом должна быть задана совокупность частот трехбуквенных сочетаний p(i,j,k) или эквивалентная совокупность вероятности переходов р_/;(&). Продолжая таким образом, можно последовательно получать все более сложные стохастические процессы. В общем случае сочетаний из п букв для определения •статистической структуры требуется совокупность вероятностей л-буквенных сочетаний p(i_l9 /₂,...., i_n) или вероятностей перехо

ЛОВ P_k9ia9uau9 .

3. ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ЦЕПЕЙ МАРКОВА

Стохастический процесс описанного типа известен в математике как дискретная цепь Маркова; он подробно рассмотрен в литературе¹!. Общий случай может быть описан следующим образом.

¹I См. В. И. Романовский, «Дискретные цепи Маркова», Гос-техиздат, 1949. (Прим. ред.)

гл. i. дискретные системы без шумов

Существует конечное число возможных «состояний» системы S₁₉S₂,...,S_n. Кроме того, имеется совокупность вероятностей переходов р.(/), т. е. вероятностей того, что система, находящаяся в состоянии S_lf перейдет затем в состояние Sy-Чтобы представить при помощи этой цепи Маркова источник сообщений, достаточно только предположить, что при каждом переходе из одного состояния 3 другое создается одна буква. Состояния будут соответствовать «остатку влияния» предшествовавших букв.

Фиг. 3. График, соответ- Фиг. 4. График, соответ-

ствующий источнику в ствующий источнику в

примере Б. примере В.

Все это может быть изображено графически, как показано на фиг. 3 и 4. Состояниями являются точки разветвления, а вероятности переходов и создаваемые при этом буквы указаны около соответствующих линий. Фиг. 3 относится к примеру Б раздела 2, фиг. 4 — к примеру В. На фиг. 3 имеется только одно состояние, так как последующие буквы независимы друг от друга. На фиг. 4 имеется столько же состояний, сколько букв. При учете трехбуквенных сочетаний было бы самое большее п² состояний, соответствующих возможным парам букв, предшествовавших выбираемой.

4. ЭРГОДИЧЕСКИЕ И СМЕШАННЫЕ ИСТОЧНИКИ

Как указано выше, дискретный источник может быть для наших целей представлен цепью Маркова. Среди возможных дискретных цепей Маркова имеется одна группа с особыми свойствами, имеющими значение в теории связи. Этот особый класс состоит из эргодических цепей; соответствующие источники также называются эргодическими. Хотя точное определение эргодического процесса несколько сложно, общая идея проста.

В случае эргодического процесса каждая создаваемая процессом последовательность имеет одни и те же статистические свойства. Так, частоты букв, частоты двухбуквенных сочетаний и т. д., полученные из частных последовательностей, будут стремиться по мере увеличения длины последовательностей к определенным пределам независимо от выбора частной последовательности. В действительности это верно не для всякой последовательности, но совокупность последовательностей, для которых это неверно, обладает

2 Теория передачи сигналов

ЧАСТЬ i. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

вероятностью 0. Грубо говоря, эргодичность означает статистическую однородность.

Свойство эргодичности связано со структурой соответствующего графика. Процесс будет эргодическим, если график обладает следующими двумя свойствами:

1. График не распадается на две изолированные части А и B₉такие, что от одной точки разветвления в части А нельзя было бы перейти вдоль линии графика в направлении стрелок в точки части B₉ а также невозможно было бы и из точек части В попасть в точки части А.

2. Замкнутая последовательность линий графика, стрелки которых ориентированы в одном направлении, называется койтуром. Под «длиной» контура понимается число линий, из которых он состоит. Второе свойство требует, чтобы наибольший общий делитель длин всех контуров графика равнялся единице.

Если первое условие удовлетворено, а второе нарушено тем, что общий делитель d>l, то последовательности имеют некоторого рода периодическую структуру. Различные последовательности распадаются на d различных классов, которые в статистическом отношении одинаковы за исключением сдвига начала (т. е. выбора того, какую букву последовательности назвать первой). Путем смещения на величину от нуля до d—1 каждая последовательность может быть сделана статистически эквивалентной любой другой.

Простым примером при d=2 является следующее. Имеются три возможные буквы а₉Ь₉с. За буквой а следует либо 6, либо с с вероятностями V₃ и ²Z₃ соответственно. За Ъ и за с всегда следует буква а. Тогда типичная последовательность имеет вид abacacacabacababacac

Такие случаи не имеют большого значение для нашей работы.

Если нарушено первое условие, то график может быть разделен на некоторое число частных графиков, каждый из которых удовлетворяет первому условию.

Будем предполагать, что второе условие также выполняется для всех частных графиков. В этом случае имеем то, что может быть названо «смешанным» источником, составленным из некоторого числа «чистых» составляющих. Составляющие соответствуют различным частным графикам. Если L₁₉ L₂₉ L₃,... — составляющие источники, то можно написать

L=PiL₁ + P₅Z₂ + p₃L₃ + где» P_j ^вероятность составляющего источника L₁.

Ф\ чёски дело обстоит таким образом. Имеется несколько раз-лич! источников L₁₉ L₂₉ L₃,..., каждый из которых имеет одно-род ю статистическую структуру (т. е. является эргодическим). Мы ie знаем априори, который будет использован, но раз поел ,овательность началась с данной «чистой» составляющей L_iy

ГЛ. i. ДИСКРЕТНЫЕ СИСТЕМЫ БЕЗ ШУМОВ

19.

она будет продолжаться бесконечно согласно своей статистической структуре.

Для примера можно взять два процесса, описанных выше, и предположить P₁=O,2 и р₂=0,8. Последовательность от смешанного источника

L =0,2 L₁ + 0,8 L₂

может быть получена путем выбора первым L₁ или L₂ с вероятностями 0,2 и 0,8, а затем создания последовательности, определенной этим выбором.

Если не оговорено противное, то будем предполагать, что источник является эргодическим. Такое предположение позволяет отождествлять средние значения, взятые по последовательности, со средними значениями, взятыми по совокупности возможных последовательностей (вероятность отклонения равна нулю). Например, относительная частота буквы А в частной бесконечной последовательности будет с вероятностью единица равняться ее относительной частоте в совокупности последовательностей.

Если P_i — вероятность состояния I_y а рД/) — вероятность перехода в состояние /, то, чтобы процесс был стационарным, P_iдолжно, очевидно, удовлетворять условиям равновесия

P_j=ZPiPAi)-

В эргодическом случае можно показать, что при любых начальных условиях вероятности Pj(N) пребывания в состоянии / после N символов приближаются к равновесным значениям при N оо.

5. ВЫБОР, НЕОПРЕДЕЛЕННОСТЬ И «ЭНТРОПИЯ»

Дискретный источник сообщений был представлен выше в виде цепи Маркова. Возникает вопрос, можно ли определить величины, которые измеряли бы в определенном смысле, сколько д^йнкх «создаст» такой процесс, или лучше, с какой скоростью «создайся» данные? v^ Vl

Пусть имеется набор возможных событий, вероятности появления которых суть р₁₉ р₂>-.., Р„.Эти вероятности известны, но это все, что знаем относительно того, какое произойдет событие. Можно ли найти меру того, чему равна «возможность выбора» или какова неопределенность исхода при выборе события из этой группы?

Если такая мера существует,— обозначим ее Я(р₁,р₂,... рД,— то целесообразно потребовать, чтобы она обладала следил- ими "свойствами:

1. H должна быть непрерывна относительно P_i.

2. Если все P_i одинаковы, р.= L , то H должна быть монотонно

возрастающей функцией от п. В случае равновероятных событий

ЧАСТЬ i. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

имеет место большая возможность выбора или большая неопределенность, чем в тех случаях, когда имеются и более вероятные и менее вероятные события.

3. Если выбор распадается на два последовательных этапа, то исходное H будет взвешенной суммой индивидуальных значений Н. Смысл этого иллюстрирует фиг. 5. Слева имеются три возможности

1 1 1

с вероятностями P₁= j, р₂= -^, P₃=-^*

Справа сначала выбираем между двумя возможностями с вероятностями ¹Z2 и в случае второй возможности делаем еще выбор между возможностями с ве-

^ФИГ- ⁵' выбор™"⁶ ^СЛУЧЗИ роятностями V₃ и V₃- Окончательные

результаты имеют те же самые вероят* ности, как и прежде. В этом частном случае требуется, чтобы

^Н(~2 TT ' ~6~) ⁼ ^Н(~2 ' ~2~) + "2~ т)'

Коэффициент V2 появился потому, что выбор на втором этапе происходит только в половине общего числа случаев. В Приложении 2 обосновывается следующий вывод:

Теорема 2

Единственной формой Я, удовлетворяющей трем указанным предположениям, является форма

H = -KfpJogp_i,

где К — положительная постоянная.

Эта теорема, как и предположения, используемые для ее доказательства, имеют для данной теории второстепенное значение. Она дана главным образом для того, чтобы подкрепить закономерность наших дальнейших определений.

Величины вида H=—^p_zIog P_i (постоянная К определяет только, единицу измерения) играют центральную роль в теории передачи сообщений в качестве мер возможности выбора и неопределенности. Форма величины Я такова же, как и энтропии, определяемой в-статистической механике, где P₁ — вероятность того, что система находится в ячейке i своего фазового пространства.

Условимся называть H=—P_i Iog P_i «энтропией»¹! совокупности вероятностей P₁,..., р_п. Если случайная переменная обозначена

¹J Автор вводит термин «энтропия» на основании чисто внешнего сходства выражения для введенной им величины H с выражением для энтропии в общепринятом значении. Поскольку с понятием энтропии в статистической

ГЛ. i. ДИСКРЕТНЫЕ СИСТЕМЫ БЕЗ ШУМОВ

X_t то будем обозначать «энтропию» через Н(х); таким образом, х — не аргумент функции, а лишь знак, отличающий ее от Н{у)_ут. е. от «энтропии» случайной величины у.

На фиг. 6 представлена в виде функции от р «энтропия» в случае двух возможностей с вероятностями р и q= 1—р, а именно:

H =—(р Iog р + q Iog q).

1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0.1

(двоич.ед.)

о 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 Ift _лP

Фиг. 6. «Энтропия» в случае двух возможностей с вероятностями р и (1—р).

Величина H обладает рядом интересных свойств, которые подтверждают правильность применения ее в качестве рациональной меры возможности выбора.

1. #=0 только в том случае, если все вероятности p_lt кроме одной, равны нулю, а эта единственная вероятность равна единице. Таким образом, H равна нулю только в случае полной определенности исхода опыта. В остальных случаях H больше нуля.

физике связано вполне определенное физическое содержание, то во^из-бежание возможных недоразумений из-за формалистической терминологии автора в дальнейшем слово «энтропия» поставлено в кавычки. Следует иметь в виду, что в данном случае «энтропия» есть не больше, чем краткое название величины H = ^p_iXogp_it где P_i — вероятность появления некоторого события и {Прим. ред.)

ЧАСТЬ i. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

2. При заданном п H максимальна и равна Iog п, когда все р_£одинаковы ^Lj . Это и интуитивно соответствует состоянию наибольшей неопределенности.

3. Пусть имеются два события х и у с т возможностями для первого и п — для второго. Пусть p(i,j) означает вероятность совместного появления /-го значения для первого и /-го значения для второго события. «Энтропия» совместного события равна

H{X_tу) = — S Pih /) Iog P(IJ)_t

тогда как

ВД =-2 icg 2/>(/,/), HUf) =-Zp(LI) iog 2 р(ч)-

ij i

Легко показать, что

H{x_t у)<Н{х)+Н{у)₉

причем равенство имеет место только в случае независимых событий [т. е. если р(/,/)=р(/)р(/)].

4. Всякое изменение в сторону выравнивания вероятностей Pi» Р2,..., P_n увеличивает Н. Так, если Рх<р₂ и увеличиваем P₁, одновременно уменьшая р₂ на такую же величину, так что P₁ и р₂приближаются друг к другу, то H увеличивается.

В более общем виде, если над вероятностями осуществляется операция «выравнивания» вида

где ^а_и~^аи = 1 и все CL_ij^O₉ то H увеличивается. (За исключе-

i J

нием того частного случая, в котором такое преобразование сводится к одной только перестановке ру, когда H₉ конечно, сохраняется неизменной.)

5. Пусть имеются два случайных события х и у₉ как в пункте 3, не обязательно независимых. Для каждого частного, значения /, которое может принимать X₉ имеется условная вероятность P_i(Z) того, что у имеет значение /. Она равна

Мы определяем условную «энтропию» величины у₉ Н_х{у) как среднее значение «энтропии» у для каждого значения X₉ вычисленное с учетом весов, соответствующих вероятностям частных значений х.

ГЛ. i. ДИСКРЕТНЫЕ СИСТЕМЫ БЕЗ ШУМОВ

Она равна

HM = -^Pihj) Iog P₁(J).

Эта величина показывает, какова в среднем неопределенность значения у при известном х. Подставляя значение P₁(J)₉ получим

нм = -S Piⁱ> D ^1ое P(U) + S P(U) iog S P(U) = н (х₉у) - я (х)

U U J

или

Я(х, у)=Н(х)+Н_х(у).

Неопределенность (или «энтропия») совместного события (х, у) есть неопределенность события х плюс неопределенность события у, когда х известно.

6. Из 3 и 5-го пунктов имеем

Н(х) + Н(у) > Я(х, у) = Н(х) + Н_х(у).

Отсюда

Н(У) > Н_х(у).

Неопределенность события у никогда не возрастает вследствие знания события х. Она уменьшается, если только события х и у не являются независимыми.- В противном случае она не изменяется.

6. «ЭНТРОПИЯ» -ИСТОЧНИКА СООБЩЕНИЙ

Рассмотрим дискретный источник с конечным числом состояний, вроде рассмотренных выше. Для каждого возможного состояния i имеется совокупность вероятностей P_i(J) создания различных возможных символов /. Для каждого состояния существует «энтропия» H_i. «Энтропия» источника определяется как среднее значение этих H_iy каждому из которых приписан вес, в соответствии с вероятностью появления соответствующего состояния

H= 2 P_iH_l = - у₄ P_i P_i(J) Iog P₁(J).

i U

Это — «энтропия» источника на символ текста. Если процесс Маркова развивается с определенной скоростью, то можно говорить также об «энтропии» в секунду

где J₁ — средняя частота (появлений в секунду) состояния и Очевидно,

H^t= тН_у

где т — среднее число символов, создаваемых за 1 сек.

H или H' измеряют количество данных, создаваемое источником на символ или за секунду. Если в качестве основания логарифмов

ЧАСТЬ i. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

выбрано 2, то они будут выражены в двоичных единицах на символ или за секунду.

Если последовательные символы независимы, то H просто равняется — 2 Pi ^lcS Piy ^где Л — вероятность символа /. Предположим, что в этом случае мы рассматриваем длинное сообщение из N символов. Оно будет содержать с большой вероятностью около P₁N появлений первого символа, p₂N появлений второго и т. д. Отсюда вероятность данного частного сообщения будет приближенно равна

P = P^p_i^ P^p₂'".-. Р^рп"

или

Iogp = N^_i P₁ Iog р_г

Iogp = -NH,

я = А.

¹ N '

Поэтому H приближенно равна логарифму обратной величины вероятности типичной длинной последовательности, деленному на число символов в последовательности. Тот же результат сохраняется и для любого источника.

Формулируя более точно, имеем (см. Приложение 3):

Теорема 3

Для любых заданных е>0 и 8>0 можно найти такое N_0f что последовательности любой длины N>N₀ распадаются на два класса:

1. Группа последовательностей, общая вероятность которых меньше, чем е.

2. Остаток, все члены которого обладают вероятностями, удовлетворяющими неравенству

Iog-

IogA

Другими словами, почти достоверно, что весьма бли-

зко к H_f когда N велико.

Близкий результат справедлив для любого числа последовательностей с различными вероятностями.

Рассмотрим опять последовательности длины N. Расположим их в порядке уменьшения вероятностей. Введем n(q) — числа последовательностей, которые мы должны взять из этой совокупности, начиная с наиболее вероятной последовательности, чтобы

ГЛ. i. ДИСКРЕТНЫЕ СИСТЕМЫ БЕЗ ШУМОВ

накопить полную вероятность q для взятых нами последовательностей.

Теорема 4

_Ит1£|п(?)_=Я(

когда q не равно нулю или единице.

\ogn(q) можно истолковать как число двоичных единиц, требуемых для описания последовательности, когда рассматриваются только наиболее вероятные последовательности с общей вероятностью q. Тогда ^log^*⁷* есть число двоичных единиц на символ,

необходимых для описания последовательностей. Теорема гласит, что для больших N оно не зависит от q и равно Я. Быстрота 'возрастания логарифма числа сравнительно вероятных последовательностей определяется величиной Я, независимо от истолкования термина «сравнительно вероятный». Благодаря этим результатам, доказанным в Приложении 3, можно в большинстве случаев рассматривать длинные последовательности, как если бы их было 2™, каждая с вероятностью 2~^HN.

Следующие две теоремы показывают, что Я и Я' могут быть определены предельными переходами непосредственно из статистики последовательностей сообщений без рассмотрения вероятностей состояний и вероятностей переходов между состояниями.

Теорема 5

Пусть P(B_i) — вероятность появления на выходе источника последовательности символов B_i. Пусть

^G"=--4S P(^)Iogp(B_i),

где суммирование распространяется на все последовательности B_if содержащие N символов. Тогда Gn является монотонно убывающей функцией от Я и

Iim G_n= Я.

N-* оо

Теорема 6

Пусть p(B_if Sj) — вероятность появления последовательности

B_if сопровождаемой символом Sy, а P₈ (Sj) = ~~^Р^в^~~--условная

вероятность того, что Sy следует за B_i. Пусть

ЧАСТЬ i. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

где суммирование распространено по всем группам B₁ из N-I символов и по всем символам Sy. Тогда Fn является монотонно убывающей функцией от N

Fn=NGn-(N-I)Gn-I, G_n = JT^Fn, F_n <G_N

Wm F_n= Н.

Все эти результаты получены в Приложении 3. Они показывают, что ряд приближений к H может быть найден путем рассмотрения одной только статистической структуры последовательностей, охватывающих 1,2,..., N символов. Fn является наилучшим приближением. В самом деле, Fn есть «энтропия» Я-го приближения к источнику рассмотренного выше типа. Если статистическое влияние, распространяющееся больше чем на Я символов, отсутствует, т. е. если' условная вероятность появления следующего символа, при условии знания предшествовавших (Я—1) символов, не изменяется при ознакомлении с любыми символами, стоящими ранее, го Fn=H.

Fn является, конечно, условной «энтропией» следующего символа, когда известны предыдущие (Я—1) символов, тогда как Gn— «энтропия» на символ для групп из Я символов.

Отношение «энтропии» источника к ее максимальному значению, которое она может иметь при тех же символах, называется относительной «энтропией» источника. Как будет показано ниже, это — максимальная сжатость, которая может быть достигнута кодированием при помощи того же самого алфавита.

Единица минус относительная «энтропия» есть избыточность. Избыточность обычного английского текста, если не рассматривать статистическую структуру, относящуюся более чем к 8 буквам, составляет примерно 50%. Это значит, что когда пишут по-английски, то половина знаков текста определяется структурой языка и лишь половина выбирается по желанию пишущего.

Число 50% было найдено несколькими независимыми методами, которые все дают сходные результаты. Одним из таких методов было вычисление «энтропии» приближений к английскому тексту. Другой состоял в исключении из образцов английского текста некоторой части букв, после чего делалась попытка их восстановить. Если бы их удалось восстановить, когда 50% текста исключено, избыточность должна бы быть больше, чем 50%. Третий метод связан с некоторыми известными выводами криптографии.

ГЛ. i. ДИСКРЕТНЫЕ СИСТЕМЫ БЕЗ ШУМОВ

7. ПРЕДСТАВЛЕНИЕ ПРОЦЕССОВ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ

Теперь нужно представить математически операции, выполняемые передатчиком и приемником с целью кодирования и декодирования сообщений. Каждый из них будет называться дискретным четырехполюсником. На вход четырехполюсника поступает последовательность входных символов, а на выходе получается последовательность выходных символов. В общем случае выходной эффект четырехполюсника зависит не только от наличного входного символа, но также и от предыдущих. Предположим, что существует конечное число т возможных состояний четырехполюсника и что его выходной эффект является функцией наличного состояния и наличного входного символа. Следующее состояние будет функцией этих двух величин.

Поэтому четырехполюсник может быть описан двумя функциями:

где х_п есть п-й входной символ, <х_п — состояние четырехполюсника в момент введения я-го входного символа, у_п — выходной символ (или последовательность выходных символов), создаваемый, когда на входе действует символ х_п и четырех-* полюсник находится в состоянии а_п.

Если выходные символы четырехполюсника можно отождествить со входными символами другого четырехполюсника, то четырехполюсники могут быть соединены последовательно, в результате чего получится новый четырехполюсник.

Если существует второй четырехполюсник, который работает от выхода первого четырехполюсника и восстанавливает исходный входной сигнал, то первый четырехполюсник называется несингулярным, а второй — ему обратным.

Теорема 7

Выход четырехполюсника с конечным числом состояний, возбуждаемого статистическим источником также с конечным числом состояний, является статистическим источником с конечным числом состояний и с «энтропией» (на единицу времени), меньшей или равной «энтропии» на входе. Если четырехполюсник не сингулярен, «энтропии» равны.

Пусть ос представляет собой состояние источника, который дает последовательность символов X_iy и пусть P — состояние четырехполюсника, который создает на выходе группы символов y_t. Комбинированная система может быть представлена «пространством результирующих состояний» пар (а, Р). Две точки в этом пространстве (а_ь P₁) и (а₂, р₂) соединяются линией, если состоя-

ЧАСТЬ i. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

ние Cti может создать х_у который превращает P₁ в р₂, и эта линия дает вероятность этого х в данном случае. Линия обозначается группой из у_г символов, создаваемых четырехполюсником.

«Энтропия» выходного эффекта может быть вычислена как взвешенная сумма по всем состояниям. Если суммировать сначала по Р, то получающиеся члены меньше или равны соответствующим членам для а, следовательно, «энтропйя» не возрастает. Присоединим выход несингулярного четырехполюсника к обратному четырехполюснику. Если Н\_у H^f₂ и Н'_ъ суть «энтропии» выходных эффектов соответственно источника, первого и второго четырехполюсников, то Н\>Н'₂>Н^=Н\ и, следовательно:

я; =я*,

Пусть имеется система с ограничениями, наложенными на возможные последовательности того типа, который можно представить линейным графиком фиг. 2. Если вероятности p^{sX приписаны различным линиям, соединяющим состояние / с состоянием /, то эта система будет источником. Существует один частный способ назначить вероятности, который дает максимум «энтропии» (см. Приложение 4).

Теорема 8

Пусть система с ограничениями, рассматриваемая как канал, обладает пропускной способностью C=IogU?. Если положим

B_j

где T*! — длительность s-ro символа, ведущего от состояния i к

V-

состоянию /, а B₁ удовлетворяет условию

B_l=^B_jW V,

S_tJ

то «энтропия» H имеет максимум и равна пропускной способности С.

Путем надлежащего назначения вероятностей переходов «энтропия» символов в канале может быть доведена до максимума, равного пропускной способности канала.

8. ОСНОВНАЯ ТЕОРЕМА ДЛЯ КАНАЛА БЕЗ ШУМОВ

Проверим теперь правильность интерпретации величины H_yкак скорости создания данных, путем доказательства того, что H определяет пропускную способность канала, необходимую при наиболее эффективном кодировании.

ГЛ. i. ДИСКРЕТНЫЕ СИСТЕМЫ БЕЗ ШУМОВ

Теорема 9

Пусть источник имеет «энтропию» H (двоичных единиц на символ), а канал обладает пропускной способностью С (двоичных единиц в 1 сек.). Тогда можно закодировать сообщения на выходе источника таким образом, чтобы передавать символы по ка-

C _лналу со средней скоростью-^--е символов в 1 сек., где е — сколь

угодно мало. Передавать со средней скоростью, большей чем С

-Jf_y невозможно.

Обратная часть теоремы, утверждающая, что нельзя превзойти скорости А, может быть доказана, если заметить, что «энтропия» на входе канала за 1 сек. равна «энтропии» источника, так как передатчик должен быть несингулярным четырехполюсником, и что эта «энтропия» не может превзойти пропускной способности канала. Отсюда #'<С и число символов в 1 сек.

равно _ < _ .

Первая часть теоремы будет доказана двумя различными способами. Первый способ состоит в рассмотрении совокупности всех последовательностей из N символов, создаваемых источником. При большом N можно разделить их на две группы, одна из которых содержит меньше чем 2(^H+ri)^N членов, а вторая меньше чем 2^RV членов (где R — логарифм числа различных символов) и имеет полную вероятность, меньшую ja. Если N возрастает, т\ и ц приближаются к нулю. Число сигналов в канале, каждый длительностью T_t больше чем 2(^С_0)Г, причем 6 мало, когда T велико. Если-выбрать

то найдется достаточное число последовательностей канальных символов для группы, обладающей высокой вероятностью, когда NuT достаточно велики (как бы ни было мало X), а также несколько добавочных последовательностей символов. Группа последовательностей с высокой вероятностью произвольным, взаимно однозначным образом, кодируется в эту совокупность. Остающиеся последовательности представляются более длинными, начинающимися и заканчивающимися одной из последовательностей, не использованных для группы с высокой вероятностью. Эта особая последовательность играет роль стартстопного сигнала другой кодовой комбинации.

Между ними сохраняется временной интервал, необходимый для образования достаточного числа различных последователь-

ностей для всех маловероятных сообщений. Для этого потребуется

R С

где w мало.

Средняя скорость передачи символов сообщения в 1 сек. будет тогда больше, чем

При возрастании Nb_y Xhw стремятся к нулю, а скорость приближается к -у.

Другой подход к такому кодированию и иной метод доказательства теоремы состоят в следующем. Расположим сообщения длиной N в порядке убывания вероятностей, и пусть эти вероятности будут P₁ > р₂> р_г....>р_п.

S-I

Пусть P₅ = S Pi* ^эт0 ^значит> ^что P_s ^есть накопленная вероятность вплоть Aop_s^_l включительно. Произведем сначала кодирование подво^чной системе. Кодовая комбинация для сообщения s получается путем разложения P_s как двоичного числа. Разложение будет содержать m_s позиций, где m_s есть целое число, удовлетворяющее соотношению

Icg₂-A^Xl +Icg₂A.

Ps Ps

Таким образом, высоковероятные сообщения представляются короткими кодовыми комбинациями, а маловероятные — длинными. Из этих неравенств вытекает

77 <Ps < 7^7=1 •

Новая комбинация для P_s будет отличаться от всех последующих одним или более из своих m_s знаков, так как все остающиеся P₁₉

по крайней мере, на —\-~ больше, и потому их двоичное разложе-

2 ⁸

ние отличается первыми m_s знаками. Следовательно, все кодовые комбинации различны, и по ним можно восстановить сообщение. Если канальные последовательности не всегда являются последовательностями двоичных знаков, они могут быть записаны двоичными знаками произвольным образом, а двоичный код преобразован в сигналы, годные для канала.

ГЛ. i. ДИСКРЕТНЫЕ СИСТЕМЫ БЕЗ ШУМОВ

Среднее число H₁ двоичных знаков, употребляемых на символ первоначального сообщения, легко определить. Мы имеем

^Я1=4гХ^тЛ-

Но

IS (¹°^) Ps^ IS *А<12 (¹ + ¹og₂£)^р"

и поэтому

GnKH₁^G_n +Jf-.

Когда N увеличивается, Gv сходится к H — «энтропии» источника, а H₁ сходится к Я.

Отсюда видно, что неэффективность кодирования в случае конечного времени запаздывания N символов не должна быть больше,

чем — плюс разность между истинной «энтропией» Я и «энтропией»

Gn, вычисленной для последовательностей длины N. Избыточное относительное время, потребное сверх идеального случая, будет поэтому меньше, чем

A,_L_i

— ^HN ^Ь

Этот метод кодирования в сущности совпадает с методом, независимо найденным Р. М. Фэно. Его метод состоит в расположении сообщений длины N в порядке убывающих вероятностей. Этот ряд делится на две группы, по возможности с равными вероятностями. Если сообщение относится к первой группе, его первая двоичная цифра будет 0, в противном случае—1. Группа подобным же образом разделяется на подгруппы примерно равной вероятности, и частная подгруппа определяет второй двоичный знак. Этот процесс продолжается до тех пор, пока не получатся подгруппы, содержащие только по одному сообщению. Легко видеть, что за исключением незначительных отличий (в общем случае в последней цифре) это приводит к тому же самому положению вещей, как и описанный выше арифметический процесс.

9. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ И ПРИМЕРЫ

Для передачи максимальной мощности от генератора в нагрузку в общем случае применяется трансформатор, который делает сопротивление генератора, наблюдаемое со стороны нагрузки, равным сопротивлению нагрузки. В рассматриваемом случае положение вещей, грубо говоря, аналогично. Четырехполюсник, осу-

ЧАСТЬ i. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ ^

ществляющий кодирование, согласовывает источник с каналом в статистическом смысле. Источник, рассматриваемый через четырехполюсник со стороны канала, должен иметь ту же самую статистическую структуру, какую имеет источник, обеспечивающий максимум «энтропии» в канале.

Содержание теоремы 9 сводится к тому, что, хотя точное согласование в общем случае невозможно, к нему можно подойти сколь угодно близко. Отношение действительной скорости передачи к пропускной способности канала может быть названо эффективностью кодирующей системы. Она, конечно, равна отношению действительной «энтропии» канальных символов к максимально возможной «энтропии».

Вообще говоря, идеальное или близкое к этому кодирование требует длительных временных задержек в передатчике и приемнике. В случае отсутствия шумов, который и рассматривается, главное назначение этих задержек состоит в рациональном согласовании вероятностей с соответствующими длительностями последовательностей. При хорошем коде логарифм обратной величины вероятности длинного сообщения должен быть пропорционален длительности соответствующего сигнала; действительно

IogJ-

должно быть мало для всех длинных сообщений за исключением их небольшой части.

Если источник может давать только одно определенное сообщение, его «энтропия» равна нулю, и канал не нужен. Например, счетная машина, спроектированная для вычисления последовательных цифр числа iz₉ дает определенную последовательность без всяких элементов случайности. Для «передачи» этой последовательности в другую точку не нужно никакого канала. Во второй точке можно построить другую машину, вычисляющую ту же самую последовательность. Однако это может быть непрактично. В этом случае можно игнорировать статистические сведения об источнике или только часть их. Можно рассматривать цифры числа т: как случайную последовательность и сконструировать систему, способную передавать любую последовательность цифр.

Подобным же образом можно использовать некоторые из статистических сведений об английском тексте при составлении кода. В этом случае рассматривается источник с максимальной «энтропией», подчиненный статистическим условиям, которые пожелали сохранить. «Энтропия» этого источника определяет необходимую и достаточную пропускную способность канала. В примере с числом тс оставлены только те сведения, что все цифры выбираются из ряда 0,1,...,9. В случае английского текста можно пожелать использо-

ГЛ. i. ДИСКРЕТНЫЕ СИСТЕМЫ БЕЗ ШУМОВ

вать статистическую экономию, возможную благодаря знанию частот букв, но ничего больше. Источник с максимальной «энтропией» будет тогда первым приближением к английскому тексту и его «энтропия» определит необходимую пропускную способность канала.

В качестве простого примера использования некоторых из полученных результатов рассмотрим источник, создающий последовательность букв, выбранных из ряда A_y B_y С, Dc вероятностями V₂, ¹ ₄» ¹^s» ¹Zs» причем последовательные символы выбираются независимо. Имеем

и /1 , I_lIi 1,2. 1 \ 7¹

H = - ^ Iog₂ _т + j Iog₂- + _Tlog_2Tj ₌ _т

двоичных единиц символ

Таким образом, для кодирования сообщений этого источника двоичными знаками в пределе достаточно в среднем V₄ знака на символ.

В этом случае можно действительно достигнуть предельного значения, применяя следующий код (полученный по^методу второго доказательства теоремы 9):

А О В 10 С ПО , D 111.

Среднее число двоичных знаков, применяемых для кодирования последовательности из N символов, будет

^({xi + 4х²+|хз) =\n.

Легко видеть, что двоичные знаки 0,1 имеют вероятности V₂, V₂, так что «энтропия» для кодированных последовательностей равна одной двоичной единице на символ. Так как в среднем имеем V₄ двоичных знаков на букву оригинала, то «энтропия» на единицу времени будет той же самой. Максимально возможная «энтропия» для первоначального ряда равна lcg24=2 и имеет место, когда A_y B_y C_y D обладают вероятностями V₄, V₄, V₄, V₄. Отсюда относительная «энтропия» равна V₈. Мы можем перевести двоичные последовательности в первоначальный ряд символов в соотношении 2 к 1 по следующей таблице:

00 A^t

01 B^f10 С И D^f

ЧАСТЬ i. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

Этот двойной процесс кодирует первоначальное сообщение в те же самые символы, но со средним коэффициентом сжатия V₈.

В качестве второго примера рассмотрим источник, дающий последовательность букв А и В с вероятностями р для Auq для В. Если p<^q_f имеем

H = — Iog рр (1 — рУ -P = 1 -P

= —Plogp(I-P) ^р = = Plog J.

В этом случае можно построить хорошую систему кодирования сообщений в канале, передающем только 0,1, путем посылки специальной последовательности, скажем 0000, для редкого символа А и затем последовательности, указывающей число букв В, следующих за ним. Это число может быть указано путем представления в двоичной системе, причем все числа, содержащие специальную последовательность, исключаются. Все числа до 16 изображаются как обычно; 16 передается следующим после шестнадцати двоичным числом, которое не содержит четырех нулей, а именно: 17= = 10001 и т. д.

Можно показать, что при р—>0 кодирование приближается к идеальному, если только длина специальной последовательности выбрана правильно. %

Глава II ДИСКРЕТНЫЙ КАНАЛ С ШУМАМИ

10. ПРЕДСТАВЛЕНИЕ ДИСКРЕТНОГО КАНАЛА С ШУМАМИ

Рассмотрим теперь случай, когда на сигнал в процессе передачи или на концах тракта воздействуют шумы. Это означает, что принимаемый сигнал не обязательно тот же самый, что посланный передатчиком. Можно различать два случая. Если данный .,переданный сигнал всегда создает тот же самый принятый сигнал, т. е. принятый сигнал является определенной функцией переданного сигнала, .то такой эффект может быть назван искажением. Если эта функция имеет обратную — никакие два переданных сигнала не создают одинаковых принятых сигналов, — то искажения могут быть скорректированы, по крайней мере принципиально, просто путем выполнения обратного функционального преобразования принятого сигнала.

Интересен случай, когда сигнал испытывает не всегда одинаковое изменение при передаче. Тогда можно считать принятый сигнал E функцией переданного сигнала S и другой переменной — шумов N

E = f(S,N).

Шумы рассматриваются как случайная переменная, точно так же как раньше рассматривалось сообщение. В общем случае шумы могут быть представлены подходящим стохастическим процессом. Наиболее общий тип дискретного канала с шумами, какой будет рассмотрен, является обобщением ранее описанного свободного от шумов канала с конечным числом состояний. Предположим, что число состояний конечно и имеется совокупность вероятностей

р* л

того, что если канал находится в состоянии а и передается символ /, то будет принят символ /, а канал перейдет в состояние [5. Таким образом, QL и P охватывают все возможные состояния, i — все возможные передаваемые* сигналы, а /—все возможные принимаемые сигналы. Если последовательные символы подвергаются воздействию шумов независимо, имеется только одно состояние, и канал описывается совокупностью вероятностей переходов /?Д/> (вероятность того, что переданный сигнал i будет принят как /)

Когда на входе канала с шумами действует некоторый .лик сообщений, следует рассматривать два статистических оцесса,

ЧАСТЬ i. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ сигналов

описывающих источник и шумы. Соответственно этому может быть вычислен ряд различных «энтропий».

Во-первых, существует «энтропия» Н(х) источника или «энтропия» на входе канала (они равны, если передатчик не сингулярен). «Энтропия» на выходе канала, т. е. «энтропия» принимаемого сигнала, будет обозначаться через Н(у). В случае отсутствия шумов Н{у} = Н(х). «Энтропия» совместного 'события для входа и выхода будет обозначаться через Н(х, у). Наконец, имеются две условные «энтропии» Н_л(у) и H_u(X)_f «энтропия» на выходе при известном эффекте на входе, и наоборот.

Между этими величинами имеет место соотношение

Я(х, у) = Н(х) + Н_л(у) = Н(у) + Н_у(х). Все эти «энтропии» могут измеряться за 1 сек. или на символ.

11. НЕНАДЁЖНОСТЬ И ПРОПУСКНАЯ СПОСОБНОСТЬ КАНАЛА

При наличии шумов, вообще говоря, невозможно на основании принятого сигнала восстановить исходное сообщение или переданный сигнал с полной определенностью. Однако имеются некоторые способы передачи сообщений, которые являются оптимальными в отношении борьбы с шумами. Эта задача и рассматривается ниже.

Предположим, что имеется два возможных сигнала 0 и 1 и что передача осуществляется со скоростью в 1000 символов в 1 сек.

с вероятностями P₀=Pi=^-^ Таким образом, данный источник создает сообщения со скоростью 1000 двоичных единиц в 1 сек. Во время передачи шумы вносят ошибки таким образом, что в среднем один из ста принятых сигналов неправилен (0 вместо 1 или 1 вместо 0).

Какова скорость передачи сообщений? Конечно, меньше/чем 1000 двоичных единиц в 1 сек., так как около одного процента принятых символов неправильны. Сразу же хочется сказать, что эта скорость составляет 990 двоичных единиц в 1 сек., т. е. просто вычесть число ошибок. Однако'это неправильно, здесь не учитывается, что получатель не знает, где именно произошла ошибка.

Можно рассмотреть крайний случай и предположить, что шумы столь велики, что принятые символы совершенно не зависят от переданных. ВерЬятность приема 1 равна V₂ при передаче любого сообщения и аналогично для 0. Тогда около половины всех принятых символов будут правильными благодаря одной только случайности, и можно считать, что система способна передавать 500 двоичных единиц, в то время как в действительности данные вовсе не передаются. Можно было бы получить столь же «хорошую» передачу, отказавшись вообще от канала и подбрасывая монету в точке приема.

ГЛ. II. ДИСКРЕТНЫЙ КАНАЛ С ШУМАМИ

Очевидно, правильная поправка к количеству переданных данных равна количеству данных, отсутствующих в принятом сигнале, или иначе — неопределенности при приеме сигнала относительно того, что именно было в действительности передано. На основании предыдущих рассуждений относительно «энтропии» как меры неопределенности представляется рациональным использовать условную «энтропию» сообщения (при условии знания принятого сигнала) в качестве меры этих отсутствующих данных. Как увидим ниже, такое определение будет правильным.

Следуя этой идее, действительная скорость передачи может быть найдена путем вычитания из скорости создания сообщений (т. е. «энтропии» источника) условной «энтропии» Н_у(х)

[R = Н(х)]-Ну(х).

Условная «энтропия» Н_у(х) будет называться ненадежностью. Она измеряет среднюю неопределенность принятого сигнала.

В рассмотренном выше примере, если был принят нуль, то апостериорная вероятность того, что был передан нуль, равна 0,99, а что была передана единица,— 0,01. Если же была принята единица, то эти цифры поменяются местами.

Отсюда

„ двоичных единиц H_y(X) = - (0,99 lcg0,99 + 0,01 IogO_lOl) - 0,081--

или 81 двоичная единица в 1 сек. Можно сказать, что система передает со скоростью 1000—81=919 двоичных единиц в 1 сок. В том крайнем случае, когда при передаче какого-то знака равновероятен прием как 0, так и 1, апостериорные вероятности равны V₂, V₂ и

H_y(X) = - I\ Icg 4-+ A Icg А V 1 ~~Двоичных единиц~~ ^yw Д 2 ^fe 2 ' 2 ^b 2 у символ

или 1000 двоичных единиц в 1 сек. Скорость передачи, как и следовало ожидать, равна в этом случае нулю.

Следующая теорема дает непосредственную интуитивную интерпретацию ненадежности и подтверждает, что она является единственной подходящей мерой.

Рассмотрим систему связи и наблюдателя (или вспомогательный прибор), который может наблюдать как то, что передается, так и то, что принимается (с ошибками из-за шумов). Этот наблюдатель отмечает Ъшибки в воспроизводимом сообщении и передает данные в точку приема через «канал коррекции», чтобы дать возможность в точке приема исправить ошибки. Схематически это показано на фиг. 7

⁴⁴ ЧАСТЬ I. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

Теорема 10

Если канал коррекции обладает пропускной способностью, равной H_y(x)_f то можно таким образом закодировать данные коррекции, чтобы передать их по этому каналу, и скорректировать все ошибки за исключением произвольно малой доли е. Это невозможно, если пропускная способность канала коррекции меньше, чем Н_у(х).

Грубо говоря, Я Да;) есть количество дополнительных данных, которые должны быть переданы за 1 сек. в точку приема для корректирования принятого сообщения.

Данные коррекции

Наблюдатель



		M



		M'

Источник Передатчик

Приемник Корректирующее устройство

Фиг. 7. Схема системы коррекции.

Для доказательства первой части теоремы рассмотрим длинные последовательности принятого сообщения M^f и соответствующее исходное сообщение М. Количество недостающих данных в принятом сообщении M^f составляет (в логарифмической мере) ТН_у(х). Поэтому следует передавать каждые T секунд ТН_у(х) двоичных цифр. Это может быть сделано с частотой ошибок е в канале с пропускной способностью, равной Н_у(х).

Вторая часть теоремы может быть доказана, если заметить, что, во-первых, для каждых дискретных случайных переменных X₉У, г

Н_у(х₉ г) > H_y(X). Левая часть может быть представлена в развернутом виде

H_y(Z) +H_yz(X) > H_y(X)_fH_vz (х) > Н_у(х) - H_y (Z) > H_y (х) - H(z).

Если отождествить х с выходным эффектом источника, у — с принимаемым сигналом, а z — с сигналом, посланным по каналу коррекции, то правая часть равна ненадежности за вычетом ско-

ГЛ. II. ДИСКРЕТНЫЙ КАНАЛ С ШУМАМИ

рости передачи по каналу коррекции. Если пропускная способность этого канала меньше, чем величина ненадежности, правая часть будет больше нуля и Н_иг(х)>0. Но это есть неопределенность того, что было передано, когда известен как принятый сигнал, так и сигнал коррекции. Если эта неопределенность больше нуля, частота ошибок не может быть сколь угодно малой.

Пример. Предположим, что в последовательности двоичных чисел ошибки происходят хаотически, вероятность того, что цифра неправильна, равна /?, а вероятность того, что она правильна, равна q—\—р. Эти ошибки могут быть исправлены, если известно их положение. Таким образом, канал коррекции должен давать только сведения об этих положениях. Это сводится к передаче сообщений источника, который дает двоичные цифры с вероятностью р для 1 (правильно) и q для 0 (неправильно). Необходимая пропускная способность канала коррекции

— [р Iogp +q Icgq] равна ненадежности исходной системы.

Скорость передачи R может быть записана в двух различных формах на основании приведенных выше тождеств. Имеем R = H(X₁) - H_v(X) = Н(у) - HM = Н(х) + Н(у) - Н(х, у).

Первое выражение всегда интерпретируется как количество переданных данных за вычетом неопределенности того, что было передано. Второе выражение измеряет количество принятых данных за вычетом той части, которая обусловлена шумами. Третье выражение есть сумма количества переданных и количества принятых данных за вычетом «энтропии» совместных событий. Таким образом, все три выражения имеют определенное интуитивное значение.

Пропускная способность канала с шумами должна быть максимально возможной скоростью передачи, т. е. скоростью при должном согласовании источника с каналом.

Определим поэтому пропускную способность канала как С = тах[Н{х) — Н_у{х)],

где максимум взят по отношению ко всем возможным источникам сообщений, которые могут быть использованы как входные источники канала. Если канал без шумов, то Н_у(х)=0. Тогда это определение эквивалентно тому, которое всегда давалось для канала без шумов, ибо по теореме 8 максимум «энтропии» для канала равен его пропускной способности.

12. ОСНОВНАЯ ТЕОРЕМА ДЛЯ ДИСКРЕТНОГО КАНАЛА ПРИ НАЛИЧИИ ШУМОВ

Мсжет показаться неожиданным, что рассматривается вопрос об определенной пропускной способности канала при наличии шумов, так как в этом случае невозможно передавать сообщения с до-

ЧАСТЬ I. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

стоверностью. Однако ясно, что при передаче с избыточными символами вероятность ошибок может быть уменьшена. Например, путем многократного повторения сообщения и путем статистического изучения различных принятых вариантов сообщения вероятность ошибок может быть сделана очень малой. Можно было бы ожидать, что для приближения вероятности ошибок к нулю избыточность кодирования должна неограниченно возрастать, вследствие чего скорость передачи должна приближаться к нулю.

Это ни в коем случае не верно, так как в противном случае не

существовало бы вполне определенной

пропускной способности канала, а была бы пропускная способность при заданной частоте ошибок или при заданной ненадежности. Тогда пропускная способность уменьшалась бы, по мере того как требованияотносительно ошибок становились бы более жесткими.

В действительности пропускная способность имеет вполне определен

Фиг. 8. Ненадежность, возможная при данной «энтропии» на входе канала.

ное значение. При должном кодировании можно передавать по каналу сообщения со скоростью С при сколк

угодно малой частоте ошибок или при сколь угодно малой ненадежности. Это утверждение неверно для скоростей, превышающих С. При попытках передавать со скоростью, превышающей С, скажем С+R_l9 неизбежно появится ненадежность, равная или большая, чем R₁.

Это положение иллюстрируется фиг. 8. Скорость создания сообщений в канале отложена по горизонтали, а ненадежность — по вертикали. Любая точка выше жирной линии в заштрихованной области может быть осуществлена, тогда как точки, расположенные ниже жирной линии, не осуществимы. Точки самой линии, вообще говоря, не могут быть получены за исключением обычно двух.

Эти положения являются, основным подтверждением правильности предложенного определения С; они будут сейчас доказаны.

T е о р е м а 11 ₄Пусть дискретный канал обладает пропускной способностью C_yа дискретный источник — «энтропией» за 1 сек. Н. Если Н<С₉то существует такая система кодирования, что сообщения источника могут быть переданы по каналу с произвольно малой частотой ошибок (или со сколь угодно малой ненадежностью). Если #<С, то можно закодировать сообщения источника таким образом, чтобь! ненадежность была меньше, чем H—С+е, где е сколь угодно мало.

ГЛ. II. ДИСКРЕТНЫЙ КАНАЛ С ШУМАМИ

41«

Не существует способа кодирования, обеспечивающего ненадежность меньшую, чем H—С.

Метод доказательства первой части этой теоремы состоит не в указании способа кодирования, обеспечивающего требуемые свойстеФ, а в доказательстве того, что такой код должен существовать •* определенной группе кодов. В действительности частота ошибок по этой группе усредняется, и будет показано, что это среднее значение может быть сделано меньше, чем е. Если среднее значение совокупности чисел меньше, чем е, то в ней должно существовать, по крайней мере, одно число, которое меньше е. Это и устанавливает искомый результат.

Пропускная способность канала с шумами была определена как С = т&х[Н(х)—Н_у{х)]> где х относится ко входу, а у — к выходу. Максимум отыскивается по всем источникам, которые могут быть использованы на входе канала. Если максимум в действительности не достигается ни при каком источнике, то пусть S₀ означает источник, обеспечивающий приблизительно максимальную скорость.. Предполагая, что S₀используется как источник на входе канала, рассмотрим возможные передаваемые и принимаемые последовательности большой длительности T_f Можно утверждать следующее:

1. Передаваемые последовательности распадаются на два класса: класс с большой вероятностью, содержащий около 2^Tf1*^x) членов, и остающиеся последовательности с малой общей вероятностью.

2. Аналогично и принимаемые последовательности распадаются на высоковероятную совокупность приблизительно из 2^ГН{у) членов и маловероятную совокупность из остальных последовательностей.

3. Каждый высоковероятный выходной эффект может быть создан примерно 2^Т11_у^{х) входными эффектами. Возможность всех остальных случаев имеет малую полную вероятность.

4. Каждый высоковероятный входной эффект может привести примерно к 2™jc^{y) выходным эффектам. Все другие результаты имеют малую полную вероятность.

Все е и 8, связанные в этих утверждениях со словами «малый» и «приблизительно», стремятся к нулю, когда T заставляем увеличиваться, а свойства S₀ приближаем к свойствам оптимального источника.

Фиг. 9 иллюстрирует сказанное. На графике входные последовательности представлены точками слева, а выходные — точками справа. Расходящиеся линии («веер») наверху изображают ряд возможных случаев для типичного выходного эффекта. Нижний «веер» представляет возможные случаи для типичного входного эффекта. В обоих примерах отброшены последовательности «малой вероятности». ____ _п

ЧАСТЬ I. СТАТИСТИЧЕСКАЯ . ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

Предположим теперь, что имеется другой источник, дающий сообщения со скоростью R_y причем /?<С. За период T этот источник будет давать 2^TR высоковероятных сообщений. Надо связать их с выбором возможных входных эффектов канала таким образом, чтобы иметь наименьшую частоту ошибок. Будем устанавливать эту связь всеми возможными способами (используя, однако, только высоковероятную группу входных эффектов, определяемых источником S₍) и усредним частоту ошибок для этого широкого класса возмож

ных систем кодирования. Это все рав-

но, что вычислять частоту ошибок для случайной связи сообщений и входных эффектов канала при длительности Т.

Пусть наблюдается некоторый выходной эффект Ij₁. Какова вероятность, что более чем одно сообщение из числа возможных вызовет выходной эффект #!?.

Имеются 2^TR сообщений, распределенных по случайному закону в 277v и) точках. Вероятность того, что некоторая данная точка будет сообщением, поэтому равна

₂ -#(*)!.

₂тн_х(У) • возможных эффектов от каждого M »

Вероятность того, что ни одна точка «веера» не будет сообщением (кроме

действительного исходного сообще-

Фиг. 9. Схематическое представление соотношений между входными и выходными эффектами в канале.

ния), равна

JTH_y(X)

P = (\—2^T[R~^H{x)]) Но R <[Н{х) —H_y(X)I так что R — Н(х) =— Н_у(х) — т), причем Tj — положительно. Следовательно:

P ₌(\-2-™у^{х)-^Т7>)² ^Упри T-^oo стремится к

1-2-^г\

Отсюда вероятность ошибок стремится к нулю и тервая часть теоремы доказана.

Вторую часть теоремы легко доказать, замечая, что можно просто передавать от источника С двоичных единиц в 1 сек., полностью

ГЛ. II. ДИСКРЕТНЫЙ КАНАЛ С ШУМАМИ

пренебрегая остатком создаваемых данных. В приемнике пренеб-регаемая часть данных создаст ненадежность Н(х)—С, а передаваемая часть должна лишь добавить е. Этот предел можно также получить многими другими способами, как будет показано при рассмотрении канала с непрерывной передачей.

Последнее утверждение теоремы является прямым следствием определения пропускной способности канала.

Предположим, что можно закодировать сообщения источника, обладающего скоростью H(x)=C+a_f таким образом, чтобы получить ненадежность Н_у(х)=а—е, хде г — положительно. Тогда

ад—H_y(X) = C+в,

где £ — положительно. Это противоречит определению С как максимума величины Н(х)—Н_у(х)-

В действительности здесь доказано больше, нежели утверждается в теореме. Если среднее значение множества * положительных чисел отличается от нуля меньше, чем на s, то только часть из них, не превышающая |7е»^может быть больше уТ.Так как е сколь угодно мало, можно сказать, что почти все системы сколь угодно близки к идеальной.

13. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Доказательство теоремы 11, не будучи чистым доказательством существования, обладает некоторыми недостатками подобных доказательств. Попытка осуществить хорошее приближение к идеальному кодированию по методу, примененному в доказательстве, вообще говоря, представляется непрактичной. Действительно, за исключением нескольких довольно тривиальных случаев и некоторых предельных положений никаких явных свойств ряда приближений к идеальному методу не найдено. Вероятно, это не случайно, а связано с трудностью задания определенной конструкции, хорошо апроксимирующей случайную последовательность.

Приближение к идеальному методу обладало бы тем свойством, что оригинал мог бы быть еще восстановлен из сигнала, допустимым образом измененного помехами. Другими словами, предполагается, что это изменение не делает принимаемый сигнал ближе к другим возможным сигналам, чем к оригиналу.

Это достигается ценой введения некоторой избыточности при кодировании. Избыточность должна быть введена соответствующим образом для борьбы против действующих в канале шумов определенной структуры. Всякая избыточность источника будет обычно помогать, если она используется в точке приема. В частности, если источник всегда имеет некоторую избыточность и не принято никаких попыток исключить ее при согласовании с каналом, эта избыточность будет помогать в борьбе с шумами. Например, в телеграфном канале без шумов можно сэкономить около 50% времени путем

ЧАСТЬ I. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

правильного кодирования сообщений. Это не делается, и большая часть избыточности английского текста остается в символах канала. В результате при передаче оказываются допустимыми довольно сильные шумы. Значительная часть букв может приниматься неправильной восстанавливаться на основании контекста.

При отсутствии шумов для приближения к идеальному кодированию требуется, вообще говоря, некоторая временная задержка. Теперь она приобретает новую функцию, позволяя большему «образцу» шумов воздействовать на сигнал, прежде чем какое-либо суждение будет сделано в точке приема относительно исходного» сообщения. Увеличение размера «образца» всегда усиливает возможные статистические утверждения.

Содержание теоремы 11 и ее доказательство могут быть сформулированы несколько иным способом, который устанавливает более непосредственную связь со случаем отсутствия шумов. Рассмотрим возможные сигналы длительностью T и предположим, что из них выбрана некоторая подгруппа используемых сигналов. Пусть все сигналы подгруппы употребляются с одинаковой вероятностью; при этом предположим, что приемник устроен так, что, когда принимаются искаженные сигналы, он выбирает в качестве действительного сигнала наиболее вероятный из этой подгруппы. Обозначим через N(T_yq) максимальное число сигналов, которые могут быть выбраны, для подгруппы таким образом, что вероятность ложной интерпретации меньше или равна q.

Теорема 12

Если С — пропускная способность канала,,то при условии, что q не равно 0 или 1

Iim М1(ТМ_ ₌ с.

Другими словами, независимо от требований надежности можно в течение времени T уверенно различить достаточно сообщений,, соответствующих примерно CT двоичных единиц, если T достаточно велико. Теорему 12 можно сравнить с определением пропускной способности канала без шумов, данным в главе I.

14. ПРИМЕР ДИСКРЕТНОГО КАНАЛА

Простой пример дискретного канала иллюстрирует фиг. 10. Имеются три возможных символа. Первый символ никогда не подвергается воздействию шумов. Второй и третий символы имеют вероятность р пройти неискаженными, и вероятность q превратится в другой символ той же пары. Положим а=—(р lcgp+qlcg q) и пусть P_yQnQ — вероятности употребления соответственно первого, второго и третьего символов.

ГЛ. II. ДИСКРЕТНЫЙ КАНАЛ С ШУМАМИ

Имеем

Н(ху=-P IcgP—2Q IcgQ, H_y(X) = 2Qa.

Надо выбрать PnQ таким образом, чтобы Н(х)—Н_у(х) имело максимум при наложении условия P+2Q=1. Тогда

U=-PlcgP -2Q Icg Q -2 Qa + ) (Р + 2Q), ?p=-l-lcgP + X=0,

A =-2-2 Icg Q -2а -и 2Х =0.

Лередсгвсгемь/е символы

Принимаемые символы

Фиг. 10. Пример дискретного канала. Исключая X, напишем

lcgP = lcgQ + a, P = Qe= Q?,

P = -L • О - —^!-fi + 2 ' ⁴ ~~ р + 2

Пропускная способность канала равна

C = Ic_g^

Заметим, как это подтверждает очевидные значения в случае

P=I и р= L В первом случае р=1 и C=Icg 3, что правильно, так

как канал свободен от шумов и имеет три возможных символа.

Если P=-T^y Р=2 H*C=lcg2. Здесь второй и третий символы не могут

быть отличимы друг от друга и действуют совместно как один

символ. Первый символ употребляется с вероятностью ^=+, а

второй и третий вместе — с вероятностью V₂, которая может быть распределена между ними любым способом, причем всегда достигается максимальная пропускная способность.

При промежуточных значениях р пропускная способность канала будет заключена между Icg 2 " Icg 3. Различие между вторым

ЧАСТЬ i. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

и третьим символами может быть использовано для передачи некоторого количества сведений, но меньшего/чем в случае канала без; шумов. Первый символ употребляется несколько чаще, чем два остальных, так как на него не воздействуют шумы.

15. ПРОПУСКНАЯ СПОСОБНОСТЬ КАНАЛА В НЕКОТОРЫХ СПЕЦИАЛЬНЫХ СЛУЧАЯХ

Если шумы воздействуют на последовательные символы в канале независимо, то для вычисления пропускной способности можно-воспользоваться совокупностью вероятностей переходов р_и-. Это — вероятность того, что если послан символ /, то будет принят символ /. Максимальная скорость передачи сообщений в канале определяется в этом случае максимумом выражения

-2 W«S PiPu+2^piPt№Pij'

где изменяем P_i при условии 2 P_i=E По методу Лагранжа это приводит к уравнениям

Умножение на P_s и суммирование по s показывают, что (х=—С. Обозначим величины, обратные p_sj (если они Существуют), через; H_stf так что S Ktp_sj = Kj.

Тогда

2 Kt Psj Icg Psj- Icg S P_iPit = — CS Kt •

sj i s

Отсюда

2P_i pu = ехр(С Jjhst+Y_iKtPsj Iegp_z7)

/ S Sj

ИЛИ

Pt = S Kt ехр (С2 Kt + S Kt Psj Icg Psj)

t S S_t j

Это — система уравнений для определения оптимальных значений P_it причем С должно быть определено таким образом, чтобы 2Р/=1. Когда это сделано, С будет пропускной способностью канала, а P_i — соответствующими вероятностями канальных символов, при которых может быть получена такая пропускная способность.

Если каждый входной символ имеет одинаковую совокупность вероятностей на исходящих от него на диаграмме линиях и то же самое справедливо для каждого выходного символа, пропускная способность может быть легко вычислена.

гл. ii. дискретный канал с шумами

Примеры показаны на фиг. 11. В таком случае Н_у(х)ис зависит от распределения вероятностей между входными символами и равняется —2/Ag Piy ^где Pi — значения вероятностей переходов от любого входного символа. Пропускная способность канала равна

тах [Н(у) — Н_х(у)] = = тах H(у) + 2 P_i Iog P_i.

а 6 *

Фиг. 11. Примеры дискретных каналов с одинаковыми вероятностями переходов (для каждого входного и выходного эффекта).

Максимум H(у)_у очевидно, равен Jcg т_у где т — число выходных символов, так как все они могут быть сделаны равновероятными, если сделать равновероятными входные символы. Поэтому^про-пускная способность канала равна

C= Iog т+ 2 Pi Iog P_i.

Для случая, приведенного на фиг. 11,а,

С = Iog4— Iog 2= Iog 2.

Это значение будет достигнуто при использовании только первого и третьего символов.

Для случая, показанного на фиг. 11,6,

С = Iog 4- A Iog 3- -L Iog 6= = Iog 4- Iog 3- A Jog 2= IogA₂V,

Для случая, приведенного на фиг. 11,в, идоеем

С = Iog 3- A Ic_g 2- -1 Iog 3- 4 Iog 6 =

⁼ ^l0g 2^3¹/' 6^1/«'

ЧАСТЬ I. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

Предположим, что символы распадаются на различные группы таким образом, что шумы никогда не превращают символы одной группы в символы другой группы. Пусть пропускная способность для п-й группы равна C_v (в двоичных единицах за 1 сек.), если употребляются только символы этой группы. Тогда легко показать, что для наилучшего использования всей совокупности полная вероятность P_n всех символов в п-й группе должна быть

Внутри группы вероятности распределяются как раз так, как если бы эти символы были единственно используемыми. Пропускная способность канала равна

;g£2

16. ПРИМЕР ЭФФЕКТИВНОГО КОДИРОВАНИЯ

Следующий пример, хотя и несколько искусственный, является случаем, в котором возможно точное согласование с каналам, подверженным влиянию шумов. Имеются два канальных символа О и 1, а шумы воздействуют на них в группах из 7 символов. Группа из 7 символов либо передается без ошибок, либо в ней оказывается ошибочным ровно 1 символ из 7. Эти 8 вероятностей одинаковы. Имеем

>о ттт/ \ тт / \, 1 /- . 8 , 1 \ 4 двоичных единиц

С = шах Щу) - Н_х{у)\ =-тг (7+-8 Icg -₈ ) =-₇--

Эффективны;" код, обеспечивающий полную коррекцию ошибок и передачу со скоростью С, представляет собой следующее.

Пусть группа из 7 символов будет X_l9 X_2t..., X₇. Из них X₃₉X_5t X_6t X₇ — символы сообщения, которые зависят от характера сообщения. Остальные три символа являются избыточными и выбираются следующим образом:

X_a выбирается так, чтобы а=Х_А+Х₅+Х₆+Х₇ было четным X₂ » » » $=х₂+Х₃+Х₆+Х₇ » »

X_i » » » Y=^i~b^3+X>+^7 » »

Когда группа из 7 символов принята, вычисляются а, В, у, и если они окажутся четными, то означают нуль, а если нечетными, то означают единицу. Двоичные цифры а, [5, у дадут тогда индексы тех X_jt которые являются ошибочными (если получится 0, то это означает отсутствие ошибок).

Глава III НЕПРЕРЫВНЫЕ СООБЩЕНИЯ

Рассмотрим теперь случай, когда сигналы или сообщения (или те и другие) являются непрерывными переменными в противоположность исследованным ранее дискретным системам. При этом значительная часть результатов может быть получена предельным переходом от дискретного случая путем деления всего континуума сообщений или сигналов на большое, но конечное число малых областей и вычисления различных параметров, введенных на дискретной основе. По мере уменьшения размеров областей эти параметры в общем сходятся в пределе к соответствующим значениям для непрерывного случая.

В непрерывном случае не будем стремиться к наибольшей общности или к полной математической строгости, так как это связано с широким применением абстрактной теории размерностей. Предварительное изучение, однако, показывает, что теория может быть сформулирована совершенно аксиоматическим и строгим образом, включая как непрерывный и дискретный случаи, так и многие другие. Некоторые вольности, допущенные в настоящем анализе при предельных переходах, во всех случаях, представляющих практический интерес, могут быть оправданы.

17. МНОЖЕСТВА И АНСАМБЛИ ФУНКЦИЙ

В непрерывном случае встречаемся со множествами функций и с ансамблями функций. Множество функций, как указывает само название, есть просто некоторый класс или набор функций обычно одной переменной — времени. Оно может быть определено либо путем явного представления различных функций во множестве, либо неявно, путем указания тех свойств, которыми обладают функции множества, а другие функции нет. Приводим некоторые примеры:

1. Множество функций

/e(Z)=sin (t+Q).

Каждое частное значение 6 определяет частную функцию множества.

2. Множество всех функций времени, не содержащих частот выше W гц.

часть i. статистическая теория передачи сигналов

3. Множество всех функций, ограниченных по полосе частотой W и по амплитуде — амплитудой А.

4. Множество всех английских речевых сигналов, рассматриваемых как функции времени.

Ансамбль функций есть множество функций вместе с вероятностной мерой, посредством которой можно Определить вероятность того, что функция множества обладает некоторыми определенными свойствами ¹J. Например, вместе со множеством

/_e(Z) ₌ sin (Z + 0)

можно задать распределение вероятностей для б, т. е. P(Q). В таком случае множество становится ансамблем.

Приведем некоторые другие примеры ансамблей функций:

1. Конечное множество функций Za(Z) , где £=1,2,..., п₉ вместе с вероятностью того, что Za есть Pk .

2. Множество функций с конечным числом измерений

Z(^ai» a₂,.,., а_л; t) вместе с распределением вероятностей для параметров Ol₁

р(о_ъ Ct₂,..., а_л).

Например, можно рассмотреть ансамбль, определяемый в виде

f(a_l9...₉ а_п9 B₁₉ Q_n; t)= ^y^a_n sin n(wt + Q_n),

я=1

где амплитуды a_t распределены нормально и независимо, а фазы O_i распределены равномерно и независимо в интервале (0-^-2тс).

3. Ансамбль

f(a_i91) =^a_n ~~^pwt-n)~~ '

где a_t распределены по нормальному закону, _независимы и все имеют одно и то же стандартное отклонение Y^. Это выражение представляет «белые» шумы, полоса частот которых ограничена участком _лот 0 до гц₉ а средняя мощность равна N²). —~~————- I \

¹) По математической терминологии функции принадлежат к измеримому пространству, полная мера которого есть единица.

*) Это представление может быть использовано как определение «белых* шумов с ограниченной полосой частот. Оно имеет некоторые преимущества, связанные с меньшим числом предельных переходов, нежели определения, применявшиеся в прошлом. Термин «белые шумы», прочно укоренившийся в литературе, представляется несколько неудачным. В оптике под белым светом понимается излучение, имеющее либо сплошной спектр (в противоположность линейчатому), либо спектр, равномерный по отношению к длине волны (а это не то же самое, что спектр, равномерный по отношению к частоте).

гл. iii. непрерывные сообщения

4. Пусть на оси Z распределены точки по закону Пуассона. В каждой избранной точке помещается функция f(t) и различные функции складываются, давая ансамбль

£/(*+**).

A= - оо

где tk — точки, подчиняющиеся распределению Пуассона. Этот ансамбль может рассматриваться как разновидность импульсных или дробовых шумов, когда все импульсы одинаковы.

5. Система английских речевых функций с вероятностной мерой, определяемой частотой повторения при обычном использовании.

Ансамбль функций f_a(t) называется стационарным, если при сдвиге всех функций во времени на некоторую фиксированную величину получается тот же ансамбль.

Например, ансамбль

/₈(Z) = sin (/ + б) _ф,

является стационарным, если 0 равномерно распределены в интервале 0ч-2тс. Если сдвинуть каждую функцию на t_u то получается

U(t+ h)= sin (t +Z₁ + 0)= sin (Z+ <f),

где <p распределены равномерно в интервале 0-f-27r. Каждая функция изменилась, но ансамбль в целом при этом смещении остался неизменным. В приведенных выше других примерах ансамбли также все стационарны.

Ансамбль называется эргодическим, если он является стационарным и если во множестве функций не существует подмножества функций с вероятностью, отличной от О и !,которое было бы стационарным. Ансамбль

sin (Z+0)

является эргодическим. Никакое подмножество этих функций с вероятностью, отличной от О и 1, не может быть превращено в самое себя при всех временных смещениях. Вместе с тем ансамбль

а sin (/+0),

где а распределены по нормальному закону, а 6—равномерно, является стационарным, но не эргодическим. Подмножество этих функций для а, заключенных между О и 1, например, является стационарным и имеет вероятность, не равную О или 1.

Из приведенных выше примеров ансамблей 3-й и 4-й являются эргодическими, а 5-й, возможно, также может рассматриваться как эргодический. Если ансамбль эргодический, то, грубо говоря, каждая функция множества является типичной для ансамбля.

ЧАСТЬ i. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

Более точно, в случае эргодического ансамбля среднее любой статистической величины,взятое по ансамблю, равно (с вероятностью 1) среднему, взятому по всем временным смещениям некоторой частной функции множества Грубо говоря, можно ожидать, что по мере течения времени каждая функция испытает с надлежащей частотой все изменения, претерпеваемые любой из функций множества.

Выполняя различные операции с числами или функциями, получаем новые числа или функции. Точно так же можно совершать операции над ансамблями для получения новых ансамблей. Допустим, например, что имеется ансамбль функций Za(Z) и оператор T₉ который даст для каждой функции Za(Z) результат

_ga(t)=T№.

Для множества g_a{t) мера вероятностей определяется мерой для множества fa(Z). Вероятность некоторого подмножества функций g_a(f) равна вероятности подмножества функций f_a(t)_y которые создают члены данного подмножества функций g в результате операции Т. Физически это соответствует прохождению ансамбля через некоторое устройство, например фильтр, выпрямитель или модулятор. Функции на выходе устройства образуют ансамбль ga(t).

Устройство или оператор будет называться инвариантным, если сдвиг входной функции приводит просто к сдвигу выходной функции, т. е. если

g*(t) = Tfa(t)

означает, что

gait+t^TUt+tJ

для всех Za(Z) и всех Z₁. Легко показать (см. Приложение 5), что если Г— инвариантный оператор, а входной ансамбль стационарный, то выходной ансамбль также стационарный. Подобным же образом, если входной ансамбль эргодический, то выходной ансамбль будет также эргодическим.

Фильтр или выпрямитель являются инвариантными устройствами при всех временных смещениях. Операция модуляции не является инвариантной, так как фаза несущей создает определенную временною структуру. Однако модуляция инвариантна при всех смещениях, кратных периоду несущей.

Существует теснак св^зь между инвариантностью физических устройств при временных смещениях и теорией Фурье. Если устройство линейно и инвариантно, то анализ методами Фурье является удобным математическим аппаратом для решения задачи.

¹JStoh есть знаменитая эргодическая теорема Биркгофа—Хинчина или, вернее, один из вариантов этой теоремы^. См., например, Э. Хопф, «Эргодическая теория», Успехи математических наук, IV, вып. 1, 1949. (Прим. ред.)

ГЛ. III. НЕПРЕРЫВНЫЕ СООБЩЕНИЯ

Ансамбль функций представляет собой подходящее математическое представление для сообщений, создаваемых непрерывным источником (например, речь), для сигналов от передатчика и для мешающих шумов. Теория связи имеет дело не с операциями над частными функциями, а с операциями над ансамблями функций. Система связи конструируется не для определенной речевой функции и тем более не для синусоидальной функции, а для ансамбля речевых функций.

18. АНСАМБЛИ ФУНКЦИЙ С ОГРАНИЧЕННОЙ ПОЛОСОЙ

ЧАСТОТ

Если функция времени f(t) ограничена по полосе частот участком от 0 до W гц , то она полностью определяется заданием ее ординат в ряде дискретных точек, отстоящих друг от друга на ^сек.

Теорема 13¹)

Пусть /(Z) не содержит частот, превышающих W гц. Тогда

' OO

f,j\_ V¹ у sin7t(2№Z — п) 1\^г>— 1л^Лп _п(2№ — п) '

где

В этом разложении /(Z) представлена как сумма ортогональных функций. Коэффициенты X_n при различных членах могут рассматриваться как координаты в «функциональном пространстве» с бесконечным числом измерений. В этом пространстве каждой функции соответствует одна точка и каждой точке — одна функция.

Функция может рассматриваться как ограниченная временным интервалом T₉ если все ординаты X_n вне этого временного интервала будут равны нулю. В этом случае только 2TW координат отличаются от нуля. Таким образом, функции, ограниченные полосой частот W и длительностью T₉ соответствуют точкам в пространстве 2TW измерений.

Подмножество функций⁴ с полосой частот W и длительностью T соответствует области в этом пространстве. Например, функции, полная энергия которых меньше или равна E₉ соответствуют точкам сферы из 2TW измерений с радиусом r=Y2WE.

Ансамбль функций с ограниченной полосой частот и ограниченной длительностью будет представляться распределейием

¹J Эта теорема была установлена В. А.Котельниковым в 1933 г. (Прим. Ред.)

часть i. статистическая теория передачи сигналов

вероятностей p(x_l9...₉x_n) в соответствующем л-мерном пространстве. Если ансамбль не ограничен по времени, то можно считать, что 2TW координат в данном интервале T представляют часть функции в интервале T₉ а распределение вероятностей p(x_l9..₉x_n) дает статистическую структуру ансамбля для интервалов такой длительности.

19. «ЭНТРОПИЯ» НЕПРЕРЫВНОГО РАСПРЕДЕЛЕНИЯ

«Энтропия» дискретной группы вероятностей P₁,...,р_п определялась как

H=— ^yE₁P_lIogp_i.

Аналогичным образом определим «энтропию» непрерывного распределения с функцией плотности распределения р(х) как

H=— j р(х) Iog р(х) dx.

— OO

В случае л-мерного распределения р(х₁₉...₉ X_n) имеем

H=— J . . J р(х_1у . . ., х_п) \ogp(x_l9 . . ., X_rJdx₁. . . dx_n.

Если имеются два аргумента х и у (которые сами могут быть многомерными), то «энтропия» совместного события и условная «энтропия» даются уравнениями

Н(х₉ у)=— J{р{х₉ у) Iogр(х₉ у) dxdy₉НЛу)=-^ P(*>y)log -^f-dxdy₉H_y(X)=- р{х₉ у) Iog -eg^L dxdy₉

где

P(*) = Jp(*. y)dy_{9 (}РкУ) = §Р(х, y)dx.

«Энтропия» непрерывного распределения имеет многие свойства дискретного случая. В частности:

1. Если х ограничено некоторым объемом v в своем пространстве, то Н(х) максимальна и равна Iog V₉ когда р(х) постоянно и

равно -L в этом объеме.

2. При любых двух переменных X₉ у имеем

Н(х₉у)<Н(х) + Щу)₉

гл. iii. непрерывные сообщения

причем знак равенства будет тогда (и только тогда), когда х и у независимы, т. е. р(х_уу) = р(х)р(у) (за исключением, возможно, ряда точек с нулевой вероятностью).

3. Рассмотрим обобщенную операцию усреднения следующего типа:

p'(y) = $a(x_y y)p(x)dx_y

где

J a(x_y у) dx= ja(x, у) dy= 1, a(x_y y)>0.

Тогда «энтропия» усредненного распределения р'(у) равна или больше «энтропии» первоначального распределения р(х).

4. Ил\еем

Щх,у)=Щх)+НМ=П(у)+Н_у(х)

нм<н(у).

5. Пусть р(х) будет одномерное распределение. Распределение р(х)_у обеспечивающее максимальную «энтропию», при условии, что стандартное отклонение х равно о, есть нормальное распределение. Чтобы это показать, необходимо разыскать максимум

Н(х) = —^р(х) Iog р(х) dx_y

накладывая в качестве ограничений соотношения

о²= j р(х)х² dx и l=j р(х) dx.

Согласно вариационному исчислению это приводит к необходимости нахождения максимума для

J [— р(х) Icg р(х)+\р(х)х²+р р(х)] dx.

Условием этого является

— 1 — IOg p(X) +X + JJL = О,

и, следовательно, подбирая постоянные для удовлетворения упомянутых ограничений, найдем

P(X) = -+-

у Ztz а

Подобным же образом обстоит дело и в случае п измерений, когда моменты второго порядка распределения р(х₁₉...₉х_п):

^АН⁼ I • * ' §^xi ^xJP(*v ,XrJdx₁. . . dx_n.

часть i. статистическая теория передачи сигналов

При помощи подобных же вычислений найдем, что максимум «энтропии» имеет место, когда р(х_1у..._ух_п) является /г-мерным нормальным распределением с моментами второго порядка Aj.

6. «Энтропия» одномерного нормального распределения, стандартное отклонение которого есть а, равна

Н(х) = Iog Ybu а.

Ход вычислений таков:

P(X)=-^ * ^ -logp(x) = Iog 1/2^0 +^L , Н(х)= -J р(х) Iog p(x)dx= Jp(X)IogV27adx+J р(х) -Ц- rfx= = Iogy^r^a+ -А- = Iog ")/2^0 + IogyT =logl/2^a.

Подобным же образом n-мерное нормальное распределение с квадратичной формой ац дается уравнением

P(xi.....*„Н^J ехр (- C_ij X_i X_j),

а «энтропия» может быть вычислена как

#=log(2 7ue)*/²| GtjY¹K

где |а₇| есть определитель, элементы которого а₇.

7. Если л: ограничено половиной оси [р(х)=0 прих<0], а первый момент х равен

а=I p(x)xdx_yо

то максимум «энтропии» имеет место, когда

P(X)=-E_e-

и равен он

Iog еа.

8. Между «энтропиями» для непрерывного и дискретного случаев ^имеется одно существенное различие. В дискретном случае «энтропия» измеряет абсолютным образом беспорядочный характер случайной переменной. В непрерывном случае измерение является относительным к координатной системе. Если изменить координаты, то «энтропия» в общем случае также изменится. Действительно, при переходе к координатам y_lf...,y_n новое значение «энтропии» будет

гл. iii. непрерывные сообщения

щу)=J... Jр(*1, .. .> x_n)j ¢4) ^1оер(^ь. • ••^(-J-)^dyi• • *

где У ^есть якобиан преобразования координат. Разлагая логарифм и меняя переменные на х_1у..._ух_пУ получим

Н(у) = Я(х)-/...jp^,.. .,x_n)logJ^jY¹-• ■ ^dX»-

Таким образом, новое значение «энтропии» равно старому за вычетом ожидаемого логарифма якобиана. В непрерывном случае «энтропия» может рассматриваться как мера случайности относительно принятого стандарта, а именно выбранной координатной системы, в которой каждому малому элементу объема dx₁...dx_nпридан равный вес. При изменении координатной системы «энтропия» .в новой системе является мерой случайности, когда равным элементам объема dy₁...dy_n в новой системе придан одинаковый вес.

Несмотря на зависимость от координатной системы, понятие «энтропии» является столь же важным в непрерывном случае, как и в дискретном. Это объясняется тем, что скорость создания сообщений и пропускная способность канала определяются разностью двух «энтропий», а эта разность не зависит от координатной системы, так как каждый из двух членов изменяется одинаково.

«Энтропия» непрерывного распределения может быть отрицательной. Шкала измерений устанавливает произвольный нуль, соответствующий равномерному распределению по единичному объему. Распределение, более сосредоточенное чем это, будет иметь меньшую «энтропию», и следовательно, она отрицательна. Однако скорость создания сообщений и пропускная способность канала всегда будут не отрицательны.

9. Частным случаем изменения координат является линейное преобразование

При этом якобиан есть просто определитель Ia₇I""¹ и

Н(у) = Н(х)+1о_ё\а_и\.

В случае вращения координатной системы (или любого другого преобразования, сохраняющего измерения) J=I и Н(у)=Н(х).

20. «ЭНТРОПИЯ» АНСАМБЛЯ ФУНКЦИЙ Рассмотрим эргодический ансамбль функций с ограниченной полосой частот шириной W гц. Пусть

p(*i»...» х_п)

часть i. статистическая теория передачи сигналов

будет функция плотности распределения для амплитуд X₁,... ,х_я в п последовательных точках. Определим «энтропию» ансамбля функций на степень свободы как

H^t = — Hm A j Jp(x_b ..., х_п) logp(x_b ..., х_п) Clx₁... dx_n.

Можно также определить «энтропию» Я за 1 сек. путем деления не на п_у а на время T в секундах для п значений. Так как n=2TW_y то Я = 2И?Я'.

Для «белых» термических шумов распределение р является нормальным и поэтому

H' = Iog Y^eN у H = W\og2izeN.

При данной средней мощности Я «белые» шумы имеют максимально возможную «энтропию». Это следует из отмеченных выше максимальных свойств нормального распределения.

«Энтропия» непрерывного стохастического процесса имеет много свойств, аналогичных свойствам энтропии дискретных процессов. В дискретном случае «энтропия» была связана с логарифмом вероятности длительных последовательностей и с числом сравнительно вероятных последовательностей большой длительности. В непрерывном случае «энтропия» подобным же образом связана с логарифмом плотности вероятностей для длинной серии «образцов» сигнала и с объемом сравнительно высокой вероятности в функциональном пространстве.

Более точно, если положить, что р(х_ъ...,х_п) является непрерывным при всех X₁ и для всех п₉ то для сравнительно больших п

-H¹п

при любом выборе (X₁,...,х_л) за исключением группы, полная вероятность которой меньше 8, причем 8 и е произвольно малы. Это следует из эргодических свойств при разделении пространства на большое число малых ячеек.

Связь Я с объемом может быть установлена следующим образом. При тех же самых предположениях рассмотрим я-мерное пространство, соответствующее р(х_ь...,х_п). Пусть V_n{q) будет наименьший объем в этом пространстве, который заключает в себе полную вероятность q. Тогда

щ ₌ я'.

если только q не равно О или 1.

гл. iii. непрерывные сообщения

Эти результаты показывают, что при больших п существует совершенно четко определенный объем высокой вероятности (по крайней мере, в логарифмическом смысле) и что внутри этого объема плотность вероятностей сравнительно равномерна (опять-таки в логарифмическом смысле).

В случае «белых» шумов плотность вероятностей равна

-TiW^^exp ("ЯГ

Так как она зависит только от 2*Дто поверхности равной плотности вероятностей представляют собой сферы, а все распределение обладает сферической симметрией. Область высокой вероятности есть сфера радиуса [Z^r nN. При п—►oo вероятность нахождения вне сферы радиуса Y n(N+e) стремится к нулю, как бы ни было мало е, а L логарифма объема сферы стремится к Iog ]/2тсеЛЛ

В непрерывном случае удобно пользоваться не «энтропией» ансамбля H₉ а производной величиной, которую будем называть энтропийной мощностью. Она определяется как мощность «белых» шумов, ограниченных такой же полосой частот, что и рассматриваемый ансамбль, и имеющих такую же «энтропию». Другими словами, если H^f есть «энтропия» ансамбля, то его энтропийная мощность равна

В геометрической трактовке это означает измерение объема высокой вероятности квадратом радиуса сферы, имеющей такой же объем. Так как «белые» шумы имеют максимальную «энтропию» для данной мощности, то энтропийная мощность любых шумов меньше или равна их действительной мощности.

21. ПОТЕРЯ «ЭНТРОПИИ» В ЛИНЕЙНЫХ ФИЛЬТРАХ Теорема 14

Если ансамбль функций, имеющий,«энтропию» на степень свободы H₁ в полосе частот W, пропускается через фильтр с характеристикой Y(f)₉ то ансамбль на выходе имеет «энтропию»

H₂ = H₁+ 4flog|y(/)|*d/.

Действие фильтра представляет собой линейное преобразование координат. Если рассматривать частотные составляющие как первоначальные координаты системы, то новые частотные состав-

часть i. статистическая теория йередачи. сигналов

ляющие будут представлять собой старые, умноженные на некоторые коэффициенты. Таким образом, матрица преобразования координат является относительно этих координат диагональной. Якобиан преобразования равен (для п синусоидальных и п коси-нусоидальных составляющих)

= НТО)!² = ехр 2Iog|Щ)I*.

i=l

где I₁ расположены на равных расстояниях в полосе W. В пределе это превращается в

Так как якобиан J постоянен, то его среднее значение равно такой же величине. Применяя теорему об изменении «энтропии» с изменением координат, получаем сформулированный выше результат. Его можно также выразить через энтропийную мощность.

Поэтому если энтропийная мощность первого ансамбля функций есть N_lf то энтропийная мощность второго ансамбля равна

Конечная энтропийная мощность равна начальной, умноженной на геометрическое среднее коэффициента передачи фильтра. Если усиление измеряется в децибелах,то выходная энтропийная мощность увеличится на арифметическое среднее коэффициента передачи в децибелах внутри полосы W.

В табл. 1 для ряда идеализированных характеристик передачи фильтра вычислена потеря энтропийной мощности, выраженная в децибелах. Приведены тоже импульсные характеристики этих фильтров для W=2k₉ причем предполагается, что фазовый угол равен нулю.

Потеря «энтропии» во многих других случаях может быть найдена при помощи этих результатов. Например, коэффициент энтропийной мощности А > полученный для первого случая, относится

также к любой характеристике передачи, получаемой из 1—о> путем преобразования оси о> с сохранением измерения. В частности, линейно возрастающая характеристика G(<o)=<d или пилообразная характеристика между 0 и 1 имеет такую же потерю «энтропии». Обратная характеристика имеет^ обратный коэффициент потерь,

гл. iii. непрерывные сообщения

поэтому -в случае Характеристики — коэффициент равен е². Возведение усиления в какую-либо степень приводит к возведению коэффициента потерь в ту же степень.

Таблица 1


Характеристика фильтра		Коэффициент энтропной мощности	Усиление энтропной мощности (д 6)	Импульсная реакция
i J-W—+0	*(л)* 1	I	-8,68	Sin*^zTtt* (TltI²
f J-Cc;²— 0	г\		-5,32	го Ico i *с.** о
1 1-е»;³— Q	*См)* 1	0,384	-4,15	„/cost-I cost. sinfi ⁶I t* Ziⁱ t³ I
1 tf^— 0	W 1		-2,66	2 t
1 0	ГЛ W 1	1 _е2ос	-8,68 а	Jp_s [cos(!-or)t- cost]

22. «ЭНТРОПИЯ» СУММЫ ДВУХ АНСАМБЛЕЙ ФУНКЦИЙ

Если имеются два ансамбля функций /_a(Z) и gfc(Z), то можно создать новый ансамбль путем «сложения». Допустим, что первый имеет функцию плотности вероятностей p(x_l9...₉x_n)₉ а второй — ?(х!,...,х_л). Тогда функция плотности для суммы дается выражением

^r(^xi>.... х_я) = J ... Jp Qf_l9.. ., у_п) q(x_x — P₁,..., х— у_п) (Iy₁... dy_n.

Физически это соответствует сложению шумов или сигналов, представляемых первоначальными ансамблями функций.

Следующий результат доказывается в Приложении 6.

часть i. статистическая теория передачи сигналов

Теорема 15

Пусть средняя мощность двух ансамблей ^функций бу* дет N₁ и ZV₂, а их энтропийные мощности — ZV₁ и ZV₂. ^Т/>~ца энтропийная мощность суммы ZV₃ ограничена пределами

N₁+N₂<N_S<H₁+N₂.

«Белые» шумы с нормальным распределением имеют свойство поглощать всякие другие шумы или ансамбли сигналов, которые могут быть сложены с ними. При этом результирующая энтропийная мощность приближенно равна сумме мощности «белых» шумов и мощности сигнала (измеренной от среднего значения сигнала, которое обычно равно нулю), если только мощность сигнала мала (в определенном смысле) по сравнению с шумами.

Рассмотрим функциональное пространство п измерений, связанное с этими ансамблями функций. «Белые» шумы соответствуют сферическому нормальному распределению в этом пространстве. Ансамбль сигналов соответствует другому распределению, не обязательно нормальному или сферическому.

Пусть моменты второго порядка этого распределения относительно его центра тяжести будут aj. Другими словами, если p(x_l9...,x_n) есть функция плотности распределения, то

^aU = J • • • $p(*i — */) (^xJ — ^ау) ^dx^ • • • ^dxn>

где OL₁ координаты центра тяжести, а a_i;. — определенно положи -тельная квадратичная форма. Повернув координатную систему, можно выравнять ее с главными направлениями этой фюрмы. Тогда CLj приводится к диагональной форме Ь_и. Потребуем, чтобы каждая форма Ь_ц была мала сравнительно с ZV — квадратом радиуса сферического распределения.

В этом случае шумы и сигнал создают нормальное распределение, соответствующая квадратичная форма которого есть

N + b_u.

Энтропийная мощность этого распределения равна или приближенно

(N" + 2б_йА/»-о»/«=л/+ -E S ь_и.

Последний член есть мощность сигнала, первый — мощность шумов.

Глава IV КАНАЛ С НЕПРЕРЫВНОЙ ПЕРЕДАЧЕЙ

23. ПРОПУСКНАЯ СПОСОБНОСТЬ КАНАЛА С НЕПРЕРЫВНОЙ

ПЕРЕДАЧЕЙ

В канале с непрерывной передачей входные или передаваемые сигналы являются непрерывными функциями времени /(/), принадлежащими к некоторому множеству, а выходные или принимаемые сигналы будут их искаженными вариантами. Рассмотрим только такой случай, когда как передаваемые, так и принимаемые сигналы ограничены некоторой полосой частот W. Тогда в интервале T они могут быть заданы 2TW числами, а их статистическая структура описана функциями распределения с конечным числом измерений. Таким образом, статистические свойства передаваемого сигнала будут определяться функцией

P(x_v . . . , х_п) = P(X)₉

а статистические свойства шумов — распределением условных вероятностей

Скорость передачи сообщений в таком канале определяется аналогично дискретному каналу, а именно:

R = H(X)]- H_v(X)₉

где Н(х) есть «энтропия» на входе, а Н_у(х) — ненадежность.

Пропускная способность канала С определяется как максимум R чри изменении входного ансамбля по всем возможным ансамблям. ^to означает, что в случае приближения с конечным числом измерений следует изменять Р(х)=Р(х₁₉...₉х_п) и разыскивать максимум

- j Р(х) Iog Р(х) dx + Jj Р(х₉ у) Iog ^л ^dy*

Это выражение может быть написано в виде

пользуясь тем обстоятельством, ⁱIro

Г Г P(х₉ у) Iog Р(х) dxdy=

Г Р(х) Iog Р(х) dx.

часть i. статистическая теория передачи сигналов

Таким образом, пропускная способность канала выражается как

^d=JlⁿL г JJ ^у) ^log ~ж0к^dx ^dy-

Отсюда ясно, что R и С не зависят от координатной системы,

Р(х v)

так как числитель и знаменатель в Iog ~~р^Р~~(у) ^ПР^И ^пР^е°бразо-вании х и у любым однозначным образом будут умножаться на один и тот же коэффициент.

Интегральное выражение для С является более общим, чем выражение Н(х)—Н_у(х). Надлежащим образом интерпретированное, оно всегда существует, тогда как в некоторых случаях Н(х)—Н_у(х) может оказаться неопределенной формой вида оо —оо . Это происходит, например, если в случае я-мерной апроксимации х ограничивается поверхностью меньшего числа измерений, нежели h.

Если используемое при вычислении Н(х) и Н_у(х) основание логарифмов равно двум, то, как и в дискретном случае, С есть максимальное число двоичных единиц, которое может быть передано за 1 сек. по каналу со сколь угодно малой ненадежностью. Это можно понять физически, разделив пространство сигналов на большое число малых ячеек. Ячейки делаются настолько малыми, чтобы плотность вероятностей того, что сигнал х в результате действия шумов перейдет в точку у, т. е. Р_х(у), была достаточно постоянной по всей ячейке. Если ячейки рассматриваются как отдельные точки, то положение будет точно такое же, что и в дискретном канале, и использованные там доказательства будут применимы и здесь.

Физически ясно, что подразделение объема на отдельные точки в любых практических случаях не может существенно сказаться на конечном результате, если только ячейки достаточно малы. Поэтому пропускная способность будет пределом пропускных способностей для дискретных подразделений, а это и есть пропускная способность канала с непрерывной передачей, как она определена выше.

Математически можно прежде всего показать, что если и есть сообщение, х — сигнал, у — принимаемый сигнал (измененный шумами), а v — восстановленное из сигнала сообщение, то

Н(х)-Н_у(х)> Щи)-H_v(u)

независимо от того, какие операции производились над u_t чтобы получить x_t или над у для получения v.

Таким образом, независимо от того, как кодируют двоичные знаки для создания сигнала или как декодируют принимаемый сигнал для восстановления сообщения, скорость дискретной передачи двоичных знаков не превышает определенную выше пропускную способность канала. С другой стороны, при весьма общих условиях

гл. iv. канал с непрерывной передачей

можно найти систему кодирования, обеспечивающую передачу двоичных знаков со скоростью С при сколь угодно малой ненадежности или частоте ошибок. Это справедливо, например, когда в случае апроксимации сигнальных функций пространством конечного числа измерений, Р(х₉ у) непрерывно как по X₉ так и по у₉ за исключением группы точек, где вероятность равна нулю.

Важный частный случай имеет место, когда шумы складываются с сигналом, являясь независимыми от него (в вероятностном смысле). Тогда Р_х(у) есть функция только разности (векторной) п=у—х

PM = Qiv-*)

и шумам можно приписать определенную «энтропию» (независимо от статистических свойств сигнала), а именно «энтропию» распределения Q{n). Эта «энтропия» будет обозначаться Н(п).

Теорема 16

Если сигнал и шумы независимы, а принимаемый сигнал является суммой передаваемого сигнала и шумов, то скорость передачи равна

R = H(y)-H(n)₉

т. е. «энтропии» принимаемого сигнала за вычетом «энтропии» шумов. Пропускная способность канала равна*

С = шах Н(у) — Н(п).

p(X)

В силу того, что у=х+п₉ имеем

Н(х₉ у) = Н(х₉ п).

Разлагая левую часть и пользуясь независимостью х и п₉ найдем Н(у)+ H_y(X) = Н(х)+Н(п).

Отсюда

R = Н(х) - H_y(X) = Н(у) - Н(п).

Так как Н(п) не зависит от Р(х)₉ то для максимума R необходимо, чтобы имела максимум Н(у) — «энтропия» принимаемого сигнала. Если на ансамбль передаваемых сигналов накладываются некоторые ограничения, то «энтропия» принимаемых сигналов должна быть максимальной при этих ограничениях.

24. ПРОПУСКНАЯ СПОСОБНОСТЬ КАНАЛА ПРИ ОГРАНИЧЕНИИ СРЕДНЕЙ МОЩНОСТИ

✓

Простым применением теоремы 16 является случай, когда шумы представляют собой «белые» тепловые шумы, а принимаемые сигналы ограничены некоторой средней мощностью Р. Тогда принимаемые сигналы имеют среднюю мощность Р+А^где N есть сред-

часть i. статистическая теория передачи сигналов

няя мощность шумов. Принимаемые сигналы обладают максимальной «энтропией», когда они также образуют ансамбль «белых» шумов, так как это наибольшая возможная «энтропия» для мощности P+N.Такая «энтропия» может быть получена путем надлежащего выбора ансамбля передаваемых сигналов, а именно в том случае, если они образуют ансамбль «белых» шумов мощностью Р. Тогда «энтропия» (за 1 сек.) принимаемого ансамбля будет

H(y) = Wlog2*e(P + N)₉а «энтропия» шумов

Н(п) = W \og2TzM. Пропускная способность канала равна

С = Н(у)-H(H) = Wlog ^p^L. Теорема 17

Пропускная способность канала с полосой частот W_f на который действуют «белые» тепловые шумы мощностью N_f при средней мощности передаваемых сигналов P равна

C = Wlog^yY-.

Это означает, что при достаточно сложных системах кодирования можно передавать сообщения со скоростью

C-W Iog P+^N двоичных единиц ~~ N сек.

при сколь угодно малой частоте ошибок. Невозможно передавать с большей скоростью при любой системе кодирования без того, чтобы частота ошибок не имела конечного положительного значения.

Для достижения этой предельной скорости передаваемые сигналы по своим статистическим свойствам должны приближаться к «белым» шумам. Система, в которой скорости передачи достигают предельной, может быть описана следующим образом. Пусть создаются М=2₅ «образцов» «белых» шумов длительностью каждый Т. Им приписываются двоичные числа от 0 до M—1. В передатчике последовательности сообщений разбиваются на группы по S сообщений и для каждой группы передается как сигнал соответствующий «образец» шумов. При приеме значения M «образцов» известны и действительный принимаемый сигнал, искаженный шумами, сравнивается с каждым из них. «Образец», имеющий наименьшее эффективное отклонение от принимаемого сигнала, выбирается как передаваемый сигнал, после чего восстанавливается соответствующее двоичное число.

Этот процесс эквивалентен выбору наиболее вероятного (в апостериорном смысле) сигнала. Число используемых «образцов» шу-

гл. iv. канал с непрерывной передачей

мов M будет зависеть от допустимой частоты ошибок е, но почти для любого выбора числа «образцов» имеем

Iim Iim IogM (е, Т) _ T_171ncj Р+Н

е-*ОГ-*оо T ~ & M

Таким образом, независимо от того, сколь малым выбрано е, можно, выбирая T достаточно большим, приблизиться сколь угодно близко

к передаче TWlog ~~^P~^^N~~ двоичных единиц за время Т.

Формулы, подобные С = Wlog , для случая «белых» шумов были получены независимо и другими авторами, хотя при несколько другой интерпретации.

В случае произвольных мешающих шумов (не обязательно «белых» тепловых шумов) задача разыскания максимума, связанная с определением пропускной способности C₉ повидимому, не может быть полностью решена. Однако могут быть установлены верхний и нижний пределы для С, выраженные через среднюю мощность шумов N и энтропийную мощность шумов ZV₁. В большинстве практических случаев эти пределы достаточно близки друг к другу, и поэтому полученное решение может считаться удовлетворительным.

Теорема 18

Пропускная способность канала с полосой частот W₉ на который воздействуют произвольные шумы, ограничивается неравенствами

riog^₄<C<IP IogEbE,

где P — средняя мощность передаваемых сигналов; ZV — средняя мощность шумов; ZV₁ — энтропийная мощность шумов.

Здесь опять средняя мощность искаженных сигналов будет P+N. Максимальная «энтропия» была бы в том случае, когда принимаемые сигналы представляли бы собой «белые» шумы и она равнялась бы Wlog2ize(P+N). Достигнуть этого невозможно, т. е. не может быть такого ансамбля передаваемых сигналов, который, будучи добавлен к мешающим шумам, создавал бы в приемнике «белые» тепловые шумы. Однако это определяет верхний предел Для H(у) и поэтому

С=тах Н(у)—Н (п) < W Iog 2ne(P+N)—W Iog ZiteN₁.

Это и есть верхний предел, указанный в теореме.

Нижний предел может быть найден при рассмотрении скорости передачи в случае, если передаваемые сигналы представляют собой «белые» шумы мощностью/⁵. При этом энтропийная мощность принимаемых сигналов должна быть, по крайней мере, равна энтропийной

часть i. статистическая теория передачи сигналов

мощности «белых» шумов со средней мощностью P+N₁. Действительно, теорема 15 устанавливает, что энтропийная мощность суммы двух ансамблей больше или равна сумме отдельных энтропийных мощностей. Отсюда

шах Н(у) > W Iog 2w{P+NJ

С> W Iog 2тгв(Р + ZV₁) — W Iog ZizeN₁=W Iog ^A .

По мере возрастания P верхний и нижний пределы сходятся, поэтому предельная скорость равна

Если сами шумы являются «белыми», то N=N₁ и полученный результат сводится к доказанной ранее формуле

С = HHog

Если шумы подчиняются нормальному закону, но спектр их не обязательно равномерный, то ZV₁ есть геометрическое среднее мощности шумов, взятое по различным частотам в полосе W. Таким образом,

ZV₁^expA Jlog ZV(/) df₉w

где ZV(Z) — мощность шумов на частоте /. Теорема 19

Если установить пропускную способность канала при данной мощности передаваемых сигналов P равной

c=w log Et_Ezi,

то т] монотонно убывает при возрастании P₉ стремясь в пределе к нулю.

Допустим, что при данной мощности P₁ пропускная способность канала равна

riogEEi..

Это означает, что наилучшее возможное распределение сигнала, скажем р(х)₉ будучи добавлено к распределению шумов q(x)₉ дает принимаемое распределение г(у)₉ энтропийная мощность которого есть Pi+ZV—Tj₁. Пусть мощность увеличена до Р_г+ЬР путем добавления к сигналу «белых» шумов мощностью ДЯ. «Энтропия» принимаемого сигнала теперь равна по меньшей мере

H(y)=W log 2w(P_x + N--Ti₁ + ДЯ),

гл. iv. канал с непрерывной передачей

что следует из применения теоремы о минимальной энтропийной мощности суммы. Следовательно, поскольку можно получить указанную величину H₉ «энтропия» наилучшего распределения должна быть, по крайней мере, такой же, а -ц должно монотонно убывать. Чтобы показать, что при P-^oo к]->0, рассмотрим сигнал, который представляет собой «белые» шумы большой мощности Я. Какими бы ни были мешающие шумы, если мощность Я достаточно велика, принимаемый сигнал будет приближенно «белыми» шумами в смысле обладания энтропийной мощностью, сходящейся к P+N.

25. ПРОПУСКНАЯ СПОСОБНОСТЬ КАНАЛА ПРИ ОГРАНИЧЕНИИ ПИКОВОЙ МОЩНОСТИ

В некоторых случаях ограниченной является не средняя мощность, а мгновенная пиковая. Задача вычисления пропускной способности канала сводится тогда к разысканию максимума (путем вариации ансамбля передаваемых символов) выражения

Щу)-Н(п)

при наложении ограничения, что все_функции /(/) в ансамбле для всех t меньше или равны, скажем, ]AS. Задача при таком ограничении не может быть так же хорошо математически решена, как в случае ограничения средней мощности. В рассматриваемом случае можно определить только нижний предел, пригодный для любых отношений -Jf₉ верхний предел, пригодный для больших , и прибли-

женняе значение С для малых отношении -^-

Теорема 20

Пропускная способность канала С с полосой частот W₉ на который воздействуют «белые» тепловые шумы мощностью N₉ ограничена величиной

гдеЗ — допустимая пиковая мощность передаваемых сигналов. Для достаточно больших отношений E

С < Wlog _N (1+8),

где е — сколь угодно мало. При —►Oh полосе частот W₉ начинающейся от О,

часть i. статистическая теория передачи сигналов

Желательно сделать «энтропию» принимаемых сигналов максимальной. Если -дг велико, то это будет близко соответствовать

случаю, когда «энтропия» передаваемого ансамбля максимальна.

Приближенный верхний предел определяется путем ослабления условий, накладываемых на ансамбль. Допустим, что мощность ограничена величиной S не в каждый момент времени, а только в дискретных точках, где фиксируются значения передаваемого сообщения. При таких ослабленных условиях максимальная «энтропия» передаваемого ансамбля будет больше или равна максимальной «энтропии» при исходных условиях. Измененная таким образом задача может быть легко решена. Максимальная «энтропия» имеет место в том случае, если различные «образцы» сигнала независимы и имеют функцию распределения, которая постоянна от — YSao +YS «Энтропия» при этом равна

U?log4S.

Принимаемый сигнал будет тогда иметь «энтропию», меньшую, чем

W\og(4S+2izeN)(l+z), причем е 0 при -^- оо Пропускную способность канала найдем, вычитая из этого выражения «энтропию» «белых» шумов W\og2izeN: ₂

■ S +M

W Iog (4S + 2izeN)(\ + е)- WXog 2^N=W Iog ~~^пе _N~~ (1 + s)

Это и есть искомое выражение для верхнего предела пропускной способности канала.

Чтобы найти нижний предел, рассмотрим тот же самый ансамбль функций. Пусть эти функции проходят через идеальный фильтр с треугольной характеристикой, коэффициент передачи которого равен единице при нулевой частоте и линейно спадает до нуля на частоте W.

Прежде всего покажем, что функции на выходе фильтра ограничены по пиковой мощности во все моменты времени, а не только

в указанных дискретных точках. Сначала заметим, что импульс sin 2л WY

~~_2nWt~~ проходя через фильтр, создает на выходе функцию

1 Sin²TiWY

2 (KWt)² >

которая никогда не является отрицательной. В общем случае входная функция может рассматриваться как ряд сдвинутых во времени функций

sin2nWt ^а 2л WY »

гл. iv. канал с непрерывной передачей

где амплитуда «образца» а не превышает |/S Следовательно, напряжение на выходе состоит из суммы сдвинутых во времени неотрицательных функций указанного ранее типа с такими же коэффициентами. Для любого момента времени t эти функции принимают наибольшее положительное значение в том случае, когда все коэффициенты а имеют максимальную положительную величину, т. е. В этом случае входная функция есть постоянная с амплитудой УS₉а так как фильтр для постоянной составляющей имеет коэффициент передачи единицу, то и выходная функция будет такой же. Таким образом, выходной ансамбль имеет пиковую мощность S.

«Энтропия» выходного ансамбля может быть найдена по «энтропии» входного ансамбля при помощи доказанной ранее теоремы. Выходная «энтропия» равна входной плюс геометрическое среднее коэффициента передачи фильтра w w

JWtfM =Jlog Y=^tJdf =-2W.

О о

Следовательно, выходная «энтропия» равна Vlog4S—2V = Vlog^ , а пропускная способность канала больше, чем

Теперь надо показать, что для малых значений -д- (отношение пиковой мощности сигнала к средней мощности «белых» шумов) пропускная способность канала равна приближенно

Более точно

^logjl +J

при J₁ ->0.

Поскольку средняя мощность сигнала P меньше или равна его пиковой мощности S₉ то отсюда следует, что для всех -^-

C<Wlog(l+£)<Wlog(l+4)

Поэтому если найден ансамбль функций, соответствующих скорости передачи, близкой к U?log^ ! + -^-j, и ограниченных полосой частот

часть i. статистическая теория передачи сигналов

W и пиковой мощностью S_t то последняя часть теоремы будет доказана.

Рассмотрим ансамбль функций следующего типа. Последовательность из t «образцов» имеет одно и то же значение — либо +]AS, либо—|AS; следующие t «образцов» опять имеют одинаковое значение и т. д. Значения для последовательности выбираются случайно с вероятностью V₂ для + j/S и V₂ для —y/S Если этот ансамбль пропустить через фильтр с треугольной характеристикой (коэффициент передачи для постоянной составляющей равен единице), то на выходе пики будут ограничены до S. Кроме того, средняя мощность близка к S и может достигнуть этого значения, если взять / достаточно большим.

«Энтропия» суммы из этого ансамбля и тепловых шумов может быть найдена использованием теоремы о сумме шумов и малого сигнала. Теорема применима, если

достаточно мало. Это можно обеспечить, взяв отношение -^- достаточно малым (после того как t выбрано). Энтропийная мощность со сколь угодно близким приближением будет равна S+N_y и, следовательно, скорость передачи сколь угодно близка к

Глава V

СКОРОСТЬ СОЗДАНИЯ СООБЩЕНИЙ ДЛЯ НЕПРЕРЫВНОГО

ИСТОЧНИКА

26. ФУНКЦИИ ОЦЕНКИ ВЕРНОСТИ ВОСПРОИЗВЕДЕНИЯ

В случае дискретного источника была определена конечная скорость создания сообщений, а именно «энтропия» соответствующего стохастического процесса. Для непрерывного источника положение оказывается значительно более сложным. Прежде всего непрерывно изменяющаяся величина предполагает бесконечное число значений и поэтому для точного задания требует бесконечного числа двоичных знаков. Это означает, что при передаче выходного эффекта непрерывного источника для точного воспроизведения сообщения в месте приема, вообще говоря, необходим канал с бесконечной пропускной способностью. Поскольку в каналах существует обычно определенный уровень шумов и,следовательно, пропускная способность ограничена, точная передача невозможна.

Это рассуждение, однако, обходит действительное положение вещей. Практически при непрерывном источнике может интересовать не точная передача, а передача с определенным допуском. Вопрос заключается в том, можно ли приписать непрерывному источнику конечную скорость в том случае, когда требуется только определенная верность воспроизведения, измеренная подходящим способом. Разумеется, при возрастании требований к верности воспроизведения скорость создания сообщений ""будет возрастать.

Как будет показано, в весьма общих случаях можно определить такую скорость. Путем надлежащего кодирования создаваемые сообщения можно передать по каналу, пропускная способность которого равна рассматриваемой скорости, и выполнить при этом требования к верности воспроизведения. Канал, обладающий меньшей пропускной способностью, такой возможности не обеспечивает.

Прежде всего необходимо дать общую математическую формулировку понятию о верности передачи. Рассмотрим группу сообщений большой длительности, скажем T секунд. Источник описывается заданием в соответствующем пространстве плотности вероятностей Р(х) того, что будет выбрано рассматриваемое сообщение. Данная система связи описывается (с внешней точки зрения) заданием условной вероятности Р_х(у) того, что если источник создал сообщение X_t воспроизводимое сообщение в месте приема будет у. Система в целом (включая источник и передающую систему) опи-

часть i. статистическая теория передачи сигналов

сывается функцией вероятностей Р(х_уу) наличия передаваемого сообщения х и принимаемого сообщения у. Если эта функция известна, то тем самым полностью известны свойства системы с точки зрения верности воспроизведения.

Любая оценка верности должна математически соответствовать операции над функцией Р(х_уу). Эта операция должна, по крайней мере, давать сравнительную оценку системы. Другими словами, необходимо, чтобы в результате можно было сказать, что согласно нашему критерию верности из двух систем, описываемых функциями Р_х(х_у у) и Р₂{х_у у)_у либо: 1) первая обеспечивает более высокую верность; 2) вторая обеспечивает более высокую верность, либо 3) они обеспечивают одинаковую верность. Это значит, что критерий верности может быть представлен численно оцениваемой функцией

vlP(x₉ у)]₉

аргумент которой изменяется по возможным функциям вероятностей Р(х_у у). В дальнейшем будем полагать, что меньшим значениям функции оценки соответствует более высокая, верность.

Теперь покажем, что при очень общих и приемлемых допущениях функция v[P(x_y у)] может быть написана в значительно более специализированной форме, а именно как среднее функции р(х_у у)_увзятое по множеству возможных значений х и у:

VlPix₉ у)] = Jj Pix₉ у) р(х_у у) dx dy.

Чтобы это показать, достаточно предположить: 1) что источник и система являются эргодическими, так что очень длительный «образец» сообщения будет с вероятностью, близкой к единице, типичен для ансамбля, и 2) что оценка является «приемлемой» в том смысле, что возможно на основе наблюдения типичных входных и выходных «образцов» X₁ и у_г создать опытную оценку и, если длительность этих «образцов» возрастает, опытная оценка будет с вероятностью единица сходиться к точной оценке, основанной на полном знании функции Р(х_уу).

Пусть опытная оценка будет р(х_у у). Тогда функция р(х_у у) при T-^oo стремится к постоянной величине почти для всех значений (х_у у)_у которые находятся в области высокой вероятности для данной системы

Pix₉ y)-+v[P(x ₉у)]₉и можно также написать

Pix, У)-* ц ^р(х>У) Р(*. У) dx dy,

так кар

Jj Pix₉ y)dxdy = \. Это доказывает искомый результат.

гл. v. скорость создания сообщении

Функция р (х, у) имеет общую природу «расстояния» между х н у¹). Она измеряет, насколько было бы плохо (относительно нашего критерия верности) принять у₉ когда передано х. Полученный выше общий результат может быть сформулирован еще следующим образом. Любая приемлемая оценка может быть представлена как среднее функции «расстояния», взятое по множеству исходных и воспроизводимых сообщений х и у и взвешенное в соответствии с вероятностью Р(х_у у) получения рассматриваемых пар, полагая, что длительность сообщений T взята достаточно большой.

Ниже даются простые примеры функций оценки.

1. Эффективный критерий

V = lx(t) - y(t)]² .

В этом очень часто применяемом критерии верности функция «расстояния» р(х_уу) представляет собой (отвлекаясь от постоянного множителя) квадрат обычного эвклидова расстояния между точками х н у в соответствующем функциональном пространстве

2. Частотно-взвешенный эффективный критерий. Прежде чем воспользоваться эффективной мерой верности, можно приписать различным частотным составляющим разные веса. Это эквивалентно пропусканию разности x(t)—y(t) через формирующий фильтр с последующим определением средней мощности на выходе. Положим

e(t) = x(t)-y(t)

тогда

3. Критерий абсолютной ошибки

¹J Однако она не является «метрической» в строгом смысле, так как в общем случае не удовлетворяет либо условию р(х_у у)= р(у, х), либо условию р(х, у)+ ?(y,z) > p(x_t z).

часть i. статистическая теория передачи сигналов

4. Свойства слуха определяют оценку или, скорее, ряд оценок, подходящих в случае передачи речи или музыки. Так, например, существует критерий разборчивости, при котором р(х_у у) равна относительной частоте неправильно интерпретированных слов, когда сообщение x(t) принимается как y(t). Хотя в этих случаях нельзя дать точного представления функции р(х,у), она может быть в принципе определена путем эксперимента. Некоторые ее свойства следуют из хорошо известных экспериментальных результатов по исследованию слуха, например из того, что ухо сравнительно нечувствительно к фазе, а чувствительность к амплитуде и частоте приближенно логарифмическая.

5. Дискретный случай может рассматриваться как частный случай, в котором подразумевается оценка, основанная на частоте ошибок. Функция р(х,у) определяется тогда как число символов в последовательности у, отличающихся от соответствующих символов в последовательности х_у деленное на полное число символов в последовательности х.

27. СКОРОСТЬ ИСТОЧНИКА ПРИ ДАННОЙ ОЦЕНКЕ ВЕРНОСТИ

Теперь можно определить скорость создания сообщений для непрерывного источника. Дана функция Р(х) для источника и оценка V_y определяемая функцией «расстояния» р(х_у у)_у которая предполагается непрерывной по х и у. Для данной системы Р(х_у у) качество измеряется величиной

^v== IIk^x' У)^р(^х* У) ^dxdV-

Кроме того, скорость выдачи двоичных единиц, соответствующая данной функции P(х_у у)_у равна

Определим скорость создания сообщений при данном качестве воспроизведения V₁ как минимум R_y полученный при фиксированном V=V₁ и при изменении Р_х{у). Таким образом,

при условии

^^1-Р(*' ^ ^l0g ^pWPM ^dx ^dyV₁= ^^р(^х> У)?(^х> у) ^dxdV-

Это означает, что в действительности рассматриваются все системы связи, которые могли бы быть использованы и которые обеспечивают передачу с требуемой верностью. Скорость передачи двоичных единицах _{вычисляется} _для _каждой системы и выбирает-

сек.

гл. v. скорость создания сообщении

ся наименьшая скорость. Эта последняя и есть скорость, приписываемая источнику при рассматриваемой верности воспроизведения.

Обоснование этого определения заключается в следующей теореме.

Теорема 21

Если источник при данной оценке V₁ имеет скорость создания сообщений R_l9 то можно закодировать сообщения на выходе источника и передавать их по каналу с пропускной способностью С при верности воспроизведения, как угодно близкой к v_l9 если только R_±< С. Это невозможно, если R₁^C.

Последнее утверждение теоремы немедленно следует из определения R₁ и предыдущих результатов. Если оно не справедливо,

^ ^ двоичных единиц то можно было бы передавать больше чем С-

сек.

по каналу с пропускной способностью С.

Первая часть теоремы доказывается методом, аналогичным использованному при доказательстве теоремы 11. Прежде всего следует разделить пространство (х_у у) на большое чцсло малых ячеек и рассматривать этот случай как дискретный. Это изменит функцию оценки не больше чем на произвольно малую величину (если ячейки весьма малы) вследствие предполагаемой для функции р(х_у у) непрерывности. Допустим, что Р_г(х_у у) есть частная система, пр^т<* которой скорость минимальна и равна R₁. Выберем из высоковероятных сообщений у по произволу некоторый ряд, содержащий

членов, где при Г-> оо е 0. При большом T каждая выбранная точка будет соединена линией высокой вероятности (к^к на фиг. 9) с рядом х. Вычисления, подобные использованным при доказательстве теоремы И, показывают, что при большом T почти все х охватываются «веерами» линий, идущими от выбранных точек у_у почти при любом выборе у.

Соответствующая система связи действует следующем образом. Выбранным точкам приписываются двоичные числа. Когда появляется сообщение х, оно будет (с вероятностью, достигающей 1 при T-*- оо) расположено, по крайней мере, на одном из «вееров» линий. Тогда по каналу передается соответствующее двоичное число (или, если их несколько, одно произвольно выбранное число), закодированное надлежащим образом для обеспечения малой вероятности ошибок. Это возможно, поскольку R_x< С. В приемной точке восстанавливается соответствующее у_у которое и используется как принимаемое сообщение.

Оценка v\ для этой системы может быть сделана сколь угодно близкой к р_ь если взять T достаточно большим. Это обусловливается

часть i. статистическая теория передачи сигналов

тем, что для каждого длинного «образца» сообщения x(t) и воспроизводимого сообщения y(t) оценка сходится к V₁ (с вероятностью 1).

Интересно отметить, что в этой системе шумы в воспроизводимом сообщении создаются за счет специфического квантования в передатчике, а не за счет шумов в канале. Они в некоторой степени аналогичны шумам квантования при кодовой импульсной модуляции.

28. ВЫЧИСЛЕНИЕ СКОРОСТИ СОЗДАНИЯ СООБЩЕНИЙ

Определение скорости создания сообщений во многих отношениях подобно определению пропускной способности канала. В первом случае

*= p^^P{x'^y)hg mm^dxdy

при фиксированных Р(х) и V₁ = JjV*» У)?(^х> У) ^dx dyк Во втором случае

^c=mz^^P{x,y)l08^^^)dxdy

при фиксированном P_x (у) и при наложении, возможно, одного или более других ограничений (например, ограничение средней мощности) вида К = jjp(x, у) Цх, у) dx dy.

Для общей задачи разыскания максимума, возникающей при "определении скорости источника, может быть найдено частное решение. Пользуясь методом Лагранжа, рассмотрим выражение

j'j[p(x, у) Iog pgypg) +V-P(x, у) ₉(х, у) + Цх) Р(х, у)] dxdy.

Вариационное уравнение, когда берут первую вариацию по Р(х,у), приводит к

P_y(X) = В(х)е~^^х'^у\

где X определяется из условия получения необходимой верности воспроизведения, а В(х) должно удовлетворять равенству

\B(x)e~^x^^y)dx= 1.

Это показывает, что при наилучшем кодировании условная вероятность для различных принимаемых сообщений у, т. е. Р_у(х), экспоненциально уменьшается вместе с р(х, у) —функцией «расстояния» между рассматриваемыми х и у.

В частном случае, когда функция «расстояния» р(х, у) зависит только от (векторной) разности между хну

Р(*> У) = ?(^х — У), имеем J_sw _е-Щ*-у) _dx ₌ _к

гл. v. скорость создания сообщений

Следовательно, В(х) — постоянная величина, скажем а, и

P_y(X) = ае~^Мх-^у).

К сожалению, эти формальные решения в частных случаях трудно численно оценить, и поэтому ценность их представляется небольшой, фактическое вычисление скоростей источников было выполнено только для немногих очень простых случаев.

Если функция «расстояния» р(х₉ у) представляет собой средний квадрат разности между х и у, а ансамбль сообщений — «белые» шумы, то скорость может быть определена. В этом случае имеем

R = min [Н(х) — H_y(X)] = Н(х) — шах Н_у(х)

при N=(x—у)². Но максимум Н_у(х) соответствует случаю, когда у—х есть «белые» шумы, причем он равен BP₁Iog^TueZV, где W₁ — полоса частот ансамбля сообщений. Поэтому

R = W₁ Iog 2iueQ — W₁ Iog 2?ueZV = W₁ Iog -¾-,

где Q — средняя мощность сообщений. Это доказывает следующую теорему.

Теорема 22

Скорость источника «белых» шумов мощностью Qhc полосой частот W₁ при эффективном критерии верности воспроизведения равна

R = W₁ Iog^,

где ZV есть допустимый средний квадрат отклонения воспроизводимого сообщения от исходного сообщения.

В более общем случае для любого источника сообщений можно получить неравенства, ограничивающие скорость создания сообщений при допустимом среднем квадрате отклонения.

Теорема 23

Скорость для любого источника с полосой частот W₁ ограничена соотношениями

W₁log-%-<R<W₁ IogA

где Q есть средняя мощность источника, Q₁ — его энтропийная мощность и ZV — допустимый средний квадрат отклонения.

Нижний предел следует из того, что максимум Н_у(х) при данном (х—y)²=N имеет место в случае «белых» шумов. Верхний предел будет получен, • если разместить точки, использованные при доказательстве теоремы 21, не лучшим образом, а случайно в сфере радиуса YQ-N

часть i. статистическая теория передачи сигналов

Приложение 1

Пусть N_i(L) будет число групп символов длительностью L_yзаканчивающихся в состоянии /. Тогда имеем

i, s

где Ь\р bf_jy ...>bj—длительности символов, которые могут быть выбраны в состоянии / и приводят к состоянию /. Эти выражения суть линейные разностные уравнения, свойства которых при L—► oo должны быть вида

Л^т_у = A_jW^lПодставляем в разностное уравнение

AW = X^aI^w

-А

или

h^is)

A_j = I_dA_lW-"»

Чтобы это было возможно, определитель

0(V) = |a_/y| = |2V ^u -8_iy|

должен быть равен нулю, что дает W_y который, конечно, является наибольшим действительным корнем уравнения D=^CK Тогда величина С равна

Замечаем, что придем к тому же результату, если потребуем, чтобы все группы начинались с одного и того же произвольно выбранного состояния.

Приложение 2

/1 1 t \ Пусть Hi — , — —-) = А(п). По условию (3) можно разбить выбор из числа S^m равных возможностей на ряды по т выборов из s равных возможностей в каждом и получить

A(s^m) = mA(s).

приложения

Точно так же

A(t") = nA(t).

Можно выбрать п произвольно большим и найти т из условия

s^m < tⁿ<J s^m+i.

Таким образом, логарифмируя и деля на п \og s, найдем

т__

IcgZ __

Iogs ^ л п

или

HL-^^tI ^ _е

/i Iog 5 '

где е — произвольно мало.

Теперь из свойств монотонности А (п)

A(s^m)^A(t")^A(s^m+i), mA(s)^ nA(t) < (m-f

Следовательно, деля на az^(s):

Л(0 A(s)

п ~ п

или

MQ A(s)

m п

MQ A(s)

О,

Л(0 = -ZClogZ,

Iog/

где /( должно быть положительным, чтобы удовлетворить условию (2).

Допустим теперь, что имеется выбор из п возможностей с соизмеримыми вероятностями p_L = , где щ — целые числа.

Можно разделить выбор из ^ щ возможностей на выбор из п возможностей с вероятностями P₁,..., р_п и затем, если i было избрано, произвести выбор из H_i возможностей с равными вероятностями. Пользуясь опять условием (3), приравняем полный выбор из ZⁿL ^В03' можностей, вычисленный двумя способами

KlogEn_i= Н(р_ъ..., р_п)+KE P_iIogn_i. Следовательно:

н = к (Е P_i iog Ещ-Е P_i iog щ) =

= - к E P_i iog ^^l- = - кЕ P_i iog P_r

Если pi иррациональны, они могут быть апроксимированы правильными дробями и то же самое выражение должно сохраниться при предположении о непрерывности. Таким образом, это выражение справедливо в общем случае. Выбор коэффициента К производится из соображений удобства, он определяет единицу измерений.

П р и*л" о ж?е"н и е 3

Предположим, что источник является эргодическим, так что применим сильный закон больших чисел. Таким образом, число пересечений данной траектории P_ij в последовательности большой длины N приблизительно пропорционально вероятности нахождения в состоянии / (скажем, P_i) и последующего выбора этой траектории, т. е. P_iP_ijN. Если N достаточно велико, то вероятность ошибки ±8 при этом меньше е, так что для всех случаев за исключением группы малой вероятности действительные числа заключены в пределах

{P₁ P_ij ±8) N.

Следовательно, почти все последовательности имеют вероятность

P=ILPij

[иной

~тИ~ ^0ГР^аничен величиной

или

Это доказывает теорему 3.

Теорема 4 немедленно следует отсюда по вычислении Верхнего и нижнего пределов для n(q)_y основанных на диапазоне возможных значений р в теореме 3.

В смешанном (не эргодическом) случае, если

^L=X PiK

а «энтропии» составляющих суть Н₁>Н₂>...>Н_пУ справедливо следующее предложение.

Теорема есть убывающая ступенчатая функция

5—1 5

w(q) = H_s в интервале J Ja..

приложения

Для доказательства теорем 5 и 6 прежде всего заметим, что Fn монотонно убывает, так как увеличение N увеличивает индекс условной «энтропии». Простая подстановка значения р_в (Sj) в формулу для Fn показывает, что

F_n =NG_n-(N-I)G_n- l

Суммируя по всем N_f получим

Gn =4 S ^Fn-

Следовательно, Gn>Fn и Gn монотонно убывает. Они должны также сходиться к одному и тому же пределу. Пользуясь теоремой 3, видим, что

IimGyv =H.

TV-OO

Приложение 4

Допустим, что имеется ряд ограничений, наложенных на последовательности символов, причем последовательности — с конечными состояниями и поэтому могут быть представлены линейным графиком, как на фиг 2. Пусть /⁽₇ будут длительности различных символов, которые могут случиться при переходе из состояния / в состояние /. Какое распределение вероятностей P_i для различных состояний и вероятностей p\f выбора символа s в состоянии /, переходящем в состояние /, дает максимальную скорость создания сообщений при данных ограничениях? Ограничения определяют дискретный канал, а максимальная скорость должна быть меньше или равна пропускной способности С этого канала. Действительно, если все группы большой длительности равновероятны, то в результате получилась бы именно эта скорость, а если они возможны, то такая скорость была бы наилучшей. Ниже будет показано, что эта ркорость может быть получена путем надлежащего выбора

P₁ и pjf

Рассматриваемая скорость равна

YKJfFii

Пусть

V ij ~~ В:

часть i. статистическая теория передачи сигналов

где B₁ удовлетворяет уравнению

_ (S)

/\s

Эта однородная система имеет не равное нулю решение, поскольку W таково, что определитель коэффициентов равен нулю

У М)

= 0.

Выбранные таким образом р%- являются подходящими переходными вероятностями, так как прежде всего

(s)

Pv -LtbT ^w - ~вГ~^и

j, s J_y s

так что сумма вероятностей в любой частной узловой точке равна единице. Далее, они не отрицательны, как это можно видеть из рассмотрения величин A_i (Приложение 1). Все A_i обязательно не отрицательны, а B_i удовлетворяют подобной же системе уравнений, только с переменой местами / и /. Это приводит к обратной ориентации линий на графике.

Подставляя эти значения p\f в общее уравнение для скорости, получим

R - i^{s)

2 Pip¹O 4}

_ Iog W 2 PiPⁱO ^liO - 2 PiP^kQ '°g ⁸J+ 2 PiP^tQ ^loS Bi _Лп„ _ш п

~ 2 PW 4 -IOgw-C

Таким образом, скорость при этой группе переходных вероятностей ровна С, и поскольку эта скорость никогда не может быть превзойдена, то она является максимальной.

Приложение 5

Пусть S₁ будет некоторое измеримое подмножество g-ансамбля, а S₂— подмножество /-ансамбля, которое дает S₁ в результате операции Т. Тогда

S₁=TS₂.

Пусть H^x будет оператор, смещающий на интервал времени X все функции множества. Тогда

H^xS₁=H^xTS₂=TH^xS_2t

приложения

так как T— инвариантна и поэтому может переставляться с H^x . Таким образом, если m[S] есть вероятностная мера множества S, то

т [H^xS₁]=ш [TH^f S₂] =т [H^xS₂]=m [S₂]=m [S₁],

где второе равенство следует из определения меры Bg-пространстве, третье — из стационарности /-ансамбля, а последнее—опять-таки из определения меры g. Это показывает, что g-ансамбль— стационарный.

Для доказательства сохранения эргодических свойств при инвариантных операциях положим, что S₁ есть подмножество g-ан-самбля, инвариантное при операциях H^x, и пусть S₂ будет множество всех функций /, которые преобразуются в S₁. Тогда

Я^х S₁ = ^rS₂ = TTZ^x S₂ = S_b

так что H^xS₂ включается в S₂ при всех X. Теперь так как

m[H^xS₂]=m [S₂] =HilS₁],

то это означает

H^xS₂ = S₂

для всех X при т [S₂ J 0,1. Это противоречие показывает, что S₁ не существует.

Приложение 6

Верхний предел N₃^N₁+N₂ объясняется тем обстоятельством, что максимальная возможная «энтропия» для мощности N₁J-N₁будет в том случае, когдз имеются «белые» шумы такой мощности. При этом энтропийная мощность равна N₁J-N₂.

Чтобы найти нижний предел, допустим, что имеются два распределения в п измерениях P(X_i) й q(x_t) с энтропийными мощностями A₁ и N₂. Какую форму должны иметь р и q, чтобы энтропийная мощность Zv₃ их взаимодействия

'W = J P(yiM*i — Vbdy_i

была минимальной?

«Энтропия» для г, которую обозначим H₃, равна

H₃= — ^ Jx_i) Icgr(X_i)Clx_i.

Надо разыскать минимум этого выражения при наложении следующих условий:

H₁=-^p(X_l) Iegp(X_l)Clx_i, H₂ = — ^q(X_i) Icgq(X_i)Clx_i.

часть i. статистическая теория передачи сигналов

Рассмотрим тогда

U=— \[г(х) Icg г(х)+1р(х) Iogp(X) + ^q(X) Icg q(x)] dx,

W=- J {[ 1 + Iog г(х)] Щх) + X [ 1 + Iog р(х)] Ър(х) +

+ p[l+\cgq(x)]bq(x)}dx.

Если р(х) изменяется при частном значении аргумента X_i=S_i, изменение г(х) равно

br(x) = q(x_i — s_i)

bU=—^(X_i — S₁) Iog r(x) dx_i — X Iog P(S_i) = 0.

Так же точно обстоит дело, если изменяется q. Таким образом, условия минимума

\q(x_t — S_i) Iog Jx_i) dx_t=—\ Icg P(S_i)_t

— s_t) Iog г(X_i) dx-_L = —Iog q(s_i).

Если умножить первое выражение на P(S_i)_f а второе на q(s^ и проинтегрировать по S_f то можно получить

H_z = — Xtf₁,

H_z = -^H₂

или, решая относительно X и ^ и подставляя в уравнения: H₁ ^(X_i — S_i) Icgr(X_l) dx_t=— H_z Iogp(S_i),

H₂ Jp(x, ~ S₁) Iogr(X_i) dx~— H_z Iog q(_Si).

Допустим теперь, что p(x_t) и q(x_t) подчиняются нормальному закону

Тогда r(x_t) будет также подчиняться нормальному закону с квадратичной формой C_ij. Если обратные величины этих форм составляют CL_ijt b_ijt C_iJ_t то

приложения

Надо показать, что эти функции удовлетворяют условиям минимума только в том случае, если CL_ij=Kb_ijt и таким образом дают минимум H₃ при наложенных ограничениях.

Прежде всего имеем

Iog /■(X₁)=-J- Iog Е_ {C_ij I - 7-2 ^си ^х' ^xJ

j Я(Ь — S_i) Iog Г{X₁) ClX_i=

=\ Iog + I C_ij I — 7- 2 —J 2 C_y ь_ц. Это должно равняться

^(4^Иу|-7-24уЦ.

что требует

В этом случае A_ij = -ff~^BU ^и ⁰^^a УР^авнения превращаются в тождества.

ЧАСТЬ II

ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ¹*

С. РАЙС

Глава I ДРОБОВОЙ ЭФФЕКТ

Дробовой эффект в электродных лампах представляет собой типичный пример шумов. Эти шумы являются следствием флук-туаций интенсивности потока электронов, текущего от катода к аноду. Здесь будет рассмотрен упрощенный тип дробового эффекта.

1.1. ВЕРОЯТНОСТЬ ПОСТУПЛЕНИЯ НА АНОД ТОЧНО К ЭЛЕКТРОНОВ ЗА ПРОМЕЖУТОК ВРЕМЕНИ T

Предположим, что флуктуации электронного потока являются беспорядочными, и будем трактовать эту случайность следующим образом. Подсчитаем число электронов, поступающих на анод за длительный промежуток времени T_y измеряемый в секундах. Допустим, что оно равно /C₁. Повторяя процесс подсчета для многих промежутков длительностью T_y получим ряд чисел /C₂, /C₃,... Км* где M — полное число таких промежутков. Среднее число электронов в секунду V определяется как

V= Iim *i + *»-" + *Af, (1.1-1)

M-* оо MT ^V '

причем предполагаем, что этот предел существует. По мере увеличения M при постоянной величине T некоторые /С будут иметь одинаковые значения. Действительно, при возрастании M число К, имеющих какое-то данное значение, будет стремиться к увеличению. Это заключение основано на предположении, что электронный ток представляет собой постоянный ток, на который накладываются беспорядочные флуктуации. Вероятность попадания на анод К электронов за данный опыт определяется как

p^jfj_Jj_m число опытов, дающих точно К электронов j_

M •* оо Al

^г) S .О. Ric е, «Mathematical Analysis of Random Noise», Bell System Technical Journal, 23, № 3, 282-332, Julv 1944, 24, № 1, 46—156, January 1945.

гл. i. дробовой эффект

Конечно, р(К) зависит также от T Предположим, что беспорядочность электронного потока такова, что вероятность попадания электрона на анод в промежуток времени (Z,Z+AZ) равна vJZ (lt таково, что VAZs^l) и что эта вероятность не зависит от событий, происходящих до момента времени Z или после момента Z+AZ.

Этого предположения достаточно для написания выражения для р(К)_у которое равно

р(Ю=<7/да. (1.1-3)

Это есть «закон малых вероятностей» Пуассона. Один из иногда применяемых методов доказательства может быть легко продемонстрирован для случая K=O. Разделим промежуток (0,7) на M

интервалов каждый длительностью AZ=-^. Выбираем AZ таким малым, чтобы vAZ было значительно меньше единицы. (Это и есть «малая вероятность» того, что электрон попадает на анод в промежуток времени AZ.) Вероятность того, что электрон не попадает на анод в первый промежуток AZ, равна (1—vAZ). Соответственно вероятность того, что электрон не попадает на анод ни в первый, ни во второй промежуток, равна (1—vAZ)², а вероятность того, чта электрон не попадает на анод ни в одном из M промежутков, равна

(I^vAZ)^vL Заменяя M через -^- и полагая AZ—ИЗ, получим

р(0)= е-*

Выражения для р(1), р(2),...,р(/() могут быть выведены подобным же образом.

1.2. ТЕОРЕМА О НАЛОЖЕНИИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ

Допустим, что попадание электрона на анод в момент Z=O вызывает какой-то эффект F(t) в некоторой точке выходной цепи. Если выходной контур таков, что эффекты, вызываемые отдельными электронами, складываются линейно, то полный эффект в-момент Z благодаря действию всех электронов равен

Щ= Y_lFit-U), 0.2-1)

Л= -оо

где £-й электрон попадает в момент Za- , а ряд предполагается сходящимся.

Теорема о наложении случайных возмущений утверждает, что среднее значение /(Z) равно

7(Z) = vj7(Z)dZ, (1.2-2)

часть ii. теория флуктуационных шумов

а средний квадрат флуктуаций вокруг этого среднего значения

+ оо

[/(О-/W² =v ]>(*)#, (1.2-3)

— OO

где V есть среднее число электронов, попадающих на анод за 1 сек.

Формулировка этой теоремы не будет достаточна, пока не определено, что подразумевается под словами «среднее значение». Форма приведенных выше уравнений может натолкнуть^а мысль, что это есть среднее во времени, т. е. значение

Iim A [l(t)dt. (1.2—4)

Однако при доказательстве этой теоремы усреднение обычно производится по весьма большому числу промежутков длительностью T_y а t сохраняется постоянным. Этот процесс в известной степени подобен применявшемуся в разделе (1.1); для большей ясности рассмотрим, что представляет собой, например, /(/). Мы наблюдаем /(Z) во многих, скажем M_y интервалах, длительностью каждый T_y причем Г велико по .сравнению с промежутком, в течение которого эффект Z⁷(Z), вызыраемый поступлением одиночного электрона, значителен. Пусть J(F) будет значение /(Z) через Z' секунд после начала п-то интервала. Z' равно ^ плюс постоянная величина, зависящая от начального момента интервала. Индекс поставлен впереди, чтобы сохранить обычное место для другого индекса, который будет введен позже. Значение I(F) тогда определяется так:

1Щ= Iim А [,/(0 + 2/(0 + -■ • +мЦЩ] (1.2-5)

M-* оо

причем предполагается, что предел существует. Средний квадрат флуктуаций /(/') определяется таким же точно путем.

Как показывают уравнения (1.2—2) и (1.2—3), эти средние значения и все им подобные средние значения, появляющиеся в дальнейшем, оказываются независимыми от времени. Когда это справедливо и входящие в уравнение (1.2—5) M интервалов следуют друг за другом, среднее во времени (1.2—4) и среднее (1.2—5) становятся одинаковыми. Чтобы это показать, умножим обе части (1.2—5) на dt' и проинтегрируем в пределах от О до Т:

мт мт

^/1F)=l^mJf2j Jindt^limJ_f j Iit) dt, (1.2-6)

m=l О О

а это то же самое, что и среднее во времени (1.2—4), если только последний предел существует.

гл. I. дробовой эффект

1.3. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ О НАЛОЖЕНИИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ

Рассмотрим случай, когда точно К электронов поступают на _анод в интервале длительностью T Прежде чем интервал начался, было предопределено прибытие этих К электронов в промежутке (О, 7), хотя каждый данный электрон может поступить на анод с одинаковой вероятностью в тот или другой момент времени. Подсчитываем все эти электроны от первого до /(-го; следует подчеркнуть, что при этом подсчете не касаемся порядка поступления электронов на анод. Поэтому если t_k — момент поступления £-го электрона, то вероятность нахождения tk в промежутке (t,t+dt) dt

равна -rf.

T принято весьма большим сравнительно с интервалом значений Z, для которого Z⁷(Z) значительно отличается от нуля. В физических задачах подобный интервал обычно существует; назовем его А, хотя он и не очень определенен. Тогда если точно К электронов поступают на анод в промежутке (0,7), то создаваемый ими эффект приблизительно равен

I_K{t)=YF(t-t_k\ (1.3-1)

A=I

причем степень приближения весьма хороша во всем интервале за исключением участка внутри А у конечных точек.

Допустим, что исследуется большое число M интервалов длительностью 7. Число промежутков, # которые на анод поступает точно К электронов, будет равно в первом приближении Mp(K), где р(К) находится из (1.1—3). Для фиксированного значения Z и для каждого интервала, в который поступает К электронов, Ik(I) будет иметь определенное значение. Когда M—► оо, то среднее значение /#(/), найденное путем усреднения по интервалам, равно

да = ^•••^-2^-4)=2(^^-^), (ьз-2)

0 0 A=I A=I 0

и если A<Z<7 — А, то

+ OO

Если теперь усредним /(Z) по всем M интервалам, а не только ^по тем, в которые на анод поступает К электронов, то получим.

часть ii. теория флуктуационных шумов

если M—► оо:

OO оо ^ -\- со

W= 2 р^)Щ) = 24 п+е-Цпъ dt =

TV= О K = O 7

= v Jz⁷(Z) Л, (1.3-4)

что и доказывает первую часть теоремы. Этот детальный вывод быд применен для доказательства сравнительно простого соотношения (1.3—4), чтобы иллюстрировать метод, который может быть применен для доказательства более сложных выводов. Конечно, соотношение (1.3—4) легко установить, замечая, что интеграл представляет собой среднее значение эффекта, вызываемого поступлением одного электрона, причем это среднее значение взято за 1 сек., а V есть среднее число поступлений электронов за 1 сек.

Чтобы доказать вторую часть (1.2—3) теоремы, сначала вычислим Z²(Z) и воспользуемся соотношением

[/(Z) - /(Z)I² = /² (Z) - 2/(/) /(Z) + /(Z)² = Z² (Z) -/(Z)². (1.3-5) Из определения I_K(t) в уравнении (1.3—1) следует

M') = 2 2 м-у nt-t_m).

1 m=l

Усредняя это выражение по всем значениям Z₁,Z₂,..., Z^, поддерживая Z постоянным, как и в (1.3—2), получим

KK⁷ ^Т

MW = X 2 [-J- \-«F{t-t_k)F{t-t_m).

Кратный интеграл имеет два различных значения. Если k=tn» то его значение равно

F\t-t_k)^,

а если k+=m_y то

J4(/-4)4j F{t-t_m)-j

m t

Подсчет числа членов в двойной сумме показывает, что первое значение имеют К членов, а второе значение (К²—К) членов.

ГЛ. I. ДРОБОВОЙ ЭФФЕКТ

Следовательно, если Д<7<7—Д, то

+ оо +оо 2

ILt) = $ dt + *<£72 [ j _Л ]

- оо —оо

Усредняя по всем интервалам, а не только по тем, в которые на анод поступает К электронов, получим

Щ = 2 P(K)Iut) = V Г F\t)dt + Wy,

K-O J

— OO

где суммирование по К выполняется так же, как в (1.3—4), а после суммирования подставляется значение (1.3—4) для /(Z). Сравнение с (1.3—5) доказывает вторую часть теоремы.

1.4. РАСПРЕДЕЛЕНИЕ ТОКА I(t)

Если выполняются некоторые условия, то часть времени, в течение которого ток /(Z) заключен в пределах (/,/+<//), равна P(I) dl_y где при V—* оо плотность вероятностей P(I) сходится к

1 -(/-7)²/2а*

—е ¹ (1-4—1)

^qI /2к

Здесь / — среднее значение /(Z), равное (1.2—2), а квадрат стандартного отклонения о₇ , т. е. дисперсия, равна (1.2—3). Нормальное распределение следовало ожидать в силу «центральной предельной теоремы» теории вероятностей. Она утверждает, что при некоторых условиях распределение суммы большого числа случайных переменных сходится к нормальному закону распределения, дисперсия которого равна сумме дисперсий отдельных переменных. Подобным же образом среднее значение нормального распределения равно сумме средних значений отдельных переменных.

До сих пор говорилось о предельной форме плотности вероятностей P(I). Можно написать точное выражение для P(I)_f которое, однако, весьма сложно. Из точного выражения может быть получена предельная форма. Найдем теперь это выражение.

В соответствии с тем, как это было сделано при доказательстве теоремы о наложении случайных возмущений, ищем плотность вероятностей P(I) для значений /(Z), наблюденных через Z секунд от начала каждого из промежутков длительностью T_i составляющих 'большое число M.

Вероятность нахождения /(/) в интервале (/, I-\-dI) =

= 2 (вероятность поступления точно К электронов) X K=O

X (вероятность нахождения I_K(t) в интервале ( /, IJdI) при поступлении на анод точно К электронов).

часть il теория флуктуационных шумов

Обозначая последнюю вероятность в суммировании через Pk(I) (II₉, используя применявшиеся ранее обозначения и отбрасывая множитель dl₉ получим

Р(П= Y₁P(K)Pk(I)- (1-4-2)

k=O

Вычислим Pk(I) методом «характеристических функций», ис^ пользуя определение Ik(I)

Ik(I)= JZ⁷(Z-Za). (1.3-1)

a=I

Этот метод будет применен в его простейшей форме: вероятность того, что сумма ZC независимых случайных переменных

Xi + X₂^jI---⁹+Х_К

находится в интервале между X и X+dX₉ равна

^dxL |^е_ш,П (сред. знач. е ^k )du. (1.4—3)

— оо a= 1

Среднее значение e^tXkU> т. е. характеристическая функция распределения Xk у находится усреднением по значениям Xk . Хотя это и наиболее простая форма метода, но она также и наименее общая, так как интеграл в некоторых важных случаях расходится. Примером такого случая является распределение, которое дает вероятность L , что я* = — 1, и -L , что Xk=E Однако в таких случаях

все же формально можно пользоваться уравнением (1.4—3), применяя соотношение

J" е~^Шс1и = 2Ща), (1.4—4)

-OO

где 8(а)=0 за исключением а=0, когда 8(0)= оо, а ее интеграл, взятый в пределах от а=—е до а=+£, равен единице (здесь ^£!>0h Если заменить Xk на Z⁷(Z-Za), то видно, что среднее значение e^l*^kU равно

-L-Jexp [iuF(t — t_k )] dt_k . о

Все ZC характеристических функций одинаковы, и, следовательно, из (1.4—3) P_k(I) dl равно

гл. i. дробовой эффект

Хотя при выводе этого соотношения было принято Z(>0, но оно также справедливо и для K=O [если только использовано (1.4—4)]. В этом случае P₀(Z)=S(Z), поскольку /=0, когда электроны не поступают на анод.

Вводя выражение для Pk(I) и выражение (1.1—3) для р(К) в уравнение (1.4—2) и выполняя суммирование, получим + « т

P(I) = A j ехр — Uu — v7 + VJ ехр [iuF(t — х)] dz\du. (1.4—5)

- OO ^ о

Первая показательная функция может ^ыть несколько упрощена. Воспользовавшись соотношением

v7 = V Jdx

можем написать

т т

— vT+vj* ехр [iuF(t — х)] di =

о о Полагаем, что k<^t<iT — Д, где Д есть интервал, рассмотренный в связи с уравнением (1.3—1). Принимая \F(t—х)| = О при 11 — х| > Д, можно написать последнее выражение в виде

⁺~

V \ (e^iuF{t)—\)dt. (1.4—6)

— OO

Подставив это выражение в (1.4—5), получим искомое уравнение Для P(I)

+ OO + OO

P(I) = jехр 1 — tfu+v С (J^um du. (1.4—7)

-OO — OO

Представление о тех условиях, при которых плотность вероятностей сходится к нормальному закону (1.4—1), можно получить из (1.4—7), разлагая (1.4—6) в ряд по а и определяя, когда можно пренебречь членами с и* и с высшими степенями и. Это проделано в разделе 1.6 для другого, несколько более общего случая.

1.5. ОБОБЩЕНИЕ ТЕОРЕМЫ О НАЛОЖЕНИИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ

Вместо выражения (1.2—1) для тока дробового эффекта I(I) будем теперь иметь дело с током

+ OO

/(/)= у; a_kF(t-t_k), (1.5-1)

часть ii. теория флуктуационных шумов

где F(I) — функция того же типа, что и ранее, и где... a_lt а₂,... CLk₉...—независимые случайные переменные, все имеющие одинаковое распределение. Предполагается, что моменты а^п существуют и что все события являются случайными.

Обобщенная теорема утверждает, что п-й семиинвариант плотности вероятностей P(I) для тока / (1.5—1) равен

+ OO

X„=v^ jV(Z)]*dZ, (1.5-2)

где V есть ожидаемое число событий в 1 сек.

Семиинварианты распределения определяются как коэффициенты в разложении

Iog, (сред. е^Ш)= J ^{iuY +Ф% (1.5-3)

т. е. как коэффициенты в разложении логарифма характеристической функции. Семиинварианты X связаны с моментами распределения. Поэтому если т_ъ т₂>... обозначают моменты первого, второго и т. д. порядков относительно нуля, то

сред, е"«= 1 +2 КГ ^{^iu)"⁺ ^Uⁿ )•

Комбинируя это соотношение с выражением для X, можно показать, что

T=LTI₁=I₁₁

D= Ki₂= X₂ + X₁Zn₁, 1^ъ=т₃= X₃+2X₂m₁ + X₁m₂ .

Отсюда следует, что X₁=/, а X₂= (/—/)². Следовательно, из (1.5—2) можно получить первоначальную формулировку теоремы, если положить п равным единице и двум и принять, что все а равны единице.

Обобщение теоремы немедленно следует из обобщения выражения (1.4—7) для плотности вероятностей. Проделывая такие же операции, что и в разделе 1.4, и заменяя Xk на a_kF(t—t_k), получим

+ оо T

сред. A*" = Aj q(_a)da j ехр [iuaF(t — t_k)]dt_k ,

-оо о

где q(a) есть функция плотности вероятностей для а. Следовательно,

гл. i. дробовой эффект

плотность вероятностей P(I) для тока /, заданного в виде (1.5—1), равна

+ OO +OO +OO

P(I) = 7- J ехр [ — Ни + V j* q(a) da J (e^iu<">V)—\) dt) du. (1.5—4)

— OO — OO — OO

Из (1.5—4) логарифм характеристической функции для P(I) равен

+ OO +OO OO +OO +OO

V j q(a) da jV"™ ~ D 2 4г ^v | q(a) da a+\t) dt.

— OO

Сравнение с рядом (1.5—3), определяющим семиинварианты, приводит к обобщению теоремы, формулированному в виде (1.5—2).

Могут быть сделаны и другие обобщения теоремы. Например, положим в выражении (1.5—1) для тока I(I)_f что Z₁, Z₂,..., Za,..., хотя и продолжают быть случайными переменными, но теперь не обязательно распределены в соответствие с принятыми ранее законами. Допустим, что дана плотность вероятностей р(х)_у где х — промежуток между следующими друг за другом событиями:

Z₂= Z₁+X₁ , (1.5-5)

Z₃ = U + X₂= Z₁+ X₁+ X₂ и т. д.

Для рассмотренного выше случая

р(х) = V*-". (1.5—6)

Предполагаем, что ожидаемое число событий в 1 сек. равно v. Возьмем частный, но важный случай, для которого

F(Z)=O, Z<0, F(t) = e-*<y Z>0.

Для очень длинного промежутка, простирающегося от Z=Z₁ до Z= T+ Z₁, внутри которого происходит точно К событий, будем иметь, если Z не близко к концам промежутка:

I(t) = a₁F(t—t₁)+ A₂F(Z-Z₁-X₁) + • • • + a*+iF(Z—Z₁-X₁-----х_к) =

^aJW+a^t' -X₁)+ • • • + a*+iF(Z'—X₁-----х_к),

D(Z)= a\F²(t')+a\F*(t'—X₁) + - • - + ^₊iF²(Z'—X₁-----х_к) +

+ 2a₁a₂F(t^f)F(f-x₁) + • • • +2^+1^ W~*i-----x_K) +

+2a₂a₃F(t'— XOF(F-X₁-X₂)H-----\- • • •

где Z'= Z-Z₁. Если проинтегрируем I²(I) по всему интервалу 0<Z'<7 и опустим штрих, то получим приближенно

часть ii. теория флуктуационных шумов

j/²(Z) dt = (а\ + •. • +aht) <f(0)+

+2^2^(^0 +га^ср^+ХгН-----^a&x+iUiXi+ ...+х_к)+

+ 2а₂а₃ср(х₂)Н-----1-----\-2a_Ka_K+i w(x_K),

где

-1—

w(x) = J F(t)F(t — x)dx.

Если разделить обе части на T и положить, что К и T очень велики, то

у H- *±i C_f(O) ^va^O)

{ O₁A₂Cp(X₁)+a₂a₃(D(х₂) H-----\-a_Ka_K+i cp(x_K)J

= -у ^сР^ед- 0A₊i<p(x_A )]

=^r va² J cp(x) p(x) dx ,

Ia₁O₃Cf(X₁+x₂) H----j = Lzlсред, j* _Qk _Ck+2 ^ ₊

OO OO

^ VO² Jdx₁ J dx₂ P(X₁) p(x₂) cf (X₁+x₂). о 0

Соответственно

Щ = Iim-L- [ I²(I) dt = 0

=v a2(c(0)+ 2v a² [ j P(*)<PW ^d* +

00 00

+ J GfX₁ J dX₂ P(X₁)P(X₂) Cf(X!+X₂) + 1.

Для нашего частного случая экспоненциальной формы F(Z) имеем

/ \ е ~^ах

гл. i. дробовой эффект

а кратные интегралы, встречающиеся в выражении для I²(I)_i могут быть представлены при помощи

q= ^ р(х) е-** dx. (1.5—8)

Поэтому а так как

то получим

2 а D(Z)= va2+2a²vy^- ,

/(Z) ^vajF(Z) dt^HL,

тт-т- 4+С#)'[ч^)-']- <'-⁵-⁹>

Уравнения (1.5—8) и (1.5—9) представляют собой обобщение теоремы при условии сохранения ограничений, рассмотренных в связи с уравнениями (1.5—5) и (1.5—7). Были сделаны и другие обобщения¹!, но здесь ограничимся этим.

Читатель может найти интересным проверку того, даст ли уравнение (1.5—9) правильный ответ, если р(х) задано в виде (1.5—6), а также исследовать случай, когда события разделены равными промежутками.

1.6. СХОДИМОСТЬ РАСПРЕДЕЛЕНИЯ ТОКА / К 'НОРМАЛЬНОМУ * ЗАКОНУ

В разделе 1.5 было показано, что плотность вероятностей P(I) для тбка шумов / может быть формально представлена в виде

+ OO OO

^PW = 4 J ^exp [ - ^iIu + Ц ('")" Jr] ^d", (1-6-1)

_ оо Л=1

где I_n есть п-й семиинвариант, определяемый уравнением (1.5—2). Полагая

X₂ = а²

X = LA =Lzl (1.6—2)

са ⁴⁷

и разлагая

^ехрЦ^(/"^)лНг

Ч См. Е. Н. P о у л а н д, Proc Camb. Phil. Sor., 32, 580—597, 1936. Он распространяет теорему на случай существования двух функций вместо одной, обозначенной нами I(I). А. Я. Хинчин в Известиях АН СССР (сер. мат., № 3, 1938) продолжил и уточнил работу Роуланда.

100

часть ii. теория флуктуационных шумов

в ряд по степеням U_i почленно интегрируя этот ряд, пользуясь соотношениями

2п

+ оо

J (iua)ⁿ ехр { — шах — ^f^lj du = (—)"a-i<pW(x),

w«»(x) = -±= fne-^x*¹²,

и, наконец, собирая члены согласно порядку степени v ² , получим P(I) а <г-уо)(*) —^Zl w(3)(_x) ₊

AAcp(4_W+^i⁷ <р(в)_(д)

+...

(1.6-3)

Первый член дает нормальное распределение, а прочие члены показывают, как достигается такое распределение, когда v->oo.

1.7. СОСТАВЛЯЮЩИЕ ФУРЬЕ ТОКА /(Z)

В некоторых аналитических работах ток шумов представляется в виде

ти\ До I n/ 27mZ . _и . 2tc/zZ\

АО = -₂°- +Yl ^^cos T^-+ M^m^J (1.7-1)

и в определенном месте работы полагается, что TnN стремятся к бесконечности. Коэффициенты а_п и b_ni I^n ^N_i рассматриваются как независимые случайные переменные, распределенные вокруг нуля по нормальному закону.

В соответствии с нашим обычным подходом к дробовому эффекту предположим, что в течение промежутка (0,7) на анод поступают точно К электронов, так что ток шумов в этом промежутке равен

MO = ^F(t-tk). (1.7-2)

a=i

Коэффициентами разложения Ik(I) в ряд Фурье в интервале {0,7) являются а_пк и b_nKt где

К T

а_пК - 1Ьпк = ■Y E J ^р(* ~'* > ^exp (-¹Ir) ^dt *

a=i о

К +оо _к

~ -г S fao ^exp Г- ⁱIr H^dt=ё ^ⁱ"⁹* • ⁽¹ -⁷"³⁾

a-i -» ^l ^j a=i

гл. i. дробовой эффект

101

В этом выражении

(1-7-4)

— tS_n = Т" J F(t)e~^t2*^nt,T dt.

В предыдущих разделах моменты поступления электронов Z₁, Z₂,- --Лк рассматривались как К независимых случайных переменных, каждое из которых распределено равномерно в интервале (0,7). Следовательно, и Q_k могут считаться случайными переменными, равномерно распределенными по интервалу от 0 до 2iz.

Попутно заметим, что в уравнение (1.7—3) входит сумма из К случайно ориентированных единичных векторов. Когда К становится очень большим, как это будет в случае v-* оо, то известно,-что действительная и мнимая части этой суммы представляют собой случайные переменные, которые стремятся стать независимыми и нормально распределенными вокруг нуля. Это дает представление о том, каким образом появляется нормальное распределение коэффициентов. Усреднение по 6а в уравнении (1.7—3)дает, когда п>0:

ClnK = Ь_пк= 0. После дальнейших алгебраических выкладок

(1.7-5)

CLnK = Ь²_пк = 2 Rn у

(1.7-6)

где пфт и п_у т> 0.

До сих пор рассматривался случай поступления на анод точно К электронов в промежутке длительностью 7. Теперь переходим к общему случаю поступления любого числа электронов, используя формулы, аналогичные

(1.7-7)

(1.7-8)

а Ь =

о,

пфт.

Во второй строчке а_п обозначает стандартное отклонение величин ^а_п и Ь_п. Можно получить выражение для q\ в несколько иной форме,

102

часть ii. теория флуктуационных шумов

написав

W =

(1-7-9)

где I_n—частота п-й составляющей. Воспользовавшись (1.7—4), получим

+ OO

а² = 2vAf

j F\t)e~ⁱ²^n^t dt

(1.7—10)

Поэтому о'п пропорционально -^-.

Функция плотности вероятностей P(a_ly...,a_:v, b_lf..._yb_N) для 2N коэффициентов a_ly..._y a_Ny Ь_1у..._уЬм может быть выведена подобно плот¹-ности вероятностей тока шумов в разделе 1.4. Здесь N произвольно, но фиксировано. Выражение, аналогичное (1.4—5), есть интеграл кратности 2N

+ OO +OO

= (2iz)-^ ^du₁.. .^dv_N _ехр[—Iia₁U₁+...+b_Nv_N)—v7+v7£],(l .7—11)

где

2те

LjdOexp

iY^^un^Cn+^vn^Sn) casn9+(v_nC_n—u_nS_n) sin nQ

,(1.7-12)

п=Л

В этом уравнении C_n—iS_n представляет собой преобразование Фурье (1.7—4) функции F(t).

Вслед за этим нужно показать, что (1.7—И) сходится к нормальному закону в 2N измерениях, когда v—изо Эта задача оказывается весьма сложной. Представление о том, как выглядит это выражение, можно получить, рассматривая частный случай, когда F(I) является четной функцйей Z, и пренебрегая некоторыми членами. Тогда

Р(а_ъ .. .,a_N,b_u...,b_N) = (1+ K₁)

"(4+^)/₂

л = 1

где

X_m =

Уп

(1.7-14)

-a₃ = (2v7)"^V,J[Xa+/(xaX/ — y_ky_{) + 2у_шУьУ1],

k, i

а суммирование производится в пределах 2<(£+/)<ZV при £</.

гл. i. дробовой эффект

103

Отсюда видно, что если TuN поддерживаются постоянными, то корректирующий член т] стремится к нулю, когда v становится очень большим. Весьма грубое представление о порядке величины т] получают, считая, что х и у можно заменить единицами. Полагая далее, что сумма состоит из N² членов, каждый из которых может быть как положительным, так и отрицательным, получим, что величина суммы имеет порядок N. Тогда можно ожидать, что т] имеет порядок ZV(2vT)~^1/

Глава II

ЭНЕРГЕТИЧЕСКИЙ СПЕКТР И ФУНКЦИЯ КОРРЕЛЯЦИИ

В разделе 2.1 энергетический спектр и функция корреляции рассматриваемой функции времени, например, заданной в виде кривой, простирающейся до Z=оо, определяются соответственно уравнениями (2.1—3) и (2.1—4). Связь этих величин с формулами преобразования Фурье (2.1—5) и (2.1—6) вначале утверждается без доказательства; рассмотрение способа доказательства отнесено к разделам 2.3 и 2.4.

В разделе 2.3 рассмотрение основано на рядах Фурье, а в разделе 2.4 аналогичные результаты получаются более прямым путем на основе интегральной теоремы Парсеваля.

Если анализируемая функция содержит постоянную или периодические составляющие, то выводы раздела 2.1 должны быть дополнены, что и проделано в разделе 2.2. ,

Первые четыре раздела посвящены анализу заданной функции времени. Однако большинство 'приложений метода относится к функциям, которые ведут себя как более или менее случайные функции.

В математическом анализе подобная случайность обусловливается предположением, что функция t является также и функцией некоторых параметров, которые затем считаются случайными переменными. Этот вопрос разобран в разделе 2.5.

В разделе 2.6 выводы раздела 2.5 применяются для определения среднего энергетического спектра и средней функции корреляции тока дробового эффекта.

То же самое сделано в 2.7 для прямоугольной волны, полупериоды которой имеют случайную длительность. Пример, в котором интервалы предполагаются одинаковой длительности, но знак волны случаен, также рассмотрен в 2.7.

Представление тока шумов в виде тригонометрического ряда с коэффициентами, рассматриваемыми как случайные переменные, разбирается в разделе 2.8.

Последние два раздела 2.9 и 2.10 посвящены некоторым вопросам теории вероятностей, в них соответственно рассмотрен нормальный закон и центральная предельная теорема.

гл. ii. энергетический спектр и функция корреляции 105

2.1. НЕКОТОРЫЕ РЕЗУЛЬТАТЫ ОБОБЩЕННОГО ГАРМОНИЧЕСКОГО АНАЛИЗА

Вначале сформулируем выводы, которые нужно получить, а затем покажем их правдоподобие при помощи методов, которые являются скорее эвристическими, чем строгими.

Допустим, что I(I) есть одна из функций, которые упоминались выше. Можно представлять себе, что она задана в виде кривой, простирающейся от Z=— оо до Z= оо. Можно также считать, что функция /(Z) составлена из большого числа синусоидальных составляющих, частоты которых лежат в диапазоне от 0 до +оо . Это не обязательно должен быть ток шумов, но если считать эту функцию током шумов, то, протекая по сопротивлению 1 ом, этот ток рассеет некоторую среднюю мощность, скажем р вт. Часть этой средней мощности, выделяемой составляющими, частоты которых заключены между / и f+df, будем в дальнейшем обозначать w(f) df, следовательно:

P = JW)df. (2.1-1)

w(f) имеет размерность энергии и на этом основании часто называется «энерго-частотным спектром» тока /(Z). В дальнейшем будем называть w(f) просто «энергетическим спектром»¹!.

Математическая формулировка этих рассуждений приводит к совершенно четкому определению w(f).

Пусть <D(Z) будет функция времени /, равная нулю вне интервала 0<Z<7 и равная /(Z) внутри этого интервала. Ее спектр представляется следующим выражением:

S(f)= [ I(t)e'^2%i/t dt. (2.1-2) b

Энергетический спектр w(f) определяется как

w(f) = Iim ~~²¹У^)|2~~ (2.1-3)

где учитываются только значения />0 и предполагается, что этот предел существует. Это определение w(f) применимо, когда /(Z) не имеет периодических членов и постоянной составляющей. В противном случае уравнение (2.1—3) должно быть либо дополнено, либо применен другой метод исследования. Эти вопросы будут разобраны в разделе 2.2.

В литературе для w(f) принято также название «спектральная плотность мощности» или просто «спектральная плотность». (Прим. ред.)

106

часть ii. теория флуктуационных шумов

Функция корреляции для /(/) определяется пределом

ф(т) = Iim 4" f/(0 W + *)dt, (2.1 - 4)

который предполагается существующим. ф(т) тесно связана с коэффициентами кррреляции, применяемыми в статистической теории для измерения корреляции двух случайных переменных. В данном случае значение /(Z) в момент времени Z есть одна переменная, а ее значение в другой момент времени Z+x есть другая переменная.

Энергетический спектр w(f) и функция корреляции ф(х) связаны между собой следующими соотношениями +

w(f) = 4J Ф(т) cos 2те/т dx, (2.1_5)

ф(т) = J w(f) cos 2ти/т d/. (2.1 — 6)

Отсюда видно, что ф(т) является четной функцией т и что

Ф(0) = р. (2.1-7)

Когда известна либо ^(/), либо ф(т), вторая функция может быть найдена, если только соответствующий интеграл является сходящимся.

2.2. ЭНЕРГЕТИЧЕСКИЙ СПЕКТР ДЛЯ ПОСТОЯННОЙ И ПЕРИОДИЧЕСКОЙ СОСТАВЛЯЮЩИХ

Как указывалось в разделе 2.1, если /(Z) имеет постоянную или периодическую составляющую, то предел в уравнении (2.1—3) для /=O или для частоты периодической составляющей не существует. Пожалуй, наиболее удовлетворительным способом преодоления этой трудности с математической точки зрения является переход к оперированию с интегралом энергетического спектра

г*

\w{g)dg, (2.2-1)

вместо того чтобы иметь дело с самим спектром w(f).

Определение ф(т) в виде (2.1—4) сохраняется. Если, например:

/(Z) = А + С cos (2rc/₀Z — <р), (2.2— 2)

^х) Эти соотношения получены А. Я. Хинчиным в работе «Теория корреляции стационарных стохастических процессов» в 1934 г. (Прим. ред.)

гл. ii. энергетический спектр и функция корреляции Ю7

то по уравнению (2.1—4) ф(х) равна

ф(х) = л²+-у⁰⁰⁸ ²^fo^x-Формулы перехода (2.1—5) и (2.1—6) дают

(2.2— 3)

Г , 2 Г sin2r./x

) w(g) dg =- J ф(х) —_;— dx,

о о ф(т) = j* cos 2*ju/t d j w(g) dg

(2.2-4)

O LO

где последний интеграл должен рассматриваться как интеграл Стильтьеса. Если выражение (2.2—3) для ф(х) подставить в первую формулу (2.2—4), то получим

/ (A²_y если 0 </ < /о,

/■

g)dg={ ₂ _С2 (²-²-⁵)

о [А + -Tf_t если/>/₀.

Если это выражение использовать во второй формуле (2.2—4), то приращения дифференциала, очевидно, будут A² при /=O и

при /=/₀. Полученное выражение для ф(х) совпадает с первоначальным.

Теперь воспользуемся менее строгим, но более удобным методом рассмотрения случая периодических составляющих. Исследуя интеграл в выражении (2.2—5) для w{f)_y можем написать

w(f) = 2Л² 8(/) + 4 8(/- /о), (2.2- 6)

где 8 (х) есть четная единичная импульсная функция, так что если е>0, то

E е

j 8(jc) dx = i- j S(x) dx = 4. (2.2- 7)

О -e

а 8(x)=0, за исключением х=0, когда 8(0)= оо. Это позволяет воспользоваться более простыми формулами перехода раздела 2.1. Сразу видно, что вторая из них (2.1—6) дает правильное выражение для ф(х). Первая формула (2.1—5) дает правильное выражение для (wf), если интерпретировать интегралы следующим образом:

jcos 2тг/х^ = +-8(/),

j* cos 2тс/₀* cos 2u/x dz == -Г- 8(/ — /о)-

(2.2-8)

108

часть ii. теория флуктуационных шумов

Нетрудно показать, что это находится в согласии с основным представлением

+ OO + OO

j е-^l^^tt dt= D^пф dt = Hf), (2.2-9)

— оо — оо

которое, в свою очередь, следует из формального применения формулы интеграла Фурье и соотношения

+ оо +оо

j Hf)e^i2%,t df = f Hf) е " ^l^^t _df=\, (2.2- 10)

— OO — OO

Следует помнить, что в (2.2—8) I₀^O_y а />0, так что

4f + fo) = ⁰ ^для / > о.

Определение w{f) в виде (2.1—3) дает сплошной участок энергетического спектра. Чтобы получить часть спектра, соответствующую постоянной и периодическим составляющим, примером которой служит уравнение (2.2—6) для w(f) с функциями 8, надо дополнить (2.1—3) членами типа

2-4° 8(0 + +</-/.) =

.[HmifcjS*] p._s_ ,„

Правильность этого выражения может быть проверена путем вычисления S(/) для тока /(/), заданного в виде (2.2—2), и нахождения пределов.

2.3. ОБСУЖДЕНИЕ ВЫВОДОВ ПЕРВОГО РАЗДЕЛА — РЯДЫ ФУРЬЕ

Тот факт, что соотношение между энергетическим спектром w(f) и функцией корреляции <р(т) задается формулами преобразования Фурье, непосредственно связан с теоремами Парсеваля для рядов и интеграла Фурье. Начнем с рядов Фурье и используем представление о рассеивании доли энергии каждой составляющей независимо от поведения других составляющих.

Пусть часть тока I(I)_y приходящаяся на интервал 0<t<T_fразложена в ряд Фурье

Щ = ^ + S^cos^+^sin-^) (2.3-1)

гл. ii. энергетический спектр и функция корреляции 109

где

а_п= Ц 7(0 cos ^d/, ₍₂ _з_₂₎Тогда для интервала — х <t < 7 — х

Ht + т) = ^ + !Д a„cos г + ⁶*^sin-P^lj-) (2.3-3)

Перемножая ряды для /(Z) и /(Z+x) и интегрируя по Z, получим после некоторых сокращений

+/(/)/(/+x)d/ =

= 3+ £4<^+*У<™^Н-с(£), (2-3-4)

где последний член является корректирующим и должен быть добавлен вследствие того, что ряд (2.3—3) не представляет /(Z+x) в промежутке (7—х, 7), если t>0, или в промежутке (0,—х), если х<0.

Если ток /(Z) протекает по сопротивлению 1 ом в интервале (0,7), то каждая составляющая рассеет некоторую среднюю мощность. Эта средняя мощность, выделенная составляющей с частотой

I_n=-If- Щ> должна быть равна, как это следует из теории рядов

Фурье и элементарных принципов:

-L(aS+6£)em, пфО, (2 3—5)

— вт, п=0. 4

Ширина полосы, связанная с п-и составляющей, есть разность по частоте между (я+1)-й и п-и составляющими

г г _nji п _ _1_

L+i^— L~~ T T ~~ T ^гц'

Следовательно, если среднюю мощность в полосе (1,1+df) обозначить как w(f) df, то средняя мощность в полосе f_n+i—/ равна

^(/_я)(/_л₊-/_я)=^(+)+>

по

часть ii. теория флуктуационных шумов

а из (2.3—5) следует

•фт-Т+⁸+'»' "=+0. ₍₂₃__6>«0(0)4- = -7"' ^п ⁼ ⁰'

Если коэффициенты в (2.3—4) заменить их значениями, выраженными через w(f), то получим

±1 нот +.)*+ ¢(^)-+2 Mf) '^os2jT =

⁰ ^х /2=0 ^Х ⁷

= I а; (+г) cos -L^ у- = I о>(/) cos 2ф df₉ (2.3—7)

где полагаем T настолько большим, а w(f) такого характера, что суммирование может быть заменено интегрированием.

Если / остается конечным, а T—►oo при т, поддерживаемым постоянным, то корректирующий член слева становится ничтожно малым. Пользуясь определением (2.1—4) для'функции корреляции ф(т), получим вторую из основных формул преобразования (2.1—6). Первая формула может быть сразу получена отсюда применением к w(f) формулы двойного интеграла Фурье.

Кстати, соотношение (2.3—6) между w(f) и коэффициентами а_п и Ь_п находится в согласии с определением w(f) по формуле (2.1—3), как предела, содержащего JS(/)|². Из формулы (2.3—2) для а_п и Ь_п спектр S(f_n) по уравнению (2.1—2) равен

ад)=4 (°п-*_п).

Тогда согласно (2.1—3) ш(/„) равен следующему пределу при Г—оо :

41 ад Г=тт^(а"^+ь%) ⁼ т⁽°^а»⁺^b2A

а это и есть выражение для ^w{^f~^ согласно (2.3—6).

2.4. ОБСУЖДЕНИЕ ВЫВОДОВ ПЕРВОГО РАЗДЕЛА — ТЕОРЕМА ПАРСЕВАЛЯ

Применение теоремы Парсеваля¹! позволяет получить результаты раздела 2.1 более прямым путем, чем это дает метод, исполь-

¹I Титчмарш, «Введение в теорию интегралов Фурье», Гостехиздат, 1948. (Прим. ред.)

ГЛ. II. ЭНЕРГЕТИЧЕСКИЙ СПЕКТР И ФУНКЦИЯ КОРРЕЛЯЦИИ

111

зованный в предыдущем разделе. Эта теорема утверждает, что

+ OO +OO

J Fi(f)F₂(f) df = J 0^)0,(-1) dt, (2.4- 1>

—оо —оо

где Fi, G₁ и F₂, G₂ суть пары преобразований Фурье

+ оо

F(/)= j G(Z)^T ^i2nfUt₁

— OO

V (2.4— 2)

<?(/)= j F(f)eⁱ²*^ft df.

— OO

Эти соотношения могут быть доказаны формальным образом подстановкой F₁ в виде интеграла, содержащего G₁(Z), в левую часть уравнения (2.4—1). Изменение порядка интегрирования и использование второй формулы (2.4—2) для замены F₂ на G₂ дает правую часть уравнения.

Положим теперь G₁(Z) и G₂(Z) равными нулю, за исключением интервалов длительностью 7. Эти интервалы и соответствующие значения G₁ и G₂ составляют

G₁(Z) = Z(Z), 0<Z<7,

G₂(*) = /(-* + t), х_7<*<т. ^v ' °^}

Из (2.4—3) следует, что F₁(Z) есть спектр S(f) для Z(Z), определяемый уравнением (2.1—2). Так как Z(Z) вещественно, то из первого уравнения (2.4—2) следует, что

S(-/) = S*(f). (2.4-4)

где звездочка обозначает сопряженный комплекс, и, следовательно, |S(Z)|² есть четная функция /.

Из первого уравнения (2.4—2) следует также

F₂(Z)= f l(-t + j_e-ⁱ²*^ftdt =

^К) J_t (2.4-5)

= j Z(Z) е dt = S*(Z) в

Если эти значения GhF подставить в (2.4—1), то получим

+ со t-X

J |S (/)|» r''^2n/Td/ = J /(*)/(* + х) Л, (2.4-6)

-OO О

^гДе использовано то обстоятельство, что G₂(—Z) повсюду равна нулю, за исключением интервала —x<Z<7—т, и положено т>0.

112

часть ii. теория флуктуационных шумов

Если х<0, то пределы интегрирования в (2.4—6) справа должны быть — т и 7.

Так как |S(/)|* есть четная функция /, то можно написать (2.4—6) в виде

4-J Wtf + 4 dt+Z fe) = P^^j-'cos2*fx df. (2.4-7)

о ■ • о

Если теперь определить функцию корреляции ф(х) как предел левой части уравнения при 7—►oo , а w(f) как функцию

w(f) = Iim ²-Щф . f >0, (2.1-3)

то будет получена вторая из основных формул преобразования (2.1—6). Как и раньше, первая может быть всегда получена при помощи интегральной теоремы Фурье.

Чтобы подойти к интерпретации w(f)df как средней мощности, рассеиваемой в сопротивлении 1 ом теми составляющими /(Z), которые лежат в полосе частот (/, f+df), надо положить в (2.4—7) -х=0

Iim -Lj D(Z) dt = §w{f)df. (2.4-8)

Выражение слева представляет собой, очевидно, полную среднюю мощность, рассеиваемую в сопротивлении 1 ом, а правая часть — суммирование по всему диапазону частот от О до оо. Поэтому естественно истолковать w(f)df как мощность, выделяемую составляющими в полосе частот (f,f+df).

В предыдущих разделах речь шла об энергетических спектрах w(f) и функции корреляции ф(х) для весьма общего типа функций. Следует заметить, что знание w(f) не дает возможности определить первоначальную функцию /(Z). При нахождении w(f), как это можно видеть из (2.1—3) или из (2.3—6), данные, связанные с фазовыми углами различных составляющих /(Z), исчезают. Действительно, как это видно из представления /(Z) в виде ряда Фурье (2.3—1) и из (2.3—6), можно найти бесконечное число различных функций, имеющих одинаковый спектр w{f) и, следовательно, одинаковую функцию корреляции ф(х).

^ 2.5. ГАРМОНИЧЕСКИЙ АНАЛИЗ СЛУЧАЙНЫХ ФУНКЦИЙ

Во многих приложениях теории, рассмотренной в предыдущих разделах, /(Z) есть функция Z, обладающая определенной долей случайности. Например, /(Z) может быть кривая составляющей

гл. ii. энергетический спектр и функция корреляции цз

скорости воздуха позади сетки, помещенной в аэродинамической трубе, или, что наиболее интересно, кривая тока шумов.

В некоторых математических работах эта случайность определяется введением в I(I) ряда параметров, которые затем считаются случайными переменными. Так, в дробовом эффекте моменты поступления электронов Z_ljZ₂,...,//? приняты за параметры и каждый предполагается равномерно распределенным в интервале (0,7).

Для любого данного ряда значений параметров /(Z) имеет определенные энергетический спектр w(f) и функцию корреляции ф(х). Однако теперь основной интерес представляют те функции, которые дают средние значения w(f) и ф(х) для фиксированных f и х. Эти функции можно найти путем усреднения w(f) и ф(т) по интервалу изменения параметров, пользуясь, конечно, функциями распределения параметров.

Усредняя обе части соответствующих уравнений в разделах 2.1 и 2.2, видим, что основные формулы преобразования (2.1—5) и (2.1—6) остаются неизменными. Поэтому

w(f) =4 j^(x)cos2irfxdx, (2.5—1) о

ф(т) = ]w(f) cos 2*/т df₉ (2.5-2) о

где черточки указывают на усреднение по параметрам при / или х,

сохраняемым постоянным. Определения w и ф в этих уравнениях можно также получить из (2.1—3) и (2.1—4)

w(f) = Iim Щ++ (2.5+3)

Т-оо ¹

ф(х) = Iim -L J /(Z)/(Z+ х) dt. (2.5-4) о

При усреднении по параметрам значения Zhx сохраняются постоянными. В уравнении (2.5—3) S(f), рассматриваемая как функция параметров, связана с /(Z) следующим соотношением:

S(f) \l(t)e~²*^iftdt. (2.1-2) о

Подобные же выражения могут быть получены для сред-^ него энергетического спектра постоянной и периодической составля-'ющих. Все, что нужно сделать, — это усреднить выражение (2.2—11).

114

часть ii. теория флуктуационных шумов

Иногда среднее значение произведения /(Z)/(Z+x) в форме (2.5—4) для ф(х) не зависит от времени Т. Это позволяет сразу выполнить интегрирование и получить

Ф M = /(*)/(/+т). (2.5-5) При этом достигается значительное упрощение и, кажется, простейшим способом вычисления w(f) для I(I) такого типа является нахождение сначала ф(х), а затем применение формулы перехода (2.5-1).

2.6. ПЕРВЫЙ ПРИМЕР — ДРОБОВОЙ ЭФФЕКТ

Вычислим сначала среднее значение правой части уравнения (2.5—5). Используя метод усреднения, широко применявшийся в главе I, найдем

I(t)I(t+z) = J _p(K)I_K(t)I_K(t + *)_y (2.6-1)

где р(К) есть вероятность поступления на анод точно К электронов в промежутке (0,7)

P(K)=Jfe-*⁷ (1-1-3) а к

/*(/) = 2Г(/-/*). (1.3-1)

A=I

Перемножая Ik(I) и IkH+J и усредняя Z₁, Z₂,...,Z# по их интервалам, получим

KK^t ^т

/*tf)/*(<+*)=Z Z Jt^s--4^(*-'*)^+ ■*-**.)•

A=I m = lq 0

Это уравнение совершенно подобно выражению для Z^(Z), которое применялось в разделе 1.3 для доказательства теоремы о наложении случайных возмущений, и может трактоваться таким же точно образом. Поэтому, если Z и Z+x лежат между Д и 7—Д, то написанное выше выражение приобретает вид

+ оо + оо 2

4- J F(Z)Ftf + х) dt + ^4=^ [ j F(t) dt ]

— оо — оо

Если его подставить в (2.6—1) и выполнить суммирование, то получим выражение, не зависящее от 7 Поэтому можно воспользоваться (2.5—5) и найти

+ OO

ф(т) = V j7(Z)7(Z + х) dt + Ж)²' (2.6—2) .

гл. ii. энергетический спектр и функция корреляции 115

где было применено следующее уравнение для среднего значения, тока:

+ «,

7(Z) = v ff(Z)dZ. (1.3-4JN

- OO

Чтобы вычислить w(f) из ф(т), удобно воспользоваться тем; обстоятельством, что ф(х) есть всегда четная функция х, и, следовательно, (2.5—1) можно также написать в виде

+ со

w(f) = 2^ ф(х) cos 2ф dx. (2.6—3)

Тогда

+ oo +oo +oo

w(f) = 2v j dt F(t) J dx F(t + x) cos 2ф +2 JTtf)² cos 2ф dx =

+ 00 +00

= 2v Re [ jdZF(Z)e-2,i// J dt'F(t')e²*^ift'j +

— 00 — 00

+2Щ² j eⁱ²«P dz = 2v |s(/)|² + 2 7(Z)²⁸(/)- (2.6-4)

При переходе от первого уравнения ко второму было принято Z' = Z+x и cos 2+с считался вещественной частью соответствующей показательной функции. При переходе от второго уравнения к третьему было положено

+ оо

s(Z)= f F(t)e-²^dt_f (2.6—5) а также использовано соотношение

+ оо

Jeⁱ²"/<dZ = 8(/) . (2.2—9)

— 00

Второй член в w(f), имеющий в своем составе b(f)₉ характеризует среднюю мощность, которая выделялась бы постоянной составляющей /(Z), проходящей через сопротивление 1 ом. Это находится в соответствии с представлением о том, что средняя мощность в полосе частот 0<Z<^£, где е>0, но очень мало, равна

|ш(/) d/=2 Щ² \ Hf) df = Wf- (2.6-6)

116

часть ii. теория флуктуационных шумов

Уравнение (2.6—4) для w(f) может быть также получено из (2.5—3) путем прибавления дополнительного члена, связанного с постоянной составляющей, который получается усреднением выражения (2.2—11).

Интегрируя обе части (2.6—4) по / в пределах от 0 до оо и пользуясь соотношением

D=JaJ(Z) df_t

получим в результате

D-/⁸=2v [\s(f)\*df. (2.6-7) о

Это уравнение может быть сразу получено из теоремы о наложении случайных возмущений путем применения теоремы Парсеваля.

В качестве примера использования этих формул найдем энергетический спектр напряжения на сопротивлении R_t если ток состоит из большого числа очень коротких импульсов, протекающих через R. Пусть F(t—t_k) будет напряжение, создаваемое импульсом, появившимся в момент tk Тогда

F(t) = R<c(t),

где cp(Z) есть ток в импульсе. Следует ограничиться сравнительно низкими частотами так, чтобы можно было воспользоваться приближением

+ со +ОС

s(Z) = J R(f{t)e-^F dt^R^ (f(Z) dt = Rq₉

где q есть заряд, создаваемый одним импульсом. Из (2.6—4) следует, что на низких частотах сплошной участок энергетического спектра неизменен и равен

w(l) =24R*q*=2FR*q, (2.6—8)

где I=^q — средний ток, протекающий через R. Этот вывод часто используется в связи с дробовым эффектом в диодах.

При изучении дробового эффекта предполагалось, что вероятность того, что событие (поступление на анод электрона) произойдет в интервале dt_t равна vdZ, где v есть ожидаемое число событий в 1 сек. Эта вероятность не зависит от времени Z. Иногда желательно ввести зависимость от времени. В качестве примера рассмотрим длинный интервал, простирающийся от 0 до Г Пусть вероятность совершения события в промежутке (Z, Z+dZ) будет Kp(t)dt_t где К — среднее число событий за время T_t а p(t) есть такая данная

гл. ii. энергетический спектр и функция корреляции Ц7*

функция /, что

Jp(Z) dt=\

Для дробового эффекта p(Z) = +r.

Какова вероятность того, что точно К событий произойдут в интервале 7? Как и в случае дробового эффекта (раздел 1.1), можно разделить интервал (0, 7) на N промежутков каждый длительностью AZTaK, что NM=T Вероятность того, что ни одно событие не случится в первом промежутке AZ, равна

Произведение N таких вероятностей равно при N—+oc_y M—► O

т _ —

ехр [-K \ p{t)dt}=e~^Kо

Это вероятность того, что точно нуль событий произойдет за время 7 Таким же образом приходим к выражению

ble-* (2.6-9) Kl

для вероятности того, что точно К событий случится за время 7.

Рассмотрев много интервалов (0, 7), получим много значений К, а также много значений /, измеренных через Z сек. от начала каждого интервала. Эти значения / определяют распределение / в момент Z. Таким же образом, как и в разделе 1.4, найдем плотность вероятностей для /

Р(/, t)= +- J du ехр J- iul + Kj р(х) _! J _7xj

Соответствующие среднее значение и дисперсия равны

_ _ T

/ = K Jp(X)F(Z-X) dx,

____ t

(/ _7)² К Jp(X)F²(Z-X) dx. (2.6-10)

Если S(f) выражается уравнением (2.1—2), а s(f) — (2.6—5), то, полагая длительность F(Z) малой сравнительно с 7, среднее значение |S(/)|² можно получить, подставив (1.3—1) в (2.1—2):

ад= ад+~^21://'^А

118

часть ii. теория флуктуационных шумов

Представляя S_K(f)S_K(f)> ^гД^е звездочка обозначает сопряженный комплекс, в виде двойной суммы и усредняя по Z* , используя выражение для p(f) и затем усредняя по К, получим

\Ш² = К Is(Z)I² [1 +К| ]p{x)e-W* dx\*] (2.6-11)

Это соотношение может быть применено для нахождения энергетического спектра из (2.5—3), если только р(х) не является периодической функцией. Если же р(х) — периодическая функция, то тогда для гармонических составляющих должен быть применен метод раздела 2.2. Если флуктуации p(t) медленны сравнительно с флуктуациями F(Z), то вторым членом внутри скобок в (2.6—11) обычно можно пренебречь, ибо нет таких значений /, при которых и f и s(f) были бы одновременно велики. Кроме того, если обе величины p(Z) и F(Z) подвержены флуктуациям примерно с одной и той же скоростью, то этот член должен быть учтен.

2.7. ВТОРОЙ ПРИМЕР —СЛУЧАЙНЫЙ ТЕЛЕГРАФНЫЙ СИГНАЛ

Пусть /(Z) равен либо а, либо — а, так что по форме ток представляет собой, прямоугольную волну. Полагаем промежутки между переменами знака распределенными по показательному закону. Можно придти к такому распределению, считая, что если в среднем происходит [г перемен знака в 1 сек., то вероятность перемены знака в интервале (Z, Z+dZ) равна \idt и не зависит от того, что происходит вне интервала (Z, t+df). Из рассуждений, аналогичных приведенным в разделе 1.1 для дробового эффекта, заключаем»* что вероятность получения точно К перемен знака в интервале (О, Т) равна

P(K) ^jf-e-»⁷ (2.7-1)

Рассмотрим среднее значение произведения /(Z)/(Z+т). Это произведение равно а², если оба тока / одного знака, и —а², если они противоположного знака. В первом случае в интервале (Z, Z+x) будет четное число, включая нуль, перемен знака, а во втором случае — нечетное число. Поэтому

I(Jt)I(t J т) =а² X [вероятность четного числа перемен знака в промежутке (Z, Z-j-т)]—а² X [вероятность нечетного числа перемен знака в промежутке

(*, *+т)]. (2.7—2)

Длительность рассматриваемого интервала равна |Z+x—Z| = |x| сек. Так как, по предположению, вероятность перемены знака в элементарном интервале AZ не зависит от происходящего за пределами этого интервала, то отсюда следует, что это предположение справедливо для любого интервала безотносительно от того,

гл. ii. энергетический спектр и функция корреляции ц9

когда он начинается. Следовательно, вероятности в (2.7—2) не зависят от Z и могут быть определены из (2.7—1), полагая 7=|т[. Тогда (2.7—2) превращается в следующее выражение, полагая

I(t)I(t + х) =Ofllp(O)+р(2) + р(А) + ■ ■.] _аПр(1) + р(3) +

+ р(5)+---] = cfle~ ■«

(И²2!

= аЧ

- 2-J-T

(2.7—3)

Согласно (2.5—5), функция корреляции для I(f) равна

Ф(х) = a²e~^2!i|T|. (2.7—4) Соответствующий энергетический спектр по (2.5—1) равен

w(f) 4a*jV ^cos 2u/xdx= Jg* (2.7-5)

Функции корреляции и энергетические спектры подобного типа встречаются весьма часто. В частности, они применяются при изучении турбулентности в гидродинамике. Можно также получить их и в случае дробового эффекта, если пренебречь постоянной составляющей. Все, что необходимо, это предположить, что эффект F(Z) поступления электрона на анод в момент Z=O при t<JO равен нулю и что F(Z) спадает во времени по показательному закону после броска к максимальному значению в момент Z=O. Это можно проверить, подставляя значение

F(Z) = 2aj/~ ^jJe-^2litI Z>0 (2.7-6)

в выражения (2.6—2) и (2.6—4) [после использования уравнения (2.6—5)] для функции корреляции и энергетического спектра дробового эффекта.

Энергетический спектр тока, протекающего через последовательное соединение из индуктивности и сопротивления под влиянием напряжения шумов теплового возбуждения в широкой полосе частот, также имеет вид (2.7—5).

Кстати, это дает пример двух совершенно различных токов /(Z), одного — прямоугольной формы, а второго — тока дробового эффекта, которые имеют одинаковые функции корреляции и энергетические спектры, если отвлечься от постоянной составляющей.

Есть еще другой тип случайного телеграфного сигнала, который интересно проанализировать. Ось времени делится на интервалы равной длительности h. В произвольно выбранном интервале значение /(/) не зависит от значений в других интервалах и равно-

120

часть ii. теория флуктуационных шумов

вероятно будет либо +а, либо—а. Можно имитировать такую волну, подбрасывая монету. Если выпадет герб, надо положить I(t)=a в интервале 0<7<А. Если же, выпадет решетка, то положим I(t)=—а в этом же интервале. Вторичное подбрасывание монеты даст либо +а, либо—а для второго интервала h<JJ<C2h и т. д. Это дает одну волну. Подобным образом можно построить много волн. Усреднения по этим волнам при Z=Const обозначены черточками.

Нас интересует среднее значение /(Z)/(Z+x), полагая т>0. Прежде всего замечаем, что если ф>к_у то эти два тока при любых значениях Z будут относиться к различным интервалам. Так как значения в этих интервалах независимы друг от друга, то

/(Z)/(Z + t) = Щ /(Z + t)=0

для всех значений Z, если -ф/г.

Чтобы найти среднее значение при т<А, рассмотрим случай, когда Z заключено в первом интервале 0<7<й. Так как все интервалы со статистической точки зрения одинаковы, то общность при этом не теряется. Если Z+x<A, т. е. t jh—т, то оба тока находятся в первом интервале и

I(t)I(t+J = а\

Если />/г—т, ток /(Z+:) находится во втором интервале, и тогда среднее значение равно нулю. % Возвратимся теперь к (2.5—4). Пределы интегрирования в этом уравнении от 0 до Г При xj>£ подинтегральное выражение равно нулю, и тогда

ф(~) = 0, х>А. (2.7-7)

Если х<4£, то исследования интервала 0<Z<A позволяют написать интеграл, соответствующий участку от 0 до h

h h^z h

J /(Z)/(Z + т) dt j a² dt + J 0 dt = a²(A—x)

0 Oh~x

По всему интервалу интегрирования (О, Т) будет Tlh таких участков. Следовательно, из (2.5—4)

Щ Шп-£4_(а-т ) =ф[\--Lj 0<х<Л. -(2 7-8)

Энергетический спектр телеграфного сигнала такого типа поэтому равен

Uf) = 4* J(l - Х)ссв2ф* =2h(+^Fj ⁽²⁷-⁹⁾

гл. ii. энергетический спектр и функция корреляции 121

Отсюда видно, что этот спектр имеет те же общие свойства, что и w(f) для первого типа телеграфного сигнала (2.7—5), если установить соотношение между ц — средним числом перемен знака в секунду и h — длительностью интервала в виде JiA=I.

2.8. ПРЕДСТАВЛЕНИЕ ТОКА ШУМОВ

В разделе 1.7 рассматривалось представление тока дробового эффекта в виде рядов Фурье. Это приводит к уравнению

/(Z) = J (а_я cos (O_n Z + A_llSin(I)_nZ), (2.8-1)

где

<*_n=2*f_n> Zn = ZiA/- (2.8-2)

Коэффициенты а_п и Ь_п принимаются за независимые случайные переменные, распределенные вокруг нуля по нормальному закону

со стандартным отклонением Y Mf_n) ^f- ^w(f) ^есть энергетический спектр тока шумов, т.е. w(f)df — средняя мощность, рассеиваемая теми составляющими /(Z), которые лежат в полосе частот (/, f+df), если они протекают через сопротивление 1 ом.

Выражение для стандартного отклонения коэффициентов а_п и и Ь_п получим, если заметим, что А/ есть ширина полосы частот, связанной с п-и составляющей. Тогда ш(/_п)Д/ есть средняя мощность, которая выделялась бы, если бы ток

а_п cos O_n Z + Ь_п sin ©_л Z

протекал через сопротивление 1 ом, причем это усреднение произведено по всем возможным значениям а_п и Ь_п. Поэтому

Oi(Z_n)A/ = aj cos² ш_п Z +2а_п b_n cos со_п Z sina>„Z +

_ _ _ (2. о—о)

+ bn Sin² о)_п Z = а% = 6„.

Последнее следует из независимости а_л и Ь_л друг от друга и идентичности их распределений. Можно заметить, что w(f)₉ полученное в связи, с представлением (2.8—1), есть среднее того же типа, что и обозначенное в разделе 2.5 через w(f).

Например, допустим, что нас интересует ток на выходе некоторого фильтра, когда на входе действует источник термических шумов. Пусть A(f) будет абсолютное значение отношения выходного тока ко входному, когда на вход подведено установившееся синусоидальное напряжение частоты /. Тогда

W(Z) = Wf).

(2.8—4)

часть ii. теория флуктуационных шумов

Пусть W есть средняя мощность, рассеиваемая на сопротивлении 1 ом током 1(1):

(2.8-5)

из этого уравнения можно найти С, если известны W и A(f).

Пользуясь (2.8—1) для исследования статистических свойств I(I)_y сначала находим соответствующие статистические свойства суммы, стоящей справа, в которой а и Ь рассматриваются как случайные переменные, распределенные, как указывалось выше, .а t полагается фиксированным. Вообще же время t исчезает при этой процедуре, так же как и в (2.8—3). Положим, далее, N—к» , я Д/—►O, так что суммирование можно заменить интегрированием, и наконец, расширяем диапазон частот, чтобы перекрыть все частоты от 0 до OO

Обычный путь использования уравнения (2.8—1) заключается в предположении, что имеется осциллограмма I(I)_y простирающаяся от Z=O до Z= оо. Эта осциллограмма может быть разрезана на полоски длиной T Разложение тока I(I) каждой полоски в ряд Фурье (при ТД/=1) даст группу коэффициентов, которые будут изменяться от полоски к полоске. Предполагаем, что это изменение подчиняется нормальному закону распределения.

Применяемый здесь процесс нахождения статистических свойАв путем рассмотрения а и Ь как случайных переменных при Z, сохраняемом постоянным, соответствует исследованию значений тока шумов в большом числе моментов времени. Каждой полоске соответствует определенный момент, и этот момент выбирается через Z -секунд от начала полоски. [Это есть Z, входящее в (2.8—1)]. До некоторой степени такой подход похож на исследование тока шумов в большом числе случайно выбранных моментов.

Хотя уравнение (2.8—1) может быть использовано для представления дробового эффекта и других подобных явлений, оно не является единственным, а в ряде случаев не оказывается и наиболее удобным. Другое представление, приводящее к тем же самым выводам:

т = Z

c_ncos (O)_nZ-(c_n),

(2.8—6)

где (fi, «U,..., w_N — углы, случайно распределенные в интервале

<0, 2*), а " _

C_n =V2w(fnW, *>п =2тг/_п, f_n = _ПЦ. (2.8-7)

При таком представлении I(I) рассматривается как сумма синусоидальных составляющих с постоянными амплитудами, но со случайными фазовыми углами.

гл. ii. энергетический спектр и функция корреляции 123

То обстоятельство, что два разных представления (2.8—1) и {2.8—6) приводят к одинаковым статистическим свойствам, есть следствие того, что в обоих случаях может быть использована центральная предельная теорема ¹U

Эта теорема утверждает, что при некоторых общих условиях распределение суммы N случайных векторов сходится к нормальному закону (закон может быть нормальным в нескольких измерениях ²J) при N->оо . Действительно, из этой теоремы следует, что представление тока в виде

(2.8-1)

где а_п и Ь_п — независимые случайные переменные, принимающие только значения ±V^wif_n)А/» причем вероятность каждого значения равна+-, приводит в пределе к таким же точно статистическим свойствам, что и (2.8—6).

2.9. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

Рассмотрим случайный вектор г, находящийся в пространстве К измерений.

Распределение этого вектора может быть определено указанием распределения К составляющих X₁, х₂, х_к вектора г. Говорят, что г распределен по нормальному закону, когда функция плотности вероятностей для г имеет вид

(2.9-1)

где экспонента есть квадратичная форма от х. Квадратная матрица M составлена из моментов второго порядка

P-Il Pl2- • 'VlK

(2.9—2)

M =

VlK

Vkk

где моменты определяются как

Р-н = А* Vv₁ = X₁X₂, и т. д. \М\ есть определитель матрицы M_f а х'— матрица строк

X^t = [X₁, X₂, • • -Хк].

(2.9—3)

(2.9-4)

*) См. 2.10. ²) См. 2.9.

124

часть ii. теория флуктуационных шумов

х — матрица столбцов, полученная путем транспонирования х' Экспонента в выражении (2.9—1) для плотности вероятностей может быть выписана полностью при использовании соотношения

к к

х'М-* х = YY^x_rX_s9 (2.9-5)

Г=1 S^=I

где M_rs—алгебраическое дополнение элемента \i_rs в матрице М.

Иногда между составляющими х имеются линейные зависимости, так что случайный вектор г ограничен пространством меньше, чем К измерений. В этом случае подходящая форма функции плотности вероятностей может быть получена из последовательности /(-мерных распределений, сходящихся к только что рассмотренному.

Если t₁ и г₂ — два нормально распределенных случайных вектора, то их сумма г_х+г₂ также распределена нормально. Отсюда следует, что сумма любого числа нормально распределенных векторов распределена по нормальному закону.

Характеристическая функция нормального распределения равна

сред, [ехр (Zz₁ X₁ + Iz₂ X₂ + • • + iz_Kx_K)] =

«р[-4-22г ⁽²-⁹~⁶⁾

L Г=15=1

2.10. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА Центральная предельная теорема теории вероятностей утверждает, что распределение суммы из N независимых случайных векторов r₁ + r₂+...+r_N сходится к нормальному закону при N—> оо, если распределения векторов т_1ут_2у r_N удовлетворяют некоторым общим условиям.

В качестве примера возьмем случай, когда т_1ут_2у , r_N—векторы двух измерений, причем составляющими т_п являются X_n и у_п. Не теряя общности, допустим, что

*п =°> Уп ^ 0. Составляющие результирующего вектора равны

X=X₁ + X₂ +... +X₁V, (2 10_1)

У = У!+У2+...+УХ, ^У '

а так как т_1У г₂. —независимые векторы, то моменты второго порядка результирующего вектора равны

Vu=X^z=A" + Xj+ ...+ х+

Pa = У^=У\+_у\ + ~.+ У&, _ (2.10-2)

Vu=XY = х_ху_г +х₂у₂ + ...+x_N ум.

гл. ii. энергетический спектр и функция корреляции

125

Очевидно, существует несколько различных условий, выполнение которых достаточно для того, чтобы распределение результирующего вектора сходилось к нормальному закону. Одно из достаточных условий

т¹' 2l*»r—о,

/2 = 1

Mf YJ^yj

/2=1

(2.10—3)

Центральная предельная теорема утверждает, что распределение случайного вектора (X, Y) сходится к нормальному закону при N—► oo. Моменты второго порядка этого распределения даются уравнением (2.10 — 2). Если известны моменты второго порядка нормального распределения, то можно сразу написать функцию плотности вероятностей. Поэтому из раздела 2.9

M=Fⁿ M

Vl2 V22

M-¹HAlI-¹

V22 —V12

-V12 Vn

1^1 = ^22—1*12»

X^f = IX₉ У], x^fM~^lx = I M I-Hji₂₂X² — 2fi₁₂Xy + ix₁₁V»). Следовательно, плотность вероятностей равна

+!!,"■22—H-I₂) ^Va

2тс

ехр

~^2^²-^+²+2|х₁₂ХУ

(2.10-4)

2+ЦН-22—M-I₂)

Моменты второго порядка связаны со стандартными отклонениями для X, У, обозначаемыми g₁ и а₂, и с коэффициентом корреляции для X и У, обозначаемым т, следующим образом:

Vn=⁰I, V22=°l, Vi2 = ™i°2, (2.10—5) и тогда плотность вероятностей принимает обычную форму

(1-_Т2)-у₈

ехр

Глава III

СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ

В* этой главе применены изложенные в разделе 2.8 представления о шумовых токах для вывода некоторых статистических свойств /(Z). Первые шесть разделов посвящены распределению вероятностей тока /(Z) и его нулям и выбросам. Разделы 3.7 ц 3.8 связаны со статистическими свойствами огибающей /(Z). В разделе 3.9 рассмотрены флуктуации интегралов, в которые входит Z²(Z). Распределению вероятностей суммы из синусоидального тока и тока шумов посвящен раздел 3.10, а в разделе 3.11 кратко описан другой метод получения выводов главы III. Большинство материала этой главы тесно связано с теорией процессов Маркова.

3.1. РАСПРЕДЕЛЕНИЕ ТОКА ШУМОВ

В разделе 1.4 было показано, что распределение тока.дробового эффекта сходится к нормальному закону, когда ожидаемое число событий в 1 сек. V безгранично возрастает.

В соответствии с задачами этой части будем пользоваться

Ht)= J К cos (о_п Z + Ь_п sin (O_nZ)

(2.8-1)

для того чтобы показать, что функция /(Z) распределена по нормальному закону. Этот результат немедленно может быть получен, если следовать процедуре раздела 2.8. Так как а_п и Ь_п распределены нормально, то таково же распределение а_п Cosco_nZ и b_n sinco_nZ, если рассматривать Z как фиксированное. Поэтому /(Z) есть сумма 2N независимых нормально распределенных переменных, а следовательно, и сама распределена по нормальному закону.

Среднее значение /(Z) по (2.8—1) равно нулю, так как

о,

(3.1-1)

Средний квадрат /(/) равен

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 127

/2=1

(3.1-2)

\w(f)df=m^%.

В верхней строчке (3.1—2) было использовано то обстоятельство, что все а и b независимы и, следовательно, среднее любого, комбинированного произведения равно нулю. Были также применены результаты раздела 2.8

Ql=Fi = W(I_n)Af₁ I_n = TlAf₁ а>_п = 2тг/_п.

Как показано в разделе 2.1, ф(т) есть функция корреляции для /(/), связанная с w(f) следующим образом:

ф_т = ф(т) = ^_w(I) cos 2тг/х df. (2.1 —6)

В этой главе для краткости аргумент ф(т) записан в виде индекса.

Так как известно, что /(/) распределен по нормальному закону, его среднее значение равно нулю, а средний квадрат есть ф₀, то можно сразу же написать и функцию плотности вероятностей. Поэтому вероятность того, что I(I) находится в интервале (I₁I+ dl), равна

тк^е~^т- <^зл~³>

Это есть вероятность нахождения тока в интервале между / и I+dl в случайно выбранный момент времени. Другими словами,, уравнение (3.1—3) дает ту долю времени, в течение которой ток находится в интервале (/,/ + dl).

Во многих случаях более удобно пользоваться выражением

I(t) =Jc_ncos(O)_llZ-(P_n), cl =2w(f_n)Af_y (2.8-6)

/2=1

где <fсрдг— независимые случайные фазовые углы. Чтобы показать, что и в этом виде I(t) подчиняется нормальному распределению, заметим прежде всего, что в (2.8—6) I(f) представлен в. виде суммы большого числа независимых случайных переменных

I(I) = X₁ + X₂ -I-----\-x_Nl

^_n = C_nCOS KZ — (p_n),

часть ii. теория флуктуационных шумов

и, следовательно, когда AZ^r-* оо, то /(/) будет распределен по нормальному закону. Чтобы сделать предельный процесс конечным, вначале выберем N и Af такими, что NAf=F₁ где

]w(f)df<s]w(f)df,

f о

а е — некоторая произвольно выбранная малая положительная величина. Положим теперь N—* оо, а А/—*0 таким образом, что NAf остается равным F. Тогда

А = А +А + ' * * +Aj =J 2ш(/_п)А/соз² (u_nt-w_n) =

n f

=S w(f_n)Af Lw(f)df, i ff

_. _ А _ (3.1-4)

В = Itf₁I» + • • • + M⁸ =112а» (W) MY¹' Icos К Z - (C_n)I» <

<4(A/)V.J [w(f)f'df,

где черта над членами обозначает усреднение по ср, а Z поддерживается постоянным. Если предположить, что интегралы не являются расходящимися, то отношение ВА~^3/*—*0, когда N—► оо. Следовательно, можно воспользоваться центральной предельной теоремдй¹!, если w(f)=0 при />F. Так как F может быть взято сколь угодно большим путем выбора е достаточно малым, то можно перекрыть сколь угодно большой диапазон частот. По этой причине вместо F записывается оо.

Теперь, когда при помощи центральной предельной теоремы было показано, что распределение для /(Z) в виде (2.8—6) сходится к нормальному закону, остается только найти среднее значение и средний квадрат для /(Z):

W=E^c-^cosK'-*»)=⁰»

Ш= S cl cos«Kf-«p_n) - f w(f) df = ф₀ (3.1 -5)

1 О

Отсюда получаем плотность вероятностей согласно (3.1—3); таким образом, оба представления в этом случае приводят к одинаковым результатам. Очевидно, одинаковые результаты будут получаться до тех пор, пока можно применять центральную предель-

¹I Раздел 2.10.

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 129

ную теорему. В дальнейшем, пользуясь (2.8—6), просто будем предполагать, что для доказательства сходимости к нормальному распределению может быть использована центральная предельная теорема, а все вычисления, относящиеся к уравнениям (3.1—4), будут опускаться.

Характеристическая функция для распределения I(I) равна

сред. e^iuI«)) ₌ ехр ( — ^-и*) (3.1 —6)

3 2. РАСПРЕДЕЛЕНИЕ l(t) и Kt + т)

Нужно найти распределение двух величин, в котором первая переменная есть ток шумов I(I)₁ а вторая переменная — значение этого тока /(Z + т) через некоторый промежуток времени т. Оказывается, что это распределение нормально, как и можно было ожидать по аналогии с разделом 3.1. Моменты второго порядка этого распределения равны

Pn=~lHf) = %=$w(f)df,

H₂₂ = Фо, ° (3.2-1)

Hi₂= /(/)/(/+ х) = ф, .

Выражение для Ji_ia соответствует нашему определению J2.1—4) функции корреляции

ф, = ф(х) = Iim J\l(t)I(t + х) dt. (2.1 -4)

T-* OO Q

Чтобы найти распределение, пользуясь выражением (2.8—6), напишем

I₁ = I(t) =2 C_n cos (O)_n I-(O_fl)_y

h = И* + ^T) = S

cos (O)₇₁1 — W_n + OX_n т).

Из центральной предельной теоремы для двух измерений следует, что Z₁ и I₂ распределены нормально. Так же как и в разделе (3.1):

Ix₁₁ = 7[ =E d-L jW) df = фо, ¹ о

_ £ _ (3.2-2)

1*12 = h I₂ =L с% [cos (о)_л Z — (O_n) cos (о)_л Z — (о_п + <о_п т)]. 1

130

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Величина, помещенная в квадратные скобки, равна

cos² (o)_n t — ф_п) cos и)_лх — cos ((D_n t — w_n) sin ((D_rz t — w_n) sin (D_rzX, и если взять усреднение по w_nf то второй член пропадает, и тогда

Vit =J^ — ^cos ^cdI^x J ^cos ^2tuL ^df = b> (3.2—3) i о

где использовано соотношение (2.1—6) между w(f) и ф(т) и применено обозначение (n_n = 2izf_n.

Теперь может быть написана функция плотности вероятностей для Z₁ и I₂. Из рассмотрения нормального закона в разделе 2.9 следует, что она равна

—ST-^ехр[—2ой=Ф!)-J ⁽³'^2_4>

Для полосового фильтра с полосой пропускания от f_a до f_b

имеем

^Jb

ф, =J w₀cos2izFdf=w₀-S——,—=

» ^U

= В- sin тех (f, - f_а) cos *х (/, + f J, (3.2-5)

<h = O>0 (/* — /а),

где а;₀ есть постоянное значение до(/) в полосе пропускания, а

0),=2^, io_e=2ic/_e. (3.2-6)

Согласно (3.2—4) Z₁ и I₂ независимы, когда ф_т =0. Для тех значений х, при которых ф_т =0, знание I₁ не увеличивает наши сведения об I₂. Например, допустим, что имеется узкополосный фильтр► Тогда

ф, =0, когда _т=[2(/^_в)]-1

ф_х почти равно —ф₀, когда х = (f_b + f_a)~K

При первом значении х известно только, что I₂ распределен около нуля с 1\ =%. При втором значении х I₂, вероятно, почти равен—1₁. Это согласуется с представлением о том, что ток шумов, прошедший через узкополосный фильтр, ведет себя подобно

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 131

синусоидальной волне с частотой -у- (f_b + f_a), а что касается его амплитуды, то она подвергается флуктуациям с нерегулярной частотой порядка -у- Q_b*— f_a)- Первое значение т соответствует четверти периода подобной волны, а второе—половине периода. Начертив синусоидальную волну и рассмотрев точки, разделенные промежутками в четверть периода и в полпериода, можно убедиться, что подобное представление подтверждается.

Характеристическая функция распределения I₁ и I₂ равна

сред. _e^mh+wl*₌ е_Хр _ Jk ^2 ₊ ₀i j — ^uv j . (3.2—7)

Распределение трех величин

Z₁ = I(I)_t Z₂=Z(^t₁), Z₃ = 1(1 + t₁ + т₂),

где t₁ и t₂ заданы, а I выбрано случайным, является, как и следовало ожидать, нормальным во всех трех измерениях. Моменты, из которых по методу раздела 2.9 можно найти распределение, равны

P-Il = 1*22 = 1*33 = Фо> 1*12 = <|V

1*23 = К,

1*13 = Ф(^Т1 + ^Т2) = <К + т,.

Характеристическая функция для J₁₉ I₂ и Z₃ равна

iz_xi_xViz₉ /,+ZZ₃z₃

сред, е =

= ехр ^—^^zJ + z\ + zj j — [х₁₂Z₁Z₂ — Ji₂₃ Z₂ Z₃ — [X₁₃ Z₁Z₃ J * (³-²""⁸)

3.3. ОЖИДАЕМОЕ ЧИСЛО НУЛЕЙ В I-CEK.¹) Пусть у равно

у = F(a_lta_2t---_ta_N\x) (3.3—1)

и пусть а—случайные переменные. Для данного ряда значений а это уравнение дает кривую зависимости у от х. Так как а являются случайными переменными, то назовем эту кривую случайной. Возьмем короткий интервал (х_ъ X₁J-(Ix) и затем выберем некоторый

¹J Под этим понимается ожидаемое число прохождений кривой тока шумов через уровень, относительно которого распределение симметрично. (Прим. ред.)

132

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

ряд значений а. Вероятность того, что кривая, полученная в результате подстановки этих а в уравнение (3.3—1), будет иметь нуль в интервале (х_ъ X₁ + dx)_f равна

+ оо

dx j I •*] I р(0, т); x₁)dr_i. (3.3—2)

— OO

Ожидаемое число нулей в интервале (Jt₁, х₂) равно

X_t +оо

Utf f I Y_i I р(0, т); tf) di\. (3.3—3)

X₁ — оо

В этих выражениях р(£, т\\х) есть функция плотности вероятностей для переменных

\=F(a_l9...₉a_N\ х), 4=¾-. (3.3-4)

Так как а — случайные переменные, то таковы же I и т\ и в их распределение будет входцть х как параметр, что указывается обозначением р(£, tj; х).

Эти выводы могут быть получены таким же образом, как это сделано для случая распределения выбросов случайной кривой. Этому методу доказательства свойствен тот 'недостаток, что в не*Г требуется, чтобы а были ограничены.

Теперь перейдем к доказательству близко связанного с предыдущим положения: вероятность прохождения у через нуль в интервале (Jt₁, X₁ + dx) с положительной крутизной равна

dx J т] р(0, % X₁) dt\. (3.3—5) о

dx выбирается настолько малым, что участки почти всех возможных случайных кривых (за исключением ничтожной части), относящиеся к интервалу (Jt₁, X₁-^dx), могут рассматриваться как прямые линии. Если у=\ при X₁ и проходит через нуль при х_г<С <*<л;₁ + dx_y то отрезок, отсекаемый на оси х при у=0, равен

Jt₁--L, где — крутизна. Поэтому ? и т\ должны иметь противоположные знаки и

--^<*i + dx.

Согласно формулировке задачи нас интересуют только положительные значения tj, и поэтому напишем это неравенство в виде

— 7jdx<?<0.

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ J 33

Для данной случайной кривой, т. е. для данного ряда а, значения I и равны

l=F(a_lt..._ta_N\ Xi), к]= j^|LJ

Если эти значения S и т] удовлетворяют нашему неравенству, то кривая проходит через нуль в интервале (X_ltX₁-Jdx). Вероятность этого равна¹)

оо О оо

\dti J <Йр(5, V, *i)=JlO-(— fidx)] рф.-ц; X₁) d-ц,

О - т\йх О

где учтено, что поскольку dx весьма мало, то £ равно нулю. Последнее выражение совпадает с (3.3—5).

Таким же образом можно показать, что вероятность прохождения у через нуль в интервале (x_lt X₁ J-dx) с отрицательной крутизной равна

-dx j 7) P(O_jTjJX₁)CfYj. (3.3-6)

-OO

Выражение (3.3—2) получается путем сложения (3.3—5) и (3.3—6).

Далее можно перейти к применению выведенных формул. Заменим х, у и a_h на Z, I(t) и <р_л, соответственно, и воспользуемся соотношениями

I(t)=Y °п ^cos KZ - <Pn), cl=2w(f)Af. (2.8-6)

я=1

¹I Переход от двойного интеграла в левой части этого уравнения к конечному результату (3.3—5) можно выполнить следующим образом: легко видеть, что искомая плотность вероятностей равна

Г d - о Jd(Ax) f *» j

О -TjAx

Действуя формально, безотносительно от выполнения условий, оправдывающих аналитические преобразования (они выполняются в интересующих нас случаях), получим

d ⁰⁰ ⁰

IKxl^d^ J* ^⁶» ■n;*)* = J т]Дх, Y₁; x)di\,

О - T₁Ax О

а отсюда искомая плотность вероятностей равна

j т)р(0, Y₁; x)df\.

134

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Первым шагом является нахождение функции плотности вероятностей двух случайных переменных

£ = £ CnCOS(O)_nZ₁-(P_n),

(3.3-7)

Tj=Z^x(Z₁) = — Y VnSin (O)_nZ₁ — (D_n)_tгде штрих обозначает дифференцирование по Z. Из раздела 2.10

1*11=Г² = фо»

_ N _ N

1*22= += £ CWsin²KZ₁-(P_n)= ^ (2*/_п)²Ц/_п)Д/->

^4**]>Ц/)ф=_ф;' о

1*12= =— 2 с²о)_пcos(O)_nZ₁ — (р_п)sin(O)_wZ₁ — (D_n)=O.

Выражение для ^₂₂ получается из (2.1—6) путем дифференцирования. В этом выражении ф₀ обозначает вторую производную ф(т) по т при т = 0

¢"('1)=-4*² J f*w(f) сов2ф df. (3.3—8) о ^v^-

Отсюда плотность вероятностей равна

/Я. Г, t)= ЬМ^'ехр. (3.3-9)

где фо отрицательно. Заметим, что выражение справа не зависит от Z. Отсюда вероятность нахождения нуля в интервале (Z₁,Z₁+dZ)

* У H bfcSiV»; щ,, ₍₃.з_₁₀₎

получающаяся из (3.3—2), не зависит от Z.

Ожидаемое число нулей в 1 сек., которое можно найти из (3.3—3) путем интегрирования (3.3—10) по интервалу в 1 сек., равно

ГЛ. Ш. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 135

1 Г—Y (0) T/»

«L ф(0) I

о_

(3.3-11)

Для идеального полосового фильтра, полоса пропускания которого простирается от f_a до f_bf ожидаемое число нулей в 1 сек. равно

' L 3 /*-/« J

(3.3-12)

Когда /_а=0, это выражение равно 1,155 f_b, а когда f_a весьма близко к f_b, то оно стремится к f_b+f_a.

В недавней работе М. Кэк¹) дает выражение, которое после небольшого обобщения приводит к

-/²/2ф₀ 1 /—+V^a

(3.3-13)

2п

фо

для вероятности того, что ток шумов пройдет через значение / с положительной крутизной в интервале (Z, t+df). Ожидаемое число таких прохождений в 1 сек. равно

-/^а/2ф₀ _ч Г 1 „ . _л 1 /о о 1>1\

е X ~2~ ожидаемое число нулей в 1 сек. . (3.3—14)

Уравнение (3.3—13) может быть также получено из выражения, аналогичного (3.3—5), в котором в p{O_yy\;xi) нуль заменен на у. В некоторых случаях интеграл

не сходится.

В качестве примера можно указать на случай воздействия на цепь, состоящую из последовательно включенных сопротивления и конденсатора, напряжения шумов, занимающего широкую полосу частот. Энергетический спектр напряжения на конденсаторе имеет вид

M/)=y+i. (3-3-15)

Хотя ф₀ бесконечно велико, ф₀ конечно и равно */2а. Непосредственная подстановка в (3.3—11) дает для ожидаемого числа нулей в 1 сек. бесконечное значение.

¹I См. «О распределении значений тригонометрических сумм с линейно независимыми частотами», Amer. Journ. Math., LXV, 609—615, 1943.

136

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Формула (3.3. —11) станет яснее при рассмотрении тока шумов, спектр которого состоит из двух частотных полос. Одна полоса ограничена сравнительно низкими частотами и ее энергетический спектр обозначим W₁(F). Другая полоса весьма узка и ее центральной частотой является сравнительно высокая частота f₂. Тогда полный энергетический спектр шумов

w(f) = w₁(f) + A\f~f₂)_y

где единичная импульсная функция 8 используется для представления весьма узкой полосы. Энергетический спектр узкой полосы примерно одинаков со спектром волны, уравнение которой А V 2 со$ 2*/₂/.

Интегралы, встречающиеся в формулах, имеют вид

OO OO

J w(f) df=J W₁If) df + A²=W + А²,

О и

OO OO

\ w(f)P df+Pw₁(J)df + A²ft = U + A²fl.

О о Пусть А и /₂ таковы, что

и?» л², г/«л^вя-

Тогда формула (3.3—11) дает ожидаемое число нулей

2 Ah

Можно дать качественное объяснение этой формуле, если рассматривать ток шумов, состоящим из малой компоненты

Z₂=2¹/» Л cos 2*/^,

связанной с узкой полосой частот, наложенной на большую, медленно изменяющуюся компоненту, связанную с полосой более низких частот. Так как эффективное значение второй составляющей равно W^lls_i то ей можно приписать некоторую частоту /_х и тогда приближенно

1₁₌=(2Щ!* cos2icfrf.

Нули тока шумов сосредоточены вокруг нулей второй волны. Вблизи такого нуля

/₁=±(2В?)¹/.2*/₁Д/,

где At есть расстояние от нуля. Колебания Z₁ создают нули, когда j Z₁) меньше, чем амплитуда I_2y или когда

i4>U7^a/.2iu/₁|AZ|,

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ J 37

а интервал, в котором возникают нули, определяется из

Число нулей равно этой величине, умноженной на 2/₂. Так как в 1 сек. 2Д таких интервалов, то число нулей в 1 сек. равно

Jaw¹¹-U

Это выражение отличается от полученного из нашей формулы наличием множителя +. Расхождение объясняется тем, что ток шумов был представлен в двух частотных полосах в виде синусоидальных волн I₁ и /₂.

Из этого примера ясно, что когда интеграл для ф₀ сходится при д—Д) и в то же самое время интеграл для ф₀" расходится при /₂ -* оо таким образом, что Af₂—* оо, ток шумов ведет себя как непрерывная функция, не имеющая производной. Кажется, для физических систем интегралы будут всегда сходиться, так как паразитные эффекты приведут к тому, что w(f) стремится к нулю достаточно быстро. Частота, представляющая область, в которой это происходит, имеет порядок частоты микроскопических^ колебаний.

Ряд экспериментов показывает, что в некоторых случаях справедливость формул этого раздела нарушается. Так, если ток флук-туаций, занимающий весьма широкий диапазон, будет протекать через контур, состоящий из конденсатора C₉ включенного параллельно с последовательным соединением катушки индуктивности Ь и сопротивления R₉ то уравнение (3.3—11) говорит, что ожидаемое число нулей в 1 сек. тока /, протекающего через R (и L), не

зависит от R. Оно просто равно + (LC)-Дифференциальное уравнение для I одинаково с уравнением, которому подчиняется броуновское движение зеркальца, подвешенного в газе; давление газа играет роль R. Из кривых, описывающих это движение, видно, что их характер сильно зависит от давления. К сожалению, из кривых трудно заключить, зависит ли ожидаемое число нулей от давления. Разность между кривыми при различных давлениях указывает, что здесь должна быть некоторая зависимость *).

3.4. РАСПРЕДЕЛЕНИЕ НУЛЕЙ

Задача нахождения функции распределения для промежутков между двумя следующими друг за другом нулями представляется

*) С тех пор, как это было написано, М. Кэк и X. Хурвиц исследовали задачу об ожидаемом числе нулей, пользуясь совсем другим методом, в котором применяется представление дробового эффекта (разд. 3.11). Их выводы подтверждают справедливость (3.3—11), когда интегралы сходятся. Если интегралы расходятся, то должно быть рассмотрено среднее число электронов в 1 сек., вызывающих дробовой эффект.

138

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

весьма трудной, и, кажется, удовлетворительного решения еще не дано. Здесь будут приведены некоторые выводы, связанные с общей проблемой, которые дают представление о форме распределения для области малых промежутков между нулями.

Будет доказано [в разделе, начиная с уравнения (3.4—12)], что вероятность прохождения тока шумов / через нуль в интервале (i,T+dx) с отрицательной крутизной, если известно, что / проходит через нуль при т=0 с положительной крутизной, равна

_dz_ I_фо_\¹

²* Н'о)

^lt(Mh₂-MS₃) ОН -ф|)-^в/. [1 + H arcctg(-tf)], (3.4-1)

где M₂₂ и M₂₃ — алгебраические дополнения элементов Ji₂»=—+ и |л₂₃ = — V в матрице

M =


	O о	а
	I -О-О	I а -
	<К —Фх —Фо	О
	а а -О	О

H = IW₂₈ (AfJ_t-AfJ₈)-

(3.4-2)

Выбираем 0=^arcctg(—Я)^*, значение * берется при т=0, а*/2 при т—+оо. Следует помнить, что аргументы функций корреляции представлены в виде индексов, т. е.—ф_т в действительности равно

_Ф;' = — ф"(т) = 4*² J/»tti(f) cos 2*/т df. (3.3—8)

По мере того как т становится все больше и больше, на поведение / в момент т все меньше влияет то обстоятельство, что ток проходит через нуль с положительной крутизной при т=0. Следовательно, (3.4—1) должно сходиться к вероятности того, что в некотором интервале длительностью dx, выбранном случайно, / пройдет через нуль с отрицательной крутизной. Вследствие симметрии это равно половине вероятности того, что / пройдет через нуль. Поэтому (3.4—1) должно стремиться, согласно (3.3—10), к

dz I-

~bF \

жГ ^(з-⁴-^з)

при т—* оо . Это действительно будет так, ибо M сходится к диагональной матрице, а как M₂₃, так и H стремятся к нулю при

-фофо- Для фильтра нижних частот с граничной

М₂₃/Н—М

частотой f_b выражение (3.4—3) дает

(3.4-4)

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 139

Поведение выражения (3.4—1) при т—можно определить без больших затруднений. M₂₂ и M₂₃ стремятся к нулю, как т⁴, M²₂-M* как X¹⁰, и соответственно H стремится к бесконечности как х^-*. В результате (3.4—1) стремится к

при х—-0, полагая, что фо⁴⁾ существует. Здесь индекс (4) указывает на четвертую производную при х=0

оо

ф(4) = 16*⁴ JV⁴K/) df. (3.4—6)

Для фильтра нижних частот с граничной частотой f_b выражение (3.4—5) равно

A JL (2*/,)». (3.4-7)

Если (3.4—1) применить к случаю фильтра нижних частот, то вместо х более удобно иметь дело с переменной

W= 2izf_bx₉ dw = 2rf_b dx. (3.4—8)

Поэтому, если написать (3.4—1) в виде p(<f)dy₉ то из (3.4—4) и (3.4—7) следует, что

р (w) -* —¹— = 0,0919 при w -* оо , 2тс у 3

i^ 1 п ⁽³-^4_9)

На фиг. 1 представлена p(w) как функция ср для диапазона значений w от 0 до 9. Из рассмотрения кривой и из теоретических соображений ясно, что за пределами <р>9 функция р(ср) колеблется вокруг 0,0919 с постоянно уменьшающейся амплитудой.

Можно принять, что р (ср) dcp есть вероятность того, что / проходит через нуль в интервале (cp,cp+df), если известно, что / проходит через нуль при ср=0 с крутизной, обратной по знаку крутизне при (р. p((p)dcp превышает вероятность того, что / проходит через нуль приср=0 и в интервале (cp,cp+dcp), не имея нулей между ними. Это объясняется тем, что p(y)dw включает все кривые последнего класса и, кроме того, те кривые, которые могут иметь четное число нулей между 0 и ср. Отсюда следует, что кривая, представляющая плотность вероятностей интервалов между нулями, должна располагаться под кривой р(ср).

Частичные неточности кривой р(<р) можно обнаружить при сравнении ее с функцией плотности вероятностей, эксперименталь-

140

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

но полученной М. Е. Кэмпбеллом для интервалов между 754 следующими друг за другом нулями. Он пропускал шумы теплового движения через полосовой фильтр с нижней частотой пропускания около 200 гц и верхней частотой пропускания около 3000 гц. Ввиду плавного изгиба частотной характеристики трудно отметить точное значение верхней граничной частоты. Кружки на фиг. 1 соответ-

У 0,25

0,15

0,10

0,05

0,i838

\— \ \

Ч^

•/

0,0919

г?..

_г

йй!⁴

Эксперимент. о точны

О I

2 4 6 8

<p = 2flfct

Фиг. 1. Распределение вероятностей интервалов между нулями тока шумов на выходе фильтра нижних частот.

у^Д<р — вероятность появления нуля в интервале А«р, если в начале отсчета нуль. y_D Д<р — вероятность появления нуля в интервале

Дер, если в начале отсчета нуль и крутизна кривых в нулевых точках противоположного знака, у^ => р{<р), - граничная частота

фильтра, т — промежуток времени между нулевыми точками.

ствуют данным Кэмпбелла, если предположить, что его фильтр ведет себя как фильтр нижних частот с частотой среза /^=2850 гц_упоследняя величина выбрана для того, чтобы максимум кривой Кэмпбелла совпадал с максимумом кривой р(ср).

Как видно, некоторые кружки лежат выше кривой р(<р), что,, вероятно, объясняется тем, что характеристики реального фильтра в действительности отличаются от принятых нами для фильтра нижних частот.

На фиг. 1 нанесена также кривая, тесно связанная с (3.4—1). Она относится к случаю фильтра нижних частот и представляет вероятность прохождения / через нуль в интервале (т,т+А), когда известно, что / проходит через нуль при т=0:

^ '!+''(ir) (П-№~^,и (1 +"arctgЯ), (3.4-10)

где обозначения те же, что и в (3.4—1), а — y=^arctg#^ у. Эта кривая расположена всегда выше кривой р(ср), а небольшая разни-

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 141

ца между кривыми до ср=4 указывает- на то, что вплоть до этой точки р(ср) хорошо представляет действительное распределение нулей.

Если (3.4—1) применить к случаю полосового фильтра со сравнительно узкой полосой или к какому-нибудь подобному устройству, то можно сделать некоторые приближения и получить несколько более простое выражение* чем (3.4—1). Рассмотрим обычный идеальный полосовой фильтр с полосой пропускания от f_a до f_b. Функция корреляции и средний квадрат шумов, согласно (3.2— 5), равны

= sin*x(/,-f_a) cos *х(/, + f_a)₉

% = w₀(f_b-f_a). (3.2-5)

Из физических соображений ясно, что для случая узкополосного фильтра большинство промежутков между нулями равно приближенно

_ 1

^Tl~ fb + fa'

т. е. примерно равно промежуткам между нулями синусоидальной волны, имеющей частоту, равную средней частоте фильтра. Поэтому можно предполагать, что (3.4—1) будет иметь пик, весьма близкий к Xi. Можно также ожидать пиков при 3xi, 5xi и т. д., но они здесь не рассматриваются (исследуется только поведение (3.4—1) вблизи xi).

Оказывается, M₂₃ примерно равно ZW₂₂, так что H велико, и (3.4—1) приближенно равно

dz I фо V/. . M₂₃

² (4*-«Й)^в/'^в

где х лежит вблизи X_i.

Чтобы показать, что ZW₂₃ примерно равно ZW₂₂, следует воспользоваться выражениями

м₂₃ = ф;(ф₀²-ф?) + ф_х ф;²,

M₂₂ - M₂₃ = (ф₀ + ф,) [(ф₀ - ф,) (- фх" - фо) - ф?] = = (Фо + М)(-В + С),

в=Фоф; — ф* Фо.

С = — фофо + фт Фт—Фх²

142

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Из (3.2—5) видно, что ф_т может быть написана в виде ф_т= A cospT, р=* (f_b + f_a),

где Pt₁=*, а А есть функция т, медленно изменяющаяся по сравнению с cos Рт. Видно, что вблизи t₁ ф_х примерно равна —(J)₀^ Так же точно ф_х колеблется вблизи нуля, а ф_т примерно равна — фо. Дифференцирование по т дает

(j)_j=A' cos рт — А р sin Рт, фх = (А" — A P²) cos Рт — 2A^f р sin Рт, Фо—-Ao — A₀P, %=А₀₉

где A₀ и Ao есть значения Л и ее второй производной при т=0. Это приводит к

B={A₀ A¹ — А Л о) cos Рт — 2Л₀ A^t р sin рт,

С=(АА — A²) cos² рт — Л₀ Ло + (Л²₀ — Л)² P².

Покажем, что С+В и С—В суть величины одного порядка. Если мы это сделаем, то ^г отсюда будет следовать, что ZW₂₂—M₂₅значительно меньше, чем Al₂₂+ZW₂₃, так как ф₀—ф_т, примерно равно 2фо> а ф₀+(j)_xiсовсем мало. Соответственно будет показано, что ZW₂₅почти равно ZW₂₂.

До сих пор не делалось приближений. Представим теперь медленно изменяющуюся функцию Л в виде степенного ряда по т. Так как для рассматриваемого типа функций + и +' должны быть равны нулю, то, следовательно:

Л=Л₀ + ^-Ло + ...,

Л'=тЛо + ...,

А'=А1+^АУ + ...₉

где мы пренебрегали всеми степенями выше второй. Умножение в возведение в квадрат дают

A* — Al=^A₀Al AA"- A'*=A₀Al + 4- Ио Л⁽о^}- Л₀'²)=A₀ A_Q+F,

A₀A" - AAl = +{A₀ A^ - Af) = F.

Так как (для малых т) Л и Л" примерно равны, соответственно A₀ и Л о» то разность слева мала сравнительно с Л₀Ло, т. е.

|В|«|Л₀Ло|.

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 143

Тогда выражения для В и С приближенно равны B=F cos рт — 2Л₀ Л о рт sin рт, C = F cos² рт — A₀ Ло sin² рт — A₀A₀ р² т».

Если т находится вблизи T_i , то рт приближенно равно *. Отсюда как С+В, так и С—В приближенно равны —Л₀Л₀*² и являются величинами одного порядка. Соответственно ZW₂₂ и ZW₂₃ примерно равны, а

М₂₃ = %(С + В) = -А1 Ло*².

Если это выражение для ZW₂₃ использовать в приближении для (3.4—1), то получим следующий результат: если функция корреляции имеет вид

ф_х =A cos Рт,

где Л — медленно изменяющаяся функция т, то вероятность того, что расстояние между двумя следующими друг за другом нулями лежит между т и т+с/т, приближенно равна

dx _а_

[I-Ea^a(T-T_l)»]³/' '

где а — положительно, и Для идеального полосового фильтра с полосой пропускания (/₆—f_a)

oUb + fa)* 1

a = V3

fb-fa ' h + ta

а среднее значение |т—T₁I=An¹. Поэтому

|т—T₁I_ 1 _ j_b — fg__1__(полоса пропускания)

Ч ~^~~VZ(hJfa)~ 2/3" (средняя частота) Если функция корреляции не может быть представлена таким образом, но все же ведет себя подобно синусоидальной волне с медленно изменяющейся амплитудой, то можно использовать первое приближение для выражения (3.4—1). Тогда, вероятность того, что расстояние между двумя следующими друг за другом нулями лежит между т и т+Л, приближенно равна

bdz

когда т лежит вблизи T₁, где T₁ есть то наименьшее значение т, при котором фх ^—Фо- Эта вероятность предполагается быстро сходящейся к нулю при т, удаляющемся от T₁, а Ъ выбирается так, что интеграл по действующей области вокруг T₁ равен единице.

144

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Наиболее трудной задачей является, повидимому, получение выражения для распределения нулей в случае больших расстояний между нулями. Первый метод заключается в расширении условий, приводящих к уравнению (3.4—1), путем добавления условия, чтобы / было положительным в равноотстоящих точках вдоль оси времени между 0 и т. Этот метод приводит к трудно вычислимым интегралам; для одной точки между бит интеграл имеет вид (3.5—7).

Другой метод исследования состоит в применении способа «включения и исключения» нулей между 0 и т.

Рассмотрим класс кривых /, имеющих нуль при т=0. Тогда теоретически можно будет найти функции р₀(х), P₁(^x), p₂(r, s,t), связанные с этим классом, где р₀(х) dx—вероятность того, что кривая имеет нуль в интервале dx.

рЦг, т) drdz — вероятность того, что кривая имеет нули в интервалах dx и dr. •

P₂UyS_i т) drdsdz—вероятность того, что кривая имеет нули в интервалах dx, ds и dr.

Выражение для p₀U)dz дается уравнением (3.4—10). Метод «включения и исключения» приводит тогда к выражению для P₀U) dx — вероятности получения нуля при 0 и нуля в интервале {x,x+dx), но отсутствия нулей между 0 и х. Эта вероятность равна

(3.4-11)

ООО

Выражение (3.4—П) может быть применено для случайных событий, происходящих независимо. Поэтому, если vdx есть вероятность наступления события в интервале dx, v постоянно, а события независимы, то получим для р₀, p_lt p_2i... соответственно v, N²_iN³_i... Из (3.4—11) приходим к известному выводу, что P₀(x)=ve^_VT.

Докажем теперь (3.4—1). Вывод основан на обобщении (3.3—5): если у есть случайная кривая, описываемая (3.3—1), то вероятность того, что у пройдет через нуль в интервале (х_ъ X₁ + dx_x) с положительной крутизной и через нуль в интервале (х₂> X₂ + dx₂) с отрицательной крутизной, равна

где р(£ь Xi_i £₂, Tj₂, X₂) есть функция плотности вероятностей для четырех случайных переменных

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 145

н+и,-

Б уравнении (3.4—12) X₁ и X₂ играют роль параметров. Этот вывод может быть найден во многом аналогично способу получения (3.3—5).

Если установить идентичность F с одним из представлений тока шумов /(Z), т. е. с (2.8—1), либо с (2.8—6),. то видно, что р подчиняется нормальному закону во всех четырех измерениях. Можно получить моменты втброго порядка непосредственно из этого представления, как это было сделано в уравнениях, приведенных вслед за (3.3—7). Тот же самый результат можно получить из определения ф(т) и, для разнообразия, можно выбрать этот второй метод. Положим x₁=Z₁, x₂=Z₁+^. Тогда

Ц=Ц=Щ=%у

M~2=/(Z) /(* + •*) =ф, , (3.4-13)

w (Ш+\Ф^М₀ W+WWdt,

где штрихи обозначают дифференцирование по аргументам. Интегрируя по частям, найдем

T T

\l'(t + +dl{t) =[/'(' + *)/(/) J⁷" —j I"(t + x)I(t)dt.

О 0 0

Полагаем, что / и ее производные остаются конечными, так что при делении на T интегрируемые части в пределе исчезают. Так как

I"(t + *)=+Kt+z),

то имеем

WJl = — фм = — +.

Полагая т=0, найдем

TjJ = Tjf = - ф₀

в согласии со значением [х₂₂, полученным из (3.3—7). Таким же образом

Нъ = Ит 4" J /'(' + D Щ dt = 4 М^т) = U

г-⁰⁰ о Г t

Vn₁ = Hm +-J/'(/)/(/+_T) dZ=lim(-)-L j /'(/+т) /(Z) dZ = — ф'

1 -*ОС ¹ 0 t-OO 7 q

146

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

где для получения E₂Tj₁ произведено интегрирование по частям. Полагая т=0 и используя +=0, найдем

Si^i = ^₂Tj₂= 0.

Чтобы получить матрицу M моментов второго порядка \i_rs в виде совершенно симметричном относительно ее центра, выбираем наши переменные 1,2,3,4 в порядке E₁, Tj₁, Tj₂, E₂. Из уравнений (3.4—13) и последующего видим, что этот выбор приводит к выражению (3.4—2) для M.

Если положить I₁ и E₂ равными нулю, то получим для функции плотности вероятностей в (3.4—12) выражение

Ak²

ехр

2\М\

Вследствие симметрии матрицы М, M₂₂=M₃₃. Если в интеграле (3.4—12) произвести замену переменных

х =

M₂

W У = —

M₂₂21 M

V₂

Tj₂,

2| M I

то получим

+р ^ jxdx \dyye- *-?+2Ш„1М_а»у.

Двойной интеграл можно вычислить при помощи (3.5—4). Пусть

W = arccos

M₂₁M₂

= arcctg (-Я), H = M₂₃ (Mf₂ - Mf₃) -v.,

где H имеет то же значение, что и в (в.4—2). Тогда выражение превращается в

(Ix₁Cix₂ |М|^3/«

[1 + H arcctg (—Я)].

Atz² м2 _ум2

^М22 ^т23

По свойству определителей

M₂₂M₃₃-Mf₃ = |М1(ф2-<|ф.

Используем это соотношение для исключения |М| и разделим выражение на

^dI {~~^\'

2tz { I

что, как это следует из (3.3—10), есть вероятность прохождения через нуль в интервале (x₁, x₁+^) с положительной крутизной.

В результате получим вероятность прохождения через нуль в интервале dx₂ с отрицательной крутизной, когда известно, что /

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ_147

проходит через нуль при x_3rc положительной крутизной:

Это и есть (3.4—1).

Выражение (3.4—10) дает также вероятность прохождения / через нуль в интервале dx, когда известно, что / проходит через нуль вначале с положительной крутизной. Эта вероятность может быть получена из (3.4—1) путем добавления вероятности прохождения / через нуль в интервале А с положительной крутизной, если известно, что этот ток проходит через нуль с положительной крутизной. Поэтому нужно добавить выражение, содержащее интеграл, в котором интегрирование по отношению к Tj₁ и ?]₂ производится в пределах от 0 до оо Этот интеграл, написанный при помощи введения переменных х и y_f равен

6 о

Это эквивалентно изменению знака M₂₃ и, следовательно, и Н. После сложения надо рассмотреть

1 + H arcctg (—//) + 1 —Н arcctg H = 2+H [arcctg (—Н) — arcctg Н] =

= 2+7/ (* —2 arcctg H) = 2 (1 + H arctg Н), а это приводит к (3.4—10).

3.5. КРАТНЫЕ ИНТЕГРАЛЫ, ВХОДЯЩИЕ В ФОРМУЛЫ Нужно вычислить интегралы вида

J = Jdx₁ Jdx₂ _в-*!-2«*л-*1. (3.5-1)

о о

Одним из методов является сведение показательной функции к сумме квадратов путем соответствующей линейной замены переменной, а затем преобразование к полярным координатам. Этот метод пригоден также для тройных интегралов такого же типа, но если применить его к четырехкратным интегралам, то последнее интегрирование, повидимому, не может быть выполнено в конечной форме.

Сведение показательной функции к сумме квадратов основано на следующем преобразовании. Если

X₁=^y₁ Jh₂D₂₁y₂+h₃D₃₁y₃+.. .+h_nD_nAy_n>

X₂ = O +h₂D₂₂y₂ + _+flnD_ni2y_n> (3.5-2)

x« = 0 +0 + +KD_n,_ny_nt

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

где D₀=I, Di=O₁₁, D_r,_r=D_r_i, а D_rs есть алгебраическое дополнение элемента a_sr (или a_rSi так как они равны) в D_r:

D =

а_и а₁₂... air

CLi₂ CL₂₂

CL_ir... a_rr

, h,=(D,-iD,)-\

тогда, если ни один из D_r не равен нулю:

Y^ars^Xr^Xs = У\ +У1 + -..+ У*п.

Из (3.5—2) якобиан ~~^d_d^{_{*^v ' '~~ равен Dl^u-

Применяем это преобразование к показательной функции x₁ = U₁-CLD^y₂₉X₂ = O + D-¹^₂, D₂= 1—а².

Так как x₂ пробегает от О до оо, то так же должен вести себя й у₂. Выражение для x₁ показывает, что у_х пробегает от aDl¹* у₂ до оо. Поэтому интеграл равен

оо оо й Ъ

J = D-¹^dy₂ Je-"-" Az₁.

Перейдем теперь к полярным координатам ^₁=PcosO, i/₂=p sin 6,

dyi Az₂=P dp db₉y₂ > О при О < 0 < тс, Ух> aD~^1!*y₂ при ctg 6 >oD~ Vi

и получим

arcctg [aD-Lj ^

J = Dl^lt j d6 J pe~^p2 dp .= +- D₂-¹'' arcctg (aD₂ ^v»),

о O

где arcctg лежит между О и тс. Можно написать и в более простой форме

J = +- (1 —а²)^-1/» arccos а = -L- cpcoseccp,

где

а ₌ cos (р,

причем подразумевается, что 0<ф<тс.

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ J 49

Другие интегралы можно получить путем дифференцирования. Поэтому из

OO OO

\ dx J dy е~*²-у²-2*ycos«p ₌ у _cosec (3.5—3) о о

получим

оо оо

j dx § dyxye~^x2~^y2~^2xycos<? = -L _Cosec²<p(l — <pctg<p). (3.5—4)

о о

Используя такое же преобразование, можем найти

[dtf jdyye-*-^ = (3.5-5)

О о ¹

Конечно, можно разложить показательную часть в степенной ряд и интегрировать почленно, но это приводит к ряду, который должен быть суммирован в каждом частном случае:

]dx fdyx^-y^ = 4^LS-— ^Г (—-) ^Г )•

Если принять —1 <Re(я)< — у , —1 < Re(m) <— + , то ряды

могут быть суммированы при а=1. Результат, сформулированный в соответствующем месте текста после уравнения (3.8—9), получен путем аналитического продолжения т и п.

Тот же метод применим, если пределы будут +оо . Когда тип целые числа, то получим

J dx ^dy х^пу^те~

х²-у^г-2ху COS <р _

О, п+т — нечетное (3.5—6)

/ т+п+\ \

/ 4„-i/—~ \ 2 /г+ 1—п—т 1— cos со \ .

~~(sm^Z~~ ^F(-ⁿ>-^m> —'•-2-¹)' "+'"-четное

Гипергеометрическая функция может быть также написана в виде

Путем преобразования этого выражения приходим к следующим значениям для интеграла:

150

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

0, п+т — нечетное,

_г/«+!\ —+¹

(smy)ⁿ ⁺ ^m ⁺ ¹

Ff----^-, +-; Cos²Cp ], т_уп — четные,

тЬ+ + \гЬ+^а

— 2

(sin ср)

п + т+ 1

г,/ 1—т 1 — п 3 „ _х

COS <pF|——2"-; "2"'» COS²Cp],

m, п— нечетные.

Как указывалось раньше, метод, использованный для вычисления двойных интегралов, может быть также применен в случае схожих тройных интегралов. Здесь приведем два результата, полученные таким образом:

j dx J dy ^dz ехр (—х² — y² — z² — 2сху — 2bzx — 2ayz) =

о о

OO OO

J dx I dy ^dzyzexp (—х²—у²—z²—2сху—2bzx—2ayz) =

OOU V TZ

1-fa—b—с а—bc / , _Q _t \

—-•--цг U+P+Y-V

\+а Dd'

(3.5-7)

где P и у получаются путем циклической перестановки а, 6, с из

а—cb

= arcsin

[-*

a = arccos

(1—с²)^1/г(1— &2)¹''»

, а—Ьс = arcctg —T₇-,

где а, р, Y все лежат в интервале (0,тс) и где 1 с b

D₃= с 1 а

= 1 +2abe — а² — Ь² — с².

b а 1

Для справок приведем интегралы, которые получаются из определения нормального распределения, данного в разделе (2.9):

+ OO + OO Il

Jdx₁... f dx„exp (— Y^+s

-со-'оо \ 1

+ оо + оо П

Ifll

Tzⁿ VltA

(3.5-8)

Jdx₁... \dx_nx_tx_u ехр ¢-¾% j = (\^^ ~Ч

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 151

_где квадратичная форма является определенно положительной, |а| — ее определитель, A_tu — алгебраическое дополнение элемента a_tu. Кстати, эти интегралы могут рассматриваться как частные случаи следующего выражения:

+ оо оо П П

Jdtf₁... J dx_n U_rfX_rX_s j F^X b+_r j =

+ OO OO

n—\

\a\

^aJ dx§dyy»-zf(x*+y²)X

XFlx

ELbA

¹ Ia| J J

(3.5—9)

3.6. РАСПРЕДЕЛЕНИЕ ВЫБРОСОВ ТОКА ШУМОВ

Здесь воспользуемся выводом, подобным применявшемуся в разделах 3.3 и 3.4. Пусть у будет случайная кривая, заданная уравнением (3.3—1):

у = F{a_ly..., a_N\ х). (3.3—1)

Если соответствующие условия удовлетворены, то вероятность того, что у имеет максимум в прямоугольнике (х,, X₁-Jdx_li у_ъ yi+dyj), причем At₁ и Ад — величины одного порядка, равна

-dx_xdy_x I р{у_ъО_у C)CdC, (3.6-1)

— OO

а ожидаемое число максимумов у в интервале а^х<6 получается путем интегрирования этого выражения по интервалу' —со Ky₁Koo , а<х₁<Ь. Здесь /?(Е, ?], С) есть функция плотности вероятностей для случайных переменных

E = F {а_1у..._у a_N\х_г),

(3.6—2)

= (—)

Применяя этот вывод как и раньше, заменим х и у на t и Л Тогда

E = Z=S c_ncos {w_nt —(D_n)_i

152

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

где штрихи обозначают дифференцирование по t. Согласно центральной предельной теореме, распределение Е, т], С сходится к нормальному закону. Моменты второго порядка, определяющие этот закон могут быть получены либо из приведенных выше определений Е, т\₉ С [ либо из функции корреляции, как это было сделано вслед за уравнением (3.4—13):

Г² = Ф₀, Ih=O₉

T₁C= I^f(t)F(t) =Hm 4

jl'(t)F(t)dt =

C² = Hm

T-*

= Hm^ [/'²UW²(O)] =0,

T ¹

tt = Km-Lj W(0 dt = Hm ++ = С,

T T

-| I"{t) I"{t) dt= Hm

VoⁱK

о о

где значок (4) обозначает четвертую производную. Матрица моментов поэтому равна

M =


Фо	0	Ф-
0 -	•О- I	0
	0	е-

Определитель |ZW| и алгебраические дополнения равны

I^mI=-Vhvw-V₀²),

(3.6-3)

Функция плотности вероятностей в (3.6—1) равна

р(/,ОД)= (2*— IMj-¹-'. ехр

M_nR+

2|М|

+М₃₃^+2Л4₁₃/С

(3.6-4)

и если подставить ее в (3.6—1) и выполнить интегрирование по С, то получим

dldt

(2*) Af₃₃

-V₂

(3.6-5)

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 15Я

где erf означает функцию ошибок. Это и есть вероятность наступления выброса в прямоугольнике dldt.

Как указывалось в соответствующем месте текста после уравнения (3.6—1), ожидаемое число выбросов в интервале (Z_bZ₂) может быть найдено путем интегрирования (3.6—1) в пределах от I₁ до Z₂ после замены х на Z и в пределах от —оо до +оо после замены у на /. Если применить (3.6—4), то легче сначала выполнить интегрирование по /. Тогда получим

Отсюда ожидаемое число выбросов в 1 сек.

1 Г W U

2Ч-ф;1

\Rw{f)df

(3.6—6)

J Rw(I) df

L- О

Для полосового фильтра ожидаемое число выбросов в 1 сек. равно

где f_b и f_a — частоты среза. Полагая /„«=0, найдем число выбросов для фильтра нижних частот

M-f =0,775/,

(3.6—8)

Из (3.6—8) и (З.бг—5) можно получить функцию плотности вероятностей для выбросов в случае фильтра нижних частот. Поэтому вероятность того, что случайно выбранный из всех выбросов будет лежать в промежутке I_yI + dl_y равна

-9У/8

уе

~у²/2

1+erf у

(3.6-9)

2ё

3/2тсф₀

где

/4¾ '

Когда у велико и положительно, (3.6—9) приближенно равно

dl -VЪ

Уе

-У!

/Фо

154

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Если написать (3.6—9) в виде/?/(у) dy, то плотность вероятностей pj(y) для у может быть графически представлена фиг. 2. Функция распределения Р(/_Макс. <СуУ~%) определяется как

Я(/_Макс.<УКФо) = J Pl{y)dy\

-OO

она дает вероятность того, что случайно выбранный выброс

меньше,чем заданная величина у ]Л];₀ = /. Это одна из четырех кривых, представленных на фиг. 4.

од

0,3

-л

(

►

—Я

-А—о-с

^L0.1

к ь

-2 t

-I

Фиг. 2. Плотность вероятностей выбросов тока шумов на выходе идеального фильтра нижних частот.

Рф)

— _ dl — вероятность выбранный произвольно

Гф₀

макс ^{заключен} ^междУ L ^и I + dJ.

Если / велико и положительно, то можно получить приближение из уравнейия (3.6—5). Замечаем, что

M₁₁\м\

W_. 1

— +"2 ё>

4о

так что когда / велико и положительно, то

_е-М_1Х р\2\М\ -Г»'2ф₀.

В этих условиях 1 -f-erf примерно равно двум. Поэтому, сохраняя только важнейшие члены и пользуясь определениями 714, найдем приближение для (3.6—5)

dldt ( -ФоУ''²

-/2/2ф₀

(3.6—10)

2тсф₀

Отсюда следует, что ожидаемое^число выбросов в 1 сек., лежа-

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ J 55

щих выше линии I=I_ly приближенно равно, когда I₁ велико:

2*V Eo / (3.6-11) = е~⁷1/2Фо_1_ (_ОЖИд_аемое число нулей Z в 1 сек.).

Интересно отметить, что приближение (3.6—11) для ожидаемого числа выбросов, превышающих Z₁, совпадает с точным выражением (3.3—14) для ожидаемого числа моментов, в которые Z проходит через I₁ с положительной крутизной.

3.7. ПЛОТНОСТЬ ВЕРОЯТНОСТЕЙ ДЛЯ ОГИБАЮЩЕЙ ТОКА ШУМОВ

Ток шумов на выходе сравнительно узкополосного фильтра, имеет характер синусоидальной волны, частота которой грубо равна средней частоте полосы пропускания, а амплитуда подвержена нерегулярным флуктуациям, причем быстрота флуктуаций имеет порядок ширины полосы пропускания. Здесь будут рассмотрены флуктуации огибающей подобной волны.

Прежде всего дадим определение огибающей. Пусть f_m представляет среднюю частоту полосы пропускания фильтра. Тогда если

««=2^. (+7-1) то ток шумов может быть представлен как (см. 2.8—6)

п = 1

= Z_cCos (d_mZ-Z^sin (d_mZ, где составляющие I_c и I_s суть

(3.7—2)

Z_c =V^nCOs(u)_riZ— (d_m Z — ср_п),

Tl= 1

(3.7—3)

Огибающая R есть функция Z

R = (F_c+П)Ф (3.7-4)

Как это следует из центральной предельной теоремы и из определений (3.7—3) для Z_c и I_si здесь имеются две нормально распределенные случайные переменные. Они независимы, так как

156

ЧАСТЬ II. ТЕОРИИ ФЛУКТУАЦИОННЫХ ШУМОВ

I_cI_s=O_f и имеют одинаковое стандартное отклонение, равное корню квадратному из

IJ= IJ= R + w(f) df = %. (3.7-5) й

Соответственно вероятность того, что точка (/_с, I_s) лежит внутри элементарного прямоугольника (dl_cdl_s), равна

В дальнейшем удобно ввести другую случайную переменную 6,

где

I_c = R cos 6, I_s = R sin 6. (3.7—7)

Так как I_cHl_s — случайные переменные, то таковы же R и б. Дифференциалы связаны так:

dI_cdI_s = RdQ dR_y (3.7—8)

а функция распределения для R и 0 получается из (3.7—6), если произвести замену переменных:

S_Rd^_e-n^₀ ₍₃₇_₉₎

Так как эта функция может быть представлена как произведение членов, содержащих только R и только 0, то R и 0 — независимые случайные переменные; 0 равномерно распределена в интервале (0+2ти), а R имеет плотность вероятностей

-^е~^т (3.7-10)

Выражение (3.7—10) представляет собой плотность вероятностей для огибающей. Подобно нормальному закону для мгновенных значений /, она зависит только от средней полной мощности

%=§w(f)df.

Рассмотрим теперь корреляцию между R в момент / и ее значением в некоторый более поздний момент Z+т. Пусть индексы 1 и 2 относятся, соответственно, к моментам t и Z+т. Тогда из (3.7—3) и из центральной предельной теоремы следует, что четыре случайные переменные / / I_c , I_s^ имеют нормальное распределение в четырех измерениях. Это распределение определяется моментами второго порядка

ГЛ. Ш. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 157

Ц = //, = /». = /»=ф₀ ₌

Ic₁ Is₁ = Ic_t Is_t =O_i

Ie₁ Ie_t = Is₁ Is_t = \ S С% COS (о>_я T — о>_т х) -

/2 = 1

оо

— j w(f) cos 2ictf — /Jx df = {1_ХЗ,

Л, W, =— Ic, Is₁ = 4- S C« Sin (<O_n

(3.7—11)

n = l

— jU(/)sin2*(/ -/Jxdf = jx₁₄.

Матрица моментов для переменных, расположенных в порядке

¹C₁ > L > ¹C. * I_3u > Р^аВНа

M =


Фо	О	Vn	Vu
О	Фо -	- Vu	Vis
	— 1*14	Фо	О
Va	Vis	О	о

отсюда алгебраические дополнения определителя \М\ равны M₁₁ = IH₂₂ - IH₃₃ = IH₄₄ = % (VI — R²₃ — Jii₄) = фо л,

^ = Фо — ИЗ — Н4.

IH₁₂ = IH₃₄ =0,

IH₁₃ = Af₂₄=-jx₁₃^ (3.7-12) IH₁₄=-M₂₃=-jx₁₄ + |1Н| = Л².

Поэтому плотность вероятностей для четырех случайных переменных равна:

+il+il+il)

W^exp

-{-та [♦»(/?

-Sjx₁₃(I₁Z₃-FZ₂I₄)^jx₁₄(I₁Z₄-Z₂Z₃) J , где написано Z₁, Z₂, Z₃, Z₄ вместо Z^ Z_5i Z_c> Z_5j

158

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Сделаем теперь преобразование

1₁ = R₁ cos 6_Ь I₃ = R₂ cos 0₂,

1₂ = R₁ sin G₁, I₁ = R₂ sin G₂

и усредним результирующую плотность вероятностей по и 0_2>чтобы получить вероятность того, что R₁ и R₂ лежат в интервалах ClR₁ и dR₂. Она равна

2тс 2тс

о и 1

-2|х₁₃ R₁R₂ cos (б₂ - G₁) —2рь₁₄ R₁R₂ sin (G₂ — G₁)

Так как подинтегральное выражение есть периодическая функция G₂, то можно интегрировать в пределах от G₂ = G₁ да 62 = 61 + 2тс вместо пределов от 0 до 2тс. Это интегрирование дает I₀ —функцию бесселя первого рода от мнимого аргумента. Результирующая плотность вероятностей для R₁ и R₂ равна

Fi R2 т Г F₁ R₂A ^loI А

U²₃ +VUY¹'] [-^_f (Я?+Я1)] • (3.7—13)

где из (3.7—12)

Л = ф8-Hi₃-PiV

^а Pi3 ^и Pu находятся из (3.7—11). Конечно, R₁ и R₂ всегда положительны.

Для идеального полосового фильтра с частотами среза f_a и f_b положим

L=-H—, Hf^w₀ для

и получим

V = ^wMb-fа)'

P₁₃= f ш₀cos 2*(/- fjxdf = ~~^""tr^^~~ '

Vn= f w₀sin27r(/ —/_m)xd/=0.

Член /₀ в (3.7—13), который устанавливает корреляцию между R₁ и R₂, приобретает вид

/о

F₁ F₂

Фо

sin² а:

x²

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 159

где х = Щ_ь—/д)т. Когда х кратно тс, то R₁ и R₂ — независимые случайные переменные. Когда х = 0, то R₁ = R₂. Отсюда можно приближенно заключить, что период флуктуаций огибающей R есть время, которое требуется, чтобы х возросло от 0 до тс, или (fb—fa)'¹- Это связано с выводом, полученным в следующем разделе и утверждающем, что ожидаемое число выбросов огибающей в 1 сек. равно 0,641 (f_b—f_a).

3.8. ВЫБРОСЫ ОГИБАЮЩЕЙ

Здесь будет рассмотрено распределение выбросов R. Иссле-/ дование основано на выражении [ср. с (3.6—1)]

— dRdt j p(R,0,R")R"dR", (3.8-1)

- OO

представляющем вероятность того, что выброс R попадает в элементарный прямоугольник dR dt. Плотность вероятностей для распределения трех переменных R, R', R" есть p(R_y R^f_f R^r,)_rгде штрихи обозначают дифференцирование по t.

Определим p(R_y R', R") из плотности вероятностей для I_crT_s, Г'_сУ I_sy Y_cy I_st которые будем обозначать х_1у х_2У..._у х₆. Чередование L_s и F обнаруживается в последующем. Удобно ввести обозначения

b_n = (2«)*$w(f)(f-f_M)"df₉

⁰ (3.8-2)

6о = Фо>

где f_m есть средняя частота полосы, т. е. частота, выбранная при определении огибающей R. Как видно, Ь_п аналогично производным Ф(т) при т = 0.

Из определений (3.7—3) для I_c и I_s получим моменты второго порядка:

^|"=7|=ф₀=б₀,

х+—Т² — Ь

^л4 — ¹S — ^uOi

_ n

H=HI_i Hf_n) M 4*² (W - f_mY=K,

160

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Xl =W²=U

_ _ N

X₁X₂=I_c I¹_s= £ w{f_n) м 2u(f„ - и=*,,,

^Х4 ^X5 ⁼ I_S = — Ь_ъ_ _ N

X₁X₃=I_c С = - Y_i w (/)Д/М/„- U²=-&₂, 1

X_a Xq= I_s I_s=-&₂>

X₂ X₃=I_sI_c= Ь₃ у

^хъ ^xq-Ic Is = Ь₃.

Все другие моменты второго порядка равны нулю. Поэтому матрица моментов


CT о-	К	I	0	0	0
Ьг	ь₂	-ь₃	0	0	0
CT		Ьг	0	0	0
0	0	0	к	-К	-К
0	0	0		Ьг	К
0	0	0	-ь₂	h	Ьг

Взаимная матрица равна


B₀	B₁	-B₂	0	0	0
B₁	Вгг	-B₃	0	0	0
B₂	-B₃	B_i	0	0	.0
0	0	0	Во		-S₂
0	0	0	-B₁	S₂2	S₃
0	0	0	-B₂	B₃	B_i

B₀ = (b₂b₄-bl)B, S₂₂=(fc₀fc₄-fc')B, Si = - (К fc₄ - fc₂ fc₃) B, В₃ = -(Ь₀Ь₃- Ьг Ь₂) В, В₂=(ЬгЬ₃-Ы)В, В_А=(Ь₀Ь₂-Ь\)В, В=Ь₀ &₂fc₄ ₊ 2fc₁fc₂fc₃-Ь\ - Ь₀Ъ\ -fc₄fc?,

\М\ = В*, (3.8.—3)

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 161

где В есть определитель матриц третьего порядка в верхнем левом и в нижнем правом углах М.

Как и в болёе раннем выводе, распределение X₁,..., X₆ нормально во всех измерениях. Показательная функция равна —12|ZW|]~\ умноженному на

В₀(х ] + х\) + 2 B₁ (X₁X₂ — X₄ х₆) —2 B₂ (X₁X₃ + X₄ х₆) + ' + В₂₂(х\+х\)-2В₃(х₂х₃-х_ъх_ь) + В₄(х§+х²). (3.8.—4)

В согласии'с предыдущими выводами положим X₁ = Z_c=RccsO, X₄ = Z^=RsinO, X₂=I_s = R^f sin G + Rccs 00', X₅ = Z^=R' ccs 0 — Rsin 00', X₃ = I_c = R^f ccs 0 — 2R' sin 00' — R ccs 00'²— R sin 00", X₀ = Z₅' = R^ff sin О + 2R' ccs 00' — R sin ОО'² + R ccs 00V

Угол 0 изменяется от 0 до 2тс, а 6' и 0" изменяются от—оо до + оо. Образуя якобиан, можно показать, что

At₁ At₂.... At₆=R* dR dR^f dR^ff d0 dO^f db\

Величины, входящие в (3.8—4), равны

х?+Xi=R², Xi X₂-X₄ X₅=R²O', Xi X₃ + х₄ X₆ = RR" — R²O'», х\ +X² = R'² + R²O'², X₂ X₃ — X₆ X₆=RR" 0'- 2R'² 0'-R'R 0"— R² О'³, xl+xl =R"²—2RR" 0'² + 4R'² О'² + 4RR' 0'0" + R²0^м + R² О"².

Выражение для p(R, 0, R^ff) найдем, если подставим эти значения х в (3.8—4) и проинтегрируем результирующую плотность* вероятностей по интервалам 0,0', 0":

Pi^p' 0,^) = -1¾-! <*0 J d6' J d6"exp{--[B₀R* +

0 - ее -оо V

+ 2 B₁ R²о;—2B₂(RRⁿ — R²0'²)+B₂₂ R²О'²—2 B₃RO^f (Rⁿ-R0'²) + + B₄(R'^,2-2RR"0'²+R²e"⁴ + R²0"²)]J. (3.8—5)

Интегрирование по 0 и 0" может быть выполнено сразу, и P(R, О, R") будет состоять из некратного интеграда, с которым, ^к сожалению, трудно иметь дело. Поэтому положим, что спектр

162

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

w(f) симметричен относительно средней частоты полосы f_m. Из (3.8—2) &! и Ь₃ равны нулю, а из (3.8—3) B₁ и B₃ равны нулю.

При таком предположении выражение (£.8—5) приводится к виду

p(R_y 0, R")=R²(2tc)-^8/' B₄" j dW ехр {-^₅ [B₀ R² +

— OO

+ (B₂₂ + 2 B₂) R²6'²-2 B₂R R"+B₄ (R"-R 6'²)²] J . (3.8-6)

Вероятность того, что выброс случится в элементарном прямоугольнике dRdt_y равна из (3.8—1) p(t_yR)dRdt₉ где

p(t, R)=- J р(Я, О, R) R dRT. (3.8-7)

— OO

Подставим (3.8—6) в это выражение и сделаем следующую замену переменных:

" ^_R6'², у=— _4*_R",

/28 /28

Z=-^-R = -⁶A=R, /2 8₄ 8 /2 8₄

(3.8-8)

_ (Д_аа+2 8_а) / 3__6₀ 6₄ \ /о ^₂V

2 86² ~Ц 2 261 j~~ 3 ^а''>

_па_ 2 8₄ _ 6₀6₄" 28» 6* ~~ 61 *

Здесь используются выражения для В, полученные из (3.8—3), при условии, что Ь_г и Ь₃ равны нулю. Поэтому

X ехр [— а² Z² + 2 6zx + 2 zi/ — (х + у)²]. (3.8—9)

Как и следовало ожидать, это выражение показывает, что p(t_y R) не зависит от /.

Ряд для p(t₉R) может быть получен путем разложения ехр 2z(y+bx) и последующего почленного интегрирования. Воспользуемся выражением

oo OO

1*1

AtVHW^+yP- W Г(?+1) T(H-I)

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 163

которое может быть вычислено, подставляя х=р² COs² w, у=р² sin² w.

Двойной интеграл в формуле (3.8—9) превращается в

_ ⁰⁰ _/п _чя « _ltm rf m+-L) Г(л —m+2)

* * -i/T тс V ^(2г) V_^п] ^ъ V²A _

Г ~2~ ^я! (л — m)! „ ₂ _г/ я 7\ ~~

ⁿ^^vW+-*)

где A₀= 1, а

^An=Y «I--Чя-т + 1)^ OO

6 (3.8-10) Л* (л+ О(1 — *)"^ж/---1- (1— *)-^e/s п велико.

Член, соответствующий ш=0 в (3.8—10), равен п+1. Поэтому получим

и ох *~^а2*² (Sz)^3/- Y¹ 2^я л

Нас интересует ожидаемое число выбросов в 1 сек. N. Из аналогичного вывода для / следует, что N есть коэффициент при dt_y когда (3.8—1) интегрируется по R в пределах от 0 до оо Поэтому из (3.8—7) и из

dR=V2B~b;²dz = (2b₀Byi*bl''dz=[2b₀ (а²-1)]*/. dz находим

Уравнения (3.8—11) и (3.8—12) были выведены в предположений, что спектр w(f) симметричен относительно /_ш, т. е. что ослабление

164

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

полосового фильтра симметрично относительно средней частоты. Сделаем теперь дальнейший шаг и рассмотрим идеальный полосовой фильтр

W(Z) = W_0f f_a<f<f_b,

W(F)=O_i во всех других случаях,

2/_m=W+W- (3.8-13)

Подставляя это в (3.8—2), получим нуль для Ъ_х и Ь_ъ и, кроме того,

V=Woif_b-f а) =%, V= + (f_b-f_a)\

V=+(f_b-LV,

, ^а2=1Г' (3.8-14)

6=-1-(3-*) = А,

tf=[2&₀(*_l)]V._z= (4 U'''²'

п A_n п A_n

0 1 4 6,775

1 2,3 5 8,333

2 3,735 6 9,9002

3 5,238 7 11,4736

A_n^ 1,581U+0.3953

Из (3.8—12) находим, что ожидаемое число выбросов огибающей в 1 сек. на выходе идеального полосового фильтра равно

IV =0,641 IO(W-W). (3.8-15)

Распределение выбросов R для случая идеального полосового фильтра может быть найдено путем подстановки результатов (3.8—14) в выражение (3.8—И). Тогда получим

я=0 ^Г\ 2 + 4 /

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 165

Удобно представить у как отношение

___R_______

эфф. знач. /(/)'

^Т0

/ 8 \ V. Ы ^Z*

где подразумевается, что R соответствует выбросу огибающей. Так как значение R_f соответствующее случайно выбранному выбросу огибающей, есть случайная переменная, то и у также является случайной переменной. Плотность вероятностей для у обозначим через рц(у), причем

_ p(t,R) dR

0,64110 Ub -fa)

На фиг. 3 рфу) представлена как функция у.

0,6"


		о	N
	<	Г >	<	>
	/ о /
	и / о			<
	>				ч
У						N	?---

0,5 0,4 0,3 0,2

OJS 10 IJS

Ifi

2.5 3.0 3^>

Фиг. 3. Плотность вероятностей выбросов огибающей тока шумов на выходе идеального полосового фильтра.

P_R(y)

—— ^-вероятность того, что случайно выбранный выброс

^у Фо

огибаюшей заключен между R и R dR.

Функция распределения Я(7?_Макс.< У Vty₀), определяемая как

P(R«M<yVjs)=\ Ря{у)dy,

изображена на фиг. 4 вместе с другими подобными кривыми. Эта функция представляет вероятность того, что случайно выбранный выброс огибающей будет меньше заданного значения yV%⁼ P-

166

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ УЙУМОВ

Если у велико, скажем #>2,5, то

-3 -2 -I О ! 2^3 4 5

Фиг. 4. Распределение вероятностей выбросов. А=Р(1<у ^yr^_l,). — вероятность того, что / меньше, чем у ty_p .¹ Подобно этому C=P(R<v *■ ^о)'В⁼Р(1_мянс <У V tyi) - вероятность того, что произвольный выброс I меньше, чем у Ъ ty₀. Подобно это- „<t Щ му z>=P(i?_viai<c. <у Vty_j).

Приближенное выражение для Pфу) может >б\лтъ получено из интеграла (3.8—9) для p{t_yR). Действительно, !заменяя переменные интеграции X_f у в (3.8—9) на

X^f = X₁ у' = х + у_у

ГЛ. 111. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 167

интегрируя часть интеграла, в которую входит у'₉ по частям и предполагая 6<1 (согласно неравенству Шварца а²>1, так что всегда 6<1), получим

когда R — велико.

Если вместо случая идеального полосового фильтра рассмотрим случай, когда w{f) равно¹)

W(Z)=-U_rW^)²'²'¹, Z_m»», (3.8-16)

q у Ztz

то найдем

Ь₀=1, Ь₂ = 4кЧ*, &₄=48тс⁴а\ а²=3, 6=0, А_п = (п+\).

Грубо приближенно сумма ряда в (3.8—12) равна 3,97. Поэтому ожидаемое число выбросов огибающей в 1 сек. равно

М=2,52а. (3.8—17)

Полоса пропускания определяется коэффициентом а. Представляется трудным сравнить этот случай со случаем идеального полосового фильтра. Если воспользоваться тем обстоятельством, что фильтр, для которого

w(f)=w₀exp [-^(£^)²] ,

пропускает туже самую среднюю мощность, как и идеальный полосовой фильтр с полосой пропускания, равной f_b—f_a9 то получим

W-W=⁰V^

и выражение для N превращается в

1,006 (f_b-f_a).

3.9.%>ЛУКТУАЦИИ ЭНЕРГИИ

Nii

Здесь исследуем статистические свойства случайной переменной

tx + T

E= J Z²(Z) dZ, (3.9—1) t_%

где Z(Z) — ток шумов, а Z₁ выбрано случайно.

¹J Уравнение (3.8—16) нормировано в том смысле, что средняя мощность Фо принята равной единице. Здесь а имеет другое значение, чем раньше, и размерность ее есть размерность частоты. (Прим. ред.)

168

4ACtb II. ТЕОРЦЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Если пользоваться представлениями (2.8—1) или (2.8—-6), то можно написать случайную переменную E в виде

Т/2

F=J D(Z)A, (3.9—2)

Г/2

где случайный характер выражению, стоящему справа, придается наличием либо а_п и 6„, если используется представление (2.8—1), либо W_ny если применяется (2.8—6).

Среднее значение E обозначим через т_т, где из (3.1—2)

Г/2 Г/2

E = m_r.= J D(Z) dt = j ф(0) dt= 7+ =T$w{f) df. (3.9-3)

" " —Г/2 -Г/2 О

Момент второго порядка равен

7/2 Г/2

£* = jdh j йитЩШ- (3.9-4)

-Г/2 -Г/2

Если теперь положим Z₂=Z₁-Et_jTo, как видно из раздела 3.2, получим выражение плотности вероятностей для Z(Z₁) и Z(Z₁-Et) и, следовательно, можем написать для искомого среднего значения

⁷^=-UrI+адп х

-оо — оо

Х'^+^о⁷» + ♦<»'* -2фх Z₁Z₂)

(3.9—5)

Л2=>8-ф|, Z₁ = Z(Z₁), Z₂ = Z(Z^x) = Z(Z₂). Интеграл может быть вычислен при помощи (3.5—6), если положить

WAx/ 4-, I_t = Ay

<1>т =— Фо ^c°s <р, А = ф₀ sin (р. (3.9—6)

Поэтому

TfTj = <|>² (1 +2 COS²Cp) = ф² +2ф|. (3.9-7)

Кстати, это дает выражение функции корреляций для Z²(Z). Заменяя т его значением Z₂-Z₁ и возвращаясь к (3.9—4), получим

Г/2 Г/2

E² = T² Го + 2J A₁ J A₂ <p(Z₂ - Z₁). (3.9-8)

-Г/2 —Г/2

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ /59,

Если введем о_т — стандартное отклонение E

4 -F²-Znb

то найдем

4 = (E-E)² =2 J A₁ J A₂ф²(/₂ — Z₁) =

-Г/2 -Г/2

= 4j(T — x)r(x)dx_fо

где вторая строчка может быть получена из первой либо путем замены переменных интеграции, как в (3.9—27), либо методом,, применяемым ниже при рассмотрении E⁶. Следует замеЕить, что-пределы интегрирования — Т/2, Т/2 в двойном интеграле могут быть заменены на О, T путем замены переменной Z==Z'—Т/2 как для Z₁, так и для Z₂.

Если воспользуемся выражением

ф(х) =^wQ) cos 2ф df, (2.1 -6>

то получим

sin*+к Jf₂) T

°r=jo>(/i)d/ijо о

*²(/14/₂)

SWiz(U-U)T

[(3.9-9)

*²(/i-/₂)²

Если эту формулу применить к случаю сравнительно узкополосного полосового фильтра и если T(f_b — /J>1, то членом с Д+ 4-Д можно будет пренебречь и получить приближение

- о т ^те

⁸ Г f Jt Г At sin² — h)T

от+

(3.9-10>

I — оо

= ™lT{f„-f_a) = w₀m_T ,

где из (3.9—3)

тт =w₀T(f_b-f_a). (3.9-11)

Момент третьего порядка E⁶ может быть вычислен подобным же образом. Однако в этом случае имеет смысл ввести характеристическую функцию для распределения /(Z₁), /(Z₂), /(Z₃). Taic

170

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

как это распределение нормально, то его характеристическая функция равна

сред, ехр (IZ₁1₁ + iz₂1₂ + iz₃1₃) =

ехр

^(zl+zl+zl) + W₂ - Z₁) Z₁ Z₂ +

(3.9-12)

+ Ws — Д) Zi Z₃ + Ws — h) Z₂ Z₃Из определения характеристической функции следует

коэф. при -grghf ^в ^х- Ф-

(3.9-13)

= ФВ + 2ф₀ (ФД + Ф £ + ФЛ) + 8Ф21 Фз1 Ф32,

тде ф(^2—Zi),...обозначены, соответственно, через ф₂1 и т. д. Если (3.9—13) умножить на dt₁dt₂dt₃₉ затем проинтегрировать в пределах от 0 до Г и воспользоваться приведенным выше двойным интегралом для of, то получим

TTT

(E-Ef =2! 2²JdZ₁JdZ₂ JdZ₃ ф₂₁ ф₃₁ ф₃2.

Oub

Обозначая тройной интеграл справа через J и дифференцируя, имеем

т т

L_f =3 ^dt^ йШг-к) ф(Г —Z₁) ф(Г —Z₂) =

о о

TT Tx

= 3 Jdxj di/ ф(х - у) ф(х) ф(//) = 6 j d* Jdy ф(х - у) <|>(х)

0 0 0 0

При переходе от первой строчки ко второй Z₁ и Z₂ были заменены на T—хи T—у соответственно. При переходе от второго выражения к третьему использовались соотношения, символически представленные в виде

TT Tx TT Tx Ту

^dx^dy = Jdxf di/ +Jdxfdy = \dx^dy + Jdyfdx ,

00 00 Ox 00 00

а также то. обстоятельство, что подинтегральное выражение симметрично по Jt и у. Интегрируя dJ/dT по T в пределах от 0 до T_lfпользуясь формулой

T₁ T T₁

j dT f f (x) dx = \ (T₁ —x) f(x) dx,

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМо£ J 71

замечая, что J=O_f когда T=O₉ и, наконец, опуская индекс при Ti₉окончательно получим

__т х

(Е — Ef =48Jdx \dy (Т — х) ф(х) Ф(у) ф(х — у). о о

Аналогично можно свести к сумме двух тройных интегралов и F⁴.

До сих пор в этом разделе говорилось о статистических константах Е. Нахождение точного выражения для плотности вероятностей E₉ в котором T рассматривается как параметр, представляется весьма трудным.

Когда T очень мало, то E приближенно равно Z²(Z)T. Вероятность того, что E заключено в интервале d£, равна вероятности нахождения тока в промежутке (—/,—/—dl) плюс вероятность нахождения тока в промежутке (/, I-JdIf.

7^^ехр(-2у₀)= 7ШГ^ехр{-ЖтУ^Е> ⁽³-⁹~¹⁴⁾

где E положительно,

'=W ■"'-Hw^de-

а T предполагается настолько малым, что в течение интервала длительностью T Z(Z) значительно не изменяется.

Когда T очень велико, можно разделить его на ряд интервалов, скажем п₉ длительностью каждый Tln. Пусть E_r будет доля энергии от r-го интервала. Тогда энергия в полном интервале

£ = £, + £,+ ...+£„.

Если частичные интервалы достаточно велики, то E_r — существенно независимые случайные переменные. Если, в дополнение, п достаточно велико, то E приближенно распределено по нормальному закону. Следовательно, когда T весьма велико, вероятность того, что E заключено в интервале d£, равна

dE Г (Е—т_т)

(3.9-15)

7=- ^exP

/2тс

I-

где

m_T = T\w(f)df, о

+ = T+(J)df,

(3.9—16)

172 •

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

причем второе соотношение получено, полагая в (3.9 — 9) T—►oo . Аналогия с теоремой о наложении случайных возмущений (раздел 1.2) очевидна.

Если имеем дело с полосовым фильтром, то можно пользоваться (3.9—10) и (3.9—11).

Рассмотрим полосовой фильтр со сравнительно узкой полосой пропускания, так что можно найти T₉ для которого 77_а^>2тс, но T (f_b— f_a) <^0,64. Следовательно, в T содержатся несколько периодов частоты f_a9 но, согласно (3.8—15), в течение этого интервала огибающая значительно не изменяется. Поэтому на протяжении этого интервала /(/) может рассматриваться как синусоидальная волна с амплитудой R. Соответствующее значение E приближенно* равно

где распределение огибающей R берется из (3.7—10). Отсюда следует, что вероятность нахождения E в интервале dE равна

когда E мало, но не слишком.

Рассматривая (3.9—14) и (3.9—17), замечаем, что они имеют вид

_пп + 1 Fⁿ nv

W+ ^dE- ⁽³-⁹-¹⁸>

Кроме того, нормальный закон (3.9—15) может быть отсюда получен, полагая, что остановится большим.

Этим подразумевается, что приближенное выражение для распределения E дается формулой (3.9—18), если а и п выбраны так, что значения т_т и о_т получаются из (3.9—3) и (3.9—9). Это дает

а= 4 "+1 = 4 (3.9-19)

и если опустим индекс T и подставим значение а в (3.9—18), то получим

(шеУ

\о*) ( mE\.lmE\ „ m* (3.9—20)

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 173

Представление об этом распределении дает следующая таблица:


п	Н/й—fa) *0,25		Xq, 50	+ 75	*Xr,* п~ ^л0-2;> JCa га	*Xr,* *г-~* "^0,50
о kj	0	0,29	kj,kjvo	I *,OZ/*	0 413 U, t 1 U	9 ПО ^,UU
1 1	1,45	0,96	1 VJU	2 6Q	0 372 kj,0 I Z*	1 ,VJU
О Za	2,4	1,73	9 67	3 Q4	0 847	1 47 I ,41
3	3,4	2,54	3,67	5,12	0,692	1,39
5	5.4	4,22	5,67	7,42	0,744	1,31
10	10,5	8,63	10,67	13,02	0,808	1,22
24	25	21,47	24,67	28,17	0,870	1,14
48	50	44,1	48,7	53,5	0,905	1,10

где п — показатель степени, входящий в (3.9—20). Столбец T(f_b—f_a) справедлив только для полосового фильтра с узкой полосой пропускания. Цифры в этом столбце не очень точны. Следующие три столбца дают точки, которые делят распределение на четыре интервала равной вероятности

x₀ ₂₅ = ~~^m^'²⁵~~, £₀₎₂5 = энергия, превышаемая в течение 75% времени mFo.bo р__ _км/ _

#0,50 -—' + 50 —-п-/о п-

т£р,75 р __о со/__

*0,75 = —^2—» ^0,75 —-т>-zo /₀-„-

Цифры в этих столбцах получены из таблицы неполных гамма-функций Пирсона. Последние два столбца показывают, как распределение группируется вокруг среднего значения, когда оно сходится к нормальному закону.

При больших значениях п достигается нормальный закон (3.9—15). Так как в случае справедливости этого закона точки 25, 50 и 75% соответствуют т — 0,675а, т и /п+0,675а, то в первом приближении

+50=-j = ("+1)^Г (/,-u, х₀,₂₅ = J- [т -0,675а) = *о.50-0,675]/^7о, (3.9-21)

#о,75 = #0,50+ 0,675v^rX_0f50.

Это согласуется с таблицей (см. также фиг. 5). Исследуем теперь флуктуации интеграла

Л(/)=|/2(х)/^а('-^г)А. (3.9-22)

Показания термоэлектрического амперметра, через который проходит ток /, пропорциональны A(t). а— постоянная прибора.

Начнем исследование A(I) с нахождения его функции корреляции. Сплошной участок энергетического спектра A(t) дается урав-

174

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

нением (3.9—30). Если энергетический спектр Z(Z), обозначаемый w(f)₉ равен всюду нулю за исключением участка f_a<Cf<if_b>где он равен W₀₉ то энергетический спектр A(t) равен

2wi(f_b-f_a-f) _0<rf^_f __f

и равен нулю от f_b—f_a до 2f_a. Спектр на участке от 2/_а до 2f_b не равен нулю и может быть найден из (3.9—34). Средний квадрат флук-

2.0 u5 У / GlS 0

-2_t0Qnpui

MfSiipuO

20 30 40 5060

3 4 5 6 8 Ю

Tffrfa)

Фиг. 5. Шумы теплового движения на выходе фильтра— разброс энергии флуктуаций.

ti + T

J P(t)dt, I₁ - взято произвольно, / — ток шумов.

I₁

^Е0,75 ^Ео,25 , _л^v = -g- Xa= -£-• J_b J_a-ширина полосы фильтра.

0,50

туаций A(Z) дается в общем случае уравнениями (3.9—28) и (3.9— 32). Для полосового; фильтра, если^^l- велико,

эфф. знач.

Л(0-Л] Г а A J [Wb-fa)

Начнем с того, что положим T=Z—U₉ благодаря чему интеграл для Л(Z) преобразуется в

A(t) =J D(t — _U)e~^audu.

(3.9—23)

Чтобы получить функцию корреляции W(~) для Л(Z), умножим A(t) на Л^ + т) и усредним по всем возможным значениям токов

OO OO

W(z) = A(t)A(t + z) = J _e""du j e~'^vdv 1^T(t^u)7"(t+z—v)

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 175=.

Так же как и в (3.9—4), среднее в подынтегральном выражении есть функция корреляции для Z²(Z), аргумент равен Z+т — v — Z+ ^__u — z+u — v. Из (3.9—7) видно, что она равна

Ф?+2ф²(т + а-ц), где W) ^есть Функция корреляции для Z(Z). Следовательно,

oo oo

W(x) = j +2 ^dufa e-^au-^avrU + u — v). (3.9—24) о о

Из интеграла (3.9—23) для Л (Z) видно, что среднее значение-Л (Z) равно

T=E.= **-. (3.9-25).

где

%=№+ Mftdf = 7:

Применяя последнее соотношение опять, но только на этот раз. к Л(Z), получим *

OO OO

Щ) = W(O) = Л+2 ^du^dv _e-*^u-*^v Г(и — v). (3.9—26)

о о

Двойные интегралы могут быть преобразованы путем замены переменных u + v=x_y и—v=y. Тогда (3.9—24) превращается в

ЧГ(т) = A+ ([dy^dx+]dy^dx\ е'^ги + У) =

(3.9-27)

= А + -L-J C^ay [ф!(т + у) + W - У)] dy.

Если воспользоваться тем обстоятельством, что ф(у) есть четная функция у, то из (3.9—26) следует, что средний квадрат флуктуа-ций Л(Z) равен

_ _г

[Л(Z) - Af =ГЩ -Л² = A U - ^ах dy. (3.9-28)

Функция W(t) может быть записана при помощи интегралов, в которые входит w(f)—энергетический спектр Z(Z). Вывод начинается с (3.9—24); он аналогичен переходу от (3.9—8) к (3.9—9).

176

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

В результате получим •

•о - *•+\ Ah да <м Ф+тш+тш?) ■

Удобно обозначить через w(—/) спектр для отрицательных частот, равный w(f). Интегрирование по /₂ может быть тогда произведено в пределах от — оо до + оо ; в итоге получим

оо 4 оо

W(I) = A² +J d+df₂w(f Jw(J₂) .¾¾¾¾ (З-⁹-²⁹)

Энергетический спектр W(f) для A(t) можно найти, интегрируя T(t)₁

W(f) = 4 j W(i) ccs 2ф dz. о

Рассмотрим часть A(I)_y подверженную флуктуациям, т. е. {A(I)—Л]. Ее энергетический спектр W_c(I) равен

W_c(I) = 4 j[ W(t) - Л²] ccs 2тс/т dx.

Интегрирование упрощается при применении формулы интеграла -Фурье в виде

оо 4 оо

J dz J df₂ F(J₂) ссз2г(ы-/₂)т = 4" ^fM-

О -оо

Получим

^с(/) = I ^dZiMzo ^w(f+fi) + ^w (/о а» (-z+zoi =

+ оо

= Ь'М ^w i^f-^fi) ^dfi- ⁽³-^9_30)

Простота этого результата наводит на мысль, что может быть найден менее сложный вывод. Если попытаться воспользоваться формулой

Ъ(1) = \\т ²LVL_t (2.5-3)

T-* во

где S(f) берется из (2.1—2), то нужно доказать, что T г

Iim JL J _dtl jd/W'^ R(h)Ihh) =

Г-«0 q Q

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЙХ ШУМОВ 177

+ оо

= Jif₀Wtf-Mdf₁, (3.9—31)

— oo

где f >0, /(Z) есть ток шумов, а w(f) — его энергетический спектр. Это можно доказать, пользуясь (3.9—7) и соотношением

OO +оо

8 |ф²(т) cos 2ф dx=§w(x)w(f—x) dx

О - OO

в соответствии с уравнением (4С—6) в Приложении 4С.

Выражение для среднего квадрата флуктуаций A(I)₉ в которое входило бы W(I)₉ может быть найдено, полагая в (3.9—29) т=0:

(Atf)-Ay = *(0) - A²-¾?¾? ^,(3-⁹"³²!

Тот же самый результат получим, интегрируя W_c(f) из (3.9—30) в пределах от О до оо:

oo +00

I ~~,*+!*/»~~ I^dfl "tf^-W- (3-9-33)

О -оо

Хотя по внешнему виду это выражение и отличается от (3.9—32), но оно может быть представлено в такой же форме' при помощи соотношения w(—f) = w(f).

Предположим, что /(/) — ток через идеальный полосовой фильтр, так что w(f)=0 за исключением полосы f_a<Cj<Cj_b> где w(f) = w₀. Тогда, если 3f_a+>f_b9

A = +tf_b-f_a) ,

<2wltf_b-f_a-f), 0<f<h-fa. (3.9-34)

J(x)w(f-x) dx = Iwltf- 2f_a), 2f_a<f<f_b + U,

\wK2U-f), f_b+U<f<2U

и равно нулю за пределами этих диапазонов. Энергетический спектр W_r(f) немедленно может быть найден по (3.9—30) путем делений этих значений на <х²+4тс²/². Из (3.9—33)

(A(I)-Xf= 2wi]^=Jdf + о

+ W₀ ) _а2+<1л2/а Щ+ w₀ j _al+47t,_/a Щ.

173

ЧАСТЬ И. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Если желательно получить точное решение, то интегрирование должно быть выполнено. Положив, что f_b—/_fl<C/a+/a> можно получить приближения для последних двух интегралов

{A(I)-A)² ^ W²₀ [&=&arctg ~~^2тс(/^^/а)~~ -

4ti» ^iu^ _а» «^a+4*»(/* + /_a)»J-

Далее, если ~~^2тс^б--/а)~~ велико, то

(Л(О-Л)^шГ-^ и относительное эффективное значение флуктуаций равно

Этот результат может быть также получен из (3.9—10) и (3.9— 11), полагая а настолько малым, что интеграл для A(I) может быть разбит на большое число интегралов, каждый из которых охватывает интервал длительностью Т. Предполагается, что аТ настоль* ко мало, что е-^аи существенно постоянно в каждом интервале.

[3.10. РАСПРЕДЕЛЕНИЕ СУММЫ ИЗ ТОКА ШУМОВ И СИНУСОИДАЛЬНОГО ТОКА

Допустим, что имеется установившийся синусоидальный ток

I_p = I_p(I) = P cos (о)/ - Ф_р). (3.10-1)

Выберем случайные моменты времени Z_bZ₂,... и заметим соответствующие значения тока. Как распределены эти значения? Выбор случайных моментов времени в (3.10—1) со статистической точки зрения представляет собой то же самое, что и сохранение Z постоянным и выбор случайных фазовых углов W_p в диапазоне от 0 до 2тс. Если I_p будет рассматриваться как случайная переменная, определяемая случайной переменной Q_p9 то ее характеристическая функция равна

2тс

сред. е^шр =^j e^izP ^cos (•/*-*> dw = J₀(Pz)₉ _(д _ш_₂₎где J₀(Pz)—функция Бесселя. Плотность вероятностей для I_p

IJe-H(Pt) dz=\+^P2-H^l'\ \1_Р\<Р, _(ЗЛ0_₃₎-- Io |/_| >Р.

ГЛ. III. статистические свойства флуктуационных ШУМОВ 179

В этом случае проще найти плотность вероятностей непосредственно из (3.10—1), а не при помощи характеристической функции^-.

Допустим теперь, что имеется ток шумов I_n плюс синусоидальный ток. Сопоставляя выражение для I_n (2.8—6) с изложенным выше понятием о случайных фазовых углах w_p9 приходим к следующему представлению:

Hf) = I = I_p+ lN=Pcos(w_pt-w_p) + Yc_n^s(w_nt-w_n)_f (3.10-4)

c\ = 2wtf№>

где w_p и (f_l9...w_M— независимые случайные углы.

Если наблюдать / в случайные моменты времени Z₁, Z₂,..., то как будут распределены отмеченные величины? Так как I_p и /₄v могут рассматриваться как независимые случайные переменные и так как характеристическая функция суммы двух таких переменных равна произведению их характеристических функций, то из (3.1—6) и (3.10—2) имеем

сред. е?« =сред. Л^+/"> ₌ J₀(P_z) ехр j. (3.10-5)

Это выражение представляет собой характеристическую функцию для /. Плотность вероятностей / равна¹)

+ Jexp [-/г/-(+^₀(P₂)_d2 =

Подобным же образом можно показать, что плотность вероятностей для {I₁, I₂), где I₁=I(I) —ток шумов плюс синусоидальный ток (3.10—4), а I₂=I(t+z) — значение этой суммы спустя некоторый постоянный промежуток времени т, равна

(+иг

-J^deexp bifLd' ^(ЗЛ0_7>

о где

Вф) = <Ы(Л - P cos 6)* + [I₂ - P cos (0 + «D_pT)]»} -1 — P ^cos б) Ut — P cos (0 + (O_pT)].

Ч Другой вывод этого выражения дан У. Р. Беннетом, BSTJ_r97, январь 1944.

180

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Характеристическая функция для I₁ и I₂ равна

сред. e^iuI>^+ivI* = /₀(^ У"² + v² +² w cosoyc) X

Xexp | — 4-("² + ^²)-фг^|. (3.10-8)

Иногда представляет интерес распределение огибающей тока

/ = PccspZ + I_n. (3.10—9)

Здесь о)_р заменено на р, а <р положено равным нулю. Под огибающей подразумевается R(I)₉ которую можно найти из

R*(t) = R² = (P + I_c)² + I>₉

(3.10-10)

где I_c есть составляющая I_n «в фазе» с cos р!₉ а I_s —составляющая лв фазе» с sin pZ:

С = S с_п ccs [((D_n — р) Z — <р_я], ⁷U = S ^sin [((D_n-p) Z — (р_я], I_n=I_c cos pZ — sin pZ,

'T = WWo-

Так как /_с и I_s распределены по нормальному закону вокруг нуля с дисперсией %, плотности вероятностей переменных

X = P+ I_c, у = I_s

равны соответственно

(2*40

■DJ]

2ф,

(2*4»₀)

■*«р(-&)-

Положив

x = Rcos0, p = Rsin8

и пользуясь этими распределениями, видим, что вероятность нахождения точки (х₉ у) в кольце (R₉ R+dR) равна

2тс

RdR

2г+

ехр

-L(R2 + P*-2RPccsQ)

ехр

F²+P²

/ЯР

(3.10—11)

гл. iil СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 181

где I₀ — функция Бесселя мнимого аргумента

Л>0 = Xi^T,

которая является табличной функцией. Из (3.10—11), отбрасывая dR₉получаем плотность вероятностей огибающей R.

Среднее значение Rⁿ может быть найдено путем умножения (3.10—11) на Rⁿ и интегрирования в пределах от 0 до оо . Разложение функции Бесселя и почленное интегрирование дают

W= ^₀W(W) e-HF^-j+n иЩ =

= (2фоГ^/2^-|-+^Л[-+ W-+). (З.Ю-12)

где есть гипергеометрическая функция¹!. При переходе от первой строчки ко второй было использовано первое преобразование Куммера для этой функции. В частном случае

RJ²= Р² + 2ф₀. (3.10-13)

Когда имеются только шумы, P=O и

* = «U) -(*Г ₍з,о-н,

R² = 2ф₀.

Прежде чем итти дальше, в (3.10—11) удобно сделать следующие изменения обозначений:

V= * Clv=L_rt U=L_ftt (3.10-15)

Фо* Фо

где а есть отношение амплитуды синусоидального тока к эффективному значению тока шумов.

Вместо случайной переменной R теперь имеется случайная переменная V_t плотность вероятностей которой

p(v) = uexp (--^L+^j /_о(от). (3.10-16)

Кривые p(v) в функции от v представлены на фиг. 6 для значений а=0, 1, 2, 3, 5. Кривые, показывающие вероятность того, что V меньше, чем заданная величина, т. е. кривые распределения V_tприведены на фиг. 7. Эти кривые были получены путем численного

¹J Кривые этой функции приведены в «Таблицах функций» Янке и Эмде, 373, 1948, а некоторые ее свойства изложены в Приложении 4В.

О 12345678 V

Фиг. 6. Плотность вероятностей огибающей R тока /(/) = р cos pt + In.

99.99

99.95 99.9 99,8 99.5 99


					-37 Ж
					Ф







				1










/ъ/з	2	fl	'а=0

95 &90

во

70 60

50 40 30 20

10 5

2 1

0,5 0,2 0.1 0.05

0,01

-3

-2

о v-Cf

Фиг. 7. Функция распределения вероятностей огибающей R тока /(/) = P cos pt + /л/.

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 183

интегрирования p(v). Следующее полезное выражение для этой вероятности было дано У. Р. Беннетом в одной неопубликованной работе

v »

J p(«)du = exp (_it+f!)2/_п(оо). (3.10-17)

Это выражение получается путем интегрирования по частям, пользуясь соотношением

J Uⁿ I_n-X (au)du = ~ I_n(QU)_e

При аи>1, но 1<а—V_f Беннет показал, что (ЗЛО—17) приводит к

^exp [_ S*^\ X

Эта формула может быть также получена путем подстановки асимптотического разложения (ЗЛО—19) для p(v) в (ЗЛО—17), выполнения дважды интегрирования по частям и пренебрежения членами высшего порядка.

* Когда av становится большим, I₀(av) можно заменить его асимптотическим значением. Тогда выражение для p(v) превращается в

'«Н'+аНнГЧ--^} ^<3-¹⁰-¹⁹⁾

Поэтому, когда а становится большим, либо v находится далеко у края кривой плотности вероятностей, распределение становится подобным нормальному закону. Нормальный закон определяет среднее значение P и стандартное отклонение фо'. Это стандартное отклонение таково же, что и стандартное отклонение мгновенных значений /,у.

Когда аи>1 и а> \v—а|, можно разложить коэффициент при

показательной функции в (3.10—19) в ряд по ~~^V~_Q^a~~ Почленное

интегрирование этого разложения дает, если пренебречь членами, по величине меньшими а"³:

j р(и) du =¾= 4-+4-^erf уг~-

2а/2^ V 4а + 8а« J^eXp[ 2 J'

184

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Когда / состоит из двух синусоидальных токов плюс шумы:

/ = Pcospt+QsiT\qt + I_N, (3.10—20)

где угловые частоты р и q не имеют общего множителя, плотность вероятностей огибающей R равна

ф₀г«

г J ₀(Rr)J₀(Pr) J₀(Qr)e~ ~dr, I^z'¹⁰~²¹>

где %=1 N. При Q=O интеграл может быть вычислен и тогда получается (3.10—11). Когда P=Q=O, получаем плотность вероятностей для R при наличии одних только шумов. Если вместо двух синусоидальных токов будут три, то в подинтегральное выражение следует поместить еще одну функцию Бесселя и т. д.

Для определения R удобно считать шумы сосредоточенными в сравнительно узком частотном диапазоне, а частоты синусоидальных токов — лежащими внутри этой полосы или вблизи нее. Как и в уравнениях (3.7—2)—(3.7—4), относим всё члены к средней частоте диапазона/_т = <о_т/2тс, пользуясь уравнениями типа

cos pZ=cos [(P-cd_m)Z + (d_mZ ] =

=cos(p — (dJZ cos (d_mZ — sin (р — (d_m) Z sin (o_mZ.

Таким путем получим

У=Л cos (d_mZ — В sin (d_mZ =Rcos ((d_mZ + 0), (3.10—22)

где А и В — сравнительно медленно изменяющиеся функции Z, равные

A=P cos (р — (d_m) Z + Q cos (<7 — (о J Z+

+ JJ C_n COS (o)_nZ — (d_mZ — <р_п),

(3.10—23)

Б=P sin (р — (d_m) Z + Q sin — (d_m) Z +

+ JjA_nSin(o)_nZ-(d_mZ -Cp_n)

R2=4² + B², R>0, (3.10-24) t_g0=4-.

Как и следовало ожидать, уравнение (3.10—21) тесно связано с задачей о случайных смещениях и может быть получено из вывода Клюйвера¹!, полагая, что шумы соответствуют весьма большому числу очень малых случайных смещений.

*) 1 Н. В а т с о н, «Теория бесселевых функций», ГИИЛ, 1949.

ГЛ. Ш. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 185

Другой путь вывода (3.10—21) основан на предположении, что (P-U)₇₇₁)/, (q — o)_m)/, <Pi,<p₂>- • • суть независимые случайные углы. Характеристическая функция для A_f В равна

сред. _е^,иА*»^В =Jo(PV*Hfl) J.(QV*++)*~*"**' Плотность вероятностей для A_f В составит

+ ов ■+ OO

/ 1 \2 С . ( . -UiA-IvB laA + ivB

(йг) \^du \^dve ^сред-^е— OO -OO

Если произвести замену переменных

Jl=R cos 0, w=rcos ср, B=RsinO, D=Tsincp,

то интегрирование по (р может быть выполнено. Двойной интеграл превращается в

Фо _т%

-L JtJ₀(Pt)J₀(Qr)J₀(Rr)_e' ² dr. о

Это ведет прямо к (3.10—21), если обратить внимание на то, что dAdB = RdR dQ. Кстати, если

/=Q(1 -f k cos pt) cos qt+I_Nf

где p<<7, то подобные же соображения показывают, что плотность вероятностей для R равна

2 л «о

4г J ^dcL j г J₀(Rr) J₀ [Qt(1 + k cos а)]е~ ^ '* dr_f

где (D₇₇₁ принято равным q. Интегрирование по т может быть выполнено. Это соотношение тесно связано с (3.10—11).

Возвращаясь теперь к случаю, когда / состоит из суммы двух синусоидальных токов плюс шумы, можно показать при помощи (3.10—21) и соотношения

2^Я+1Г|1 + —) I R^ⁱJ₀(Rr)_dR =- \

» ^(-4-)

что среднее значение Rⁿ равно, если — 2<Re (п) <—,

2"⁺¹r(l+-|-) С -W R"--' \ г-»-Ч₀(Рг) J₀(Qr)_e ² dr =

166

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

A=O /я-0

=(2фо)"^/2г(|-+1)£

(3.10-25)

Представляется весьма вероятным, что этот результат может быть распространен путем аналитического продолжения на положительные целые значения п. В (3.10—25) применялись обозначения

(о)*=а(а+1). .. (а + £-1),

P² Q²

(3.10-26)

а полиномы Лежандра были обозначены через Р/,(г). Ряд сходится для всех значений P_t Q и ф₀ и обрывается, когда п есть четное положительное число.

Если х или у или оба вместе велики сравнительно с единицей, то можно из интеграла для Rⁿ получить асимптотическое разложение, полагая Q<P, так что y<Jx:

(3.10-27)

Когда п — четное положительное число, этот ряд обрывается и дает такое же выражение, что и (3.10—25). Когда п — нечетное целое число, функция 2F1 может быть выражена через полные эллиптические функции E и К модуля i/¹'-*+

1_.

(3.10-28)

⁹ ^А' X ) те ^С те

Высшие члены могут быть вычислены из в (1-Zp₁F₁ (а +1, а + 1; 1; г) =

= (2а-1)(1+_г)Л(а, с; 1; г) + + (1 —а)₂^(а —1, с—1; 1; г),

(3.10—29)

ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 187

что является частным случаем соотношения

a6(Y + l)(l-z)²₂Fi(a+l, 6+1; с; г)= = A ₂Fi (а, Ъ\ с\ z) — -(Y-I) (c — a)(c — b)₂F₁(a-l₉ 6—1; с; z)_f (3.10-30) где 1=с—а—6, и

Л=а²-1)Т + 0-г) \Ь-\)(с-Ь)(Ь-\) + Ъ+\)а{с-а-\)\.

Хотя из данного выражения это и не видно, но А действительно симметрично по а и Ь. Симметричная форма может быть получена при использовании выражения, которое находится, если в (3.10—30) положить 2=0.

3.11. НЕКОТОРЫЕ ДОПОЛНЕНИЯ О ТОКАХ ДРОБОВОГО

ЭФФЕКТА

В большинстве выводов этой главы в качестве исходных использовались выражения (2.8—1) или (2.8—6). Покажем сейчас, что представление токов дробового эффекта, применявшееся в главе I, может быть также взято как исходное.

Например, допустим, что надо найти двумерное распределение /(/) и /(/+-с), рассмотренное в разделе 3.2. Это — частный случай распределения двух переменных

/(Z)=JF (/-4),

/<о+-<.>, <³"-'>

A=-OO

где теперь предположим

+ оо +оо

Jf(Z) dt= j*G(0 dt =0, (3.11-2)

- OO -OO

чтобы средние значения / и J могли быть равны нулю. Чтобы получить /(/+О из J(t)_y положим G(/) = F(/+x).

Распределение / и J может быть найдено во многом подобно тому, как в разделе 1.4 было найдено распределение для одного /. Характеристическая функция распределения равна

+ оо

f(u_t v) = сред. e^iuI+ivJ= ехр v J (ехр [iuF(t)+ivG(f)]—l) dt_f

— OO

(3.11—3)

188

часть ii. теория флуктуационных шумов

где v есть ожидаемое число событий (т. е. для дробового эффекта — попаданий на анод электронов) в 1 сек. Плотность вероятностей для IhJ равна

+ во +во

1С С —iuJ—ivJ

4**)^du)^dve КМ- (3.11-4)

Семиинварианты Х_т,„ находятся из

* \ Iog f(u, v)=Y Ц-5 №* («>)"+Tj [(ш)*, (ш)*]

т!п!

т, я—1

и равны

+ «>

W,.»=v J F^m(f) G"(t)dt. (3.11-5)

— oo

Когда v—»-оо , распределение IhJ сходится к двумерному нормальному закону. Приближение к этому нормальному закону можно найти, следуя методике раздела 1.6. Из допущения (3.11—2) следует, что X₁₀ и X₀₁ равны нулю. Из соотношений между моментами второго порядка и семиинвариантами X имеем

+ oo — oo

+ ~

Ы=Wi+Wo Wi-v J F(I) G(t) dt, (3 11 -6)

-oo

+ оо

|*22 = X₀2+^1 = V f G\t)dt.

Здесь индексы при fi отличаются от индексов при X, причем это изменение сделано для того, чтобы привести индексы в соответствие с разделами 2.9 и 2.10, так что можно сразу написать нормальное j распределение.

Глава IV

ПРОХОЖДЕНИЕ СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА

Здесь будут рассмотрены две проблемы, относящиеся к прохождению шумов через детекторы или другие нелинейные устройства. Первая относится к статистическим свойствам тока на выходе нелинейного устройства, т. е. среднему значению тока, флуктуа-циям вокруг этого среднего значения и т. д.

Вторая проблема может быть сформулирована более определенно: дано нелинейное устройство, на вход которого подается либо одно только напряжение шумов, либо напряжения шумов и сигнала. Каков будет энергетический спектр на выходе?

При написании этой главы полезным оказалось ознакомление со статьей Беннета ¹K а также с рукописью вскоре выходящей статьи Миддльтона ²K

4.1. ТОК НИЗКОЙ ЧАСТОТЫ НА ВЫХОДЕ КВАДРАТИЧНОГО

ДЕТЕКТОРА

Пусть ток на выходе устройства / следующим образом связан с входным напряжением V:

/=аР», (4.1—1)

где a=const. Если энергетический спектр V ограничен сравнительно узким диапазоном частот, то энергетический спектр / состоит из двух частей. Одна часть сосредоточена вокруг удвоенной средней частоты спектра V_i а другая — вокруг нулевой частоты. Нас интересует низкочастотная часть. Ток, соответствующий этой части спектра, будет обозначаться I_n. Это ток, который должен протекать на выходе, если включить фильтр нижних частот для отфильтрования верхней части спектра. Удобно разделить I_tl на две составляющие

_ W=U+U (4.1-2)

¹I Цитирована ранее (раздел 3.10). В следующих разделах при ссылках на статью Беннета и рукопись Миддльтона упоминаются только фамилии авторов.

²) Автор, повидимому, имеет в виду работу Миддльтона «Реакция линейного и кьатрагичного детекторов на флуктканионные шумы», опубликованную в Journ. Appl. Phys., Г/, 778, октябрь 1946. (Прим. ред.)

190

ЧАСТЬ П. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

где индексы обозначают, соответственно, «полная низкая» частота (//), «постоянный ток» (dc) и «низкая частота» (//). Имеем

Cc ⁼ I а*

TTf=V_il-I_dP=Ih-Iic • (4.1-3)

Простейший способ нахождения I_dc состоит в возведении в квадрат данного выражения для V и выделении членов, не зависящих от времени. Поэтому, если

V=P cos pt+Q cos qt+V_N, (4.1 —4)

то получим

[^fT + "2¹ + Щ • (^4Л~⁵>

I_lf может быть, конечно, определен путем выделения низкочастотных членов. Вместо этого здесь будет развит на примере квадратичного детектора, а в следующем разделе — линейного детектора общий метод исследования статистических свойств тока на выходе нелинейного устройства, когда входное напряжение ограничено относительно узким диапазоном частот.

Если низкочастотные составляющие спектра целиком пропускаются фильтрами, то

(4Л-6)

где R — огибающая напряжения V. Плотность вероятностей и статистические свойства I_tl могут быть найдены из этого уравнения, если известна функция распределения R¹). Прежде чем рассматривать эти свойства, докажем справедливость (4.1—6).

Уравнение (4.1—6) является частным случаем более общего решения, полученного в разделе 4.3. Его справедливость может быть показана рассмотрением примера

V=P cos pt+Q cos qt+V_N, (4.1—4)

где /р=р/2тс и f_q=ql2-k лежат внутри, либо примыкают к частотному диапазону напряжения шумов V_n.

¹J Если часть низкочастотного спектра не пропускается, то вопрос усложняется. I_dc может быть найден, как и выше, но для нахождения If_f необходимо сначала определить энергетический спектр / (раздел 4.5) и затем проинтегрировать по соответствующей его части. Что касается распределения I_ifi то пока можно только утверждать, что оно находится между распределением по уравнению (4.1—6) и нормальным распределением, которого оно достигает, когда только узкий участок низкочастотного спектра пропускается фильтром звуковых частот (раздел 4.3).

_rjl. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 191

Применяя формулы типа

COS pt = COS [(J) — ojt + uj] = COS (р — (D_m)/ COS (D_m/ —

X₄ — sin (р — (D_m)/ sin ш_т/, (4.1—7)

можно отнести все члены к средней частоте диапазона /_т=ю_т/2тс, как это сделано в (3.7—2) и (3.7—4). Таким образом, получим

V=A cos ш_т / — В sin (о_т/=R cos (ш_т /+8), (4.1 —8>

где Л и Б — относительно медленно изменяющиеся функции /, равные

A=Pcos(p —(D_m)/+Q.cos (q—ю J/+S с_п cos К t — wj — w_n)_t

B=P sin (р — <oJ/+Q sin — с_п sin К/ — ш_т/ — (о_п),

R²=4²+fl², #>0> (4.1-9) tg0 = 5A4.

Такое определение R было также дано в (3.10—22, 23, 24). Огибающая V есть R_t а выходной ток равен

/=OcR² JX- + -J- ^cos (2<%/+26)]. (4.1-10)

Так как R — медленно изменяющаяся функция времени, то такой же функцией является и R². Энергетический спектр R² ограничен частотами, значительно более низкими, чем 2/_т, и в результате энергетический спектр R² cos (2<o_m/-j- 20) сосредоточен вокруг 2f_n. Поэтому единственным членом в уравнении для /, соответствующим низкочастотному выходному току, является aR²/2, что и нужно было доказать.

Возвратимся теперь к статистическим свойствам I_tl. Во-первых, рассмотрим случай, когда напряжение V состоит только из одних шумов V=Vn₉ так что плотность вероятностей для огибающей R равна

-Хв-*'^/2фо ' (3.7-10)

где

отк

ф₀=[эфф. знач. V_n]²=V^ (4.1-11)

- у aR~² Г «F² R -R^l4ojr> , О

If_f= lJ-ll=]++e-«'²*>dR-&=a?y₀. (4.1-12)

Во-вторых, рассмотрим случай, когда

V=V_n + Pcospt, (4.1—13)

192

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

где р/2тс лежит вблизи полосы частот шумов Vn* Плотность вероятностей для огибающей R равна

W--^sSr-WTr)- <³-">-'»

Отсюда и из уравнений (3.10—12), (3.10—13) найдем

I_dc=^jI¹-= *% + ^~, (4Л-14)

Ifi=L- Rⁱ = а*[ 2Го + 2Р²фо + "Г"].

Tf_f = Tj_l- f_dc=*4%+P?) ф₀. (4.1-15)

В (4.1—14) ф₀ есть средний квадрат напряжения шумов V_n, а R²/2 — средний квадрат сигнала. Эти уравнения показывают, что I_dc и эффективное значение I_lf не зависят от распределения энергетического спектра шумов Vv до тех пор, пока входное напряжение V ограничено относительно узким диапазоном частот. Другими словами, хотя это распределение и влияет на выходной энергетический спектр, но оно не влияет на постоянную составляющую и эффективное значение I_lft когда ф₀ и P заданы. То, что это справедливо для большой группы нелинейных устройств, было указано Миддльтоном (см. конец раздела 4.9).

Когда входное напряжение равно

V = V_n+ P cos pt+ Q ccs qt_t (4.1—4)

p=+q₉ получим из уравнения (3.10—25)

Cc= T Я² = *(Л+-Г⁺-2-)'

Ih- 4~R⁴' (4.1—16)

4.2. ТОК НИЗКОЙ ЧАСТОТЫ НА ВЫХОДЕ ЛИНЕЙНОГО ДЕТЕКТОРА

В случае линейного детектора

/ ₌ /0, V<0, (4 2^7)

¹ Uv₉ v>o, ⁽⁴*^z ^[)

и выходной ток низкой частоты, считая, что фильтр звуковой частоты отсутствует, равен *)

In = ^ (4.2-2)

*) Автор рассматривает случай безинерционного детектирования. (Прим. ред.)

ГЛ. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 193

Здесь, как и в аналогичном случае (4.1—6) при квадратичном детекторе, предполагается, что подводимый сигнал и шумы лежат внутри относительно узкого диапазона частот. Эта формула может быть использована для вычисления плотности вероятностей и статистических свойств I_tv если известны необходимые данные об огибающей R приложенного напряжения.

Справедливость (4.2—2) может быть доказана рассмотрением выходного тока /. Он состоит из положительных полуволн aV, огибающая / тождественна огибающей aV. Однако площадь, лежащая под кривой /, составляет только 1/тс площади, лежащей под кривой aR; именно таково соотношение площади, ограниченной кривой sinx:, к площади прямоугольника, имеющего единичную высоту и длину 2тс. В результате ток низкой частоты изменяется по закону aR/тс.

Если V состоит из синусоидальных колебаний и шумов

V = V_N + Pcospt, (4.1—13) то среднее значение I_tl равно

= «(&)'"-"^г[<1+*>'4т)+*'.(т)) (4.2-3)

где I₀₁ I₁ — бесселевы функции мнимого аргумента,

_х ₌Л1₌ сред, мощность синусоид, колебаний (4.2—4) ²^⁰ сред, мощность шумов

а ф₀ есть среднее значение Vn- Уравнение (4.2—3) следует из формул (3.10—12) и (4.В—9)¹). Если х велико, то асимптотическое разложение (4.В—3) для iFi дает

J (4-2-5) Подобным же образом средний квадрат тока I_tl равен

W= +& = + (Р* + 2%), (4.2-45)

а средний квадрат тока низкой частоты /,,, (без постоянной составляющей) равен

ITf=Ifi-Ii_c .

¹J Сч. Приложение 4В. (Прим. ред.)

194

ЧАСТЬ II. ТЕОРИЯ. ФЛУКТУАЦИОННЫХ ШУМОВ

________L

Если х велико, то

W/W(4-Sr )=SUo(l-+ ), (4.2-7)

а если х =0, __

'>=-£ фо(2-+. (4.2-8)

Кривые I_dc приведены на фиг. 1,2 и 3 статьи Беннета. JOh также приводит на фиг. 4 кривые, показывающие зависимость Г(/ от х. Из них следует, что влияние комбинационных членов высшего порядка мало, когда I_lf находится путем сложения низкочастотных комбинационных тонов.

Если напряжение V состоит из двух синусоидальных колебаний и шумов &

V = V_n + P cos pt + Q cos qt, (4.1 —4)

то в среднее значение /_/; по уравнению (3.10—25) входит двойная функция J^₁

-«(M^bSSFfe-^(Ff). <«-⁹>

A=O

где

^х=~Що* ^у=Щ~о* ^(г) —полином Лежандра . (4.2—10)

Если х велико и у<Сх₉ то из (3.10—27) получим асимптотическое выражение

A=O

Функция ₂Pi может быть выражена через полные эллиптические функции EhK модуля у*¹* дг-^,;». Поэтому

.".(-FU >U)-U4(--U*

^ ■ ,F,+ ,+Ih U -U • (3.10-28)

а высшие члены могут быть вычислены по рекуррентному уравнению (3.10—29)*. Первый член £=0 в (4.2—11) дает I_dcf когда шумы отсутствуют.

_гЛ. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 195

Средний квадрат тока I_tl равен

П » +&=+ (2фо + P*+Q²) < (4.2-12)

Из этого уравнения, а также из выражения для I_dc может быть найдено эффективное значение тока низкой частоты (за вычетом постоянной составляющей). Например, когда шумы невелики,

+2*.[|-.ъ(-+-+,1 + )4-])- (4.2-13)

Член, не зависящий от ф₀, дает средний квадрат тока низкой частоты в отсутствие шумов. Когда Q уменьшается до нулй, (4.2—13) сводится к главному члену (4.2—7), как и должно быть. Если P=Q₉ то формула негодна и необходимо пользоваться асимптоти-ческим^значением

Ввиду нестрогого характера выводов в разделе 3.10 представляется ценной численная проверка эквивалентности уравнений (4.2—9) и (4.2—11). Для этого во второй ряд (4.2—9) подставляем значения х=4, у=3. Оказывается, что наибольший член в суммировании имеет место при £=11. В общем, учитываем 24 члена. В результате получаем

= 2/5502.

Для тех же значений х и у асимптотический ряд (4.2—11) дает

2,40+0,171 +0,075+0,052+ •

Если остановиться перед третьим членом, то сумма равна 2,57 При включении наименьшего члена получим 2,65. Соответствие результатов показывает, что (4.2—11) действительно является асимптотическим разложением (4.2—9)

Если входное напряжение имеет вид

_ V= Q(l +£ cos pt) cos qt+V_N, то можно воспользоваться уравнением

-Rn ₌₍2_to)»/2r(l + ++J₁Fi + + Г; ^(1 +*cos 8)«] db,

(4.2-14)

196

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

где R — огибающая по отношению к частоте q/2iz₉ а у находится из уравнения (4.2—10). Интеграл может быть вычислен путем представления в виде степенного ряда и почленного интегрирования, пользуясь соотношением

X-j(l+£cos 8)' cosmb M = о

= ⁽-i3fW)^m₂W[+-, *+Ь»;т+1;*]. (4.2-15) где т — неотрицательное целое число, / — любое число, (a)_m = a(a+l)...(a+m-l)_f (a)₀=l, (O)₀=L

Интеграл может быть также взят при помощи присоединенных функций Лежандра.

Применяя методы раздела 3.10 к (4.2—14), приходим к следующим выражениям:

^=Q²(l+4)+²V

fw_iw_M ( 1 ч (4.2—16)

R - Q Y М'И* Л (s- L * s; 1; *²)

s=0

где асимптотический ряд применим, если у очень велико, а £ не слишком близко к единице. Из этих выражений

W -S- {Q² ^jX +«2-(1+)-'''] + •••}• (4.2-17)

Сопоставление коэффициентов при ф₀ в (4.2—17) со сплошным участком выходного энергетического спектра не будет правильным*

Основная составляющая, вносимая в Iff сплошным участком энергетического спектра, есть а²ф₀/тс², т. е. как и в (4.2—7), если £=0. Разница между этим значением и соответствующим членом в (4.2—17) появляется, повидимому, из-за того, что амплитуда выделенного сигнала не точно равна aQ£/ir, но оказывается измененной вследствие присутствия шумов. Это обстоятельство можно было ожидать по физическим соображениям, так как изменение в уравнении (4.2—7) P₉ скажем удвоение, незначительно сказывается

на токе/²/ в (4.2—7), который обусловлен исключительно сплошным участком шумового спектра. Модулированная волна может рассматриваться как результат медленных изменений Р.

4.3. НЕКОТОРЫЕ СТАТИСТИЧЕСКИЕ СВОЙСТВА ТОКА НА ВЫХОДЕ НЕЛИНЕЙНОГО УСТРОЙСТВА ОБЩЕГО ТИПА

Рассматриваемая задача такова: дано нелинейное устройство, ток на выходе которого связан с входным напряжением соотношением

_гЛ. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ» УСТРОЙСТВА \ 97

/ = X-J F(iu) e?^Vudu, (4. А—1)

которое приведено в Приложении 4А¹). Пусть входное напряжение V наряду с сигналом содержит и шумы. Выберем для исследования на выходе некоторую полосу частот. Каковы будут статистические свойства тока в этой полосе частот?

Решение этой задачи в таком общем виде представляется трудным. Однако два следующих утверждения будут справедливы.

1. По мере сужения полосы частот на выходе статистические свойства соответствующего тока приближаются к свойствам шумовых токов, рассмотренным в главе III (полагая, что гармоники сигнала не попадают в эту полосу частот). В частности, мгновенные значения токов распределены по нормальному закону.

2. Если входное напряжение V ограничено относительно узкой полосой частот, то энергетический спектр выходного тока / сосредоточен вокруг нулевой (постоянная составляющая), 1-й, 2-й и т. д. гармоник средней частоты полосы частот напряжения V. Выходной ток низкой частоты, включая и постоянную составляющую, равен

I_a = A₀(R) = Uj F(iu)J₀(uR) du, (4.3-11)

где R — огибающая V

Огибающая п-й гармоники выходного тока при п>0 равна

^Ап (#) = ~!r[ Hiu)J_n(uR) du. (4.3-1)

Тогда

I =S ^An(R) ^cos (п*т t + ^nQ)> (4.3-9)

где/_т=ш_т/2тс—средняя частота полосы частот напряжения V, а 6— сравнительно медленно изменяющийся фазовый угол. Результаты, полученные в разделах 4.1 и 4.2, являются частными случаями этого уравнения.

Заключение о том, что мощность шумов в каждой полосе частот на выходе (в полосе частот, соответствующей данной гармонике f_m) зависит только от!/^=ф₀и не зависит от спектра Vn, где Vn— составляющая напряжения шумов во входном напряжении V₉ может быть также получено из (4.3—9). Замечаем, что полная мощность в п-й полосе частот зависит только от среднего квадрата

*) Здесь F (ш) представляет собой преобразование Фурье вольтамперной характеристики нелинейного устройства. (Прим. ред.)

198

' ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

огибающей A_n(R) и что в плотность вероятностей огибающей R напряжение шумов Vn входит только через ф₀.

Обоснование первого утверждения не является вполне удовлетворительным. Оно сводится к следующему. Выходной ток / может быть разделен на две составляющие. Одна, обусловленная сигналом, состоит из синусоидальных членов. Другая является шумовой составляющей.

. Здесь будет рассматриваться последняя; обозначим ее I_n, Корреляция между двумя значениями I_n, разделенными промежутком времени, стремится к нулю, когда этот интервал становится большим. Пусть т будет промежуток времени, достаточно большой для обеспечения существенной независимости двух значений In- Выберем промежуток времени T достаточно большим так, чтобы он заключал в себе много интервалов продолжительностью т. Разложив I_n в этом промежутке в ряд Фурье, получим

г а₀ . V* / 2тсп/ , , . 2те/гЛ

С = — +Zj \^ап cos-^+^sin -ут- I

/2=1 \ /

^т_г (4.3-2)

а_п — й_п = —\ е I_n(I) dt. о

Пусть рассматриваемая полоса частот простирается от /₀—р/2 до Zo+P/² ^и ^ПУ^СТЬ

^T(fo—f") = ^T(fo+ 4")= ^п*> (⁴'³"³)

где п_г и п₂ — целые числа. Число составляющих тока в этой полосе частот будет (п₂—п_х). Полагаем [5 существенно меньшим, чем 1/т. Выходной ток в этой полосе частот

^Пг I \ In= S kcos^ +Ь_я*хпЩ , (4.3-4)

где

о Г -i2«ff-/o)/ -Wo*

"n-^ibn = 4- \ ^е ^е C(t)dt₉

„ , „ „ , „ (4.3—5)

п = Eip + п - ^rLp = f₀T+(n-f₀T).

Полоса частот выбрана настолько узкой, что

Яг — — или jfr < 1.

(4.3-6)

ГЛ. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 199

Это дает возможность написать приближенно

где T₁= а Г выбирается таким, чтобы T₁ было целым числом. Допустим, что так проделано с большим числом промежутков длительностью каждый Т. Тогда I_N(t) будет различным при переходе от интервала к интервалу. Группа интегралов для г=1 дает ряд значений, которые можно рассматривать как определяющие распределение комплексной случайной переменной, скажем х_г. Аналогично ряд интегралов для г=2 определяет распределение второй случайной переменной X₂ и т. д. вплоть до х_Гх. Вследствие выбора -z настолько большим, что значение In (t) в данном интеграле практически не зависит от его значений в других интегралах, можно сказать,, что Jt₁, #₂,..., х_Гх являются независимыми. Получаем

S -z2itW-/₀)rT

г=1

CLn_lIl —/&_Bl ₊ i =2j ^е ^Хг> Ul -Ю* (р -/₀)гт

a_n% — ibn₉ =Zje X_r

Если п₂—I₁^r₁, как это предполагалось в (4.3—6), то можно применить центральную предельную теорему для доказательства того, что а_ПхУ Ь_ПхУ а_Пх+1, . . .,а_я>, Ь_п% стремятся стать независимыми и нормально распределенными вокруг нуля, по мере того, как ширина полосы P—► 0, а T—»-оо (и, следовательно, г_х—► оо) таким образом, что (п₂—Ti₁) поддерживается постоянным. При этом используется то обстоятельство, что ток In(I) таков, что вещественные и мнимые части Jt₁, Jt₂,..., х_г все имеют то же самое среднее значение и стандартное отклонение. Удобно полагать f₀T целым числом.

Поэтому, когда ширина полосы частот P достигает нуля, выходной ток в этой полосе In₉ определяемый (4.3—4), может быть представлен таким же образом, как (2.8—1), т. е. как это было сделано при изучении шумового тока в Главе III. Следовательно, статистические свойства In должны сходится к свойствам рассмотренного там шумового тока. Например, распределение вероятностей In сходится к нормальному закону.

200

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

В нашем рассмотрении было положено, что jft<g;l. Если напряжение V₉ подводимое к нелинейному устройству, ограничено относительно узким частотным диапазоном, скажем f_b—f_a9 то промежуток времени т (выбраннйй выше так, что /(/) и I(t+z) существенно независимы) может быть выбран порядка l/(f_b—/_а). В этом случае In ведет себя подобно шумовому току, если $/(f_b—/^значительно меньше единицы.

Теперь обратимся ко второму утверждению, сделанному в начале этого раздела. Пусть приложенное напряжение ограничено сравнительно узким диапазоном частот так, чтобы оно могло быть представлено уравнением (4.1—8) раздела 4.1,

V = RcosOo_m/ + 0), R>0, (4.1—8)

где \_т = есть некоторая опорная частота внутри полосы

частот, а R и 6—функции времени, медленно изменяющиеся по сравнению с cosw_m/. Через R обозначена огибающая V Из уравнения (4А—1)

I = H_smHH^du. (4.3-7)

Разложим подинтегральное выражение при помощи соотношения

ix COS ср

= Y^_n *^п ^cos Щ ^Jn(^x)> (4.3—8)

л=0

где е₀ есть 1, е_п есть 2, когда п>0, а J_п(х)— функция Бесселя. Поэтому

/ = 2 A_n(R) cos (n<o_m t+ nQ), (4.3-9)

л=0

где

^Ап(^р) = ⁶+J ади("#) du. (4.3-10)

Так как R есть сравнительно медленно изменяющаяся функция времени, то можно ожидать, что то же справедливо и по отношению к A_n(R)₉ по крайней мере для небольших значений п. Поэтому из (4.3—9) видно, что энергетический спектр / будет состоять из последовательности полос; n-я полоса сосредоточена вокруг частоты nf_m. Если при помощи фильтра устранить все полосы за исключением п-й, то выходной ток будет иметь огибающую A_n(R)₉когда п>1. Положив п=0, видим, что выходной ток низкой частоты равен просто

A₀(R) = Xj F(Iu)J₀(UR) du. (4.3-11)

_гЛ. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 201

Положив п= I₉ для полосы частот, сосредоточенных вокруг f_m>найдем

X^ V. (4'.3-12)

Статистические свойства выходного тока низкой частоты и огибающих выходных полос могут быть получены из соответствующих статистических свойств R. Например, плотность вероятностей для A_n(R) имеет вид

PWj-dR- (4.3—13).

где p(R) есть плотность вероятностей для R. В этом выражении R рассматривается как функция A_n.

Предполагалось, что учтены все полосы, окружающие гармонические частоты nf_m. Если учтем только, часть их, то, повидимому, статистические свойства будут стремиться приблизиться к статистическим свойствам шумового тока в соответствие с первым утверждением, сделанным в начале этого раздела.

Если применить (4.3—И) к квадратичному детектору, то* получим

ад = W

MR)—IT^j^-Clu = ^ RK Применяя (4.3—11) к линейному детектору, получим

U''")= - +

— OO

где путь интегрирования у начала координат отступает книзу.. Эти результаты согласуются с результатами, полученными в разделах 4.1 и 4.2.

В качестве последнего примера найдем выходной ток низкой частоты линейного детектора со смещением, выразив его через огибающую R приложенного напряжения. Из таблицы для F(Zw),. приведенной в Приложении 4А, видим, что F(Zw), соответствующее / = 0, VHB_fI=V-B_t V>B_t

равно

-iuB

ад)=--+^-

202

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Соответственно выходной ток низкой частоты равен

+ оо

MP)=- + [ ^е~ ^ШВ MuR) и* du,

— OO

;где путь интегрирования отступает книзу у начала координат. Когда B>R, интеграл равен нулю, так как путь интегрирования может быть замкнут на нижней полуплоскости бесконечным полукругом. Это значение также следует из физической сущности вопроса. Если —R+B<+R, то, интегрируя по частям, получим

+ оо

A₀(R) = — J UBJ₀(UR)+ RJ₁(UR)] U^du=

= — 4+4J" [BsinuBJ₀(uR) + RcosuBJ₁(uR)]u-¹ du=

° _ (4.3-14)

=-4+4^arcsin 4+4?*^= =—2+4^(—4 - 4^; 4^; 4")' —r<b<r-

Эта гипергеометрическая функция встречается опять в уравнении {4.7—6). В пределах —R<B<.R

dA₀

-Li/1-JL.

п Y ¹ Ri

Если в отрицательно, а r<C—в, то путь интегрирования может быть замкнут бесконечным полукругом на верхней полуплоскости и значение HHferpafla пропорционально вычету полюса а начале координат

Л₀(Я)=2*/(-4) (-1щ = -в.

Поэтому выходной ток низкой частоты для линейного детектора равен при 5>0 (r всегда положительно)

A₀(r)=o, r<B,> (4.3-15)

mr)=- 4+4^arcsin 4+4?*²-⁵²' ^в < r'

а при £<0 равен

A₀(r)=\B\, r<\B\, (4.3-16) mr)=+++ arcsin \JL+J-yW=&, \B\<r,

ГЛ. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 203

где значения арксинусов лежат между 0 и -^- • A₀(R) и ее первая

производная по R непрерывны.

Из (4.3—15) постоянная составляющая выходного тока при В+0 равна

и=Я-4+4^arcsin 4+4v#²-HpWdR, (4.3-17)

В L ₉ J

где /?(R) есть плотность вероятностей огибающей входного напряжения V_f т. е. p(R) имеет вид (3.7—10) для случая одних шумов и вид (3.10—11) для шумов плюс синусоидальное напряжение. Подобным же образом эффективное значение тока низкой частоты (без постоянной составляющей) I_lf может быть найдено из

72 72 г2 Ч/= hi— Idc ,

где, если В>0,

L²/=j[-Х ₊JL arcsin -A + -J- YRs -B^zJp(R) dR. (4.3-18)

Если V состоит из синусоидального напряжения с амплитудой P плюс шумы VW, то оно может быть представлено как (4.3—13), а если P значительно больше эффективного значения Vn , то распределение R приблизительно подчиняется нормальному закону. Если, вдобавок, (P-B) > (эфф. знач. V_n) >0, то (4.3—17), (4.3—18) и (3.10—19) приводят к приближениям

Cc^-L+L arcsin JL₊p_Vp^₊^_^

F.P, АЧ-фо 2 ' те 2теР

72* P²-P² . ¹ if ^ —^pT- То-

(4.3-19)

Второе выражение для I_dc предполагает, что Р>В. Если Б=0, то эти выражения сводятся к первым членам (4.2—5) и (4.2—7). Применяя другой метод, Миддльтон получил более точную формулу для этого случая.

Для данного приложенного напряжения ток I_dc(+)> соответствующий положительному смещению \B\_f связан с I_dc (—), соответствующему отрицательному смещению—|Б|, следующим образом:

U(-) = |S|+U(+)- (4.3-20)

Точно так же эффективное значение I_lf(+) равно эффективному значению ///(—). Уравнение (4.3—20) следует из физических

204

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

соображений, основанных на рассмотрении площадей, ограниченных кривой /. Оба приведенных соотношения вытекают из формул, данных Миддльтоном для случая, когда V состоит из синусоидального напряжения и шумов. Они могут быть также выведены из (4.3—17) и (4.3—18).

4.4. ВЫХОДНОЙ ЭНЕРГЕТИЧЕСКИЙ СПЕКТР

Рассмотрим теперь методы решения следующей задачи: дано нелинейное устройство и входное напряжение, состоящее либо из одних шумов, либо из шумов и сигнала. Каков будет выходной энергетический спектр?

В некоторых отношениях ответ на этот вопрос дает меньше, полезных сведений, нежели методы исследования, рассмотренные в первых трех разделах. Например, помимо определения эффективного значения, он говорит очень мало о плотности вероятностей тока, соответствующего данной полосе частот на выходе. С другой стороны это эффективное значение может быть найдено (путем интегрирования энергетического спектра) для любой исследуемой полосы частот. Описанные ранее методы ограничены случаем, когда входное напряжение занимает сравнительно узкую полосу частот. Даваемые ими сведения относятся ко всей полосе, соответствующей данной гармонике (0-й, 1-й, 2-й и т. д.) входного напряжения. Не существует другого пути для изучения выходного эффекта, когда часть полосы частот задержана фильтрами, за исключением нахождения энергетического спектра некоторой функции огибающей.

В настоящее время имеются два общих метода, пригодных для определения выходного энергетического спектра, причем каждый из них обладает своими преимуществами и недостатками. При прямом методе шумы представляются в виде суммы конечного числа синусоидальных составляющих и вычисляются типичные комбинационные тона. Выходной энергетический спектр получается из рассмотрения плотностей и амплитуд этих комбинационных тонов. Главное преимущество этого метода заключается в его тесной связи с известной теорией искажений в нелинейных системах. Вообще комбинационные тона низшего порядка являются единственными, имеющими существенное значение для мощности на выходе, и если они известны, то вопрос близок к решению. Основной недостаток метода — трудность подсчета комбинационных тонов, приходящихся на данный интервал. Однако Беннет разработал способ решения этого вопроса .

Основная идея второго метода заключается в нахождении функции корреляции для выходного тока. Отсюда выходной энергетический спектр может быть получен путем преобразования Фурье.

*) BSTJ_t 19, 587—610, Приложение В, 1940.

ГЛ. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 205

Метод функции корреляции и его варианты имеют более недавнее происхождение, нежели прямой метод.

В методе функции корреляции обойден вопрос о подсчете комбинационных тонов. Однако в некоторых случаях он становится несколько ограниченным. Вероятно, лучше всего при исследовании какого-либо вопроса иметь в виду оба метода. Прямой метод будет иллюстрирован применением его к квадратичному детектору. В дальнейшем будут приведены примеры двух решений методом функций корреляции.

4.5. ЭНЕРГЕТИЧЕСКИЙ СПЕКТР НА ВЫХОДЕ УСТРОЙСТВА С КВАДРАТИЧНОЙ ХАРАКТЕРИСТИКОЙ

Вероятно, наиболее прямой путь получения ' W(f) — энергетического спектра тока /, где

I=aV\ (4.1-1)

а V — напряжение шумов, заключается в возведении в квадрат выражения

V=VN = Y_i C_m cos ((oj-tfj, (2.8-6)

в котором C²_m = 2о)(/_ш)Д/, (о_т=2тс/_т, f_m = m&f₉ а <р_ь <р₂, w_M — случайные фазовые углы.

Значительное упрощение алгебраических выкладок достигается при замене (2.8—6) на

+ оо

^ = _T2jV ^т- (4-5-1)

Здесь добавлен член с₀/2, чтобы не было пробелов в суммировании, и введены обозначения

^С-т — ^Ст->

ч-т = -*т, (4.5-2)

а=2тсД/.

Возведение в квадрат (4.5—1) дает двойные ряды

vl=ltbH^(n+n)at'^i9m'"ⁿ =

=S-S 2 с_к-_пс_ае*«-*»-"-*°

206

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Допустим, что надо рассмотреть составляющую Vn частоты f_k=kAf. Очевидно, она равна

1 ⁺ ⁰⁰

A_k cos К/ — ф*) = -у- Y ^Ck~^nCn ^cos (^kat — Vk-n — Vn)- (4.5—3)

П— - оо

— энергетический спектр тока / на частоте f_k равен а², умноженному на коэффициент при Д/ в среднем квадрате (4.5—3),. где усреднение производится по (р. Поэтому

■+- OO + OO

nf*W = +YY Ck-nC_nC_k._mC_MX

— OO -OO

Х[ cos (kat — %__п — <?„) cos (kat -%._т- <f_m) ] >

где суммирование распространяется на тип. Пусть п — фиксировано; рассмотрим те значения т_у которые дают среднее, отличное от нуля. Видно, что т=п и m=k—п суть два таких значения. Единственные другие возможности суть m=—п и т=—k+n_fно они приводят к членам, содержащим (за исключением случаев, когда п или k равно нулю) три различных угла w_nf w_k-_n и W_k+п , усреднение по которым дает нуль. Используя то обстоятельство, что

среднее косинусов, возводимых в квадрат, есть L _и _чт0 для данного

п имеются два таких члена, получим

+во + ОС

W(I_lt)Af=+ Y d_nc²_n=**Af £ ш(/*-цад)д/,

/Z= — оу Я»= - оо

(4.5-4)

где в последнем выражении было использовано

/*__я = (k-n)Af=f_k-f_nи учтено, что из с-_п=с_п следует

w(f-_n) = w(— n Af) = w(— f_n) = w(fj. Поэтому из (4.5—4) найдем для энергетического спектра тока /

W(f)=afij w(x)w(f — x)dx, (4.5—5)

— оо

подразумевая, что /^O и что

w(—x)=w(x). (4.5—6)

ГЛ. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 207

Результат, который получается при использовании (2.8—6) с введением косинусов и только при положительных значениях т_уравен

W( f) = *²§ w (х) w (f — х) dx+2a? (*) w (f+x) dx. (4.5—7)

0 0

Он содержит только положительные значения частоты. Уравнения (4.5—5) и (4.5—7) эквивалентны и легко могут быть преобразованы одно в другое.

Первый интеграл в (4.5—7) учитывает суммарные комбинационные тона второго порядка, а второй интеграл — разностные комбинационные тона. Это можно показать путем написания тока в виде

оо оо

/ = aV* = a Y Y ^ст°пcos(")_mt — <£>J cos (ш„/ —w_n) =

m = l л = 1

OO OO

S S °т^Сп {c0s[K-o>_n)t-W_m + W_n] +

^m=i /2=1

+cos[(o>_m+i»_n)t+w_m+io_n]}. (4.5-8)

Мощность в полосе частот (fk, fk +М) состоит из мощности, создаваемой разностными комбинационными тонами (щ+i — ^_l) ,плюс мощность, создаваемая суммарными комбинационными тонами (^k-i+ ^i). В первом случае / пробегает от 1 до оо, а во втором случае/ пробегает от 1 до k—1.

Рассмотрим сначала разностные комбинационные тона и на момент предположим, что как £, так и / фиксированы. Два ряда значений m=k+l, п=1 и m=l₉ n=k+l суть единственные значения т и п в (4.5—8), дающие частоты (щ+i— ю,). Два соответствующих члена в (4.5—8) равны, так как cos (—х) равен cos х. Средняя мощность, связанная с этими двумя членами,

(-у- CkTl C₁ ) 4C0S²[(tD_A+z — (D_i)/ — <Pa+z+<P/] =

= L(OLC^₁C₁)Z. (4.5-9)

Мощность в полосе частот (fk, f_k+Af)₉ связанная с разностными тонами, получается суммированием по / от 1 до оо :

₂ OO OO ос

-\Y^cTc} = 2** Y w(f_k+i) w (I_l)(Af)*^ 2а* Af § w(f_k+f)w(f)df.

z=I z=I о

Это приводит ко второму члену в (4.5—7).

208

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Рассмотрим теперь суммарные комбинационные тона. Для членов такого типа в (4.5—8), приводящих к частоте <о_л, m+n=k. Пусть л=1, тогда m=£—1. Фаза этого члена по отношению ко всем другим членам случайна, за исключением одного члена, соответствующего n=k—1, m=l, который имеет такую же фазу. Средняя мощность, вносимая этими двумя членами в (4.5—8), равна, как и в (4.5—9),

l(_a C₁C_k-I)*.

Она связана с двумя членами, для которых m+n=k. Положив л=2 и проделав ту же процедуру, получим еще два члена. Поэтому, предположив, что k — нечетное число, найдем, что мощность, создаваемая в интервале (/>, f_k J-Af) суммарными комбинационными тонами, равна

<*-п/2 *-i f_k

\ Y -J-E l?^CnCk-nY-+ °?Af \w(f)w(f_k-f)df₉

л=1 п=1 S

что приводит к первому члену в (4.5—7).

Если напряжение V₉ приложенное к устройству с квадратичной характеристикой, является суммой напряжения шумов V_n и синусоидального напряжения

V=Pcosp/+V_;V, (4.1 — 13)

то получим

V²=P²COs²pt+2PV_N cospt+Vl- (4.5—10) Из двух уравнений

cos²p/ = -J- + -L cos 2р/,

АЛ оо 1 о

следует, что /=aV² имеет постоянную составляющую

^a-L + a]w(f)df₉ (4.5-11) о

что согласуется с (4.1 — 14), и гармоническую составляющую

^L² cos 2р/. (4.5-12)

ГЛ. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 209

Сплошной участок энергетического спектра W_c(f) определяется остальными членами (4.5—10)

2PV_N cos pt+ V*.

Используя (2.8—6), видим, что м

2PV_NCOS pt = PY C_m [COS (O)_jfl/ + pt— w_m) + cos (p_mt — pt— (D_m)].

Предположим, что р=2тсгД/. Члены, имеющие отношение к частоте f_n=nAf₉ это те, для которых

% + P = ²^n* hm — P I = ²^fп>

т + г = п₉ \т — г\ =п₉

т = п — г_г т = г ± п₉

где должны быть приняты во внимание только положительные значения т. Если п+>г₉ то т=п—г или т=г+п. Если п<г₉ то т=г—п или т=г+п. В обоих случаях значениями т являются I л—г I или п+г. Члены частоты f_n в выражении для 2PV_ncos pt поэтому равны

РС\ n-r \ COS (2тс/_п/ — (?, _л__г ₁ ) + РСп + г COS (2izf + — (D_n ₊ _r)_t

а средний квадрат этого выражения, если усреднение взять по (D₉равен

-¾ - г , + <4₊, ) = [ H U п-г ,) +XUn ₊ r)] =

= _P2Af[w(\f_n-f_p\) + w(f_n+f_p)]₉

где f_p=p/2n.

Добавляя еще выражение (4.5—5), полученное йз Vh₉ видим, что сплошной участок W_c(f) энергетического сцектра тока / рдвен

w_c(f) = **p*[w а -I_p)+w а+I_p)] +

+ OO

+ afi jw (х) w(f — x) dx, (4.5—13)

— OO

где w(—f) имеет такое же значение, что и w(f).

Уравнение (4.5—13) было использовано для вычисления W_c(f) (фиг. 8). Предполагается, что составляющие входных шумов имеют одинаковые амплитуды в полосе частот шириной [J с центральной частотой f_v (ср. фильтр C₉ Приложение 4С). Рассматривая площадь, ограниченную кривой низкочастотной части спектра, найдем P

\^Wc(f)df = *²$w₀(P*+$w₀). * о

210

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Так как средний квадрат входного напряжения Учесть ф₀=рш₀, то это уравнение совпадает с выражением (4.1—15) для среднего квадрата тока I_lf (ток низкой частоты без постоянной составляющей). Если фильтры звуковых частот срезают часть спектра, то, чтобы получить средний квадрат соответствующего выходного тока, W_c(J) следует интегрировать по сохранившейся части спектра, о чем упоминается в примечании к уравнению (4.1—6).

^lWctt)

2с

Вход сигнал

Вход, шумы

p^r —»

-г—

2f_P-P

2f_p тр-

» .8/2 P

Фиг. 8. Сплошной участок спектра на выходе устройства с квадратичной характеристикой.

Напряжение на входе—Pcos t+ V_jj. Постоянная составляю-

щая на выходе

Когда напряжение V состоит из напряжения шумов V_n и двух синусоидальных напряжений, частоты которых не являются кратными:

V = Pcospt + Q cosqt + V_n,

то можно показать, что сплошной участок W_c(J) энергетического спектра тока / равен (4.5—13) плюс дополнительные члены

_a2q2 _[w{f _ _ffl)H_ _w(f ₊ _fq)]t (4.5-14)

где J_q = q/2*.

Если напряжение, приложенное к устройству с квадратичной характеристикой (4.1—1), равно

V(f) = Q(\+k cos pt) cos qt + V_n = = Q cos qt + Щ eos(p+q)t + ^ cos (p - q) t + V_n ,

то результирующий ток содержит постоянную составляющую

во

Q J1 + +j + « jHf)df. (4.5-15)

ГЛ. ГУ. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 211

Синусоидальные члены тока / можно получить возведением а квадрат

Q(l + k cos pt) cos ^/

и умножением на а. Оставшаяся часть тока / имеет сплошной энергетический спектр

W_c(f) = a2Q2

w(f-f_q) + w(f + f_q) +

+ 4

₄ «"Vf Ip IqJ i 4

¹ +

+ L

+ с

w(x) w(f — x) dx_f (4.5—16)

где J_p = р/2тс и J_q = q/2iz.

4.6. ДВА МЕТОДА ФУНКЦИИ КОРРЕЛЯЦИИ

Как упоминалось в разделе 4.4, эти методы определения выходного энергетического спектра основаны на нахождении функции корреляции W(z) для выходного тока. Отсюда энергетический спектр W(J) выходного тока можно определить из (2.1—5), переписанного в виде

W(J) = 4 j* W(x) cos 2ф dx. (4.6-1)

Напомним, что W(J)Af может рассматриваться как средняя мощ~ ность, которая рассеивалась бы составляющими тока /, лежащими в полосе частот (/,/+А/),если / протекает через сопротивление 1 ом.

Допустим, что на вход нелинейного устройства подано напряжение V(t). Оно может состоять из напряжения шумов V_n(t) плюс синусоидальные составляющие. Предположим, что ток на выходе есть /(/). Нелинейное устройство характеризуется связью между V(t) и /(/). В данной рабрте предполагается, что /(/) в момент / полностью определяется значением V(t) в момент /. Будут описаны два метода нахождения ¹J^rCO: а) интегрированием двумерной плотности вероятностей для V(t) и V(t+x) в пределах, заданных свойствами нелинейного устройства; этот метод является наиболее прямым в случае, когда> на детектор действуют только одни шумы;

212

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

б) введением и использованием характеристической функции двумерной плотности вероятностей для V(t) и V(t+x); ради краткости характеристическая функция будет обозначаться х. ф.

4.7. ЛИНЕЙНОЕ ДЕТЕКТИРОВАНИЕ ШУМОВ — ПЕРВЫЙ МЕТОД

Первый метод исследования будет иллюстрирован применением его к определению энергетического спектра на выходе линейного детектора, когда входное напряжение состоит только из одних шумов.

Линейный детектор характеризуется следующими соотношениями:

^У) WQ₉ V(f)>0, (4.7-1)

которые могут быть получены из (4.2—1), если положить <х=1, а входное напряжение равным

VQ-VnV), (4.7-2)

где Vn(I) — шумовое напряжение, функция корреляции которого есть ф(х), а энергетический спектр w{f).

Функция корреляции Щх) есть среднее значение I(t)I(t+x)₉которое равно среднему значению функции

F(V_vV_i) = № ^когда ^V* >0. (4.7-3)

^х ¹ ' \0, при всех других V_y ⁴

где было положено

V₁ = Vtf), V₂ = Vtf + +

Двумерное распределение для V₁ и V₂ находится из (3.2—4), откуда следует, что среднее значение функции F(V_V V₂) есть

+ во +о

(%V\ +%У\-Ц_%УУ^, (4.7-4)

2 |Af|

— ао — оо

где

|М| = Фо²-е

Для случая линейного детектора, когда F(V_ljV₂) находится из (4.7—3), интеграЛ равен

OO OO

I^r^v'ij ^dv^ ^dV₂V₁V₂ ехр -щщ^+МХ-ЦУм] =

ГЛ. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 213

(Фо — ФЭ*'¹ + фх arccos

-Фт

Фб

где ДЛя Вычисления интеграла было использовано (3.5—4). Значение арккосинуса берется в пределах от 0 до тс. Итак, функция корреляции для /(/) равна

= Jr

(фо —ф?)¹'*+ фх arccos

— Ф„

(4.7-5)

Отсюда при помощи (4.6—1) может быть получен энергетический спектр Wtf). С этой целью удобно написать (4.7—5) через гипергеометрическую функцию. Путем разложения и сравнения членов найдем

щх) = 7₊_J_. _L. + ₌

^W 4 ⁺ 2* Ц 2 ' 2 ' 2 ' ф§ /

Ф?

(4.7-6)

_ Fx

= J₇L л.+.л.++ + члены с ф*, ф? и т. д..

4 2и 471+

Как будет более подробно изложено в разделе 4.8, постоянный член A² в ЧГ(т) относится к постоянной составляющей тока /(/) силой в А ампер. Поэтому /(/) имеет постоянную составляющую, равную

V₈

X [эфф. знач. V(t)].

(4.7-7)

2тс

/2тс

Это совпадает с (4.2—3), если положить P равным нулю. Интегралы вида

W(Z)=Jt?

cos 2тс/х dt,

которые получакпгся, если (4:7—6) подставить в (4.6—1) и почленно интегрировать, рассматриваются в Приложении 4С. Из приведенных там результатов видно, что если пренебречь ф£ и высшими степенями, то получим следующее приближение для сплошного участка W_c(J) спектра W(J):

W_c(f)*= G₁(I)++ =

Mf)

¹ Ul w(x)wtf —x)dx,

(4.7-8)

4 ' 4тхф₀ 2 где w(—/) определено как wtf).

214

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Если спектр Vn(I) равномерен в сравнительно узком диапазоне, простирающемся от J_a до J_by так что w(f) равен W₀ в этом диапазоне и нулю вне его, то можно воспользоваться полученными в Приложении 4С результатами для фильтра с. Приведенные там величины /о и P связаны с J_a и J_b следующим образом:

fa ~ fo I » fb ⁼ fo~\ 2 '

а значение W₀ такое же, что и в данном случае, и равно L_e Приведенное там значение Gz(J) ведет к следующему приближению для низких частот:

WJ ('-O = U¹-W ^

КОГДа 0 <f<(f_b-fa)> И К W_c(J)^O ДЛЯ (f_b-fa)<f<fa.

Положив для кривой W_c(J) (фиг. 8), соответствующей квадратичному детектору, P=O, видим, что форма низкочастотного участка спектра представляет собой треугольник, а при /=P спектр равен нулю. Поэтому из (4.7—9) можно придти к заключению, что в первом приближении форма выходного энергетического спектра в случае линейного детектора такова же, что и для квадратичного детектора, если входное напряжение представляет собой шумы в сравнительно узкой полосе частот.

Приближенное эффективное значение низкочастотного выходного тока может быть получецо интегрированием (4.7—9)

_ VL

ib = \^wc(f)dj^ ~~^wM£7~~~~^fa)~~=i>

откуда

эфф. знач. тока н.ч.^ -т=Х [эфф. внач. приложи напряжения].

У 8те

(4.7—10)

Как видно, этот ток равен половине постоянной составляющей. Следует помнить, что (4.7—10) является приближением, так как мы пренебрегли ф£ и высшими степенями. Точное значение может быть получено из (4.2—8). Тогда коэффициент (8^)-^=0,200 следует заменить на

2—⁷L J^u=о, 209.

Для других типов полосовых фильтров можно найти W_c(J), если из Приложения 4С взять соответствующие значения G. Ока-

ГЛ. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 215

зывается, что (4.7—10) справедливо для всех трех типов фильтров. Это частный случай теоремы, упоминаемой несколько раз раньше, которая утверждает, что полная мощность любых комбинационных частот зависит только от полной мощности действующих на входе шумов, но не от их спектрального распределения. Позже в разделе 4.9 будет показано, что член ф? в (4.7—6) соответствует комбинационным частотам n-го порядка.

4.8. МЕТОД ХАРАКТЕРИСТИЧЕСКОЙ ФУНКЦИИ

Как упоминалось раньше, особенно в связи с уравнением {1.4—3), х. ф. случайной переменной х есть среднее значение ехр (шх). Она является функцией и. X. ф. двух случайных переменных х и у есть среднее значение ехр (iux+ivy)_t т. е. функция UHV.

X. ф., которой мы будем здесь пользоваться, есть х. ф. двух случайных переменных V(t) и V(t+x)₉ где V(t) — напряжение, приложенное к нелинейному устройству. Его случайный характер определяется тем, что / выбирается случайным, а х остается фиксированным. Эту характеристическую функцию можно написать в виде

\g(u₉v₉x) =^fHm L f-ехр [iuV(f)+ivV(t+x)] dt. (4.8-1)

¹ о J

Если V{t) содержит напряжение шумов Vn(I)₉как всегда будет предполагаться в этом разделе, и если используются уравнения (2.8—1) или (2.8—6), то в уравнении (4.8—1) появляется большое число случайных параметров (а_п и Ь_п или (D_n). В соответствии с применением упомянутых уравнений можно произвести усреднение по этим параметрам без изменения значения (4.8—1) и 1%м самым упростить интегрирование.

Например, положим

V(t)=V_stf) + V_N(t), (4.8-2)

где V_s(t) есть некоторое регулярное напряжение, которое может, например, состоять из одной или более синусоидальных составляющих. Подставляя в (4.8—1) и используя соотношение (3.2—7), для характеристической функции Vn(I) и VW(/+^t) найдем

g_N(u₉ v₉x) = сред, {ехр \iuV_N(t) +ivV_N(t + ^T)J I =

= ехр [ — L (u*+v*)—фх uv] ,

(4.8-3)

216

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

где ф_х E= ф(т)—функция корреляции напряжения шумов V^(Z). Для х. ф. V(Z) и V(t+x) получим

g(u,v,x) - ехр [—-L (u*+v*) — +uv] X

ХДгп L j ехр [*uV_sQ + ivV_s(t + т )J dt=g_N(u₉v₉x) g_s(u,v,x). (4.8-4)

В последней строчке g"₅(w,d,t) обозначает предел выражения в средней строчке

g_s(u₉ V₁ х) = Hm -Ljexp [Zw V_sQ + wV_s(t + х)] dt. (4.8-5)

Основной причиной, по которой удобно пользоваться х. ф., является то, что совсем немногие нелинейные устройства могут быть описаны интегралом

/= L j* F(Iu)_eⁱ^du , (4А— 1)

где функция f(Zw) и путь интегрирования С выбираются в соответствии с типом нелинейного устройства. Примеры таких устройств даны в Приложении 4А.

Функция корреляции W(x) для /(Z) равна

W(x) = Iim -L Г I(t)I(t + x)dt =

T-у оо J

T ⁰

₌ l_imU_ \dtj F(iu)e^iaV«4u$F(iv)e»^v^ dv=

г-*°° о С с

= L J f (ш) <fw J F(Zd) <fo Hm L J _ехр [Zw V(Z) + tvV(t + x)]dt =

CC U

= Lf ^Jf(Zd)£(w, d, т) dv. (4.8-6) с с

Это основная формула метода характеристической функции.

Если V(Z) есть сумма напряжения шумов и регулярного напряжения, как (4.8—2), то (4.8—6) превращается в

W(x) ^rL Г F(iu)e-W^du \ F(iv)_e ~^Ы* <Г^ФГ g_s(u₉v₉x)dv₉

" i L f (4.8-7)

ГЛ. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 217

T^cg_s(U₁V₁X) есть х. ф. для V_s(t) и V_s(t+x)_f определяемая уравнением (4.8—5). Это окончательное выражение для W(т). Все дальнейшее сводится к вычислению этого интеграла и к нахождению* из уравнения

W^r(Z) = 4 I W(x) cos 2izfxdx (4.6— 1}

энергетического спектра для /.

Весьма часто ток I(I) имеет постоянную и периодические составляющие. Представляется удобным рассматривать последние отдельно, так как они соответствуют тем членам в W(x)_yблагодаря которым интеграл (4.6—1) для W(J) расходится. Действительно, из раздела 2.2 следует, что функция корреляции вида

A*+L cos 2тс/₀т (2.2—3>

соответствует току

А + CXos (2тсу — се), (2.2—2>

где фазовый угол ср не может быть определен из (2.2—3), так как он не влияет на среднюю мощность.

Рассмотрим функцию корреляции для V(t)=V_s(t)+V_N(t). Она равна

I_im JJ \ V_s(t) V_s(t + х) dt + ] V_s(t) V_N(t + T)dt +

+ \v_N(t)V_s(t+x) dt+J V_n(I)V_n (t + x)dt. (4.8-8> о о

Так как V_s(t) и V_N(f) независимы, то второй и третий интегралы исчезают.

В результате

Функция корреляции для V(f) = функция корреляции для

⁴ V_sQ + функция корреляции для V_N(t). (4.3—9>

Теперь, когда х—+Co₁ функция корреляции для V_n(I) становится равной нулю, а функция корреляции для V_s(f) приобретает приведенную выше форму (2.2—3). Таким образом, функция корреляции регулярного напряжения V_s(I) может быть найдена из V(I)₁ если положить т—►oo и собрать остающиеся члены.

Результаты, полученные для V(I)₁ справедливы и для /(/), и такая же процедура может быть Повторена при собираний тех частей W (х) , которые соответствуют постоянной и периодическим составляющим I(I).

218

часть ii. теория флуктуационных шумов

Обращаясь теперь к (4.8—7), видим, что, когда т—► oo, ф_т —►O, тогда как g_s(u, v_f т), определяемая уравнением (4.8—5) и соответствующая напряжению V_j(Z), остается, в общем, по величине неизменной. Это последнее утверждение может показаться не совсем очевидным, но исследование ряда случаев позже докажет, что оно справедливо, по крайней мере, для этих случаев. Поэтому, полагая в (4.8—7) ф_х =0, находим ту часть W(J)_f которая соответствует постоянной и периодической составляющим I(t)\

^T-W=4SiJ ^)LHzw U(W)I^^v2 _gs{UiVr)dVi (4.8-10) с с

где. индекс оо показывает, что W₀₀(J) есть та часть W(J), которая не исчезает при т -► оо.

Уравнение (4.8—9) в применении к /(Z) можно написать в виде

Т(т) = Т4т)+ВД\ V 8-11)

тде W_c(J) есть функция корреляции сплошного участка энергетического спектра тока /(Z).

Кстати, если воспользоваться импульсными функциями 8(/) для интерпретации интеграла в (4.8—6), как это изложено в разделе 2.2, то можно избежать разделения W(x) на две части в (4.8—11). Этот метод дает надлежащие значения постоянной и синусоидальной составляющих, если даже (4.6—1) не сходится [вследствие наличия членов, ведущих к ¹j^rOo(t)]

4.9. ЭНЕРГЕТИЧЕСКИЙ СПЕКТР НА ВЫХОДЕ НЕЛИНЕЙНОГО УСТРОЙСТВА ОБЩЕГО ТИПА

Чтобы иллюстрировать метод характеристической функции, рассмотрим случай нелинейного устройства общего типа, описываемого уравнением

/= L^F(iu)e^iVudu_f (4А— 1)

где V состоит из напряжения шумов плюс синусоидальное напряжение

V(Z) = Pcospt + V_N(t). J4.1-13)

Как обычно, V_N(t) имеет энергетический спектр w(f) и функцию корреляции ф(т). Ради краткости ф(т) часто записывается в виде + Сравнивая (4.1—13) с (4.8—2), найдем

V_j(Z) = PcospZ. (4.9—1)

Гл. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 21 9

Первой задачей является вычисление характеристической функции g_s(u_f v₁ х) для двух случайных переменных V_s(t) и V_s(t+*). Это можно сделать, пользуясь интегралом (4.8—5):

g_s (u₁v₁j) = Iim Tp f ехр [iuP cos pt + IvP cos p(t + j)] dt =

Г-oe ¹ g

= J₀(PVи* + v* + 2uv cos рт ) , (4.9—2)

где J₀ — функция Бесселя. Интегрирование выполнено при помощи следующей подстановки:

и cos pt + v cos p(t + т) = (и + V cos рт) cos pt — v sin рт sin pt = = уХ² + d²+ 2wd cospT cos (pt + фазов. угол), и пользуясь соотношением

Характеристическая функция для (4.1—13) была найдена в разделе 3.10.

Функция корреляции W(J) для I(t) теперь может быть получена путем подстановки найденных выше выражений в (4.8—7)

⁼ №}^dU J ^dV ^Х

'с с

X C^^uv J₀ (pyu* + v*+2uvcospx) • (4.9—3)

W₀₀(J) — функция корреляции для постоянной и периодической составляющих / согласно (4.8—10) определяется из этого уравнения, если положить ф(т) = 0.

а Если надо рассмотреть какой-либо частный случай нелинейного устройства, то соответствующая функция F(iu) может быть найдена в Приложении 4А. Так, например, F(iu) для линейного детектора есть — и~². Подстановка этого значения в (4.9—3) приводит к некоторому двойному интегралу. Если бы существовал какой-либо легкий способ вычисления этого интеграла, то тогда все было бы решено. К сожалению, до сих пор не найдено простого метода вычисления.

Здесь может быть применен один способ, близко связанный € прямым методом. Он основан на разложении

g_s(^u> ^v> ^т) = ^Jo{PV"² + с² + 2uv cos рх ) =

X= £ е_п(-Г J_n(Pu)J_n(Pv)Cosnpx; (4.9-4)

220

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Это разложение дает возможность написать те члены в (4.9—3), которые, собственно, создают трудности, в виде

е ~^^ии J₀ (РУи* + d² + 2uv cos рх) = = SS (->^Л ⁺ * ^osnpx J_n(Pu)J_n(Pv). (4.9-5)

Преимуществом применения двойной суммы является упрощение интегрирования. Подставляя ее в (4.9—3) и полагая

[П+k г»

H_nk = -^_r F(Iu) и^р J_n(Pu)_e ~ (w2)»² du, (4.9-6) с

получаем

₄ оо оо

л-О A=O

Функцию корреляции W₀₀(x) для постоянной и периодической составляющих / найдем, полагая х—► оо и ф_х ->0. Остаются только те члены, для которых £=0:

¹M*)= S ^h²₀ cosпрх. (4.9-8)

л=0

Сравнивая это с известным уже результатом, а именно, что для А + С cos (2xzf₀t — (f), (2.2—2)

функция корреляции равна

А* + L² cos 2тс/₀т, (2.2—3)

и помня, что S₀=I' ^а ^еп — ² ^для ^п>1> получим

Амплитуда постоянной составляющей тока I=h₀₀,

Амплитуда-^--ой составляющей тока I=h_n0. (⁴^ ^

Кстати, эти выражения для амплитуд почти сразу получаются при прямом методе решения, что будет показано в связи с уравнением (4.9—17).

Так как функция корреляции W_c(x) для сплошного участка W_c(J) энергетического спектра тока / определяется как

W_c(x) = W(x)-W_o0(x)_f (4.8-11) то также получаем

ВД=Ё SiFUL3„cosnpx. (4.9-10)

л=0 A=I

Гл. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 22 1

Если это подставить в уравнение

W_c(f) = 4 \ W_c(x) cos2tc/t dx, (4.9-11)

то получим

^(0=2 Sl⁵ *Ц +Gj(f иЩ , (4.9-12)

где

G_k(J) = J <|4 cos 2тс/х dx (4.9-13)

есть функция, исследованная в Приложении 4С и являющаяся четной функцией /. Двойной ряд (4.9—12) для IV_c выглядит довольно сложным. Однако если представляет интерес только какой-то определенный участок частотного спектра, то часто достаточно учесть лишь небольшое число членов ряда.

Выше упоминалось, что прямой метод нахождения выходного энергетического спектра тесно связан с только что выведенными выражениями. Исследуем теперь эту связь.

Начнем со следующего вывода теории комбинационных тонов. Пусть к нелинейному устройству типа (4А—I) подведено напряжение

V=P₀ COStf₀+/⁵!COS*!+ . . . +Pn COSXn]

X_k=Pkt₁ k = 0, 1,..., N₁ (4.9-14)

где p_k некратны друг другу. Выходной ток равен

OO QO

I-Y"' E Т^Ат₀...

TTi₀=Q TTip_j =O

... s_m^cos т₀ X₀Cos tu₁X₁... cos Tu_nX_n , (4.9—15)

где е₀ = 1, а при 1 e_m = 2. Если произведение косинусов представить в виде суммы косинусов углов tu₀x^m₁x₁... +Tu_nX_n> ^то видно, что коэффициент при типичном члене есть Л_ОТо..._т^, за исключением случая, когда все т равны нулю. Тогда этот коэффициент равен уЛ₀...₀. Поэтому

A₀...о—постоянная составляющая тока /, \А_1По..._тм \ —амплитуда составляющей частоты

-¾-1 ЩР₀±т₁р₁ ± . .. ±m_N Pn | . (4.9—16)

222

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Для всех значений т

A_m^... _ж = +г\ F(Iu) П J_rrtr(P_rU) du,

{ '=° (4.9-17) M=Tti₀J-Tn₁+ ... +m_N. Заменим (4.9—14) на

V=PcospZ+^, (4.1—13)

полагая P₀=P_f P₀=р и представляя напряжение шумов V_nв виде суммы остальных членов. Так как при этом P₁,...Pn будут весьма малыми, то способ Лапласа показывает, что в (4.9—17) можно положить

П WOWxp [- + {Pl+ ... +Р\) }ъе~*~ (4.9-18)

Здесь было использовано то обстоятельство, что ф₀ есть средний квадрат напряжения V_n. Из этих уравнений следует:

—

Постоянная составляющая / = -j^-J F(iu)J₀(Pu)e ² du_f

^С - Ьи¹

Эти результаты идентичны с (4.9—9).

Выведенные уравнения показывают, что h_n0 должно быть связано с п-й гармоникой р. Подобным же образом можно доказать, что hnk должно быть связано с комбинационными тонами создаваемыми п-й гармоникой частоты р и k элементарными синусоидальными составляющими напряжения V_n. Рассмотрим только комбинации типа Piip₂ ±Рз> ^взяв ^для примера £=3 и пренебрегая членами типа Зр_х и 2р_х+р₂. Комбинации первого из упомянутых выше типов значительно более многочисленны, а именно: число таких членов порядка N³₉ тогда как число членов последних двух типов соответственно N и N².

Итак, примем £=3 и m_lf m_2l т₃=1₉ а m₄,..., m_N=0 в соответствии с комбинационными частотами вида пр^р_х+р₂+р₃. Пользуясь приближениями, найдем

/Л+ 8 р р р P ~ Ф*^И>

я, 1.1,1,0,0, ...,о ⁼~Т~ ~~' 8~~ ³ \F(iu)J_n(Pu)u³ е ² du =

Fi F₂ P₃ # =—4-ⁿnS-

Если рассматривается какая-либо другая комбинационная частота типа пр Jzp_TxJzp_r% JcPr_t, то получается подобное же выражение,

Гл. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 223

в котором P₁ P₂ P₃ заменено на P_riP_rtP_r,. Это может быть сделано для любого значения £. Полученный результат показывает, что It_nk и, следовательно, также (п,£)-ые члены в двойных рядах (4.9—10) и (4.9—12) для W_c(x) и W_c(J) должны быть связаны с комбинационными частотами порядка (п,£), где п относится к сигналу, а £ — к составляющим шумов.

Теперь можно сформулировать теорему относительно полной мощности, связанной с комбинационными частотами данного порядка. Для выбранного нелинейного устройства (т. е. когда F(iu) задано) полная мощность, которая рассеивается всеми комбинационными частотами порядка (п,£), если ток / протекает через сопротивление 1 ом₉ равняется

Vnk(V) =--rink =-J-. (4.9—19)

Существенной особенностью этого выражения является то, что оно зависит только от эффективного значения напряжения Vn и от функции F(iu) и вовсе не зависит от спектрального распределения шумов на входе.

Доказательство (4.9—19) основано на соотношении

W_nk(O)= j w_nk(f) df

между полной мощностью всех комбинационных частот порядка (n₉k) и соответствующей функцией корреляции, найденной из (4.9-7).

Эта теорема была применена Миддльтоном для доказательства юго, что если входное напряжение ограничено относительно узкой полосой частот, так что выходной спектр состоит из ряда полос, то мощность в каждой полосе частот зависит только от Vf_f _уно не от спектра Vn-

4.10. НЕКОТОРЫЕ РЕЗУЛЬТАТЫ, ПОЛУЧЕННЫЕ МЕТОДОМ ФУНКЦИИ КОРРЕЛЯЦИИ

В этом разделе приводится ряд выводов, которые могут быть получены из теории, изложенной в разделах, следующих за 4'.6.

Если напряжение на входе квадратичного детектора, описываемого уравнением

I=OiV²₉ (4.1—1)

состоит только из одних шумов, так что V= Vn, то функция корреляции для тока / равна

Т(т)=а»(ф8+2ф|), (4.10-1)

224

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

где ф_х есть функция корреляции для Vn- Сравним (4.10—1) с уравнением (3.9—7). Если V взять в общем виде, то

W(x) = I(t) I(t + х) = сс² V²(Z) V²(t+x) =

--**Х

Ни)² (iv)²

коэфф. при ~~^v_2!⁷~~ -4^— в разложении в степенной ряд

характеристической функции для V(Z), V(Z+x)

(4. 10—2)

где было использовано известное свойство характеристической функции. Выражение для х. ф., обозначенной g(u,v,x)_f дается уравнением (4.8—4). Например, если напряжение V состоит из синусоидального напряжения и шумов (4.1 —13), то характеристическая функция находится из (4.8—3) и (4.9—2). Следовательно:

коэфф. при —v— в разложении выражения

⁴_ _г , Л ₌

a²J₀{PVu²+v*+2uv cos рх ) ехр I-J^y (и² + d²) — ф_хш? J

= а² + фо J + Ц cos2px + 2Р²ф_х cos рх + 2ф_х²]. (4.10—3)

Первые два члена дают постоянную составляющую и вторую гармонику. Последними двумя членами можно воспользоваться для вычисления сплошного участка энергетического спектра по уравнению (4.5—13).

В качестве примера приложения теории раздела 4.9 рассмотрим случай, когда синусоидальное напряжение вместе с напряжениями шумов (4.1—13) подается на вход детектора со следующей характеристикой:

⁷=о. v<o,

I=V-, v>o. ^K'^lv '

В таблице Приложения 4А находим

F(iu) = r(v+l)(ra)"^-1-

Путь интегрирования С проходит вдоль вещественной оси от —оо до +оо, отступая книзу у начала координат. Тогда интеграл (4.9—6) для h_nk приобретет вид *

h_nk = -

+*-,-1 р -V

— r(v + l)J и*—» J_n(Pu)e ² du =

2ic

Гл. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 225

P²

где х = -щ+ интегрирование выполнено путем разложения J_n(Pu) по степеням и и использования соотношения

J е~^аи2 U²¹-¹Ciu = ier**« а~Нт Xiu Г(Х) =

/ «Л (4.10-6)

²V / а Г(1-Х)

Здесь подразумевается, что arg w=0 в положительной части С.

Согласно (4.9—9), постоянная составляющая / дается уравнением

^Л°° ⁼ _2Г

Фи)

\Т) Н- — '¹'-^х) (4.10-7)

которое сводится к (4.2—3), когда v=l для линейного детектора (за исключением коэффициента а).

Если входное напряжение (синусоидальное напряжение и шумы) ограничено относительно узкой полосой частот, а нас интересует низкочастотное выходное напряжение, то следует рассмотреть разностные комбинационные тона, соответствующие комбинационным

частотам порядка (0,0), (0,2), (0,4),..... (1,1),(1,3),..., (2,0),(2,2)...

и т. д., где типичные частоты имеют порядок (n_fk). Члены порядка (0,0) и (2,0) дают постоянную составляющую и вторую гармонику и, следовательно, не учитываются при вычислении W_c(f). Из оставшихся членов наибольшее значение в рядах (4.9—12) и (4.9—10) для 1V_C(/) ^и ¹PcO^c) имеют либо (0,2), либо (1,1). Другие члены имеют все меньшее значение по мере возрастания пик. Тогда низкочастотная часть сплошного участка выходного энергетического спектра по (4.9—12) равна

Wcif) = 4г ^o²₂G₂(Z) + L-Ao²₄ G₄(Z) + • • • +

+L-A^G₁(Z-Z₀)+ G₁Q+ Z₀)]+ 4rh?_s[G₃(f-Z₀)+ (4.Ю-8)

+ G₃Q + /о)] +4\^hL W ~²fo) + ^G*(f + 2/o)l + • • •

Из табл. 2 в Приложении 4С можно определить низкочастотные части функций G. Следует помнить, что G_m(x) есть четная функция х и что 0</«/₀.

3 качестве примера пусть напряжение входных шумов Vn имеет такие же w(f) и ф(х), что и в случае фильтра а (фильтр

15 Теория передачи сигналов

226

ЧАСТЬ И. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

с вероятностной характеристикой) в Приложении 4С, так что W® =-Me-"-'^

ау 2те

Допустим, что частота синусоидального сигнала лежит в середине полосы частот, т. е. р=2тс/₀. Поэтому из (4.10—8) в случае распределения входных шумов, следующего нормальному закону, для участка низких частот найдем:

w_e(f) = * *л Го +T^j₇= d п е-+

4ау те 64зу 2те

, 2 , 2 , -/²/2а² , 1 ,2,3 —/²/6а² .

W A₂₂ H е"^//4;2 + • • • • (4.10-9)

4а/ те

Хотя здесь рассматривался детектор с характеристикой степени- v, уравнение (4.10—9) дает низкочастотный участок спектра IV_c(Z), соответствующий шумам, подчиняющимся нормальному закону, для любого нелинейного устройства, если только в уравнение подставлены надлежащие h_nk.

Частный случай уравнения (4.10—9) возникает тогда, когда на линейный детектор подаются одни шумы. Низкочастотный участок выходного энергетического спектра

те — ^ т\т\ 4/пте

_ фоте"⁸/» Г_1_ /W .__L_ . (4.10- 10)

~~ 2а 1 4 ^е +₆4/2 ⁶ ⁺

• 1 >г-/²/12

256/3"

где были применены уравнение (4.7—6) и табл. 2 из Приложения 4С. Функция корреляции для "

V_s = P cos pt + Q cos qt_t

где р и q — некратные величины, есть

J₀(PYu* + d* + 2uv cos рт) JoiQVи* + V² + 2uv cos qx).

*) См. примечание на стр. 167. (Прим. ред.)

Гл. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 227

Из уравнений (4.9—16) и (4.9—17) немедленно следует, что

Aooo = ^_rJ F(iu) J₀(Pu) J₀(Qu) _е-^{а%12)Ь du (АЛ 0-1 \у

есть постоянная составляющая тока /, если приложенное напряжение равно

P cos pt+ Q cos qt + Vn . (А. 1 —4)

Рагадзини получил приближенное выражение для выходного энергетического спектра, когда напряжение

V = V_s + ^vMy (4 ]0—\2\

V_s = Q(l + г cos pt) cos qt ^ш ¹ '

подведено к линейноми детектору¹). В наших обозначениях его выражение для сглошного участка энергетического спектра (для области низиих частот)

^c(Z) — _ni_a*(Q*+2tyo) ^Х

W_c(J) по уравнению (4.5—16) для квадратичного детектора

(4. 0-13)

В знаменателе подставлено а², чтобы сократить а² в выражении (4.5—16). Для линейного детектора было положено

>+\ IS: <*^л°-ч>

и⁴индекс модуляции k в (4.5—16) заменен на г.

Формула Рагадзини совершенно точна, если индекс модуляции г мал, особенно когда y=Q²/(2ty₀) велико. Чтобы доказать это, положим в (4.10—13) г=0; тогда

™ = *'(Q*Uo) [^Q2 ^W{f« ~^f) ⁺ ^Q2 ^W«o ⁺ ^f) ⁺

+ oo (4.Ю-15)

-f- j w(x)w(f — x)dx

где f_q=ql2iz. Это выражение нужно сравнить с низкочастотной частью W_c(F) из уравнения (4. IO—8) для частного случая линейного детектора, на входе которого действуют синусоидальное напряжение и шумы. Основные члены в (4. IO—8) дают

W_ctf) = Aj⁴₁ Iwtf f)+wtf_q + f)] +

+ OO

+ £02^- j ^wW ^w(f — ^x)^dx-

(4.Ю-16)

¹JCm. уравнение (12) в статье «Действие флуктуационных напряжений на линейный детектор», PIRE_t 30, 277—288, июнь 1942.

228

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Значения А, соответствующие линейному детектору, получаются, если положить в (4.10—5) v=l, помня, что Q теперь играет роль Р:

М = Щ~У"++;2;-у) Ao2 = (2*<l>₀r'Vi(4-; U-у)

(4.10—17)

^У~ 2+

Кстати, первое приближение для выходного эффекта линейного детектора, даваемое уравнением (4.10—16), интересно само по себе. На фиг. 9 показан низкочастотный участок W_c(f), вычислен-

WjfJ

2с

Вход сигнал

Вход, шумы

W₀ I

ii_t—

П Р/2 P

Частота

-P •

Фиг. 9. Низкочастотный участок спектра на выходе линейного детектора.

UM-SH

Постоянная составляющая на выходе=РЛ_и+рге/₀Ло1«

ный по уравнению (4.10—16) для случая, когда шумы на входе равномерно распределены в узкой полосе частот шириной (3, а J_p — средняя частота этой полосы частот. A₁₁ и A₀₂ можно определить «з кривых фиг. 10. На фиг. 9 и графиках фиг. 10 P и х заменяют Qhz/, входящие в (4.10—17), чтобы сохранить те же обозначения, что и на фиг. 8 для квадратичного детектору

Для сравнения полезны следующие значения:

когда х =0 Au=O

когда х велико

(4.10—18)

те 1

TzQ^m

А₀₂ = (2тсф₀)"^,/- Ao₂ =

Гл. IV. ПРОХОЖД. СИГНАЛА И ШУМОВ ЧЕРЕЗ НЕЛИНЕЙНЫЕ УСТРОЙСТВА 229

Значения для больших х найдены из асимптотического разложения (4В—3) в Приложении 4В.

Первое сравнение между (4.10—15) и (4.10—16) произведем,, полагая Q -+оо. Тогда оба выражения приводятся к

^wc(f) = Hf_g -f) + wQ_q + f) 1 (4.10-19)

Q|-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1

0 0,5' 1,0 1,5 2,0 2,5 3.0 3,5 kfl

у Cpeg. мощность синусоиды _ P²^л " Сред, мощность шумов ~ 2Pw₀

Фиг. 10. Коэффициенты для расчета выходного эффекта линейного детектора согласно фиг. 9.

A»iVw(7* 4

что показывает, что в этом случае имеет место полное совпадение. Пусть теперь Q=O. Тогда оба уравнения дают

+ OO

-W_ctf) = +^_ojw(x)wtf-x)dx,

— оо

где A=Tz для формулы Рагадзини и A=A для (4.10—16). Поэтому результаты вычислений все еще вполне хорошо согласуются. Предельное значение (4.10—16) может быть также получено из (4.7-8).

Даже если индекс модуляции г и не совсем мал, то можно показать, что, когда Q->oo , W_c(J) все еще достигает значений, определяемых уравнением (4.10—19). Формула Рагадзини дает несколько больший результат, так как она включает дополнительные члены, показанные в (4.5—17), которые содержат £²/4, но эта разница не кажется серьезной. Если Q²+2^₀ в знаменателе (4.10—13) заменить на Q²+ —Q²£²+2^₀, то согласие между формулами улучшается.

230

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Приложение 4А Таблица нелинейных устройств, описываемых интегралами

Многие нелинейные устройства могут быть описаны интегралами

вида

i=L^_F{lu)eivu_dUf _(4А__1}

где функция F(Zw) и путь интегрирования С выбираются в соответствии с нелинейным устройством. В таблице даны примеры подобных устройств. Некоторые важные случаи не могут быть представлены в. такой форме. Примером является ограничитель с характеристикой

I=—aD_t V< — D_t

I=oV_f _D<V<D,

I=aD_t D<V, (4А-2)

для которого можно написать

•о

I=L fsin VwsinDw-L- =

tz J u²

п , 2ct f IVu . du

= -^а° + Щ^е ^sinDu W⁹ (4А-3) с

где С простирается от —оо до +оо и отступает книзу у начала координат. Эта форма ийтеграла отличается от рассматриваемой в главе IV. Однако, кажется, не представит трудностей распространение теории на частный случай ограничителя.

НЕЛИНЕЙНЫЕ УСТРОЙСТВА, ОПИСЫВАЕМЫЕ ИНТЕГРАЛАМИ


I	F(iu)	С	Тип устройства
I = o-Vⁿ₁п—целое	оп\ (iu)ⁿ⁺ⁱ	Положительный контур вокруг W = O	Устройство с характеристикой п-й степени
/ = а(У—В)^п, п—целое	^ал! _e-iuB (iu)ⁿ⁺ⁱ	Положительный контур вокруг w = 0	Устройство с характеристикой я-й степени со смещением

ПРИЛОЖЕНИЯ

231

Продолжение


I	F(iu)	C	Тип устройства
1 = 0, V<0 / = aV, 0<V	а а (ш)² ~~ U²	Вещественная и ОСЬ ОТ — оо ДО + оо с отступлением книзу у W = O	Линейный детектор; точка среза при V=O
1 =KJ₁ V <£> I = a(V—ВУ , v—любое положит, число	«Т/41 I А \	»	Детектор с характеристикой v-й степени со смещением
/ = 0, V<0 I = OV_t 0<V<D I = aD_t D<V	(iw)²	»	Линейный детектор плюс ограничитель
/ = 0, V<0 /=cp(V), V>0 i	F{p) = ]e-^pt4{t)dt 0

Приложение 4В

Функция _XF_X (а\ с; х)

В вопросах, связанных с прохождением через нелинейные устройства синусоидальных колебаний вместе с шумами, появляется гипергеометрическая функция

л (°; с; 2) = 1+ ^_n + +fif-2r+... (4B-D

Здесь будут изложены некоторые ее свойства, используемые в главе IV. Кривые фЦа; с; z) даны для а=—4;—3,5...; 3,5; 4,0 и с=—1,5; —0,5; +0,5; 1; 1,5; 2; 3; 4 в книге Янке и Эмде «Таблицы функций»¹). Приведен также список свойств этой функции и другие ссылки.

Если с не является отрицательным целым числом или нулем,

то

,FKa; с; г)=е\Р_г(с-а; с;-г). (4В-2)

^Cm. Янке и Эмде, «Таблицы функций», Гостехиздат, 373, 1948.

232

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

Когда Re(z) > 0, то справедливы асимптотические разложения

C_t Z) — _V{a)zc-a у i Jj^--+

(1__а) (2 — g) (с —g) (с —fl+1) I

2! z² "¹^ * ' •J'

q(q+l) (1+fl — g) (2 + g — c) , ] U- ₂, ₂₂ -Г • • .J-

Многие из гипергеометрических функций, с которыми приходится сталкиваться, могут быть выражены через функции Бесселя первого рода мнимого аргумента. Эта связь может быть установлена при помощи соотношения¹)

IF₁ (v + -L ^2v + ^1; ^z) = ^22V; ^г<* + D * -*Wv (-f) (4В-4)

вместе с рекуррентными соотношениями


	Fa +	F_a-	F_c +	F_c-	F
1.	а	(а — с)			с —2а — z
2.	ас		(с — а)г		— c(a + z)
3.	а			\—с	с — а—1
4.		— с	— Z		с
5.		а — с		с — \	1—а —z
6.			*(C-Q)Z*	*C(C*-I)	C(I-C-Z)

Например, первое рекуррентное соотношение получается из первой строчки в следующем виде:

aF(a+l; с; z) + (a — c)F(a — \\ с; z) +

+ (с —2а — z) F(a\ с; z) =0. (4В—5)

Эти шесть соотношений между смежными iFi функциями аналогичны 15 соотношениям, полученным для смежных ₂F_X гипергеометрических функций, и могут быть выведены из последних при помощи соотношения

(а; с; г)== Iim _%F_xfa\ b; с;L j (4В—6)

Рекуррентное соотношение, вводящее две функции ф_х типа (4В—4), можно получить, заменяя в соотношении, даваемом четвер-

*) Г. Н. В а т с о н, «Теория бесселевых^функций», ГИИЛ, 1949.

ПРИЛОЖЕНИЯ

233

той строчкой таблицы, а на а+1, а затем устраняя фЦа+Х; с\ г) из этого соотношения, а также из полученного с помощью третьей строчки таблицы. Это дает

!F₁ (а; с; z) = (а; с — 1; z) + + +(¾" F(a+Uc + l;i). _(4В_₇₎

Полагая v равным нулю и единице в (4В—4) Ha=J, с= 2 в (4В—7), получим

xFi(+,r,z)=e*i4₀(-f\,

(4В—8)

Л 2; г) ₌ _е*/2

2 , Д 2

Соотношения в приведенной таблице позволяют найти выражения для J₁ {п+L _т. ^ _Где п и m— целые числа. В частности, воспользовавшись (4В—2), получим

л(—4 1;(1+^/.(4) + +4)} (4В-9)

Приложение 4С¹Энергетический спектр, соответствующий ф_хВесьма часто встречается интеграл

во

G_n(f) = j [ф<*)]^я cos 2тс/т dt, _(4С_,_}

где ф(т) есть функция корреляции, соответствующая энергетическому спектру w(f). Из основного соотношения между w(f) и ф(т) согласно уравнению (2.1—5)

G₁(Z) = -4-. (4С—2)

Выражение для спектра произведения двух функций позволяет представить G_n(J) через oy(Z). Будем пользоваться следующей формой этого выражения. Пусть F_r(J) будет спектром функции <?,(+ так что

+ 00

у At) Hdf,

г = \,2,

234

часть ii. теория флуктуационных шумов

+ 00

-2ш/т

W(Z)= j<P,We -™"dx.

- OO

Тогда

+ 00 +00

J «PiW «P2W е dx = J F₁(X) F₂(f - х) dx, (4С-3)

— OO -OO

т. е. спектр произведения <Pi(^x)<p2(^x) есть интеграл, написанный справа.

Если <рi(t) и <р₂(^х) — вещественные четные функции т, то (4С—3) можно написать в виде

OO +00

J «PiW «PzW cos 2ф di = J- J F₁(X) FJf — х) dx. (4С—4)

О —оо

Чтобы получить G₂(Z), положим (I₁(X) и ср₂(т) равными ф(т). Тогда можно воспользоваться (4С—4), так как ф(т) есть четная вещественная функция х. Если w_r(x) есть четная вещественная функция т, то из формулы интеграла Фурье для F_r(Z) следует, что F_r(Z) должно быть четной вещественной функцией f. Поэтому положим

2W(Z) = OJZ), г =1,2 и определим спектр w(f) для отрицательных Z как

w(-f) = ш(/). (4С-5) Тогда уравнение (4С—4) дает

+ оо

G₂(Z) = J- j4(x)te((f - х) dx =

-OO

оо OO

= 4" J w(x)w{J — х) dx + L ^w(x)w(f + х) dx_t (4С—6)

о о

где во втором уравнении появляются только положительные значения аргумента w(f).

Чтобы определить G₃(Z), положим ср₄(х) = ф(х), 2^_х(/) = a;(Z) и <?₂(т) = ф²(т). Тогда

F_a(Z) = 2 |<р₂(т) cos 2ф dx = 2G₂(f)

ПРИЛОЖЕНИЯ

235

и из (4С—4) получим

+ со

G₈W = 4 J - *)^dx=

— оо

Lj dx j

w(y)w(f — у) dy.

(4C-7)

Уравнение (4C—7) наводит на мысль, что выражение для G₂(Z) можно написать в виде

GJ/)

+ Oo

1 Г

(X)Gitf-x)dx.

(4С-8)

То, что это справедливо, видно из (4С—2) и (4С—6). В результате ■оказывается, что уравнение

+ OO

G_n(Z) = W(J-X)G_a-I (х)dx (4с_9)

может быть использовано для поэтапного вычисления G_n(f).

Рассмотрим теперь G_n(J) для случая полосовых фильтров с относительно узкой полосой пропускания. В качестве примера возьмем фильтры, характеристики которых дают следующие значения w(f) и ф(т).

Таблица 1

Фильтр

w(f) для/>0

Фо -(/-А)^а/2о^а

-----е

ф₀е-Sdeox^_cos ₂₇__7оХф₀е"^2тев1х| cos2*/₀ т

0/211

__Фо «____

«²+(/-/о)²

('•

Sin тейт Фо cos 2те/₀т

^ (/)=0 для остальных частот

Эти фильтры будем называть соответственно фильтр а, фильтр b и фильтр с. Во всех фильтрах Zo — средняя частота полосы

236

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

пропускания. Постоянные выбраны так, что когда приложено напряжение, занимающее широкую полосу частот, все фильтры пропускают одну и ту же среднюю мощность

причем предполагается, что /₀^> а, /₀^> а, /₀^> р, так что полосы пропускания сравнительно узки.

Выражения для G_n(J)_f соответствующие нескольким значениям U_f приведены в табл. 2. Когда Yi=X₁G₁(J) просто равно +/)/4. G₂(J) получается, полагая п=2 в (4С—1) для G_n(J)_f возводя в квадрат ф(т), взятое из табл. 1, и пользуясь соотношением

cos² 2тс/₀т = — + — cos 4тс/₀х.

Выражение для G₂(J) в табл. 2, относящееся к фильтру с, является точным. Выражения для случая фильтров а и Ь дают хорошее приближение вблизи /=O и /=2/₀, когда G₂(J) велико. Однако они не являются точными, так как отброшены члены, содержащие /+2/₀. Как следует из таблицы, все функции G₂ в рассматриваемых трех случаях ведут себя одинаково. Каждая функция имеет пик, симметричный вокруг 2/₀, ширина которого в два раза больше, чем ширина пика в спектре +/); затем между О и 2/₀ функция равна почти нулю, а при нуле создает опять пик, высота которого в два раза превышает пик при 2/₀.

G₃(Z) получается путем возведения в куб взятых из табл. 1 значений ф(т), используя соотношение

COSⁱ

2тс/₀т = ~ COS 2т:J₀X + -L COS 6тс/₀т.

Рассматривая, каким образом в (4С—1) косинусоидальные члены комбинируются с cos 2тс/т, приходим к заключению, что для полосовых фильтров с относительно узкой полосой G₃(Z) имеет пики при /о ^и 3/₀, причем первый пик в три раза больше второго. Выражения для G₃(Z) и G₄(Z) являются приближенными в том же самом смысле, что и выражения для G₂(J). Можно заметить, что коэффициенты внутри скобок для фильтров а и Ь есть -биноминальные коэффициенты для рассматриваемых значений п. Поэтому для п=2 они равны 2 и 1, для п=3 они равны 3 и 1 и для п=4 они равны 6, 4 и 1.

Функции G_n(J) более высоких порядков для фильтров а и Ь могут быть вычислены подобным же образом. Встречающиеся интегралы равны

Таблица 2


	Фильтр а	Фильтр Ь
G₁U)	т° _е- (/ - Л)W 4а/" 2те	^aTo ¹ 4те о* +U-U)²
GM)	.1.2 *-Z⁰₇=* [2_е-/ ^/4°Ч* -G-2/c)V4.'j 8а/ 4те	9-,1, 9 г о 1 1 ^2aYo² \ ² ¹8те Ua² + /² + 4a²+(/ —2/₀)² J
G₃(Z)	.1.3 Ь [Зе - (Z - /o)^J/6^³ ₊ _е - (/ - 3/₀)U6*^j 16а/" бтс	З_афз г з 11 т l9a*+(Z-/o)²⁺9«'+(Z-3/₀)² J
G₄(Z)	,1,4	/U.1,4 Tfi 4. 11 ^4aYn ^Ь, ⁴ , ¹
G₄(Z)	™ [6б ~ F'⁸³ + 4б " ^ - г/оГ/во» ₊ _е - (/ - 4/_с)²/8а]** 32а/ 8гс	32те 116а² + /² + 16а² + (/ — 2/₀)² ~Пба² + (/ — 4/₀)²J
G_n(Z) n—нечетное / — мала	0	0
G_n(Z) п — четное / — мала			<\|/₀^ял! 1 1
G_n(Z) п — четное / — мала			(^пЛ(1)12" 2^я+1™«₁ ₊ Ш* (2 / V2 I \па)
O_nU) п — четное п — велико / — мала	-J- ,-/³^a' ZtzqH
Фильтр с O₁U)	\|. когда (/+_)</< (_/o ₊ L) 0 при др. частотах	Фильтр с G₂(Z)	U(l-U), когда 0</<р J\|(Z-2Zo+P), (2Z.-P)<Z<2/₀jji (2/,+ [)-/), 2/₀</<(2/₀ + р)

238

ЧАСТЬ II. ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ

cos 2ф dz = ^

2те /г²а²+/2

Во многих примерах представляли интерес только значения G_n{f) для / вблизи нуля, т. е. только тот пик, который образуется вблизи нуля. Очевидно, что G_n(J) имеет подобный пик только тогда, когда п — четное; этот пик образуется благодаря наличию постоянного члена в разложении

COS^X

= ~2k^\ ^cos2£# +2kcos 2(k — \)х +■

(2^)(2^—1) 2!

cos 2(£— 2)х +

(2*)!

COS

2x + i-²A>il

ЧАСТЬ IH

ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

Глава I

ПРИНЦИП «ОБРАТНОЙ ВЕРОЯТНОСТИ» В ТЕОРИИ ПЕРЕДАЧИ СИГНАЛОВ i)

Ф. ВУДВОРД и и. дэвис

Теория получения данных подчеркивает значение относительных вероятностей возможных «сообщений», вычисленных перед и после приемЗ сигнала. Эти последние вероятности объединяют все данные, несомые принятым сигналом, и могут быть вычислены из него при помощи «обратной вероятности». В принципе это вычисление может быть выполнено электронными устройствами в самом приемнике/Гаюш образом получаем определение оптимального устройств^для извлечения всех сведений, остающихся в сигнале, на который воздействовали шумы. Указания на то, как эта теория может быть применена к задачам радиолокации и связи, даются в последнем параграфе работы.

1. «ОБРАТНАЯ ВЕРОЯТНОСТЬ» И ПЕРЕДАЧА СООБЩЕНИЙ

Любое пригодное к передаче сообщение является результатом выбора из множества возможных сообщений, которые могут быть либо дискретными, либо непрерывно переходить одно в другое. В теории передачи сообщений состояние знания перед приемом сигнала может быть описано указанием вероятности появления каждого сообщения. После приема сигнала можно надеяться, что из всей группы возможных сообщений будет выделено некоторое определенное сообщение. Другими словами, его априорная вероятность заменяется на апостериорную вероятность, равную единице.

Благодаря искажениям за счет помех принятый сигнал не всегда будет с полной достоверностью указывать переданное сообщение. Поэтому апостериорная вероятность не будет полностью сконцентрирована на одном сообщении, а будет распределена между несколь-

¹JPh. М. Woodward and I. L. Davies, «Information Theory and Inverse Probability in Telecommunication», Proc of the IEE_t part III, 99, Jfc 58, 37—44, March 1952.

240 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

кими сообщениями. Следовательно, в общем случае полная вероятность, равная единице, распределяется- между сообщениями после приема сигнала иным способом, нежели перед приемом.

В этом заключается одна из существенных особенностей теории передачи электрических сигналов. Интуитивно мы полагаем, что увеличение вероятности истинного сообщения соответствует возрастанию количества данных. Прежде чем окажется возможным сформулировать это более точно, необходимо рассмотреть сами априорные и апостериорные распределения вероятностей, что немедленно приводит к принципу «обратной вероятности».

Наилучшим способом изложения этой теоремы является рассмотрение простого примера.

Допустим, что для передачи одного из двух сообщений, «да» и «нет», используется простая телеграфная система и что сообщения передаются двумя различными сигналами, отмечаемыми в приемнике зажиганием зеленой и красной ламп. Допустим далее, что в большом числе случаев, когда передается сообщение, помехи превращают определенную часть «красных» сигналов в «зеленые» и наоборот. Ради общности положим, что эти части различных, скажем, ²/₅ «зеленых» сигналов становятся «красными» и V₃ «красных» становятся «зелеными». Наконец, допустим, что среди передаваемых сообщений «да» и «нет» встречаются в отношении 5:3.

Тогда все имеющиеся сведения могут быть схематически записаны в виде табл. 1.

Sfc»- < Таблица 1


Да	Да	Да	Да	Да	Нет	Нет
Зеленый	Зеленый	Зеленый	Красный	^ Красный	Красный	Красный

Нет Зеленый

Эта таблица представляет просто перечисление всех равно-возможных случаев, причем в верхней строке записаны передаваемые сообщения, а в нижней — соответствующие принятые показания. Таблица позволяет определить любые необходимые вероятности, например одна верхняя строка дает априорное распределение вероятностей

р (да) =V₈, р (нет) =V₈.

Однако, если появился «зеленый» сигнал, надо выбирать только из тех возможностей, которые соответствуют «зелёному» во второй строке. Среди них 3 из 4 соответствуют «да» и, следовательно, апостериорная вероятность для «да», когда принят «зеленый» сигнал, равна V₄- Это и есть применение «обратной вероятности».

Формально теорема устанавливается следующим образом. Пусть х — передаваемое сообщение, а у — принятое показание. Тогда по теореме об умножении вероятностей вероятность совмещения

ГЛ. I. ПРИНЦИП «ОБРАТНОЙ ВЕРОЯТНОСТИ»

241

р (X_i у), т.е. вероятность совместного появления значения х и значения у₉ равна

Р(х, У) = р{х)Рх(у) = р(У)Ру(х)> (1)

где условная вероятность р_х(у) есть вероятность появления у, если появился х.

Эти важные соотношения легко могут быть проверены при помощи табл. 1. Так, когда х есть «да», а у — «зеленый» сигнал, то

L- ⁵_y1-1_y1

Из пя?и вероятностей, входящих в уравнение (1), две имеют особенное значение для теории передачи электрических сигналов, а именно р(х) — априорная вероятность сообщения х и р_у(х) — апостериорная вероятность сообщения х при условии приема сигнала у. При пшщме- в общем случае должны быть рассмотрены все значения хутк что р(х) и р_у(х) част^рассматриваются как распределения вероятностей. Их суммы по х равны, конечно, единице.

Теорема «обратной вероятности»¹) представляет собой просто выражение для апостериорного распределения, полученное из (1), а именно:

_ру(х)=фщу1 ₍₂₎

Предполагается, что наблюдатель знает априорные вероятности р(х) и статистические свойства помех, определяемые р_х(у), представляющим полное семейство распределений. При приеме сигнала у наблюдатель должен использовать уравнение (2) для определения относительных вероятностей того, что каждое из сообщений х было переданным сообщением. Так как у будет тогда фиксированным, р(у) представляет постоянную, которая может быть вычислена, если р_у(х) нормировано, т. е. его сумма по х равна единице.

В этом случае уравнение (2) может быть записано в виде

P_y(x) = kp(x)p_x(y)_f (3)

где"£ — постоянная, не зависящая от х. Статистически р_у(х) представляет относительную частоту, с которой х действительно передается в большом числе переданных сообщений, которые создают один и тот же сигнал у в приемнике.

Например, если принят «зеленый» сигнал:

Рзем. (да) = k х|- X-I- = (I-) k,

Рзел. (нет) = k Xj Xy *■

*) Эха TeopeMa известна й теории вероятностей как теорема о вероятности гипотез, или теорема Бэйеса. (Прим. ред.)

242 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

Апостериорное распределение нормируется, если положить £=2

Рзел. (Да) =~, Рзел. (нет) =-j-

что уже было получено раньше. Так же точно, когда принят «красный» сигнал, апостериорное распределение будет

Рк_Р. (да)=у, Рк_Р. (HeT)=-J-.

Ясно, что в общем случае для каждого принятого сигнала будут различные апостериорные распределения вероятностей сообщений.

Во многих случаях различные принимаемые сигналы не дискретны и число их не конечно, а они образуют непрерывное множество. Это может быть, например, если у — напряжение в некоторый фиксированный момент времени. Тогда теорема «обратной вероятности» должна быть истолкована несколько иным образом.

Если у относится к непрерывному множеству, его распределение вероятностей будет характеризоваться непрерывной плотностью распределения, причем р(у) dy — вероятность попадания у в интервал (у, y+dy). При подстановке этих вероятностей в уравнение (2) дифференциалы dy сокращаются и уравнение^(З) остается в прежней форме, где р_х(у) будет плотностью вероятностей.

Формула также справедлива, если х непрерывно, так как тогда дифференциалы dx также сокращаются. Следовательно, теорема «обратной вероятности» применима в форме уравнения (3), когда х или у или, наконец, оба вместе являются непрерывными переменными, причем в этом случае используется соответствующая плотность вероятностей.

Как было показано, каждый возможный принятый сигнал приводит к своему собственному апостериорному распределению вероятностей для передаваемых сообщений. Если эти распределения усреднить в соответствии с вероятностями появления сигналов, а именно р(у), то интересно отметить, что в результате получается априорное распределение вероятностей сообщений. Таким образом, интегрирование (или суммирование) уравнения (I) по у дает

j Р(У)Р_у(х) ^dy = \ Р(^Х)РЛУ) dy=Р(х) . (4)

Слева здесь среднее апостериорного распределения, а справа — априорное распределение. В сокращенной записи среднее по всем значениям некоторой переменной z будет обозначаться Cp₂и уравнение (4) тогда запишется так:

Ср, Ру(х)= р(х). (5)

В нашем примере, как видно из табл. 1, два принимаемых сигнала — «зеленый» и «красный» — встречаются во всем множестве одинаково часто. Соответственно среднее с равными весами двух

ГЛ. I. ПРИНЦИП «ОБРАТНОЙ ВЕРОЯТНОСТИ»

243

апостериорных распределений (V₄, V₄) и (V2, V2) дает априорное распределение (V₈, V₈).

При применении «обратной вероятности» к задачам теории передачи сигналов первый основной шаг сводится к оценке р_х(у), представляющем статистические свойства шумов в наиболее подходящем для решения задачи виде. Это часто оказывается значительно более сложным, чем может показаться из приведенных рассуждений, поскольку у не всегда является таким простым, как «зеленый» или «красный» сигнал. В общем случае у будет представлять полный сигнал, как, например, телеграфная посылка или отраженный сигнал радиолокационной станции, плюс шумы.

Однако при этом не возникают какие-либо принципиальные затруднения, поскольку можно рассматривать полный сигнал как последовательность ординат кривой напряжения и вычислить рх(Уъ У г, %•••) ^как многомерное распределение вероятностей совмещения. Этот вопрос более детально рассмотрен в § 4.

2. ТЕОРИЯ ПОЛУЧЕНИЯ ДАННЫХ

^звеетно, что определенный выбор между двумя равновозмож-нымц^событиями соответствует одной двоичной единице количества дайных, а выбор между п равновозможными событиями — Iog₂w двоичным единицам. В этом рассуждении предполагается полная определенность результата выбора, однако часто прием сигнала приводит только к изменению относительных вероятностей для ряда событий, без четкого выделения одного из них как достоверного. Поэтому необходимо разработать более общее определение, сводящееся к этому более простому, когда нет апостериорной неопределенности. Это и было сделано Шэнноном.

Настоящее изложение основано на работе Шэннона, но отличается своим подходом к задаче и исходными постулатами, поскольку вначале рассматривается действительно переданное количество данных, а не усредненное количество или средняя скорость передачи. Впрочем, определения Шэннона легко отсюда получаются, а некоторые его основные результаты кратко упоминаются в дальнейшем.

Начнем с двух следующих аксиом относительно аддитивности к<?личества данных.

1. Если последовательно посылаются два сигнала, представляющие одно сообщение, а наблюдатель рассматривает апостериорную вероятность после приема первого сигнала как априорную вероятность перед приемом второго, то полное увеличение количества данных относительно этого сообщения равно сумме количества данных от каждого сигнала.

2. Если посылаются два сигнала, представляющие два независимых сообщения, то полное увеличение количества данных от-

244 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ B РАДИОЛОКАЦИИ

носительно этих сообщений равно сумме количества данных, когда каждый сигнал рассматривается отдельно.

Из этих двух аксиом может быть развита вся дальнейшая математическая теория.

Обозначим сообщение, о котором идет речь в первой аксиоме, через X₁. Отметим три вероятности для этого сообщения: во-первых, его априорную вероятность P(X_i)_f во-вторых, апостериорную вероятность P_y(X_i) после приема первого сигнала и, в-третьих, принимая P_y(X_i) за априорную вероятность для второго сигнала, обозначим конечную вероятность после приема второго сигнала через P₂(X_i).

Допустим теперь, что после приема у и z наблюдатель вполне уверен, что было послано i-oe сообщение, так что P₂(X_i)=I. Количество данных увеличилось, поскольку первоначальная неопределенность, связанная с P(X_i)_f полностью устранена и полный выигрыш от приема у и z поэтому зависит только от р(х). Аналогично увеличение количества данных от одного второго сигнала зависит только от Py(X_i). Соответственно увеличение количества данных от первого сигнала определяется только р(х) и P_y(X_i).

Таким образом, если остается неопределенность после того, как данное сообщение X_i было передано и принято при наличии шумов, количество данных является функцией априорной и апостериорной вероятностей одного этого сообщения. Оно может быть записано в виде

Лр(х),р_у(х)] • (6)

Тогда первая аксиома утверждает

JlP(X_i)_t P_y(X_l)]+ JlP_y(X_l)_fP₂(X_l)] = J[p(X)_t р_г(х)]. (7)

Как показано в Приложении, для удовлетворения этого тождества / должно иметь вид

JlP(X), P_y(X_l)] ^ j lp(x)] - / Ip_y(X)]. (8)

Чтобы определить теперь функциональную форму /, необходимо воспользоваться второй аксиомой. Два независимых сообщения можно обозначить X_i и X_k , а соответствующие принятые сигналы у и z. Поскольку вероятность совмещения двух независимых событий равна произведению лх вероятностей, вторая аксиома дает

/ lp(x)p(Xk)]— j lP_y(x)p_z(x_k )]= Ч lP (x)]+j lp(x_k)]- i IP_y(X)]- jlp₂(x_k)]. (9)

Из этого тождества следует, как это показано в Приложении, что j(p) должно иметь вид

j(p)=A Iog р +B_f (10)

ГЛ. I. ПРИНЦИП «ОБРАТНОЙ ВЕРОЯТНОСТИ]

245

где постоянные А и В могут быть выбраны произвольно. Тогда из уравнений (6), (8) и (10) количество данных может быть записано в форме

Р&Я=-Alog(11)

а чтобы увеличение вероятности истинного сообщения представляло положительное количество данных, А принимается равным —1. Наконец, для краткости записи вместо / будем писать I_xtyf чтобы отметить, что это есть количество полученных данных, когда передано некоторое сообщение X_f а принят некоторый сигнал у. Тогда, пользуясь уравнением (1):

<'2)

Это основное выражение для количества данных в теории Шэннона.

К сожалению, когда принимается сигнал, искаженный шумами, наблюдатель не в состоянии полностью судить об истинном сообщении. Кроме того, с точки зрения наблюдателя, интуитивно чувствуется, что тот же самый принятый сигнал всегда представляет одно и то же количество данных независимо от действительно переда иного сообщения.

Поэтому единственный способ определить увеличение количества данных для наблюдателя заключается в усреднении I_xtyпо всем случаям, в которых фиксирован один лишь сигнал у. Как показано в § 1, в этих условиях передаваемые сообщения появляются с относительными частотами, определяемыми р_у(х). Тогда увеличение количества данных I_y для наблюдателя можно определить, усредняя 1_х,_уи принимая р_у(х) за весовой коэффициент:

W=Cp, Uy = Y Pyi^x) ^1о§ Iur' ⁽¹³⁾

если сообщения дискретны.

Часто сообщения образуют континуум, как, например, в случае расстояний до самолета или показаний измерительного прибора. Распределение вероятностей х представляется тогда непрерывными кривыми плотности вероятностей, но теория без труда может быть распространена и на этот случай.

Если р(х) — плотность распределения, то р(х) Ъх есть вероятность того, что х лежит между х и х+Ьх. Если разбить область значений х на элементы шириной Ix_f то может быть использована дискретная теория и тогда, полагая Ьх—► O:

, Г , м PyLLrIr (¹⁴>

246 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

Следует отметить, что увеличение количества данных по уравнению (13) или (14) аддитивно в смысле аксиомы 2, но не в смысле аксиомы 1. Это объясняется тем, что увеличение количества данных для наблюдателя представляет апостериорное среднее, а усреднение после приема первого и второго сигналов производится по различным множествам.

Как и следовало ожидать, можно показать, что I_y (в противоположность I_x ) никогда не является отрицательным и равно нулю только в том случае, когда распределения р(х) и р_у(х) одинаковы, так как тогда прием сигнала совершенно не изменяет состояния знания наблюдателя.

Полученные выше соотношения могут быть иллюстрированы применением их к примеру, приведенному в § 1. Если послано сообщение «да» и принят «зеленый» сигнал, то переданное количество данных определяется из уравнения (12):

Iog рзел. (да) — Iog р (да) = Iog |- — Iog |- = Iog -|.

Аналогично, если послано «нет» и опять принят «зеленый» сигнал, значение I_xty равно

Iog Рзел. (нет) — Iog р (нет) = Iog j -Iog -| = Iog |

Оно отрицательно, потому что вероятность сообщения «нет», которое в действительности было послано, уменьшилась в результате приема сигнала.

Ни одно из приведенных выше выражений не представляет, однако, большой ценности для наблюдателя, поскольку единственное его знание относительно того, что было послано, дается апостериорным распределением

Рзел. (Да) =-J- рзел. (HeT) = J .

Поэтому увеличение количества данных для наблюдателя равно /зел. =L log-§- +^- log-|-=0,0510 двоичной единицы,

что является примером применения уравнения (13). Так же точно при приеме «красного» сигнала

14 14

/_кр. = у logj+j Iogj =0,0466 двоичной единицы.

Как/_зел., так и /_кр. обязательно положительны.

Вычисленные выше количества данных относятся к определенным принятым сигналам, но когда необходимо найти пропускную способность канала, важное значение имеет среднее количество данных /, когда ни X_t ни у не заданы. Эта величина применялась Шэнноном. Она получается путем усреднения количества данных,

ГЛ. I. ПРИНЦИП «ОБРАТНОЙ ВЕРОЯТНОСТИ» 247

--<---'----.

полученных при приеме каждого сигнала, причем этим данным придан вес в соответствии с вероятностью появления сигналов.

В нашем примере «красный» и «зеленый» сигналы встречаются одинаково часто (см. табл. 1) и поэтому

/ = 1(0,0510+0,0466) = 0,0488 двоичной единицы.

Общее выражение получается, если применить оператор Cp^ к уравнению (14):

/=Cp_jrZ_v=J Р(У)§ P_y(X)Iog -^y^ydxdy. (15)

Это то же самое, что и среднее от 1_Х}У по всем по всем у, которое по уравнению (12) имеет симметричную форму:

/=Cp_jcfjrZ_jcor=Jj p(x₉y)\og -^^щ-dxdy. (16)

Еще другая форма / получается в том случае, если сначала разделить логарифм в уравнении (15) на две части

/=Cp^j p_y(x)\ogp_y(x)dx — \§р(у)р_у(х) logp(x) dxdy.

Интегрирование по у может быть выполнено при помощи уравнения (4); тогда

I=H(X)-H_y(X)₉ (17)

где

Н(х) = -§ P(X)Iogp(X) dx₉ (18) Н_у(х) = — Cp^ py(x)\ogp_y(x)dx. (19)

Шэннон называет Н(х) «энтропией» распределения р(х), и уравнение (17) тогда утверждает, что среднее количество данных, приходящихся на сигнал, равно разности априорной и апостериорной «энтропий». Из симметрии уравнения (16) следует, что / может быть также написано в форме

^ I^Н{у)-HM (20)

путем перемены местами х и у.

Из этого последнего выражения Шэннон получает свою теорему 17 — один из основных результатов теории передачи сигналов. Она утверждает, что среднее количество данных, которое может быть передано за время T по каналу с полосой частот W при наличии гауссовых шумов с равномерным спектром средней мощностью N₉ может достигать, но никогда не превосходит

/макс = WT IOg (l +Lj_i (21)

где P — средняя мощность принимаемых сигналов.

248 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

Эта теорема показывает ограниченность пропускной способности канала. Обычно мощность шумов возрастает пропорциот нально полосе частот: N=WN₀₉ где N₀ — средняя мощность шумов в единице полосы частот. Тогда /_Макс. растет вместе с W₉ стремясь в пределе к

PT E

Iim /макс. = д7~ ⁼ лг~ натуральных единиц, (22)

где E — полная энергия сигналов.

Уравнения (21) и (22) в принципе позволяют измерить эффективность любой системы передачи сигналов как при наличии, так при отсутствии ограничения величины полосы частот канала. Конечно, чрезвычайно затруднительно оценить таким способом эффективность всей системы, предназначенной, например, для передачи музыки. Однако такие системы, как радиолокационные станции, линии радиосвязи с кодовой импульсной модуляцией и с временной импульсной модуляцией, сравнительно просто поддаются анализу.

Можно показать, что при кодовой импульсной модуляции и временной импульсной модуляции необходима мощность сигнала примерно на 8 дб больше, чем в идеальной системе, удовлетворяющей уравнению (21). Вместе с тем доказано¹), что в лучшем случае при измерении расстояний радиолокационной станцией достигается весьма близкое приближение к идеальной системе, определяемой уравнением (22).

Все полученные соотношения одинаково применимы как к случаю дискретных распределений вероятностей, так и к случаю непрерывных распределений, если только заменить суммы интегралами. Это связано с тем существенным обстоятельством, что под знак логарифма входят только отношения вероятностей (либо плотностей вероятностей).

Путем простого постулирования аддитивности количества данных была показана возможность измерения количества данных как логарифмического изменения вероятностей. Формальное определение I_xty в уравнении (12) непосредственно имеет мало значения, поскольку оно предполагает знание как переданного сообщения X₉ так и принятого сигнала у. Когда наблюдатель принимает сигнал, его более интересует значение 1_х,_у, усредненное по всем сообщениям, которые могли быть переданы, т. е. I_y. Наконец, I_yможет быть усреднено по всем сигналам у_у чтобы получить / — среднее количество данных, приходящихся на сигнал.

3. ШУМЫ И АПОСТЕРИОРНОЕ РАСПРЕДЕЛЕНИЕ

Чтобы применить излагаемую теорию к практическим задачам, необходимо рассмотреть, как может быть построено апостериорное

¹J См. следующую главу. (Прим. ред.)

ГЛ. I. ПРИНЦИП «ОБРАТНОЙ ВЕРОЯТНОСТИ»

249

распределение вероятностей по принятому сигналу у. Предполагается, что априорное распределение р(х) известно и тогда апостериорное распределение р_у(х) может быть сразу найдено из уравнения (3), как только вычислено р_х(у)-

Условная вероятность р_х(у) описывает действие шумов на систему. Она определяет случайный характер принимаемого сигнала при фиксированном передаваемом сообщении. Если принимаемый сигнал y(t) состоит из исходного сигнала U_x(I)_y представляющего сообщение X₉ и гауссовых шумов с равномерным спектром, вычисление р_х(у) может быть непосредственно выполнено, как это показано ниже.

Если u_x(t) — сигнал, который был бы в отсутствие шумов, распределение вероятностей для принятого сигнала у(1) (при действии помех) имеет вид

PxiH) = G(V-U_x)₉ (23)

где G(n) — плотность вероятностей для шумов n(f).

Простой способ точного вычисления G основан на известной теореме ¹J о том, что если функция времени /(/) не содержит частот, превышающих W₉ то

Важным свойством функции ^s*"^* является то, что она равна нулю, когда л: — целое число, и единице, когда* =0, а также, что

^sln7C* dx = \

- OO

Г°smn(x—r) sin tz(xs) , ( \, r = S

где г и s — целые числа.

Чтобы применить эту теорему, необходимо предположить, что все рассматриваемые колебания пропущены через фильтр нижних частот, коэффициент передачи которого постоянен вплоть до Частоты W и равен нулю на всех более высоких частотах. Если выбрать граничную частоту W достаточно большой, то сигнал останется неизменным и никакой потери общности это предположение не вызовет. Позже будет показано, что точная величина W не имеет значения и W исчезает из последующих формул.

*) См. часть I, теорема 13. (Прим. ред.)

250 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ B РАДИОЛОКАЦИИ

Рассмотрим сначала гауссовы шумы с равномерным спектром n(t). На выходе фильтра каждое значение n^Lj в точке отображения¹!, обозначаемое в дальнейшем п_гУ имеет по определению распределение вероятностей

p(n_r) = exp(-L)_y (25) V 2NJ

где N — средний квадрат n(t) или средняя мощность шумов.

Можно показать,что эти значения шумов в точках отображения статистически независимы, если только спектр шумов равномерен в пределах всей полосы частот вплоть до Wau_f. Следовательно, распределение вероятностей совмещения для всего множества «дискрет» шумов равно произведению отдельных распределений. Поскольку «дискреты» определяют рассматриваемые колебания шумов, то это произведение дает плотность вероятностей для самих колебаний шумов. Поэтому

G(n) = ехр(-Y j£) (26)

^ 2Л+

Возводя в квадрат основное тождество (24), интегрируя по времени и пользуясь свойствами функции ~~^sir^~~ , сумму *под знаком показательной функции можно представить интегралом, и тогда G(n)^exp[-Lj_n2_(/) _dty (27)

Здесь N₀ есть средняя мощность шумов в единице полосы частот, имеющая размерность энергии и являющаяся основным параметром шумов.

Теперь апостериорное распределение для сообщения * может быть написано в явной форме. Из уравнений (3), (23) и (27)

Ру(х) = kp(x) ехр [- -Lj (y-u_x )i Л ] . (28)

Это соотношение является основным вероятностным уравнением во всех задачах, когда помехи создаются только за счет добавления к сигналу гауссовых шумов с равномерным спектром.

Постоянная k выбирается из условий нормировки р_у(х)\ интеграл под знаком показательной функции берется по всему проме; жутку времени, в течение которого производится передача сигнала.

^г) Т. е. значения колебаний шумов, рассматриваемые в дискретных

точках, отстоящих друг от друга по оси времени на интервал Z₀= -L-. В дальнейшем применяется термин «дискреты» шумов. (Прим. ред.) 2iV

ГЛ. I. ПРИНЦИП «ОБРАТНОЙ ВЕРОЯТНОСТИ»

251

Отсюда следует, что если отвлечься от априорного весового коэффициента, то наиболее вероятным сообщением является такое сообщение, форма колебаний которого u_x(t) имеет наименьшее эффективное отклонение от формы принимаемых колебаний y(t).

4. КОРРЕЛЯЦИОННЫЙ ПРИЕМНИК

Может показаться, что описанные математические операции полезны только при вычислении количества данных, несомых сигналом, однако вероятностное уравнение (28) имеет более широкое значение.

В принципе оно указывает, как должен быть построен идеальный приемнйк для извлечения всего наличного количества данных из смеси сигнала и шумов на входе приемника.

Идея, на которой основывается это утверждение, теперь должна быть очевидной, поскольку р_у(х) само является наличным количеством данных. Разумные требования, которые можно предъявить к приемнику, должны исходить из условия, чтобы на основании выходных сигналов наблюдатель мог оценить относительные вероятности того, что каждое возможное сообщение является истинным. Если приемник позволяет вычислить эти вероятности, то никакого другого истолкования принимаемых сигналов не требуется. Рассматриваемое с этой точки зрения уравнение (28) математически описывает свойства идеального приемника.

Теперь будут обсуждены следствия этого утверждения. Допустим, что интеграл под знаком показательной функции записан в виде

При приеме у² фиксировано и поэтому не зависит от *, которое можно рассматривать как испытуемое сообщение. Поэтому первый интеграл является постоянным множителем в р_у(х) и может быть включен в £.

Во многих задачах интеграл от и_х² также не зависит от *, вследствие того что сигналы, представляющие различные сообщения, все имеют одинаковую энергию. Если это так, третий член также можно исключить, и уравнение (28) тогда превращается в

(29)

где

(30)

Начинать вычисления нужно с образования q путем поочередного умножения функции y{t)_f описывающей принимаемый сигнал,

252 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

на функции U_x(I)₉ представляющие все возможные исходные сигналы, и последующего интегрирования по времени. q(x) является основным членом в уравнении (29) и представляет собой оценку корреляции между у и и_х .Функция q(x) возрастает, если u_x(t)—сигнал, соответствующий действительно переданному сообщению.

Операция образования q из у обычно является необратимой. При таких процессах в общем случае происходит потеря данных, однако рассматриваемая операция связана с потерей только ненужных данных относительно шумовых составляющих сигнала y(t).

Если в конечном итоге требуется определить наиболее вероятное сообщение, а априорные вероятности сообщений все равны, достаточно вычислить только q(x). Остальная часть уравнения (29) представляет просто амплитудные искажения q(x). Поскольку искажения монотонны, то в результате значение *, при котором наступает максимум р_у(х)₉ обеспечивает также максимум q(x).

Рассмотрим теперь влияние множителя L под знаком показательной функции. Этот множитель действует таким образом, что, когда шумы малы, показательная функция значительно усиливает изменения q(x) с *. Именно это и следовало ожидать, так как если шумы невелики, то должно быть мало сомнений относительно истинного сообщения. Поэтому кривая р_у(х) должна иметь ясно выраженный максимум, представляющий высокую степень надежности.

В другом крайнем случае, когда шумы настолько велики, что полностью перекрывают сигнал, показательная функция за счет

множителя L становится весьма малой по сравнению с единицей.

Поэтому р_у(х) просто совпадает с р(х) и уравнение (14) показывает, что при приеме сигнала количество данных не увеличивается.

Как будет видно, промежуточное положение возникает не тогда, когда средняя мощность сигнала P примерно равна мощности шумов N_y а в том случае, когда полная энергия сигнала E сравнима с мощностью шумов в единице полосы частот N₀. Действительно, P может быть много меньше N и в этом заключается большое преимущество корреляционного приемника. Это также видно непосредственно из уравнения (22), где именно отношение E

-JT определяет максимальное количество данных в идеальной системе. Впрочем, не следует думать, что корреляционный метод обеспечивает нечто большее, чем дает интегрирование при приеме сигналов.

На практике, повидимому, корреляционные методы могут быть использованы только в простейших системах. В наших рассуждениях всюду молчаливо подразумевалось, что сигналы u_x(t)_y соответствующие различным сообщениям, точно известны перед приемом.

ГЛ. I. ПРИНЦИП «ОБРАТНОЙ ВЕРОЯТНОСТИ»

253

В радиосвязи дело осложняется тем, что начальное временное положение сигнала заранее неизвестно.

В этом случае теория усложняется, так как функция сигнала, соответствующего сообщению *, должна быть записана в виде Uxijt—х), где х — неизвестное временное запаздывание. Апостериорное распределение тогда становится интегралом, взятым по всем возможным временным запаздываниям:

Py(X) = k jp(*, х) ехр JLj y(t)u_x(t-х) dt J dx. (31)

Это означает, что прежде всего должна быть установлена взаимная корреляция во все возможные моменты времени между принятыми сигналами и всеми возможными сигналами, представляющими сообщения. Во всех системах, за исключением простейших, это приведет к недопустимым на практике усложнениям.

В случае радиолокации сообщение (дальность до цели) представляется самим временным запаздыванием, а другие параметры колебаний постоянны. Для простоты здесь предполагается, что имеется только одна цель и сила отраженных сигналов известна и не зависит от дальности.

Тогда апостериорное распределение для временного запаздывания будет

PyU) = kpU) ехр [L j y(t)u(t - х) dt ] . (32)

В этой формуле y(t) и u(t) — высокочастотные колебания и, оставляя в стороне вопрос о пределах интегрирования, рассмотренный в другой работе V, интеграл имеет форму выходного эффекта линейного фильтра. На входе действуют принимаемые колебания y(t)_fа импульсщная реакция есть w(—/), т. е. функция, обратная по времени передаваемым колебаниям.

Подобный фильтр устанавливает взаимную корреляцию у и и по высокой частоте, т. е. выполняет ту же самую операцию, что и обычный приемник. Необходимость детектирования из уравнения (32) не очевидна, поскольку теоретически в этом нет необходимости при определении расстояния до неподвижной цели. Детектирование только уничтбжает тонкую структуру сведений о дальности до цели, получаемую от несущей. Дальнейшее рассмотрение уравнения (32) более полно проделано в другой работе ¹J.

Для иллюстрации уравнения (32) в случае, когда все колебания низкочастотные, был выполнен простой эксперимент. На фиг. 1,а изображен передаваемый сигнал, а числовое сообщение * предполагается закодированным таким образом, что время запаздывания х этого сигнала равно *. На фиг. 1,6 показаны 7ипнчные колебания у, появляющиеся при добавлении шумов, отфильтро-

¹)См. следующую главу. (Прим. ред.)

254 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

ванных в некоторой произвольной полосе W₉ как об этом говорилось раньше.

После того как наблюдателю было указано, что импульс может находиться с равной вероятностью в любом месте линии развертки (априорная оценка), ему было предложено на основании одного лишь наблюдения установить апостериорное распределение вероятностей для временного положения импульса. Наблюдатель был ознакомлен с формой и амплитудой импульса, но ему было неизвестно истинное положение отраженного сигнала.

Фиг. 1. Экспериментальное определение положения импульса.

а-сигнал; б — сигнал и шумы; в — апостериорное распределение по субъективной оценке наблюдателя; г — вычисленное алостернорное распределение.

Его субъективная кривая изображена на фиг. 1,в, а теоретическая кривая, вычисленная по уравнению (32), показана на фиг. 1,г. Если отношение сигнал/шум возрастает, то кривая фиг. 1,г стремится к дельта-функции.

Идеальный приемник должен осуществлять преобразование кривой фиг. 1,6 в кривую фиг. 1,г чисто электронными устройствами, выдавая относительные вероятности всех возможных сообщений, благодаря чему отпадает необходимость в субъективной оценке.

5. ЗАКЛЮЧЕНИЕ И ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Было показано, что из всех распределений вероятностей, которые могут быть использованы для описания статистических свойств системы передачи сигналов, два распределения имеют особое значение. Это — распределения вероятностей различных возможных «сообщений» перед и после приема сигнала. Процесс приема может рассматриваться как событие, изменяющее относительные вероятности сообщений, а теория получения данных обеспечивает числовую меру этого изменения.

Эти идеи естественно приводят к представлению о том, что весь процесс приема есть просто способ определения или выявления апостериорных вероятностей сообщений. Следовательно,

ГЛ. I. ПРИНЦИП «ОБРАТНОЙ ВЕРОЯТНОСТИ»

255

выражение для апостериорного распределения само представляет математическое описание свойств оптимального приемника.

Как можно заметить, во всех уравнениях для апостериорной вероятности априорное распределение появляется как весовой коэффициент. Это основное свойство «обратной вероятности» может привести к затруднениям. В статистике часто оказывается, когда делается попытка произвести выбор между различными гипотезами (сообщениями) в свете некоторых новых данных (сигнала), что нет очевидного способа априорной оценки гипотез.

Хотя это затруднение вряд ли может возникнуть в системе связи, оно часто появляется в системах наблюдения, таких, как радиолокация. В этом случае при обстоятельствах, совершенно отличных от тех, с которыми мы до сих пор встречались, может оказаться необходимым приписать дальности до цели некоторое априорное распределение вероятностей. Если нет статистических сведений, на которых можно было бы основывать априорное распределение, то как оно вообще может быть определено?

Здесь иногда представляется заманчивым постулировать некоторую неопределенную функцию просто как «формальный способ выражения незнания». В лучшем случае это — несколько произвольная процедура, и возражения против нее хорошо выражены Бартлеттом¹), который пишет: «Подстановка простой функции для априорной вероятности, которая, если она вообще могла бы быть вычислена, определенно потребовала бы формулировки всех исходных данных, дает апостериорную вероятность в точной форме, которая, однако, может привести к серьезным заблуждениям. Кроме того, в этой попытке сделать конечный вывод относительно параметра (сообщения) и дать точную вероятность каждого возможного значения, мы вынуждены смешать сведения, которые могут быть извлечены из образца (сигнала), с другими сведениями, возможно, имеющимися в нашем распоряжении».

Необходимо различать два пути, по которым происходит ис-пбльзование принципа «обратной вероятности» в этой работе. Ьо-первых, он используется в процессе измерения увеличения количества данных в смысле Шэннона. Хотя этот прирост данных определяется самим сигналом, его величина оказалась зависящей от априорного распределения. Если нельзя построить априорного распределения, то невозможно определить, в какой степени сигнал просто дублирует существующее знание. Это, конечно, не оправдывает использования чисто субъективных априорных распределений в теории Шэннона, которая основана на частотном определении вероятности, но оправдывает применение априорных множителей всякий раз, когда имеются предварительные статистические данные.

¹J М. С. Б а р т л е т т, «Вероятность и случайность в теории статистики», Proc of the Royal Soc А, 141, 518, 1933.

256 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

Во-вторых, в работе предлагается использовать «обратную вероятность» для описания свойств идеального приемника. Можно разъяснить это положение. Нет необходимости требовать, чтобы идеальный приемник выдавал вычисленное до конца апостериорное распределение, поскольку последнее легко находится по выходному сигналу. Таким образом, вызывающий затруднения априорный множитель вполне может быть исключен из математического описания свойств идеального приемника, когда этот множитель вызывает сомнение и на практике вводится субъективной оценкой наблюдателя.

Может возникнуть вопрос, почему необходимо требовать, чтобы в идеальном приемнике производилось определение апостериорных вероятностей каждого возможного сообщения, а не просто выделялось наиболее вероятное сообщение, поскольку на практике обычно только это и нужно. Действительно, многие системы связи чрезвычайно бы усложнились, если бы на выходе приемника требовалось определять вид апостериорного распределения (возможно, многомерного). Однако нет необходимости всегда так буквально понимать развиваемую теорию.

Апостериорное распределение может по желанию рассматриваться как средство определения наиболее вероятного сообщения. Тогда может быть построен приемник, выдающий на выходе те значения X_f при которых р_у(х) достигает максимума.

Иногда имеются возражения против такой процедуры. Во-первых, сила критики Бартлетта значительно возрастает, поскольку априорное распределение используется необратимым способом. Во-вторых, достоверность сообщения перестает быть очевидной наблюдателю. И, наконец, в некоторых случаях, как, например, в радиолокации, после некоторого наблюдения могут поступать еще сигналы, относящиеся к тому же сообщению. При этом апостериорное распределение после первоначального наблюдения необходимо как априорное распределение для следующего сигнала.

Как показано в другой работе ^х), именно так обстоит дело, когда в радиолокационной системе осуществляется суммирование сигналов от импульса к импульсу. Преждевременный выбор оптимального сообщения делает невозможным такое комбинирование нескольких сигналов, и в результате может произойти потеря части полезных сведений.

Приложение

Функция Jlp(X_l)_t р_у(х)] может быть написана в более простой форме т]) как функция двух переменных I и tj. Тогда тождество/7) утверждает, что

J(a,» + /(p_t1f) = y(a_fT), (33)

¹J См. работу Вудворда в главе IH. (Прим. ред.)

ПРИЛОЖЕНИЕ

257

где а, р и у — частные значения переменных S и ij. Предполагается, что дифференцируема по £. Тогда, рассматривая в уравнении (33) приращение а до а+Sa:

Поскольку это тождество справедливо для всех значений P и Y, то —~~^ ¹⁷~~ не зависит от т]. Поэтому интегрирование по S дает

j(S₁t₁) = Z(S) + ^), (34)

где /(S) не зависит от Tj₁ а k(r_t) не зависит от S_i Но при подстановке из уравнения (34) в уравнение (33)

и, следовательно:

j(S₁t₁)=Z(S)-Z(t₁). (35) Уравнение (9) может быть теперь записано в форме

Поддерживая Y и S постоянными, напишем

/(a;) = /(a) + /Q + const. (36)

Если предположить, что /((•) дифференцируема, то, рассматривая небольшие изменения а в уравнении (36), найдем

. ^di l ^di Jw"

Полагая a = 1:

4; L=T' ⁽³⁷⁾

где Л — постоянная, равная /'(l). Поскольку уравнение (37)-тождество, то

\ № = 4

и, следовательно:

/(Q = Alcgc + ^, (38)

где А и В — произвольные постоянные. Это и есть искомый результат, использованный в уравнении (10).

Глава II

СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПРИЕМА РАДИОЛОКАЦИОННЫХ

СИГНАЛОВ *)

Ф. ВУДВОРД и И. ДЭВИС

1. ВВЕДЕНИЕ

Известно, что количество данных, которое может быть получено при любом физическом наблюдении, ограничено флуктуа-ционными процессами. По этой причине в радиотехнике всегда стремятся работать с сигналами, большими сравнительно с внутренними шумами канала. На первый взгляд можно заключить, что сообщения могут передаваться с удовлетворительной' скоростью только в том случае, если мощность сигнала P больше мощности внутренних шумов в системе N. Однако столь резкой границы не существует, ибо, как показано в части I, предельная скорость, с которой могут передаваться сообщения в присутствии шумов с равномерным спектром, равна

О)

если полоса ограничена частотой W. Тем не менее во многих практических системах при P=N обнаруживается порог разборчивости, однако это связано только со способом кодирования сообщений. Это не следует из уравнения (1), так как здесь подразумевается идеальное кодирование, которое может усложниться при P<jN. Порог особенно заметен, если при кодировании происходит нетопологическое возрастание первоначального числа измерений ²).

*) Ph. М. Woodward and I. L. D а v i е s, «А Theory of Radar Infor-mation», The Philosophical Magazine_f 41, № 321, 1001 — 1017, October 1950.

²) Как показано В. А. Котельниковым (см. §18, часть I), множество функций времени со спектром, ограниченным полосой частот W_f и определенных на интервале T может быть представлено совокупностью точек в пространстве 2WT измерений. При такой геометрической трактовке процесс кодирования эквивалентен преобразованию «пространства сообщений» в «пространство сигналов». При этом преобразовании размерность пространства сигналов, вообще говоря, может стать отличной от размерности пространства сообщений. При топологическом преобразовании, т. е. когда преобразование осуществляется однозначным непрерывным образом, размерности пространств должны быть одинаковы. При нетопологическом преобразовании, например, в случае передачи с частотной модуляцией или с кодовой импульсной модуляцией, размерность пространства сигналов должна быть существенно большей. В таких системах пороговый эффект действия помех выражен весьма заметно. (Прим. ред.)

ГЛ. II. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПРИЕМА СИГНАЛОВ

259

Простейшие данные, выдаваемые радиолокационной системой,— расстояния до отражающего объекта, который в этой работе считается неподвижным. Такие данные обладают только одним измерением, но так как они кодируются специальным образом, то размерность возрастает. В процессе работы повторяющиеся колебания (не обязательно последовательность импульсов) излучаются, отражаются объектом и принимаются. Предполагается, что наблюдение продолжается только конечное время — некоторое целое число периодов повторения, благодаря чему приемник получает конечное значение энергии сигнала. Наблюдатель сравнивает передаваемые и принимаемые колебания и старается определить время запаздывания. Наличие шумов при приеме ограничивает точность наблюдения.

Кик передаваемые, так и принимаемые колебания занимают значительную площадь на частотно-временной диаграмме и поэтому заключают в себе значительное число элементарных ячеек *). Пользуясь геометрической трактовкой ²), можно сказать, что их размерность высока. Но так как форма передаваемых колебаний неизменна, и вовсе не содержит нужных сведений, а принимаемые колебания представляют собой запаздывающую копию передаваемых, то неясно, ,можно ли также успешно использовать эту площадь на частотно-временной диаграмме, как и в обычной системе связи. Одна из задач работы — показать, что в этом смысле радиолокационные системы могут быть весьма эффективными.

Основная задача заключается, однако, в том, чтобы определить порог разборчивости³), который можно ожидать резко выраженным из-за принятого метода кодирования. В условиях разборчивого приема возможно определить точность, с которой может быть установлено значение расстояния до цели.

Математический анализ сосредоточивается вокруг одного важного понятия — распределения апостериорных вероятностей для времени запаздывания т между передаваемым и принимаемым сигналами. Это распределение вероятностей описывает все, что может быть известно относительно расстояния, после того как было

*) Понятие об элементарной ячейке AfAt (или об элементарном сигнале) связано со следующим. Для того чтобы сигнал, ограниченный полосой частот А/, можно было зарегистрировать на выходе приемного устройства, он должен воздействовать на это устройство некоторый минимальный промежуток времени At. В результате можно говорить об элементарной ячейке площадью AfM на частотно-временной диаграмме. Подробнее см. А. А. Харкевич, «Спектры и анализ», Гостехтеоретиздат, глава 1, §13, 1952. (Прим. ред.)

*) См. примечание на стр. 258. (Прим. ред.)

⁸) В дальнейшем мы сохраняем термины «порог разборчивости» и «разборчивый прием», заимствованные из техники радиосвязи, хотя следует помнить, что в данном случае речь идет о зрительном наблюдении, а не о слуховом приеме речи. (Прим. ред.)

260 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

произведено наблюдение. Оно формально выводится в § 3 после предварительного введения необходимой терминологии в § 2.

Как оказывается, распределение зависит от двух функций т, для которых приняты термины «функция сигнала» и «функция шумов». Они представляют собой функцию автокорреляции сигнала и функцию взаимной корреляции сигнала и шумов. Они обе зависят от известной формы передаваемых колебаний и от известных статистических характеристик шумов, но, кроме того, в отдельности зависят и от действительно принимаемых сигналов и шумов.

Сравнительное значение этих функций обсуждается в § 4, где доказываются некоторые их свойства. Так называемая функция сигнала показывает, в какой степени ограничена точность определения расстояния в присутствии шумов (§ 5). Ограничение точности; которое она описывает, представляет собой просто «топологическую неопределенность» наблюдения, поскольку она относится к области неопределенности в окрестности истинного значения дальности.

Вместе с тем функция шумов может создать ложные пики в распределении вероятностей, представляющие «нетопологическую неопределенность» или ненадежность, которая может появиться в результате наблюдения и сделать наблюдение бесполезным с практической точки зрения. Эта ненадежность возникает из-за нетопологического преобразования, упоминавшегося раньше.

Условия, при которых в радиолокационной системе возникает ненадежность, рассматриваются в § 6, где выводится формула для порога разборчивости. Наконец, в § 7 находится «энтропия» апостериорного распределения. За вычетом априорной «энтропии» она описывает количество данных, полученных при наблюдении. Интересно сравнить этот результат с общей формулой для пропускной способности канала связи. Полученные результаты кратко обсуждаются в заключительном параграфе.

2. МАТЕМАТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ КОЛЕБАНИЙ

Передаваемые высокочастотные колебания будут описываться комплексной функцией ф(/), а принимаемые колебания — функцией

_Yffl =аф(/-т)+.vffl. (2)

При приеме ф(/) претерпевает изменения по амплитуде и запаздывает на интервал т при прохождении до цели и обратно. v(/) есть комплексная случайная функция, представляющая шумы. Все эти комплексные функции образованы из вещественных функций, описывающих колебания, путем добавления мнимой составляющей в квадратуре по методу, изложенному, например, в работе Гэбора¹).

Гэбор, Journ. Inst. Electr. Eng., 93, ч. III, 429; 1945.

ГЛ. II. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПРИЕМА СИГНАЛОВ Г61

Проведение анализа при помощи таких комплексных функций не приводит к каким-либо ошибочным выводам; необходимо только помнить, что энергия, рассеиваемая в единичном сопротивлении, теперь не равна интегралу от квадрата функции, а составляет половину интеграла от квадрата модуля функции.

Ради чисто математических удобств будем полагать, что энергия шумов сосредоточена в конечной полосе частот. Если эта полоса достаточно широка, чтобы включить весь спектр ф(/), то никакой потери общности такое предположение не вносит. Действительно, оно просто эквивалентно допущению,что принимаемые колебания у(0 профильтрованы таким образом, чтобы ослабить шумы, оставив сигнал неизменным. Подобное ограничение шумов, предполагаемых равномерно распределенными по частоте, не имеет отношения к задаче об оптимальной фильтрации.

Поскольку у, ф и v являются высокочастотными функциями, их можно написать в виде

у = y(t) #**fJ₉

ф = u(t) e*W, (3) v = л(/)

где у у и и п — комплексные низкочастотные функции, а /₀—несущая частота, определяемая из

Можно показать, что при таком определении /₀ является центральной частотой энергетического спектра сигнала ф. Когда функция ф периодична, то это эквивалентно условию

}Ш-/о)Л=0, (5)

где интеграл берется по одному периоду, а / обозначает мгновенную частоту или скорость изменения фазы колебаний ф(/). Приведенные определения обладают тем преимуществом, что они одинаково хорошо применимы к любому виду модуляции.

В дальнейшем удобно ввести векторное представление электрических колебаний. Допустим, что z(t) — комплексная функция /, чей комплексный частотный спектр s_z(f) равен нулю вне участка частот (—W₉ W)y как это предполагалось для определенных выше функций//, и и п. Хорошо известно¹), что z(t) может быть полностью

^х)См. часть I, теорема 13. (Прим. ред.)

262 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

описана при помощи ряда дискретных значений г

у сле-

довательно, представлена в виде комплексного многомерного вектора z с этими составляющими.

Скалярное произведение двух таких векторов z и w равно

z*w=U г; W= 2W j sfQwQ dt. (6)

Второе уравнение может быть доказано путем последовательного применения теоремы Парсеваля¹) к интегралам Фурье, представляющим функции z(t) и +/), и к рядам Фурье, представляющим s₂(f) и s_w(f) в интервале (—W₉ W). Из уравнения (6) немедленно следует

u*u = \u\²=2W j \u(t)\*dt=AWE, (7)

где E обозначает энергию колебаний и или ф внутри участка интегрирования. Далее, если и' описывает колебания -—₉ можно оп-

ределить эффективную полосу частот P из уравнения

|u'|²=p²|uj². (8)

Эта полоса частот P с точностью до постоянного множителя совпадает с эффективной полосой частот по определению Гэбора, который

ft2

показал, что -|^- есть момент второго порядка энергетического

спектра и относительно начала отсчета, либо спектра ф относительно /₀.

Векторное обозначение особенно удобно при рассмотрении характеристик шумов, и результаты, полученные в этом разделе, будут использоваться в равной мере как в векторной, так и в интегральной форме, так как одна может быть преобразована в другую при помощи уравнения (6).

3. ОСНОВЫ ТЕОРИИ РАДИОЛОКАЦИОННОГО НАБЛЮДЕНИЯ

Центральной задачей является построение по данным принимаемым колебаниям и по известным переданным колебаниям распределения вероятностей для расстояния до цели, измеренного в единицах времени запаздывания т. Допустим, что действительное значение времени запаздывания есть т₀, а коэффициента а— а₀, тогда принимаемые колебания

T(O = OVKf-T₀)-MO. (9)

¹JCm. часть II, глава II, §2.4. (Прим. ред.)

ГЛ. II. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПРИЕМА СИГНАЛОВ

263

Чтобы построить распределение вероятностей для х (в общем случае также для а), когда известны только у(0 и ф(/), необходимо прежде всего определить плотность вероятностей для наблюдаемых колебаний *[(/) в предположении некоторых определенных значений т и а. Эта плотность вероятностей зависит только от тех значений шумов, которые необходимо выбрать для удовлетворения принятых предположений.

' При избранных значениях (х, а) щумы определяются как

или, пользуясь низкочастотными функциями (3):

Iy(I)I- ш(* — ~ ^2п1Ах] ^^iht Q 0)

Выражение в квадратных скобках может быть представлено вектором

у — аии)е-^\ (11)

где u(t—х) становится непрерывной векторной функцией от х, а ш=2тг/о.

Вектор (11) однозначно определяет высокочастотные флук-туационные шумы, и в предположении шумов, подчиняющихся нормальному закону, его многомерная плотность вероятностей пропорциональна

ехр [-~~'У—а'-¹"'-~~]. (,2)

Здесь N — средняя физическая мощность шумов, равная среднему квадрату как вещественной, так и мнимой части шумовых флуктуация в каждой точке отображения¹). «Дискреты» шумов не имеют между собой корреляции, поскольку предполагается, что шумы равномерно распределены по участку высоких частот шириной 2 W.

Если априорное распределение вероятностей для х и а обозначить р₀(х, а), то по принципу «обратной вероятности» их апостериорное распределение будет²)

• рЬ а) = р₀(х, а) ехр [- ~~'^+*"¹' ]~~ (13)

Это есть распределение частот истинных значений х и а по множеству, в котором принимаемые колебания у(0 фиксированы.

¹J Как и в главе I, так в дальнейшем будут называться точки, в которых берутся значения функции z ) » образующие составляющие многомерного вектора этой функции. Эти составляющие по примеру предыдущей главы будут именоваться «дискретами». (Прим. ред.)

²) Подробное изложение теоремы «обратной вероятности», устанавливающей связь между апостериорным и априорным распределениями вероятностей, приведено в главе I, § 1. (Прим. ред.)

264 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

Вместе с тем априорное распределение есть соответствующая частота по множеству из всех принимаемых „колебаний. Оно должно быть точно определено, прежде чем итти дальше.

Так как в этой работе рассматривается количество данных, несомых принимаемыми сигналами определенной энергии,, то предполагается, что коэффициент а постоянен и, следовательно, его априорное распределение

ip₀(a) = 8(a-a₀). (14)

Далее предполагается, что априорное распределение вероятностей для х равномерно по фиксированному интервалу T_t меньшему или равному периоду повторения передаваемых колебаний. Такое предположение не только является простейшим, но и наименее связывающим,поскольку оно представляет состояние наименьшего предварительного знания между пределами распределения. Поэтому внутри интервала T

PoU> ⁰O = -у ⁸(^а — ^ао). (15) Из (13)'следует, что апостериорное распределение для х равно

р(х) р(х,«) da = ехр [- ~~'У"++"¹²~~] (16)

внутри априорного интервала T и равно нулю вне его повсюду.

Это выражение будет теперь преобразовано к более удобному виду. Разлагая в ряд и опуская члены, не зависящие от х, получим ¹J

PtfY= ехр {-¾- Re у* Iu (х) е~¹ф } (17)

Из числа членов, которые исчезли, |у |² зависит от х₀, но не зависит от х, тогда как член | u(x) j² пропорционален энергии сигнала за интервал наблюдения и не зависит от х, поскольку он охватывает целое число периодов. Перейдем теперь к интегральной форке^

р(х) = ехр

^ReJ //*(/)w(/-x)e-^ia)Td/] (18)

где

N=2WN₀₉ (19) а Nо — средняя мощность шумов в единице полосы частот.

¹J Здесь и в дальнейшем Re обозначает вещественную часть соответствующего выражения, а Im—мнимую часть. (Прим. ред.)

ГЛ. II. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПРИЕМА СИГНАЛОВ

265

Из (3) и (9), подставляя у_у найдем

р(т) = ехр RejL_e-M^) I _[<u*_{t_ _)u{t__z) ₊

¹ ° ^J (20)

₊ a₀n*(t)u(t-t)e-^l^]dt}

Так как п(() — комплексная случайная величина, постоянная е~~^iaizO может быть включена в нее без изменения ее статистических свойств и поэтому в дальнейшем опущена. Обозначив фазу интеграла через 0 и написав

gU) = L jw*(/ - t₀)w(/ - т) dt, (21)

hU)= ^-Jn*(/)w(/-t)d/, (22) получим (20) в виде

р(т) = ехр {cos [ш(т - т₀) - 0].\g(z) + А(т)|}. (23>

Косинус — высокочастотная функция т, тогда как 0 и модуль — низкочастотные функции. Это означает, что апостериорное распределение состоит из последовательности близко расположённых пиков, лежащих под медленно изменяющейся огибающей. Эти пики возникают из сравнений, которые может делать наблюдатель между фазами несущих передаваемых и принимаемых колебаний.

Сведения, даваемые этой тонкой структурой, бесполезны, когда имеется неопределенность в различении одного пика от другого. Действительное распределение для т, обозначаемое Р(т), можно найти путем сглаживания кривой р(т) при устранении тонкой структуры. Важно, однако, иметь в виду, что хотя сведения, которые могли бы быть получены при сравнении фаз передаваемой и принимаемой несущих, не будут приниматься во внимание, в дальнейшем предполагается наличие фазовой когерентности от одного периода повторения модуляции до другого в течение интервала наблюдения. Другими словами, изменение фазы дает полезную информацию, но абсолютная величина — нет. 1¾ Сглаженное распределение легко получить интегрированием (23)

* . 2к _г ш

по т в пределах от т до т+——, полагая [в [этом интервале

изменения 0 и модуля незначительными. Это н равноценно взятию огибающей р(т), поскольку тонкая структура не имеет синусоидального характера. Интегрирование дает

PU) = Uokg+ V), (24)

266 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ B РАДИОЛОКАЦИИ

где I₀ — видоизмененная функция Бесселя; X — нормирующая постоянная. Следует подчеркнуть, что интегралы g и А распространяются на весь период наблюдения.

Свойства Р(т) в сильной степени зависят от относительной роли g и Л, которые можно рассматривать как составляющие распределения вероятностей, связанные соответственно с сигналом и шумами. Для удобства они будут называться функцией сигнала и функцией шумов. Первая представляет собой функцию автокорреляции сигнала, а вторая — функцию взаимной корреляции между сигналом и шумами.

4. ФУНКЦИИ СИГНАЛА И ШУМОВ

В этом разделе будут сформулированы некоторые свойства gU) и А(х) и попутно выяснен критерий оценки количества энергии, которое должны нести эхо-сигналы для удовлетворительного радиолокационного наблюдения.

Следует ожидать, что Р(х) должно иметь пик в окрестности истинной дальности х₀. Этот пик должен появиться из-за функции сигнала g(x). Во всех других местах g(x) будет практически незначительной вследствие специального выбора формы радиолокационных колебаний. Вблизи х₀ можно разложить u(t—х) по теореме Тейлора и получить из (21)

S^rW=ж j^u*⁽'

Utf — ^хо) —tf — h) Wtf — т₀) +

+ +(х-T₀jV(Z-T₀)j Л, (25)

пренебрегая высшими степенями т—т₀ и обозначая и'. Положив

P² = ^' <²⁶>

где E — теперь энергия принимаемого сигнала <х₀ф, можно получить из (7), (4) и (8) следующие полезные соотношения:

4j"*('-^xo)"(f ~h)dt = P², -ij_U*(Z-T₀)«'(Z-x₀)df=0,

-F₀J^x' ~ ^хо) u"tf - т₀) dt = - р* Р*

ГЛ. II. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПРИЕМА СИГНАЛОВ

267

Это — определенные интегралы, которые берутся по целому числу периодов повторения функции u(t). Второе соотношение зависит от определения (4) несущей частоты, а третье получается после интегрирования по частям. Поэтому¹)

gU) = Р²-}р²Р²(^-*о)² + 0(х - х_оу. (30)

Как будет видно, пик распределения g(x) в точке т₀ имеет высоту р², причем в его окрестности g(x) вещественна. Величина р²имеет важное значение, это — безразмерный энергетический параметр, постоянно встречающийся в излагаемой теории. Полученное выше разложение g(x) понадобится в дальнейшем при определении точности измерения дальности.

Теперь необходимо рассмотреть функцию шумов А(х) и ее влияние на g(x). Преобразование (22) к векторному обозначению дает

h(x) = -j- п* и(х). (31)

Это скалярное произведение является линейной функцией составляющих п. Результат представляет собой стационарную случайную функцию, причем распределения действительной и мнимой частей независимы и являются нормальными относительно нуля. Пользуясь аддитивными свойствами дисперсий, легко показать, что

[ReA(x)P = IImA(x)P= ^аЛ1^Ш ₌ _р2. ₍₃₂)

Далее, хорошо известно (часть И, глава III), что распределение амплитуд такой функции подчиняется закону

q(\h\)=^\h\ek7~ (33)

и что значение среднего квадрата | А | равно 2р^а.

Когда £<tf₀> эффективное значение p\f 2 модуля функции А(х) больше пикового значения р² функции g(x) и в Р(х) функции сигнала и шумов не различимы. Поэтому необходимый, хотя и недостаточный критерий удовлетворительного наблюдения заключается в том, что полная принимаемая энергия должна быть больше мощности шумов, приходящейся на единицу полосы частот (для удобства вычислений будем предполагать «много больше»).

¹)3нак О перед скобками указывает тот наибольший член разложения в ряд, который в дальнейшем отбрасывается. (Прим. ред.)

268 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ B РАДИОЛОКАЦИИ

Условие

P²» 2 или E > N₀ (34)

будет применяться на протяжении дальнейшей части работы. Оно недостаточно, поскольку само по себе не гарантирует, что площадь под кривой PU) вся сосредоточена вблизи т₀.

Немедленным следствием этого условия является то, что пик функции сигнала g(x) велик сравнительно с единицей.

Из (24) можно видеть, что это свойство еще усилено в PU), так как функция 1₀(х) асимптотически возрастает по показательному закону вместе с х. Поэтому .для практических радиолокационных колебаний пик кривой нормированного распределения вероятностей, вызванный функцией сигнала, будет сконцентрирован вблизи т₀ и в (30) высшими степенями (т—т₀) можно будет пренебречь.

Исключая области вблизи этого пика, функция сигнала будет иметь незначительное влияние на Р(х), и функция шумов (если она достаточной величины) одна будет определять это распределение. Поэтому полный интервал T₉ в котором определена функция PU), можно разделить на два участка. Первый участок включает пик Р(х), созданный функцией сигнала,— здесь Р(т) будет обозначаться PgU). Остальной участок имеет длительность, почти равную T₉где PU) будет обозначаться P_hU), ^так как функция g" почти не оказывает здесь влияния. Можно удовлетворительно разделить эти два участка, потому что P_hU) само состоит (когда р² велико) из последовательности изолированных и случайно возникающих пиков.

Первый участок будет определять точность, с которой может быть измерена дальность, тогда как площадь под вторым участком определяет степень ненадежности наблюдения.

Под ненадежностью наблюдения понимается вероятность того, что во множестве результатов наблюдений при фиксированных принимаемых колебаниях действительное значение дальности не лежит где-либо вблизи т₀.

Теперь наиболее важные свойства функций сигнала и шумов уже изложены и, как видно, если полная принимаемая энергия невелика по сравнению с мощностью шумов, приходящейся на единицу полосы частот, то от системы может быть получено только незначительное количество данных. Этот результат относится, конечно, не только к радиолокации; он следует в весьма общем случае из уравнения (1).

5. ТОЧНОСТЬ ИЗМЕРЕНИЯ ДАЛЬНОСТ

%^т Могут быть два различных статистических подхода к проблеме об ошибке наблюдения. Первый подход (обманчиво простой) заключается в фиксировании истинного значения и определении

ГЛ. II. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПРИЕМА СИГНАЛОВ

269

разброса оценок. Другой, применяемый в этой работе, состоит в фиксировании типичной формы принимаемых колебаний, отраженных от цели, расположенной на истинном расстоянии т₀, и в рассмотрении разброса истинных значений т, которые могли бы быть созданы такими принимаемыми колебаниями. Последний подход, связанный с введением распределения вероятностей Р(т), устраняет рассмотрение того,как оператор оценивает истинное значение, когда наблюдает принимаемые колебания.

Так как распределение PU) представляет свойства множества, в котором принимаемые колебания Y фиксированы, оно является частным, поскольку зависит от данного выбора Y- Поэтому необходимо рассмотреть средние статистические свойства Р(т) путем изменения Y» сохраняя т₀ постоянным [см. уравнение (9)1. Средние значения по этому множеству при фиксированном т₀ будут различаться от средних значений по множеству при фиксированном Y путем применения символа Cp вместо черты. Дальше будет показано, что распределение P_gU) является приближенно нормальным вблизи т₀, и вычислено его стандартное отклонение.

До сих пор любая ненадежность наблюдения, возникающая из-за поведения функции шумов hU) вне g-области вокруг т₀, игнорировалась, но ее влияние внутри этой области представляет интерес и может быть учтено следующим образом. Из уравнения (31) и разложения в ряд Тейлора и(1—т) функция шумов вблизи т₀ равна

[htf) = [П*и(т₀) -(т-т₀) n*U'(x₀) + С(т - T₀)»]. (35)

Можно показать, что, если р² достаточно велико, пренебрежение всеми членами, за исключением линейного и постоянного 'членов, не является серьезным, несмотря на необходимость включения квадратичного члена в соответствующее разложение ^(т).Поэтому можно написать

hU) = 5 + /4 = [5₀ + (* - *₀)П + / 1ъ + (* - ^xoh'h (36)

где Z₀₁T₁₀V ит]' — случайные величины во множестве с фиксированным т₀, обладающие нормальным распределением вокруг нуля. Из уравнения (32)

Cp GS) =Cp (TiS) = р». (37)

в при помощи таких же аргументов легко показать, что

Cp(^)-Cp(V²) = PV. (38)

Таким образом, \g+h\ может быть приближенно оценено в окрестности т₀ для последующей подстановки в уравнение (24).

270 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

Разлагая модули в ряды и пренебрегая всеми степенями (т—т₀) выше второй, получаем из уравнений (30) и (36)

I gtfHhtf) |-р»+5.+ 2+hw"-4-р²Р²(^о + +)*+

⁺⁰[v)- <³⁹>

Это выражение можно записать в более простой форме

\g ₊ h\^p* + _X--U-P²P²(X--C_m)», (40)

где из (37) и (38)

Cpx = 1. (41) Cpx_m = T₀, (42)

Cp(x_m-x₀)*=-U-. (43) Поэтому из уравнения (24) имеем вблизи т₀

(44)

P_gU) = ь/о р² + х - \- р²Р²(* - Vn)²J •

Асимптотическое разложение I₀ равно

'•««7¾^¹ + *-+⁰^)]- ^<46>

Тривиальное применение этого разложения показывает, что распределение P_gU) должно быть вблизи т₀ приближенно нормальным с параметрами

X=X_m, (46)

F^ = W- <⁴⁷> Поэтому стандартное отклонение т от его среднего значения в

ох= U > (48)

Это выражение представляет апостериорную неопределенность измерения дальности. То обстоятельство, что среднее значение т в P_g(x) само имеет такую же неопределенность по отношению к т₀ [уравнение (43)], не является простым совпадением. Именно этот результат следАало ожидать в результате применения «обратной вероятности»: оба разброса значений в действительности представляют один и тот же эффект. _ш /

ГЛ. II. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПРИЕМА СИГНАЛОВ

271

Уравнение (48) представляет первый результат, имеющий практический интерес. Неопределенность не зависит от частотной характеристики приемника, поскольку она была найдена безотносительно от какого-то определенного приемного устройства и представляет оптимальные свойства системы.

6. НЕНАДЕЖНОСТЬ НАБЛЮДЕНИЯ

В конце § 4 было отмечено, что степень ненадежности наблюдения есть вероятность того, что во множестве результатов наблюдений при фиксированном принимаемом сигнале действительная дальность х не находится где-то вблизи т₀. Поэтому ненадежность А может быть представлена площадью, лежащей под той частью кривой Р(х)₉ которая связана только с функцией шумов h{x)₉ т. е. в которой исключен пик сигнала, рассмотренный в предыдущем разделе. Она будет вычислена умножением ожидаемой площади, рассчитанной на единицу дальности х и связанной только с одной функцией А, на полный априорный интервал Т. Последний включает небольшой участок интегрирования вблизи т₀, который, строго говоря, следовало бы исключить, но так как для любой практической системы справедливо неравенство

T » + (49)

то это приближение является оправданным. Удобно определить P_h(x) в виде

= (50)

что совпадает с видом выражения (24) для Р(х)₉ за исключением области вблизи т₀. «Ожидаемая площадь на единицу дальности» под кривой P_h{x) является, конечно, ожидаемым значением P_hи может быть получена рассмотрением распределения вероятностей для |А| (уравнение 33). Поэтому

CpP_h= P_h = j P_hQ(P_h) dP_h, (51)

где

Q(P_h) dP_h = q(\h \)d\ А |. (52)

Оба средних значения в (51) равны, поскольку А(т) стационарная случайная функция. Интеграл может быть вычислен подстановкой q из (33) и P_h из (50), пользуясь разложением (45) для функции Бесселя. В результате получим

P_h=\e*²[\+0(p-% (53)

272 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

и ненадежность, определяемая средней площадью под кривой P_h(z)₉ равна

A = TP_h. (54)

Остается только определить нормирующий коэффициент X для P(z)₉ зависящий также от площади под кривой P_gU), связанной с функцией сигнала.

Эта площадь получается интегрированием распределения [уравнение (44)1, пользуясь опять разложением функции Бесселя.

В результате находим ¹J

fuW^ = ^r[l-SpⁱT +G(p"⁴)]. V

Пренебрегая по сравнению с единицей членами порядка р" чаем нормирующее уравнение

1= f UWdt + f P_htf)dx=

T T

(55)

полу-

(56)

Отсюда приближенно

A =

ТУЗ

(57)

?У 3 + ё

Таким образом, при постоянных T и (3 ненадежность уменьшается от значения, близкого к единице, до нуля по мере

возрастания -L р² — от-

10 15 EfN₀

Фиг. 1. Порог разборчивости.

ношения энергии принимаемого сигнала к мощности шумов, приходящейся на единицу полосы частот. Как видно из фиг. 1, изменение ненадежности происходит довольно резко, благодаря чему образуется порог разборчивости. Условно его можно определить значением Л =0,5, и, следовательно, при этом

р2₊ 1 ₌ 1_С£г туф.

(58)

*) Здесь ради удобства использовано среднее значение показательной функции [см. уравнение (41)1. Для дальнейшего это не имеет существенного значения, за исключением Л^0,5, когда в люээм случае неизбежны допол^-нительные приближения.

ГЛ. II. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПРИЕМА СИГНАЛОВ

273

При / jp²+l) > IogTp²P обеспечивается надежный прием. Это вто-

рой критерий успешного радиолокационного наблюдения.

7. КОЛИЧЕСТВО ДАННЫХ ПРИ РАДИОЛОКАЦИОННОМ НАБЛЮДЕНИИ

Количество данных, получаемых при радиолокационном наблюдении, равно разности «энтропий» ^г) априорного и апостериорного распределений вероятностей для дальности. Поскольку было предположено, что априорное распределение — прямоугольное с шириной T_y его «энтропия», определяемая в виде²)

(59)

равна

H₀ = IogT

(60)

Искомая «энтропия» апостериорного распределения есть средняя «энтропия» для PU), взятая по полному множеству возможных принимаемых колебаний. Поскольку, однако, «энтропия» не зависит от т₀, достаточно рассмотреть среднее по множеству при фиксированном т₀. Как й раньше, часть распределения вблизи т₀, а именно P_gU), и остающаяся часть, P_hU), будут рассматриваться раздельно, причем полная «энтропия» равна сумме.

Возникает, однако, трудность при вычислении «энтропии» некоторого данного распределения Р(т), поскольку при этом необходимо использовать правильное значение нормирующего коэффициента данного распределения, который изменяется по множеству с фиксированным т₀. Благодаря этому трудно выполнить интегрирование и для упрощения используется постоянное значение нормирующего коэффициента X, зависящее от средних свойств Р(х) и определяемое уравнением (56).

Флуктуации X при р²>1 связаны почти исключительно с P_hU), и пренебрежение ими оправдывается в любом из следующих двух случаев:

а) если полная площадь под кривой P_hU) мала, т. е. Л^О, и «энтропия» приближенно равна «энтропии» одного только распределения P_gU)',

б) если полный интервал Г, по которому берется P_hU), настолько велик, что P_h включает достаточный статистический образец тех свойств множества, которые влияют на «энтропию».

Это условие приводит к A 1, хотя вывод длинен и здесь опускается. Тогда «энтропия» связана почти полностью с P_hU)-

¹JCm. часть I, § Ц. (Прим. ред.)

²)3десь р(т) означает некоторое распределение вероятностей.

274 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

Таким образом, сначала следует вычислить среднюю «энтропию», связанную только с одним PgU), которая даст «энтропию» распределения Р(х) для A ^rO. Затем нужно определить «энтропию» за счет одного только P_hU), которая представляет «энтропию» распределения Р(х) для A =^l. Наконец, может быть найдено приближение для промежуточной (пороговой) области при пренебрежении флуктуациями нормирующего коэффициента.

Часть «энтропии», связанная с распределением P_gU), может быть найдена подстановкой в уравнение (59) усредненного выражения для P_gU) ^из уравнений (44) и (41), пользуясь разложением .I₀ и выполняя интегрирование. Это дает

CpH_g=

p²P

Iog -Ар+Р²+ U+°(P^-2)

. (61)

8р² / fV2r. 8

Но если Л^О, то из (55) нормирующий коэффициент определяется соотношением

а/⁺¹ (, 1

(62)

1)2

p²P

и, таким образом:

^cP ^Hg = ^loS^ +0(Р~²). (63)

Количество данных равно разности априорной и апостериорной «энтропий», т. е.

I = H₀-H₁ = IogT-H₁ (64)

и, следовательно:

Iog-UU-, ₍л ^ 0). (65)

У 2ке

Поскольку P_hU) — стационарная случайная функция, то можно вычислить среднее значение связанной с ней «энтропии» умножением ожидаемого значения P_hIogP_h на интервал интегрирования T Тогда, пренебрегая флуктуациями X:

Cp H_h = - Г|(3(Р_Л)Р_Л Iog P_a dP_h. (66) о

Отсюда, подставляя значения Q(P_h) и P_h из уравнений (52), (33) и (50), пользуясь разложением I₀ и интегрируя, получим

Р²/2

CpH_h=-XTe '

¹°£~^Тк + P² + \ + OiP'²) (67)

ГЛ. II. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПРИЕМА СИГНАЛОВ

275

Но если A =^l, то, пользуясь (53) и (54), найдем приближенное значение нормирующего коэффициента X из

Xd = -у- (68)

Тогда

Cp H_h = Io_g (ТрУЩ - L P² - L- + 0(_Р-²) (69)

и, следовательно:

/^Lp2_i_og(p-|/2^ + L (Л-1). (70)

Уравнения (65) и (70) дают приближенные значения количества данных при условии надежного и ненадежного приема за исключением области вблизи порога при А =0,5.

Когда А не лежит вблизи нуля или единицы, необходимо, конечно, нормировать Р(х), приняв во внимание как P_gU), так и P_hU)_rи пренебрегая флуктуациями нормирующего коэффициента, которые должны быть в этой области учтены. Значение X из уравнения (56) подставляется в уравнения (61) и (67), сложение которых дает приближенное среднее значение апостериорной «энтропии» H₁. После вычитания из H₀ получим

/¾—Iog

Vtoe^pe ² + -L-J

+ 0(р-2). (71)

Как будет видно, в зависимости от того, преобладает ли под знаком логарифма первый или второй член, т. е. A 0 или A =^=I, это уравнение сводится, как это и должно быть, к (65) или (70). Оно представляет лучшее приближение для полного количества данных, чем другие ранее приведенные уравнения, несмотря на пренебрежение флуктуациями нормирующего коэффициента.

8ЛОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Основные результаты изложенной теории иллюстрирует фиг. 2, где представлены зависимости количества данных / [уравнение

{71)] и ненадежности А [уравнение (57)] от величин In 7(3 и-^-

Как видно, линии / имеют совершенно разный характер по обе стороны от порога разборчивости (А =0,5). Когда ненадежность А мала, линии / асимптотически приближаются к пунктирным кривым, даваемым уравнением (65). Получаемые сведения в этой области обеспечивают почти надежное знание дальности, подверженной «топологической» ошибке, которая по § 5 имеет стандартное отклонение

Sx = -L

276 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

где

У N₀

ар — «эффективная полоса частот» передаваемых колебаний.

Как и следует ожидать, ошибка уменьшается по мере возрастания полной принимаемой энергии E_y если мощность шумов на единицу полосы пропускания N₀ остается неизменной. Она также уменьшается при увеличении ($, однако увеличение одной полосы

частот P с целью получе-

ния более высокой разрешающей способности имеет свои недостатки, поскольку наблюдение постепенно становится более ненадеж- * ным.

Когда ненадежность больше половины, графики / асимптотически приближаются к пунктирным вертикальным линиям, да

5 6 7 8 9

10 И 12 13 V* 15 EfN₀

ваемым уравнением (70),ко-

торые представляют верх-

Фиг. 2. Кривые количества данных и ненадежности.

ний предел количества данных при постоянной

принимаемой энергии. 'В общей теории (часть I) имеется подобцый же верхний предел, с которым можно провести сравнение. В весьма общем случае количество данных /, которое может быть извлечено из некоторого

принимаемого сообщения с энергией E_y ограничено величиной L

натуральных единиц. Этот результат получается из (1), еслй написать

I = Ct = Wt Iog {[ + -J_fLjj [нат. ед.],

где/—длительность сообщения. При Wt-+ao I достигает предельного значения

ⁱS M₀ 2 ^Р '

Соответствующий предел в радиолокационном случае при р —„оо меньше этого на {log р]/2тс — -LJ натуральных единиц. Можно показать, что расхождение вызывается данными, связанными с тонкой структурой, которые были умышленно игнорированы при переходе от уравнения (23) к (24). Если бы в радиолокаций можно

ГЛ. II. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПРИЕМА СИГНАЛОВ

277

было работать без высокочастотной несущей, то этого явления не возникало бы и предельные значения в ненадежной области (фиг. 2) точно соответствовали бы теоретическому пределу.

При нормальном приеме величины р, N₀ и априорный интервал T постоянны, тогда как E возрастает вместе с временем наблюдения. Поэтому при рассмотрении диаграммы начинают слева и постепенно двигаются вдоль горизонтали направо. Вначале количество данных быстро возрастает при постепенном уменьшении ненадежности. Однако после пересечения порога и перехода в рабочую область количество данных возрастает очень медленно и представляет постепенное улучшение точности.

Это явление находится в полном соответствии с идеями статистической теории передачи электрических сигналов. Как только приближенное положение цели известно с надежностью, поступающая в дальнейшем энергия постепенно увеличивает количество данных, которые уже частично известны. Разрешающая способность по дальности возрастает за счет непрерывного уточнения, а не за счет систематического исключения ошибки. По этой причине наиболее эффективная радиолокационная система должна работать как можно ближе к порогу разборчивости (насколько близко, зависит от допустимой степени ненадежности).

Необходимо подчеркнуть, что в этой работе рассматриваются фазово-когерентные принимаемые колебания и это существенно ограничивает практическое применение теории. Если параметр дальности т был бы сам функцией времени, то вводимые в теории интегралы по времени _Nдолжны были бы вычисляться иначе. При этом полный период наблюдения должен быть ограничен интервалом, достаточно малым, чтобы в. пределах его т могла бы рассматриваться как постоянная. В этих условиях нет основания отдать предпочтение (за исключением практических соображений) концентрации используемой энергии в одном периоде модуляции или распределении ее по нескольким периодам. Нет сомнения, однако, что в последнем случае энергия тратится напрасно, если нельзя использовать длительное фазово-когерентное интегрирование.

В полученные формулы не входит полоса пропускания приемника. До тех пор, пока эта полоса достаточно широка, чтобы включить весь передаваемый спектр, количество данных не изменяется при ее изменении. Выбор формы частотной характеристики зависит, только от наилучшего способа выделения данных, несомых принимаемыми колебаниями. Эта практическая задача в работе не рассматривается.

Глава III

•

ПРОЕКТИРОВАНИЕ РАДИОЛОКАЦИОННЫХ ПРИЕМНИКОВ НА ОСНОВЕ СТАТИСТИЧЕСКИХ МЕТОДОВ i)

Ф. ВУДВОРД 1. ВВЕДЕНИЕ

Задача этой работы — изложить математический метод (в форме несколько идеализированного примера), при помощи которого в принципе всегда могут быть определены свойства теоретически идеального радиолокационного приемника.

До последнего времени общепринято рассматривать отношение сигнал/шум как основной параметр при проектировании радиолокационных приемников. Принимались меры для получения максимально возможного отношения сигнал/шум на выходе приемника. Такой подход представляется в настоящее время ошибочным, поскольку это отношение не служит мерой фактически получаемых при радиолокационном наблюдении данных. Путем пропускания колебаний через нелинейное устройство отношение сигнал/шум часто может быть искусственно увеличено, не изменяя вовсе количества данных.

В радиолокации необходимо дать ответ на такие вопросы, как наличие или отсутствие цели, ее дальности, движется ли она и т.- д.

Попытка сконструировать приемник, дающий точные ответы на один или все эти вопросы, оказывается неудачной, так как показания неизбежно искажаются шумами. Но требование автоматического определения относительных вероятностей всех возможных ответов представляется вполне реальным, и никакое приемное устройство не может, вероятно, дать что-либо большее.

В дальнейшем будет показано, как эта идея используется для решения часто встречающейся задачи — определения времени запаздывания периодического сигнала известной формы и амплитуды. В радиолокации это означает измерение дальности до неподвижной цели, наличие которой и сила отраженного ею сигнала известны. Хотя эта задача и имеет искусственный характер, но она достаточна для иллюстрации предлагаемого метода и сама по себе не лишена практического интереса.

Количество данных, несомых радиолокационным сигналом, было вычислено в другой работе²)без указания какого-либо действи-

¹) Ph. М. Woodward, «Information Theory and the Design of Radar Receivers», Proe of the IRE, 39, № 12, 1521 — 1524, December 1951.

²) См. главу II, часть III. (Прим. ред.)

ГЛ. III. ПРОЕКТИРОВАНИЕ РАДИОЛОКАЦИОННЫХ ПРИЕМНИКОВ 279

тельного способа их получения. В настоящей работе делается упор на вопросы проектирования радиолокационного приемника, а не на оценку его действительных качественных показателей.

2. ПРИНЦИП «ОБРАТНОЙ ВЕРОЯТНОСТИ» И ФУНКЦИЯ КОЛИЧЕСТВА ДАННЫХ

Излагаемый метод целиком основан на принципе «обратной вероятности»¹), устанавливающем связь между апостериорными и априорными вероятностями гипотез

P(H_nIOb) = P(H_n)P(OblH_r). S (1)

Здесь Р(Н_п I Ob) — апостериорная вероятность гипотезы H_n, после того как результат наблюдения станет известным; P(H_n) — априорная вероятность гипотезы Н_п\ Р(ОЬ\Н_п) — вероятность наблюдения, если гипотеза H_n правильна. В рассматриваемом случае «гипотезами» являются все возможные временные запаздывания данного периодического сигнала. «Наблюдение» — просто данный принятый сигнал вместе с воздействующими на него шумами, запаздывающий на неизвестный промежуток времени. Предполагается, что шумы обладают равномерным спектром и подчиняются нормальному закону распределения вероятностей.

Следует иметь в виду, что «принятый сигнал» — это не сигнал на выходе приемника, поскольку в этом случае предрешался бы весь вопрос. Речь идет о сигнале на входе приемника, включая и шумы, которые могут быть созданы в самом приемнике.

Априорные вероятности гипотез образуют непрерывное распределение вероятностей для неизвестного временного запаздывания т. Ради простоты это распределение принимается равномерным в промежутке времени, равном одному периоду сигнала. Впрочем, в излагаемую теорию могут быть введены и другие сведения, основанные на предварительном знании.

Наибольшим, что можно определить при помощи приемника на основании принятого сигнала, является апостериорное распределение вероятностей для временного запаздывания т. Это распределение и является искомыми данными. Наиболее удобно иметь дело с его логарифмом Q(x), который в дальнейшем будет называться «функцией количества данных».

Тогда уравнение (1) можно написать в виде

Q(x) = Iog Р(ОЬ\ х) + const, (2) где Р(ОЬ\ х) — плотность распределения вероятностей для принятого сигнала в случае гипотезы х. Постоянный член есть просто логарифм нормирующего коэффициента апостериорного распределения; в дальнейшем он опущен.

Ц Подробнее см. § 1, глава I, часть III. (Прим. ред.)

280 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

3. ВЫЧИСЛЕНИЕ ФУНКЦИИ КОЛИЧЕСТВА ДАННЫХ

Рассмотрим случай, когда истинное значение временного запаздывания сигнала есть т₀, и запишем принимаемый сигнал при помощи вещественных функций в виде

YQ = G(Z-T₀) + /(/). (3)

Здесь G(Z) — высокочастотный сигнал, который был бы принят при отсутствии шумов и временного запаздывания; предполагается, что он известен заранее. Допустим, что G(Z) периодически модулирован и хотя удобнее рассматривать импульсный сигнал, теория справедлива для любой периодической модуляции, включая частотную.

Функция /(Z) представляет воздействующие на сигнал шумы. Плотность распределения вероятностей величины /(Z) в любой данный момент времени Z предполагается подчиняющейся нормальному закону, но это понятие необходимо обобщить. Можно показать, например, применением теоремы о разложении непрерывной функции *), либо методами статистической механики, что плотность вероятностей функции шумов /(Z) в целом, обладающая соответствующим числом измерений²), пропорциональна

ехр

. .⁷Voj

I(f)*dt

(4)

где N₀ — средняя мощность шумов в единице полосы частот.

Для наблюдения доступен сигнал F(Z), а не непосредственно временное запаздывание т₀, поэтому необходимо поочередно испытать все возможные значения т. При избранной гипотезе т можно заключить, что одни шумы должны описываться выражением F(Z) — G(Z—т), для которого плотность вероятностей пропорциональна

ехр {- Lj IYQ - G(Z - т)]2 dt} (5) Следовательно, согласно уравнению (2):

Q(T)=-Lj [YQ-GQ-*)]* dt. (6)

Таким образом, функция данных пропорциональна интегралу квадрата уклонения принимаемого сигнала от гипотетического, свободного от воздействия шумов, сигнала с временным запаздыванием т. При изменении гипотетического временного запаздывания т его значение, обеспечивающее минимум среднеквадра-

¹J См. часть I, теорема 13. (Прим. ред.)

²) Подробнее см. § 3,глава I, часть III. (Прим. ред.)

ГЛ. III. ПРОЕКТИРОВАНИЕ РАДИОЛОКАЦИОННЫХ ПРИЕМНИКОВ 281

тичного уклонения от принятого сигнала, соответствует максимуму функции количества данных. С точки зрения наблюдателя именно это значение т есть наиболее вероятная величина временного запаздывания.

Пределы интегрирования в уравнении (6) выбираются в соответствии с исследуемой частью принятого сигнала; необходимо, чтобы она была равна целому числу периодов повторения модуляции. Если разложить подинтегральное выражение на три члена, то оказывается, что интеграл с G² не зависит от т вследствие периодичности, а интеграл с Y² по уравнению (3) зависит от т₀, но не от т. Следовательно, эти два члена можно исключить из выражения для Q(x), так как все величины, не зависящие от т, можно включить в ранее опущенный нормирующий множитель. Тогда остается

QW = if^y(W-^T)^d7- (7>

Можно сказать, что подинтегральное выражение существует для всех значений Z, но т сосредоточено внутри некоторого промежутка с определенными, заранее фиксированными, пределами, скажем, между 0 и R—периодом повторения сигнала G(Z). Область существования подинтегрального выражения может быть представлена схематически в виде полосы бесконечной длины в направлении Z, шириной R в направлении т (фиг. 1).

Если необходимо образовать функцию количества данных QU), чтобы она представляла все данные, содержащиеся в принятом сигнале F(Z) в интервале (О, R), то Y(t)G(t—т) должно быть


я	В D
			W	А	/
0 R 2		Я

Фиг. 1. Два метода интегрирования данных о дальности цели.

проинтегрировано по Z в пределах от 0 до R для каждого значения т, как это показано на фиг. 1 заштрихованным квадратом. Последующие наблюдения отраженных сигналов связаны, очевидно, с дальнейшими этапами интегрирования, пределы которых всегда будут отмечаться на диаграмме вертикальными линиями.

Неудобство этого процесса с практической точки зрения состоит в том, что все данные, накопленные за один какой-то интервал, становятся доступными мгновенно в конце интервала, а затем следует перерыв, пока выполняется новое интегрирование.

Существует другой более естественный, хотя математически

282 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

и менее прямой метод. При выполнении интегрирования не в последовательных квадратах, а в параллелограммах, как показано на диаграмме, функция количества данных становится известной постепенно во времени от т=0 до T=R (от Л до В на графике). В тот момент времени, когда достигнута точка В, начинается новый цикл от С до D. Таким образом, устанавливается зависимость между т. и Z, имеющая как бы форму пилообразной кривой временной развертки.

Этот процесс «прогрессивного» интегрирования соответствует, конечно, не фиксированным пределам в интеграле уравнения (7), а пределам, совместно перемещающимся во времени. Действительно, значение функции количества данных в момент времени Z= =/zR+t, где п относится к n-му циклу развертки, а т заключено между OhR, равно

Q_nW =Ufy(W--C) Л. (8)

t-R

С точки зрения математического исследования неудобно, что функция количества данных есть логарифм распределения апостериорных вероятностей для т только в том случае, когда пределы интегрирования постоянны. Другими словами, каждое гипотетическое значение т должно быть испытано, строго говоря, на одной и той же части принятого сигнала. Здесь нет возможности подробно рассмотреть этот вопрос, следует только указать, что «прогрессивное» распределение вероятностей

Р_п(т) = е (9)

(нормирующий множитель опущен) достаточно для всех практических целей как точное апостериорное распределение. В частности, если данные, полученные в последовательные периоды принятого сигнала, объединяются либо путем суммирования Q_nпо п, либо перемножением P_n, результирующее распределение отличается от истинного апостериорного распределения только вследствие краевых эффектов, которые постепенно уменьшаются.

4. ИДЕАЛЬНЫЙ ФИЛЬТР, ВКЛЮЧЕННЫЙ ПЕРЕД ДЕТЕКТОРОМ

Функция количества данных, определяемая уравнением (8)* допускает очень простую интерпретацию. Форма этого выражения» представляющего линейную суперпозицию, аналогична выражению для сигнала на выходе линейного фильтра. Действительно, это— сигнал на выходе фильтра в момент времени t=nR+x при подаче на вход принимаемого сигнала Y(f). При этом импульсивная реак-

ГЛ. III. ПРОЕКТИРОВАНИЕ РАДИОЛОКАЦИОННЫХ ПРИЕМНИКОВ 283

ция фильтра определяется как

(LG(Z —х), 0<Z<R, S(Z)-L ^V ^ ^ (10)

(О, Z<0 и Z>R.

Подобный фильтр (если не считать коэффициента пропорциональности Lj был рассмотрен Ван-Влеком и Миддльтоном¹),

показавшими, что он является единственным линейным фильтром, обеспечивающим максимум отношения импульсного сигнала к шумам. (Это свойство не имеет, однако, значения для излагаемрй теории.) Амплитудно-частотная характеристика фильтра имеет такую же форму, что и амплитудный спектр одного периода входного сигнала G₉ а его фазово-частотная характеристика по абсолютным значениям равна, а по знаку противоположна фазовому спектру G.

Конечно, на выходе фильтра получается модулированный высокочастотный сигнал. Если его пропустить через выпрямитель с показательной характеристикой, соответствующей уравнению (9), то он будет описываться выражением, аналогичным уравнению «прогрессивного» распределения апостериорных вероятностей для т. Выше уже указывалось, что если данные, полученные в отдельные периоды, должны быть объединены, то/перед выпрямлением несколько циклов Q может быть сложено вместе. Эта операция представляет собой просто фазово-когерентное сложение, производимое от импульса к импульсу. Его следует делать только в том случае, когда т совершенно не зависит от BpeivfeHH, как до сих пор предполагалось.

Действие этого идеального фильтра сводится к тому, что выходной импульсный сигнал становится сходным с особенно большим выбросом шумов; все структурные особенности, отличавшие первоначально сигнал от шумов, устранены и преобразованы в разницу по амплитуде. Это может показаться странным, поскольку сигнал и шумы на выходе имеют разные спектры мощности. К тому же, если сигнал на входе представляет собой прямоугольный импульс, шумы на выходе можно рассматривать как множество перекрывающихся прямоугольных импульсов, тогда как сигнал на выходе будет треугольным импульсом. Остается, однако, фактом, что множество прямоугольных импульсов, перекрывающихся на микроскопических интервалах при образовании шумов, подчиняющихся нормальному закону, создает такой фон, на котором невозможно различить очертания одиночного треугольного импульса. Если бы действительно особенности структуры выходно-

¹J Дж. В а н-В лек и Д. Миддльтон, «Теоретическое сравнение визуального, слухового и инструментального приема импульсных сигналов при наличии шумов», Journ. AppL Physics, 17, 940, ноябрь 1946.

284 ЧАСТЬ III. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В РАДИОЛОКАЦИИ

го сигнала можно было бы еще использовать, то мы тем самым пришли бы к абсурдному заключению, поскольку уже отмечалось, что наиболее вероятное значение х получается при выборе выходного сигнала наибольшей амплитуды независимо от его формы.

5. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Как было показано, распределение апостериорных вероятностей для временного запаздываниях принимает форму, аналогичную форме модулированных высокочастотных колебаний на выходе линейного фильтра, искаженных по амплитуде или «выпрямленных» устройством с показательной характеристикой. Это, естественно, приводит к такой функции от х, огибающая которой при достаточно большом сигнале имеет пик вблизи истинного значения х₀. Под огибающей этой функции лежит множество тонких пиков, создаваемых несущей частотой.

Эта тонкая структура представляет последовательность вероятных и невероятных значений х, возникающих при сравнении фазы несущей частоты в функциях F(Z) и G(Z). Когда создаваемое этой тонкой структурой весьма ненадежное знание дальности не представляет интереса, она может быть устранена путем сглаживания иди «детектирования» апостериорного распределения таким образом, чтобы сохранить площади в интервалах высокочастотных периодов. Действительно, когда х изменяется со временем достаточно быстро, чтобы воспроизвести данные, заключенные в высокочастотной структуре распределения, от одного периода развертки до следующего, *но недостаточно быстро, чтобы это значительно сказалось на модуляции, данные последующих периодов могут быть объединены только после устранения высокой частоты.

Апостериорные распределения после «детектирования» должны быть перемножены, либо произведено сложение их логарифмов. Таким путем однозначно определяется идеальная характеристика детектирования (имеющая форму Iog I₀, где I₀ — модифицированная функция Бесселя), если после детектирования должно быть произведено последовательное суммирование импульсов.

В настоящей работе не делается попытка развить теорию дальше или устранить из нее принятые допущения. Из сказанного должно быть ясно, что задача получения всех данных из сигнала, искаженного шумами, в принципе может быть однозначно решена одним универсальным методом. Для этого необходимо сформулировать вопрос, написать распределение апостериорных вероятностей для всех возможных ответов на этот вопрос и интерпретировать полученное выражение конкретным физическим устройством. Таким образом, задача расшифровки сигналов исключается, поскольку апостериорное распределение и представляет исщмые данные.

КРАТКИЙ УКАЗАТЕЛЬ ЛИТЕРАТУРЫ

А. Н. Колмогоров, Основные понятия теории вероятностей, ОНТИ, 1936. А. Я. Хинчин, Основные законы теории вероятностей, ГТТИ, 1932. Б. В. Г н е д е н к о, Курс теории вероятностей, ГТТИ, 1950. Г. Крамер, Случайные величины и распределения вероятностей, ГИИЛ, 1947.

М. А. Лео н то вич, Статистическая физика, ГТТИ, 1944.

A. А. Харкевич, Спектры и анализ, ГТТИ, 1952.

И. С. Г о н о р о в с к и й, Частотная модуляция и ее применение, Связь-издат, 1948.

B. Л. Грановский, Электрические флуктуации, ОНТИ, 1936.

В. И. Б у н и м о в и ч, Флюктуационные процессы в радиоприемных устройствах, Советское радио, 1951.

А. Я. Хинчин, Теория корреляции стационарных стохастических процессов, „Успехи математических наук", вып. 5, 1938.

A. Н. Колмогоров, Статистическая теория колебаний с непрерывным

спектром, Юбилейный сборник АН СССР, т. I, 1947.

B. А. Котельников, О пропускной способности „эфира" и проволоки

в электросвязи, „Материалы к I Всесоюзному съезду по вопросам технической реконструкции связи", 1933. В. А. Котельников, Проблемы помехоустойчивой радиосвязи, „Радиотехнический сборник", Госэнергоиздат, 1947.

B. И. С и фор о в, О влиянии помех на прием импульсных сигналов, „Ра-

диотехника", № 1, 1946.

C. В. Бородич, О помехоустойчивости связи с импульсно-кодовой моду-

ляцией, „Радиотехника", № 5, 1949. В. И. Бунимович и М. А. Леонтович, О распределении числа больших отклонений при электрических флуктуациях, „Доклады АН", новая серия, вып. 1, 1946.

ОГЛАВЛЕНИЕ

Предисловие 3

Часть I

К. Шэннон. Статистическая теория передачи электрических

сигналов 7

Введение 7

Глава L Дискретные системы без шумов И

1. Дискретный канал без шумов . И

2. Источник дискретных сообщений ... t4

3. Графическое представление цепей Маркова 16

4. Эргодические и смешанные источники . 1 /

5. Выбор, неопределенность и „энтропия" 19

6. „Энтропия" источника сообщений . . . . 23

7. Представление процессов кодирования и декодирования 27

8. Основная теорема для канала без шумов . 28

9. Обсуждение результатов и примеры 31

/ лава II. Дискретный канал с шумами 35

10. Представление дискретного канала с шумами . 35 И. Ненадежность и пропускная способность канала ... 36

12. Основная теорема для дискретного канала при наличии

шумов..... . 39

13. Обсуждение результатов 43

14. Пример дискретного канала .... 44

15. Пропускная способность канала в некоторых специаль-

ных случаях ^ ... . 46

16. Пример эффективного кодирования 48

Глава JlI. Непрерывные сообщения . 49

17. Множества и ансамбли функций . 49

18. Ансамбли функций с ограниченной полосой частот 53,

19. «Энтропия» непрерывного распределения 54

20. «Энтропия» ансамбля функций..... 57

21. Потеря «энтропии» в линейных фильтрах . 59

22. «Энтропия» суммы двух ансамблей функций 61

Г лава IV. Канал с непрерывной передачей . . 63 *23. Пропускная способность канала с непрерывной передачей . . .................. 63

24. Пропускная способность канала при ограничении сред-

ней мощности...... .......... 65

25. Пропускная способность канала при оградичении пико-

вой мощности . 69

Глава V. Скорость создания сообщений для непрерывного источника ............... 73

26. Функции оценки верности воспроизведения . . 73

27. Скорость источника при данной оценке верности 76

28. Вычисление скорости создания сообщений 78

Приложение 1 80

Приложение 2 80

Приложение 3 82

Приложение 4 83

Приложение 5 84

Приложение 6 85

Ч а ст ь II

С. Райе. Теория флуктуационных шумов 88

Глава I. Дробовой эффект 88

1.1. Вероятность поступления на анод точно К электронов

за промежуток времени T . .88

1.2. Теорема о наложении случайных возмущений 89

1.3. Доказательство теоремы о наложении случайных возмущений . . 91

1.4. Распределение тока I(t) . 93

1.5. Обобщение теоремы о наложении случайных возмуще-

* ний . . 95

1.6. Сходимость распределения тока / к нормальному закону ... . . 99

1.7. Составляющие Фурье тока / (t) 100

Глава П. Энергетический спектр и функция корреляции 104

2.1. Некоторые результаты обобщенного гармонического анализа ... . 105

2. 2. Энергетический спектр для постоянной и периодической составляющих . . . 106

2.3. Обсуждение выводов первого раздела — ряды Фурье 108

2. 4. Обсуждение выводов первого раздела — теорема Парсе-

валя . . . НО

2.5. Гармонический анализ случайных функций 112

2.6. Первый пример — дробовой эффект . 114

2.7. Второй пример — случайный телеграфный сигнал 118

2.8. Представление тока шумов . . 121

2.9. Нормальное распределение нескольких переменных 123

2.10. Центральная предельная теорема 124

Глава 111. Статистические свойства флуктуационных шумов 126

3. 1. Распределение тока шумов 126

3.2. Распределение /(/) и I(t+z) 12^ ^г3.3 Ожидаемое число нулей в 1 сек. 131

3.4. Распределение нулей .... 137 3. 5. Кратные интегралы, входящие в формулы 147 3.6. Распределение выбросов тока шумов . . 151

3. 7. Плотность вероятностей для огибающей тока шумов 155 V- 3. 8. Выбросы огибающей 159.

3.9. Флуктуации энергии . . . 167*

3.10. Распределение суммы из тока шумов и синусоидального тока ... .... . 178

3.11. Некоторые дополнения о токах дробового эффекта 187

Глава IV. Прохождение сигнала и шумов через нелинейные устройства . 189

4. 1. Ток низкой частоты на выходе квадратичного детек-

тора . . ..... ......^. 189

4. 2. Tq^ низкой частоты на выходе линейного детектора 192 4. 3. Некоторые статистические свойства тока на выходе нелинейного устройства общего типа 196 4.4. Выходной энергетический спектр 204

4.5. Энергетический спектр на выходе устройства с квадратичной характеристикой ..... 205

4.6. Два метода функции корреляции . .... .211

4.7. Линейное детектирование шумов — первый метод 212

4. 8. Метод характеристической функции ........215

4. 9. Энергетический спектр на выходе нелинейного устройства общего типа . ........ . . . 218

4. 10. Некоторые результаты, полученные методом функции

корреляции . ............... 223

Приложение 4 А. Таблица нелинейных устройств, описываемых интегралами ... . 230

Приложение 4 В. Функция ₁F₁(a; с\ х) . .......231

Приложение 4С. Энергетический спектр, соответствующий Г 233

Часть III

Применение статистических методов в радиолокации 239 Глава I. Ф. Вудворд и И. Дэвис. Принцип «обратной веро- *

ятности» в теории передачи сигналов . . . 239

1. «Обратная вероятность» и передача сообщений 239

2. Теория получения данных..... . 243

3. Шумы и апостериорное распределение 248

4. Корреляционный приемник . . . 251

5. Заключение и обсуждение результатов 254 Приложение 256

Глава IL Ф.7 Вудворд и И. Дэвис. Статистическая теория

приема радиолокационных сигналов 258

1. Введение ....... . . 258

2. Математическое представление колебаний . . 260

3. Основы теории радиолокационного наблюдения 262

4. Функции, сигнала и шумов 266

5. Точность измерения дальности 268

6. Ненадежность наблюдения . . .... 271

7. Количество данных при радиолокационном наблюдении 273

8. Обсуждение результатов 275

Глава III. Ф. Вудворд. Проектирование радиолокационных

приемников на основе статистических методов 278

1. Введение ... . . .... 278

2. Принцип «обратной вероятности» и функция количества данных . . 279

3. Вычисление функции количества данных . . 280

4. Идеальный фильтр, включенный перед детектором 282

5. Обсуждение результатов . .284

Краткий указатель литературы JJ 285

Редактор Л. Б. БАСКАКОВА Технический редактор А.В. Вилленева Корректор А. С. Кириллова Сдано в производство 22/ХП 1952 г. Подписано к печати 17/Ш 1953 г. А02085. Бумага <TOX92Vi_e=9 бум. л.-18 печ. л. Уч.-изд. л. 18,5. Изд.*» 15/1981. Цена 14 р. 45 к. Зак. № 974.

20-я типография „Союзполиграфпрома* Гдавиздата Министерства культуры СССР* Москва, Ново-Алексеевская, 52.



	ТЕОРИЯ ПЕРЕДАЧИ ЭЛЕК1ШЧ ЕСКИХ СИГНАЛОВ ПРИ НАЛИЧИИ ПОМЕХ

	СБОРНИК ПЕРЕВОДОВ Под редакцией *Н. А. ЖЕЛЕЗ НОВ A ^*	\

	Г*-

	\ управление научной информации

	ИЗДАТЕЛЬСТВО ИНОСТРАННОЙ ЛИТЕРАТУРЫ Москва —1 953



	ЧАСТЬ I СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ ЭЛЕКТРИЧЕСКИХ СИГНАЛОВ¹* к. шэнной

	ВВЕДЕНИЕ Развитие различных методов модуляции, таких, как импульсно-кодовая и временная импульсная модуляции, которые уменьшают требования к отношению сигнал/шум за счет расширения полосы частот, повысило интерес к общей теории связи ²K В настоящей работе мы расширим теорию с тем, чтобы включить в нее некоторое число новых факторов, в частности влияние шумов в канале и возможность улучшения связи за счет использования статистической структуры исходного сообщения и свойств оконечного получателя сообщений. Основная задача связи заключается в точном или приближенном воспроизведении в одной точке сообщения, выбранного в некоторой другой точке. Существенно, что действительное сообщение является одним, выбранным из определенного множества возможных сообщений. Система должна быть спроектирована таким образом, чтобы она обеспечивала передачу любого возможного сообщения, а не только того, которое действительно будет выбрано, так как последнее в момент проектирования еще не известно. Если число сообщений во множестве конечно, то это число или некоторая мано^нная функция от него может быть принята за меру количества д^ных⁵^передаваемых тогда,когда из множества выбирается одно сообщение, причем все возможности выбора равновероятны.

	¹I С Е. Shannon and W. Weaver «The Mathematical Theory of Communication», The University of Illinois Press, 3—89, 1949. ²) Термины «связь» и «система связи» понимаются автором весьма широко. Системой связи может быть любая система, предназначенная для передачи и приема сигналов, будь то система радиосвязи, радиолокации, телемеханики и пр. (Прим. ред.) ⁱ ⁸) В оригинале применяется термин «информация». Поскольку, однако, автор в дальнейшем придает ему специальное значение, устраняя семантические аспекты этого термина, мы от него отказались. (Прим. ред.)



	Глава I ДИСКРЕТНЫЕ СИСТЕМЫ БЕЗ ШУМОВ

	1. ДИСКРЕТНЫЙ КАНАЛ БЕЗ ШУМОВ Телеграф и телетайп являются двумя простейшими примерами дискретного канала. Вообще же дискретный канал означает систему, в которой может быть передана из одной точки в другую последовательность наборов из конечного ряда элементарных символов S_i,...,S„. Предполагается, что символ S_i имеет длительность во времени t_£ секунд (не обязательно, чтобы все символы обладали одинаковой длительностью, например точки и тире в телеграфии). Не обязательно также, чтобы все возможные последовательности символов S_i могли передаваться системой; могут допускаться только некоторые последовательности. Это будут возможные сигналы для канала. Например, в телеграфии предполагаются следующие символы: 1. Точка, состоящая из замыкания линии на некоторую единицу времени и последующего размыкания на такое же время. • 2. Тире, состоящее из замыкания на три единицы времени и размыкания на одну единицу. 3. Пробел между буквами, состоящий, скажем, из размыкания на три единицы. 4. Пробел между словами — размыкание линии на шесть единиц времени. Необходимо наложить ограничения на допустимые последовательности, чтобы пробелы не следовали друг за другом, так как два промежутка между буквами дают промежуток между словами. Теперь рассмотрим вопрос о том, каким образом можно измерить пропускную способность такого канала. В случае телетайпа, где все символы обладают одинаковой длительностью и допустимы все последовательности из 32 символов, ответ очень прост. Каждый символ представляет собой пять двоичных единиц. Если система передает п символов в 1 сек., естественно сказать, что канал обладает способностью передачи в 5 п двоичных единиц в секунду. Это не означает, что канал телетайпа будет всегда передавать сообщения с такой скоростью. Это — максимально возможная скорость, и будет ли в действительности достигнут этот максимум, зависит от источника сообщений на входе канала.



14	часть i. статистическая теория передачи сигналов

Теорема 1 Пусть Ь'$ означает длительность s-ro символа, который возможен в состоянии / и ведет к состоянию /. Тогда пропускная способность канала С равна Iog W_f где W— наибольший вещественный корень уравнения в виде определителя V» As)
		=O_f

где 8^ = 1, если /=/, и нуль в противном "случае. Например, в случае телеграфии определитель имеет еид

I — 1 (W-+W-) {W-+W-) (W-+W~—])			=0.

Разложение этого определителя дает уравнение, которое приводилось выше для этого случая. 2. ИСТОЧНИК ДИСКРЕТНЫХ СООБЩЕНИЙ Мы уже видели, что при весьма общих условиях логарифм числа возможных сигналов в дискретном канале линейно возрастает со временем. Пропускная способность может быть определена указанием скорости этого возрастания: числа двоичных единиц в секунду, требуемого для задания отдельного применяемого сигнала. Рассмотрим теперь источник сообщений. Как следует математически описывать источник и какое количество данных, измеренное в двоичных единицах в секунду, создает такой источник? Знание статистических свойств источников имеет большое значение для уменьшения необходимой пропускной способности канала путем рационального кодирования сообщений. Например, в телеграфии передаваемые сообщения состоят из последовательностей букв. Эти последовательности, однако, не вполне хаотичны. Вообще говоря, они образуют фразы и имеют статистическую структуру,, скажем, английского языка. Буква E появляется много чаще, чем Q_yпоследовательность TH чаще, чем XP_y и т. д. Наличие такой структуры позволяет экономить время (или пропускную способность канала) путем рационального кодирования последовательностей сообщений в последовательности сигналов. В ограниченных пределах это всегда делается в телеграфии: самый короткий символ в канале — точка применяется для наиболее частой в английском языке буквы E_y в то время как редкие буквы Q_y X_y Z выражаются более длинными последовательностями тире и точек. Еще отчетливее проводится этот принцип в некоторых коммерческих кодах, где наиболее обычные слова и фразы изображаются кодовыми группами из четырех или пяти букв, что дает значительную экономию среднего времени.



	ГЛ. i. ДИСКРЕТНЫЕ СИСТЕМЫ БЕЗ ШУМОВ	23

	Она равна HM = -^Pihj) Iog P₁(J). U Эта величина показывает, какова в среднем неопределенность значения у при известном х. Подставляя значение P₁(J)₉ получим нм = -S Piⁱ> D ^1ое P(U) + S P(U) iog S P(U) = н (х₉у) - я (х) *U U J* или Я(х, у)=Н(х)+Н_х(у). Неопределенность (или «энтропия») совместного события (х, у) есть неопределенность события х плюс неопределенность события у, когда х известно. 6. Из 3 и 5-го пунктов имеем Н(х) + Н(у) > Я(х, у) = Н(х) + Н_х(у). Отсюда Н(У) > Н_х(у). Неопределенность события у никогда не возрастает вследствие знания события х. Она уменьшается, если только события х и у не являются независимыми.- В противном случае она не изменяется. 6. «ЭНТРОПИЯ» -ИСТОЧНИКА СООБЩЕНИЙ Рассмотрим дискретный источник с конечным числом состояний, вроде рассмотренных выше. Для каждого возможного состояния i имеется совокупность вероятностей P_i(J) создания различных возможных символов /. Для каждого состояния существует «энтропия» H_i. «Энтропия» источника определяется как среднее значение этих H_iy каждому из которых приписан вес, в соответствии с вероятностью появления соответствующего состояния H= 2 P_iH_l = - у₄ P_i P_i(J) Iog P₁(J). *i U* Это — «энтропия» источника на символ текста. Если процесс Маркова развивается с определенной скоростью, то можно говорить также об «энтропии» в секунду i где J₁ — средняя частота (появлений в секунду) состояния и Очевидно, H^t= тН_у где т — среднее число символов, создаваемых за 1 сек. H или H' измеряют количество данных, создаваемое источником на символ или за секунду. Если в качестве основания логарифмов



28		ЧАСТЬ i. СТАТИСТИЧЕСКАЯ ТЕОРИЯ ПЕРЕДАЧИ СИГНАЛОВ

ние Cti может создать х_у который превращает P₁ в р₂, и эта линия дает вероятность этого х в данном случае. Линия обозначается группой из у_г символов, создаваемых четырехполюсником. «Энтропия» выходного эффекта может быть вычислена как взвешенная сумма по всем состояниям. Если суммировать сначала по Р, то получающиеся члены меньше или равны соответствующим членам для а, следовательно, «энтропйя» не возрастает. Присоединим выход несингулярного четырехполюсника к обратному четырехполюснику. Если Н\_у H^f₂ и Н'_ъ суть «энтропии» выходных эффектов соответственно источника, первого и второго четырехполюсников, то Н\>Н'₂>Н^=Н\ и, следовательно: я; =я, Пусть имеется система с ограничениями, наложенными на возможные последовательности того типа, который можно представить линейным графиком фиг. 2. Если вероятности p^{sX* приписаны различным линиям, соединяющим состояние / с состоянием /, то эта система будет источником. Существует один частный способ назначить вероятности, который дает максимум «энтропии» (см. Приложение 4). Теорема 8 Пусть система с ограничениями, рассматриваемая как канал, обладает пропускной способностью C=IogU?. Если положим B_j

	IJ где T!* — длительность s-ro символа, ведущего от состояния i к
V- состоянию /, а B₁ удовлетворяет условию B_l=^B_jW V, *S_tJ* то «энтропия» H имеет максимум и равна пропускной способности С. Путем надлежащего назначения вероятностей переходов «энтропия» символов в канале может быть доведена до максимума, равного пропускной способности канала.

8. ОСНОВНАЯ ТЕОРЕМА ДЛЯ КАНАЛА БЕЗ ШУМОВ Проверим теперь правильность интерпретации величины H_yкак скорости создания данных, путем доказательства того, что H определяет пропускную способность канала, необходимую при наиболее эффективном кодировании.



	ГЛ. i. ДИСКРЕТНЫЕ СИСТЕМЫ БЕЗ ШУМОВ	29

	Теорема 9 Пусть источник имеет «энтропию» H (двоичных единиц на символ), а канал обладает пропускной способностью С (двоичных единиц в 1 сек.). Тогда можно закодировать сообщения на выходе источника таким образом, чтобы передавать символы по ка- C _лналу со средней скоростью-^--е символов в 1 сек., где е — сколь угодно мало. Передавать со средней скоростью, большей чем С -Jf_y невозможно. Обратная часть теоремы, утверждающая, что нельзя превзойти скорости А, может быть доказана, если заметить, что «энтропия» на входе канала за 1 сек. равна «энтропии» источника, так как передатчик должен быть несингулярным четырехполюсником, и что эта «энтропия» не может превзойти пропускной способности канала. Отсюда #'<С и число символов в 1 сек. равно _ < _ . Первая часть теоремы будет доказана двумя различными способами. Первый способ состоит в рассмотрении совокупности всех последовательностей из N символов, создаваемых источником. При большом N можно разделить их на две группы, одна из которых содержит меньше чем 2(^H+ri)^N членов, а вторая меньше чем 2^RV членов (где R — логарифм числа различных символов) и имеет полную вероятность, меньшую ja. Если N возрастает, т\ и ц приближаются к нулю. Число сигналов в канале, каждый длительностью T_t больше чем 2(^С_0)Г, причем 6 мало, когда T велико. Если-выбрать



	то найдется достаточное число последовательностей канальных символов для группы, обладающей высокой вероятностью, когда NuT достаточно велики (как бы ни было мало X), а также несколько добавочных последовательностей символов. Группа последовательностей с высокой вероятностью произвольным, взаимно однозначным образом, кодируется в эту совокупность. Остающиеся последовательности представляются более длинными, начинающимися и заканчивающимися одной из последовательностей, не использованных для группы с высокой вероятностью. Эта особая последовательность играет роль стартстопного сигнала другой кодовой комбинации. Между ними сохраняется временной интервал, необходимый для образования достаточного числа различных последователь-



ГЛ. i. ДИСКРЕТНЫЕ СИСТЕМЫ БЕЗ ШУМОВ		33

вать статистическую экономию, возможную благодаря знанию частот букв, но ничего больше. Источник с максимальной «энтропией» будет тогда первым приближением к английскому тексту и его «энтропия» определит необходимую пропускную способность канала. В качестве простого примера использования некоторых из полученных результатов рассмотрим источник, создающий последовательность букв, выбранных из ряда A_y B_y С, Dc вероятностями V₂, ¹ ₄» ¹^s» ¹Zs» причем последовательные символы выбираются независимо. Имеем

и /1 , I_lIi 1,2. 1 \ 7¹ H = - ^ Iog₂ _т + j Iog₂- + _Tlog_2Tj ₌ _т	двоичных единиц символ

Таким образом, для кодирования сообщений этого источника двоичными знаками в пределе достаточно в среднем V₄ знака на символ. В этом случае можно действительно достигнуть предельного значения, применяя следующий код (полученный по^методу второго доказательства теоремы 9): А О В 10 С ПО , D 111. Среднее число двоичных знаков, применяемых для кодирования последовательности из N символов, будет ^({xi + 4х²+\|хз) =\n. Легко видеть, что двоичные знаки 0,1 имеют вероятности V₂, V₂, так что «энтропия» для кодированных последовательностей равна одной двоичной единице на символ. Так как в среднем имеем V₄ двоичных знаков на букву оригинала, то «энтропия» на единицу времени будет той же самой. Максимально возможная «энтропия» для первоначального ряда равна lcg24=2 и имеет место, когда A_y B_y C_y D обладают вероятностями V₄, V₄, V₄, V₄. Отсюда относительная «энтропия» равна V₈. Мы можем перевести двоичные последовательности в первоначальный ряд символов в соотношении 2 к 1 по следующей таблице: 00 A^t 01 B^f10 С И D^f



ГЛ. II. ДИСКРЕТНЫЙ КАНАЛ С ШУМАМИ		45

Имеем Н(ху=-P IcgP—2Q IcgQ, H_y(X) = 2Qa. Надо выбрать PnQ таким образом, чтобы Н(х)—Н_у(х) имело максимум при наложении условия P+2Q=1. Тогда U=-PlcgP -2Q Icg Q -2 Qa + ) (Р + 2Q), ?p=-l-lcgP + X=0, A =-2-2 Icg Q -2а -и 2Х =0.

P

Лередсгвсгемь/е символы	Принимаемые символы

P Фиг. 10. Пример дискретного канала. Исключая X, напишем lcgP = lcgQ + a, P = Qe= Q?, P = -L • О - —^!-fi + 2 ' ⁴ ~~ р + 2 Пропускная способность канала равна C = Ic_g^ Заметим, как это подтверждает очевидные значения в случае P=I и р= L В первом случае р=1 и C=Icg 3, что правильно, так как канал свободен от шумов и имеет три возможных символа. Если P=-T^y Р=2 H*C=lcg2. Здесь второй и третий символы не могут быть отличимы друг от друга и действуют совместно как один символ. Первый символ употребляется с вероятностью ^=+, а второй и третий вместе — с вероятностью V₂, которая может быть распределена между ними любым способом, причем всегда достигается максимальная пропускная способность. При промежуточных значениях р пропускная способность канала будет заключена между Icg 2 " Icg 3. Различие между вторым



	гл. ii. дискретный канал с шумами	47

	Примеры показаны на фиг. 11. В таком случае Н_у(х)ис зависит от распределения вероятностей между входными символами и равняется —2/Ag Piy ^где Pi — значения вероятностей переходов от любого входного символа. Пропускная способность канала равна тах [Н(у) — Н_х(у)] = = тах H(у) + 2 P_i Iog P_i.



	а 6 * Фиг. 11. Примеры дискретных каналов с одинаковыми вероятностями переходов (для каждого входного и выходного эффекта).

	Максимум H(у)_у очевидно, равен Jcg т_у где т — число выходных символов, так как все они могут быть сделаны равновероятными, если сделать равновероятными входные символы. Поэтому^про-пускная способность канала равна C= Iog т+ 2 Pi Iog P_i. Для случая, приведенного на фиг. 11,а, С = Iog4— Iog 2= Iog 2. Это значение будет достигнуто при использовании только первого и третьего символов. Для случая, показанного на фиг. 11,6, С = Iog 4- A Iog 3- -L Iog 6= = Iog 4- Iog 3- A Jog 2= IogA₂V, Для случая, приведенного на фиг. 11,в, идоеем С = Iog 3- A Ic_g 2- -1 Iog 3- 4 Iog 6 = ⁼ ^l0g 2^3¹/' 6^1/«'



	62	часть i. статистическая теория передачи сигналов

	Теорема 15 Пусть средняя мощность двух ансамблей ^функций бу* дет N₁ и ZV₂, а их энтропийные мощности — ZV₁ и ZV₂. ^Т/>~ца энтропийная мощность суммы ZV₃ ограничена пределами N₁+N₂<N_S<H₁+N₂. «Белые» шумы с нормальным распределением имеют свойство поглощать всякие другие шумы или ансамбли сигналов, которые могут быть сложены с ними. При этом результирующая энтропийная мощность приближенно равна сумме мощности «белых» шумов и мощности сигнала (измеренной от среднего значения сигнала, которое обычно равно нулю), если только мощность сигнала мала (в определенном смысле) по сравнению с шумами. Рассмотрим функциональное пространство п измерений, связанное с этими ансамблями функций. «Белые» шумы соответствуют сферическому нормальному распределению в этом пространстве. Ансамбль сигналов соответствует другому распределению, не обязательно нормальному или сферическому. Пусть моменты второго порядка этого распределения относительно его центра тяжести будут aj. Другими словами, если p(x_l9...,x_n) есть функция плотности распределения, то *^aU* = J • • • $p(i — /) (^xJ — ^ау) *^dx^* • • • *^dxn>* где OL₁ координаты центра тяжести, а a_i;. — определенно положи -тельная квадратичная форма. Повернув координатную систему, можно выравнять ее с главными направлениями этой фюрмы. Тогда CLj приводится к диагональной форме Ь_и. Потребуем, чтобы каждая форма Ь_ц была мала сравнительно с ZV — квадратом радиуса сферического распределения. В этом случае шумы и сигнал создают нормальное распределение, соответствующая квадратичная форма которого есть N + *b_u.* Энтропийная мощность этого распределения равна или приближенно *(N" +* 2б_йА/»-о»/«=л/+ -E S *ь_и.* Последний член есть мощность сигнала, первый — мощность шумов.



	Глава V СКОРОСТЬ СОЗДАНИЯ СООБЩЕНИЙ ДЛЯ НЕПРЕРЫВНОГО ИСТОЧНИКА

	26. ФУНКЦИИ ОЦЕНКИ ВЕРНОСТИ ВОСПРОИЗВЕДЕНИЯ В случае дискретного источника была определена конечная скорость создания сообщений, а именно «энтропия» соответствующего стохастического процесса. Для непрерывного источника положение оказывается значительно более сложным. Прежде всего непрерывно изменяющаяся величина предполагает бесконечное число значений и поэтому для точного задания требует бесконечного числа двоичных знаков. Это означает, что при передаче выходного эффекта непрерывного источника для точного воспроизведения сообщения в месте приема, вообще говоря, необходим канал с бесконечной пропускной способностью. Поскольку в каналах существует обычно определенный уровень шумов и,следовательно, пропускная способность ограничена, точная передача невозможна. Это рассуждение, однако, обходит действительное положение вещей. Практически при непрерывном источнике может интересовать не точная передача, а передача с определенным допуском. Вопрос заключается в том, можно ли приписать непрерывному источнику конечную скорость в том случае, когда требуется только определенная верность воспроизведения, измеренная подходящим способом. Разумеется, при возрастании требований к верности воспроизведения скорость создания сообщений ""будет возрастать. Как будет показано, в весьма общих случаях можно определить такую скорость. Путем надлежащего кодирования создаваемые сообщения можно передать по каналу, пропускная способность которого равна рассматриваемой скорости, и выполнить при этом требования к верности воспроизведения. Канал, обладающий меньшей пропускной способностью, такой возможности не обеспечивает. Прежде всего необходимо дать общую математическую формулировку понятию о верности передачи. Рассмотрим группу сообщений большой длительности, скажем T секунд. Источник описывается заданием в соответствующем пространстве плотности вероятностей Р(х) того, что будет выбрано рассматриваемое сообщение. Данная система связи описывается (с внешней точки зрения) заданием условной вероятности Р_х(у) того, что если источник создал сообщение X_t воспроизводимое сообщение в месте приема будет у. Система в целом (включая источник и передающую систему) опи-



гл. v. скорость создания сообщении		77

ся наименьшая скорость. Эта последняя и есть скорость, приписываемая источнику при рассматриваемой верности воспроизведения. Обоснование этого определения заключается в следующей теореме. Теорема 21 Если источник при данной оценке V₁ имеет скорость создания сообщений R_l9 то можно закодировать сообщения на выходе источника и передавать их по каналу с пропускной способностью С при верности воспроизведения, как угодно близкой к v_l9 если только R_±< С. Это невозможно, если R₁^C. Последнее утверждение теоремы немедленно следует из определения R₁ и предыдущих результатов. Если оно не справедливо, ^ ^ двоичных единиц то можно было бы передавать больше чем С-
	сек. по каналу с пропускной способностью С. Первая часть теоремы доказывается методом, аналогичным использованному при доказательстве теоремы 11. Прежде всего следует разделить пространство (х_у у) на большое чцсло малых ячеек и рассматривать этот случай как дискретный. Это изменит функцию оценки не больше чем на произвольно малую величину (если ячейки весьма малы) вследствие предполагаемой для функции р(х_у у) непрерывности. Допустим, что Р_г(х_у у) есть частная система, пр^т<* которой скорость минимальна и равна R₁. Выберем из высоковероятных сообщений у по произволу некоторый ряд, содержащий

членов, где при Г-> оо е 0. При большом T каждая выбранная точка будет соединена линией высокой вероятности (к^к на фиг. 9) с рядом х. Вычисления, подобные использованным при доказательстве теоремы И, показывают, что при большом T почти все х охватываются «веерами» линий, идущими от выбранных точек у_у почти при любом выборе у. Соответствующая система связи действует следующем образом. Выбранным точкам приписываются двоичные числа. Когда появляется сообщение х, оно будет (с вероятностью, достигающей 1 при T--* оо) расположено, по крайней мере, на одном из «вееров» линий. Тогда по каналу передается соответствующее двоичное число (или, если их несколько, одно произвольно выбранное число), закодированное надлежащим образом для обеспечения малой вероятности ошибок. Это возможно, поскольку R_x< С. В приемной точке восстанавливается соответствующее у_у которое и используется как принимаемое сообщение. Оценка v\ для этой системы может быть сделана сколь угодно близкой к р_ь если взять T достаточно большим. Это обусловливается



80	часть i. статистическая теория передачи сигналов

Приложение 1 Пусть N_i(L) будет число групп символов длительностью L_yзаканчивающихся в состоянии /. Тогда имеем

i, s где Ь\р *bf_jy ...>bj—длительности символов, которые могут быть выбраны в состоянии / и приводят к состоянию /. Эти выражения суть линейные разностные уравнения, свойства которых при L—► oo должны быть вида Л^т_у = A_jW^l*Подставляем в разностное уравнение

AW = X^aI^w		-А

или h^is) A_j = I_dA_lW-"»

Чтобы это было возможно, определитель 0(V) = \|a_/y\| = \|2V ^u -8_iy\|

должен быть равен нулю, что дает W_y который, конечно, является наибольшим действительным корнем уравнения D=^CK Тогда величина С равна Замечаем, что придем к тому же результату, если потребуем, чтобы все группы начинались с одного и того же произвольно выбранного состояния. Приложение 2 /1 1 t \ Пусть Hi — , — —-) = А(п). По условию (3) можно разбить выбор из числа S^m равных возможностей на ряды по т выборов из s равных возможностей в каждом и получить A(s^m) = mA(s).



приложения						81

Точно так же A(t") = nA(t). Можно выбрать п произвольно большим и найти т из условия s^m < tⁿ<J s^m+i. » Таким образом, логарифмируя и деля на п \og s, найдем

т__			IcgZ __ Iogs ^ л п

или

HL-^^tI ^ _е /i Iog 5 '

где е — произвольно мало. Теперь из свойств монотонности А (п) A(s^m)^A(t")^A(s^m+i), mA(s)^ nA(t) < (m-f Следовательно, деля на az^(s):

m		Л(0 A(s)		п ~ п

или

MQ A(s)	m п		MQ A(s)		О, Л(0 = -ZClogZ,
	Iog/

где /( должно быть положительным, чтобы удовлетворить условию (2). Допустим теперь, что имеется выбор из п возможностей с соизмеримыми вероятностями p_L = , где щ — целые числа. Можно разделить выбор из ^ щ возможностей на выбор из п возможностей с вероятностями P₁,..., р_п и затем, если i было избрано, произвести выбор из H_i возможностей с равными вероятностями. Пользуясь опять условием (3), приравняем полный выбор из ZⁿL ^В03' можностей, вычисленный двумя способами KlogEn_i= Н(р_ъ..., р_п)+KE P_iIogn_i. Следовательно: н = к (Е P_i iog Ещ-Е P_i iog щ) = = - к E P_i iog ^^l- = - кЕ P_i iog P_r



	Если pi иррациональны, они могут быть апроксимированы правильными дробями и то же самое выражение должно сохраниться при предположении о непрерывности. Таким образом, это выражение справедливо в общем случае. Выбор коэффициента К производится из соображений удобства, он определяет единицу измерений. П р ил" о ж?е"н и е 3 Предположим, что источник является эргодическим, так что применим сильный закон больших чисел. Таким образом, число пересечений данной траектории P_ij* в последовательности большой длины N приблизительно пропорционально вероятности нахождения в состоянии / (скажем, P_i) и последующего выбора этой траектории, т. е. P_iP_ijN. Если N достаточно велико, то вероятность ошибки ±8 при этом меньше е, так что для всех случаев за исключением группы малой вероятности действительные числа заключены в пределах {P₁ P_ij ±8) N. Следовательно, почти все последовательности имеют вероятность

		P=ILPij [иной
	~тИ~ ^0ГР^аничен величиной

	или Это доказывает теорему 3. Теорема 4 немедленно следует отсюда по вычислении Верхнего и нижнего пределов для n(q)_y основанных на диапазоне возможных значений р в теореме 3. В смешанном (не эргодическом) случае, если ^L=X PiK а «энтропии» составляющих суть Н₁>Н₂>...>Н_пУ справедливо следующее предложение. Теорема есть убывающая ступенчатая функция 5—1 5 w(q) = H_s в интервале J Ja..



84	часть i. статистическая теория передачи сигналов

где B₁ удовлетворяет уравнению *_ (S)* /\s Эта однородная система имеет не равное нулю решение, поскольку W таково, что определитель коэффициентов равен нулю

У М)

= 0.

Выбранные таким образом р%- являются подходящими переходными вероятностями, так как прежде всего (s)

V		Pv -LtbT ^w - ~вГ~^и
		Pv -LtbT ^w - ~вГ~^и
j, s J_y s так что сумма вероятностей в любой частной узловой точке равна единице. Далее, они не отрицательны, как это можно видеть из рассмотрения величин A_i (Приложение 1). Все A_i обязательно не отрицательны, а B_i удовлетворяют подобной же системе уравнений, только с переменой местами / и /. Это приводит к обратной ориентации линий на графике. Подставляя эти значения p\f в общее уравнение для скорости, получим R - *i^{s)*

2 Pip¹O 4} _ Iog W 2 *PiPⁱO ^liO* - 2 PiP^kQ '°g *⁸J+* 2 *PiP*^tQ *^loS Bi _Лп„ _ш п* ~ 2 PW 4 -IOgw-C Таким образом, скорость при этой группе переходных вероятностей ровна С, и поскольку эта скорость никогда не может быть превзойдена, то она является максимальной. Приложение 5 Пусть S₁ будет некоторое измеримое подмножество g-ансамбля, а S₂— подмножество /-ансамбля, которое дает S₁ в результате операции Т. Тогда S₁=TS₂. Пусть H^x будет оператор, смещающий на интервал времени X все функции множества. Тогда H^xS₁=H^xTS₂=TH^xS_2t



	86	часть i. статистическая теория передачи сигналов

	Рассмотрим тогда U=— \[г(х) Icg г(х)+1р(х) Iogp(X) + ^q(X) Icg q(x)] dx, W=- J {[ 1 + Iog г(х)] Щх) + X [ 1 + Iog р(х)] Ър(х) + + p[l+\cgq(x)]bq(x)}dx. Если р(х) изменяется при частном значении аргумента X_i=S_i, изменение г(х) равно br(x) = q(x_i — s_i) и bU=—^(X_i — S₁) Iog r(x) dx_i — X Iog P(S_i) = 0. Так же точно обстоит дело, если изменяется q. Таким образом, условия минимума \q(x_t — S_i) Iog Jx_i) dx_t=—\ Icg P(S_i)_t — s_t) Iog г(X_i) dx-_L = —Iog q(s_i). Если умножить первое выражение на P(S_i)_f а второе на q(s^ и проинтегрировать по S_f то можно получить H_z = — Xtf₁, H_z = -^H₂ или, решая относительно X и ^ и подставляя в уравнения: H₁ ^(X_i — S_i) Icgr(X_l) dx_t=— H_z Iogp(S_i), H₂ Jp(x, ~ S₁) Iogr(X_i) dx~— H_z Iog q(_Si). Допустим теперь, что p(x_t) и q(x_t) подчиняются нормальному закону Тогда r(x_t) будет также подчиняться нормальному закону с квадратичной формой C_ij. Если обратные величины этих форм составляют CL_ijt *b_ijt* C_iJ_t то



	ЧАСТЬ II ТЕОРИЯ ФЛУКТУАЦИОННЫХ ШУМОВ¹* С. РАЙС

	Глава I ДРОБОВОЙ ЭФФЕКТ

	Дробовой эффект в электродных лампах представляет собой типичный пример шумов. Эти шумы являются следствием флук-туаций интенсивности потока электронов, текущего от катода к аноду. Здесь будет рассмотрен упрощенный тип дробового эффекта. 1.1. ВЕРОЯТНОСТЬ ПОСТУПЛЕНИЯ НА АНОД ТОЧНО К ЭЛЕКТРОНОВ ЗА ПРОМЕЖУТОК ВРЕМЕНИ T Предположим, что флуктуации электронного потока являются беспорядочными, и будем трактовать эту случайность следующим образом. Подсчитаем число электронов, поступающих на анод за длительный промежуток времени T_y измеряемый в секундах. Допустим, что оно равно /C₁. Повторяя процесс подсчета для многих промежутков длительностью T_y получим ряд чисел /C₂, /C₃,... Км* где M — полное число таких промежутков. Среднее число электронов в секунду V определяется как V= Iim i + »-" + Af, (1.1-1) M- оо MT ^V ' причем предполагаем, что этот предел существует. По мере увеличения M при постоянной величине T некоторые /С будут иметь одинаковые значения. Действительно, при возрастании M число К, имеющих какое-то данное значение, будет стремиться к увеличению. Это заключение основано на предположении, что электронный ток представляет собой постоянный ток, на который накладываются беспорядочные флуктуации. Вероятность попадания на анод К электронов за данный опыт определяется как p^jfj_Jj_m число опытов, дающих точно К электронов j_ M •* оо Al

	^г) S .О. Ric е, «Mathematical Analysis of Random Noise», Bell System Technical Journal, 23, № 3, 282-332, Julv 1944, 24, № 1, 46—156, January 1945.



92	часть ii. теория флуктуационных шумов

если M—► оо:

OO оо ^ -\- со W= 2 р^)Щ) = 24 п+е-Цпъ dt = TV= О K = O 7

= v Jz⁷(Z) Л, (1.3-4)

что и доказывает первую часть теоремы. Этот детальный вывод быд применен для доказательства сравнительно простого соотношения (1.3—4), чтобы иллюстрировать метод, который может быть применен для доказательства более сложных выводов. Конечно, соотношение (1.3—4) легко установить, замечая, что интеграл представляет собой среднее значение эффекта, вызываемого поступлением одного электрона, причем это среднее значение взято за 1 сек., а V есть среднее число поступлений электронов за 1 сек. Чтобы доказать вторую часть (1.2—3) теоремы, сначала вычислим Z²(Z) и воспользуемся соотношением

[/(Z) - /(Z)I² = /² (Z) - 2/(/) /(Z) + /(Z)² = Z² (Z) -/(Z)². (1.3-5) Из определения I_K(t) в уравнении (1.3—1) следует

M') = 2 2 м-у nt-t_m).
		1 m=l

Усредняя это выражение по всем значениям Z₁,Z₂,..., Z^, поддерживая Z постоянным, как и в (1.3—2), получим KK⁷ ^Т MW = X 2 [-J- \-«F{t-t_k)F{t-t_m). Кратный интеграл имеет два различных значения. Если k=tn» то его значение равно

F\t-t_k)^,

а если k+=m_y то т


J4(/-4)4j F{t-t_m)-j			m t


Подсчет числа членов в двойной сумме показывает, что первое значение имеют К членов, а второе значение (К²—К) членов.



ГЛ. I. ДРОБОВОЙ ЭФФЕКТ		93

	Следовательно, если Д<7<7—Д, то + оо +оо 2 ILt) = $ dt + <£72 [ j _Л ] - оо —оо* Усредняя по всем интервалам, а не только по тем, в которые на анод поступает К электронов, получим Щ = 2 P(K)Iut) = V Г F\t)dt + Wy, K-O J — OO где суммирование по К выполняется так же, как в (1.3—4), а после суммирования подставляется значение (1.3—4) для /(Z). Сравнение с (1.3—5) доказывает вторую часть теоремы. 1.4. РАСПРЕДЕЛЕНИЕ ТОКА I(t) Если выполняются некоторые условия, то часть времени, в течение которого ток /(Z) заключен в пределах (/,/+<//), равна P(I) dl_y где при V—* оо плотность вероятностей P(I) сходится к 1 -(/-7)²/2а* —е ¹ (1-4—1)
^qI /2к Здесь / — среднее значение /(Z), равное (1.2—2), а квадрат стандартного отклонения о₇ , т. е. дисперсия, равна (1.2—3). Нормальное распределение следовало ожидать в силу «центральной предельной теоремы» теории вероятностей. Она утверждает, что при некоторых условиях распределение суммы большого числа случайных переменных сходится к нормальному закону распределения, дисперсия которого равна сумме дисперсий отдельных переменных. Подобным же образом среднее значение нормального распределения равно сумме средних значений отдельных переменных. До сих пор говорилось о предельной форме плотности вероятностей P(I). Можно написать точное выражение для P(I)_f которое, однако, весьма сложно. Из точного выражения может быть получена предельная форма. Найдем теперь это выражение. В соответствии с тем, как это было сделано при доказательстве теоремы о наложении случайных возмущений, ищем плотность вероятностей P(I) для значений /(Z), наблюденных через Z секунд от начала каждого из промежутков длительностью T_i составляющих 'большое число M. Вероятность нахождения /(/) в интервале (/, I-\-dI) = OO = 2 (вероятность поступления точно К электронов) X K=O X (вероятность нахождения I_K(t) в интервале ( /, IJdI) при поступлении на анод точно К электронов).



100	часть ii. теория флуктуационных шумов

в ряд по степеням U_i почленно интегрируя этот ряд, пользуясь соотношениями

J_ 2п	*+ оо* J (iua)ⁿ ехр { — шах — ^f^lj du = (—)"a-i<pW(x),

w«»(x) = -±= fne-^x¹²,*

и, наконец, собирая члены согласно порядку степени v ² , получим P(I) а <г-уо)() —^Zl* w(3)(_x) ₊
		3! AAcp(4_W+^i⁷ <р(в)_(д)
+		3! AAcp(4_W+^i⁷ <р(в)_(д)	+...	(1.6-3)

Первый член дает нормальное распределение, а прочие члены показывают, как достигается такое распределение, когда v->oo.

1.7. СОСТАВЛЯЮЩИЕ ФУРЬЕ ТОКА /(Z) В некоторых аналитических работах ток шумов представляется в виде n ти\ До I n/ 27mZ . _и . 2tc/zZ\ АО = -₂°- +Yl ^^cos T^-+ M^m^J (1.7-1) и в определенном месте работы полагается, что TnN стремятся к бесконечности. Коэффициенты а_п и b_ni I^n ^N_i рассматриваются как независимые случайные переменные, распределенные вокруг нуля по нормальному закону. В соответствии с нашим обычным подходом к дробовому эффекту предположим, что в течение промежутка (0,7) на анод поступают точно К электронов, так что ток шумов в этом промежутке равен к MO = *^F(t-tk).* (1.7-2) a=i Коэффициентами разложения Ik(I) в ряд Фурье в интервале {0,7) являются а_пк и b_nKt где К T а_пК - 1Ьпк = ■Y E J ^р( ~' > ^exp (-¹Ir) ^dt * a=i о К *+оо* _к ~ -г S fao ^exp Г- ⁱIr H^dt=ё ^ⁱ"⁹* • ⁽¹ -⁷"³⁾ a-i -» ^l ^j a=i



	Глава II ЭНЕРГЕТИЧЕСКИЙ СПЕКТР И ФУНКЦИЯ КОРРЕЛЯЦИИ

	В разделе 2.1 энергетический спектр и функция корреляции рассматриваемой функции времени, например, заданной в виде кривой, простирающейся до Z=оо, определяются соответственно уравнениями (2.1—3) и (2.1—4). Связь этих величин с формулами преобразования Фурье (2.1—5) и (2.1—6) вначале утверждается без доказательства; рассмотрение способа доказательства отнесено к разделам 2.3 и 2.4. В разделе 2.3 рассмотрение основано на рядах Фурье, а в разделе 2.4 аналогичные результаты получаются более прямым путем на основе интегральной теоремы Парсеваля. Если анализируемая функция содержит постоянную или периодические составляющие, то выводы раздела 2.1 должны быть дополнены, что и проделано в разделе 2.2. , Первые четыре раздела посвящены анализу заданной функции времени. Однако большинство 'приложений метода относится к функциям, которые ведут себя как более или менее случайные функции. В математическом анализе подобная случайность обусловливается предположением, что функция t является также и функцией некоторых параметров, которые затем считаются случайными переменными. Этот вопрос разобран в разделе 2.5. В разделе 2.6 выводы раздела 2.5 применяются для определения среднего энергетического спектра и средней функции корреляции тока дробового эффекта. То же самое сделано в 2.7 для прямоугольной волны, полупериоды которой имеют случайную длительность. Пример, в котором интервалы предполагаются одинаковой длительности, но знак волны случаен, также рассмотрен в 2.7. Представление тока шумов в виде тригонометрического ряда с коэффициентами, рассматриваемыми как случайные переменные, разбирается в разделе 2.8. Последние два раздела 2.9 и 2.10 посвящены некоторым вопросам теории вероятностей, в них соответственно рассмотрен нормальный закон и центральная предельная теорема.



гл. ii. энергетический спектр и функция корреляции Ю7

то по уравнению (2.1—4) ф(х) равна ф(х) = л²+-у⁰⁰⁸ ²^fo^x-Формулы перехода (2.1—5) и (2.1—6) дают				(2.2— 3)

	Г , 2 Г sin2r./x ) w(g) dg =- J ф(х) —_;— dx, о о ф(т) = j* cos 2*ju/t d j w(g) dg		(2.2-4)

O LO где последний интеграл должен рассматриваться как интеграл Стильтьеса. Если выражение (2.2—3) для ф(х) подставить в первую формулу (2.2—4), то получим / (A²_y если 0 </ < /о,
/■		g)dg={ ₂ _С2 (²-²-⁵)
о [А + *-Tf_t* если/>/₀. Если это выражение использовать во второй формуле (2.2—4), то приращения дифференциала, очевидно, будут A² при /=O и при /=/₀. Полученное выражение для ф(х) совпадает с первоначальным. Теперь воспользуемся менее строгим, но более удобным методом рассмотрения случая периодических составляющих. Исследуя интеграл в выражении (2.2—5) для w{f)_y можем написать w(f) = 2Л² 8(/) + 4 8(/- /о), (2.2- 6) где 8 (х) есть четная единичная импульсная функция, так что если е>0, то E е j 8(jc) dx = i- j S(x) dx = 4. (2.2- 7) О -e а 8(x)=0, за исключением х=0, когда 8(0)= оо. Это позволяет воспользоваться более простыми формулами перехода раздела 2.1. Сразу видно, что вторая из них (2.1—6) дает правильное выражение для ф(х). Первая формула (2.1—5) дает правильное выражение для (wf), если интерпретировать интегралы следующим образом:

jcos 2тг/х^ = +-8(/), о OO j* cos 2тс/₀* cos 2u/x dz == -Г- 8(/ — /о)-				(2.2-8)



	гл. ii. энергетический спектр и функция корреляции 109

	где t а_п= Ц 7(0 cos ^d/, ₍₂ _з_₂₎Тогда для интервала — х <t < 7 — х Ht + т) = ^ + !Д a„cos г + ⁶^sin-P^lj-)* (2.3-3) Перемножая ряды для /(Z) и /(Z+x) и интегрируя по Z, получим после некоторых сокращений т +/(/)/(/+x)d/ = о = 3+ £4<^+У<™^Н-с(£), (2-3-4) где последний член является корректирующим и должен быть добавлен вследствие того, что ряд (2.3—3) не представляет /(Z+x)* в промежутке (7—х, 7), если t>0, или в промежутке (0,—х), если х<0. Если ток /(Z) протекает по сопротивлению 1 ом в интервале (0,7), то каждая составляющая рассеет некоторую среднюю мощность. Эта средняя мощность, выделенная составляющей с частотой I_n=-If- Щ> должна быть равна, как это следует из теории рядов Фурье и элементарных принципов: -L(aS+6£)em, пфО, (2 3—5) — вт, п=0. 4 Ширина полосы, связанная с п-и составляющей, есть разность по частоте между (я+1)-й и п-и составляющими г г _nji п _ _1_ L+i^— L~~ T T ~~ T ^гц' Следовательно, если среднюю мощность в полосе (1,1+df) обозначить как w(f) df, то средняя мощность в полосе f_n+i—/ равна

	^(/_я)(/_л₊-/_я)=^(+)+>



	по	часть ii. теория флуктуационных шумов

	а из (2.3—5) следует •фт-Т+⁸+'»' "=+0. ₍₂₃__6>«0(0)4- = -7"' ^п ⁼ ⁰' Если коэффициенты в (2.3—4) заменить их значениями, выраженными через *w(f),* то получим ±1 нот +.)+ ¢(^)-+2 Mf) '^os2jT* = ⁰ ^х /2=0 ^Х ⁷ = I а; (+г) cos -L^ у- = I о>(/) cos 2ф df₉ (2.3—7) где полагаем T настолько большим, а w(f) такого характера, что суммирование может быть заменено интегрированием. Если / остается конечным, а T—►oo при т, поддерживаемым постоянным, то корректирующий член слева становится ничтожно малым. Пользуясь определением (2.1—4) для'функции корреляции ф(т), получим вторую из основных формул преобразования (2.1—6). Первая формула может быть сразу получена отсюда применением к w(f) формулы двойного интеграла Фурье. Кстати, соотношение (2.3—6) между w(f) и коэффициентами а_п и Ь_п находится в согласии с определением w(f) по формуле (2.1—3), как предела, содержащего JS(/)\|². Из формулы (2.3—2) для а_п и Ь_п спектр S(f_n) по уравнению (2.1—2) равен ад)=4 **(°п-_п).*** Тогда согласно (2.1—3) ш(/„) равен следующему пределу при Г—оо : 41 ад Г=тт^(а"^+ь%) ⁼ т⁽°^а»⁺^b2A а это и есть выражение для ^w{^f~^ согласно (2.3—6). 2.4. ОБСУЖДЕНИЕ ВЫВОДОВ ПЕРВОГО РАЗДЕЛА — ТЕОРЕМА ПАРСЕВАЛЯ Применение теоремы Парсеваля¹! позволяет получить результаты раздела 2.1 более прямым путем, чем это дает метод, исполь- ¹I Титчмарш, «Введение в теорию интегралов Фурье», Гостехиздат, 1948. (Прим. ред.)



	гл. ii. энергетический спектр и функция корреляции Ц7*

	функция /, что Jp(Z) dt=\ о Для дробового эффекта p(Z) = +r. Какова вероятность того, что точно К событий произойдут в интервале 7? Как и в случае дробового эффекта (раздел 1.1), можно разделить интервал (0, 7) на N промежутков каждый длительностью AZTaK, что NM=T Вероятность того, что ни одно событие не случится в первом промежутке AZ, равна Произведение N таких вероятностей равно при N—+oc_y M—► O т _ — ехр [-K \ p{t)dt}=e~^Kо Это вероятность того, что точно нуль событий произойдет за время 7 Таким же образом приходим к выражению ble-* (2.6-9) Kl для вероятности того, что точно К событий случится за время 7. Рассмотрев много интервалов (0, 7), получим много значений К, а также много значений /, измеренных через Z сек. от начала каждого интервала. Эти значения / определяют распределение / в момент Z. Таким же образом, как и в разделе 1.4, найдем плотность вероятностей для / Р(/, t)= +- J du ехр J- iul + Kj р(х) _! J _7xj Соответствующие среднее значение и дисперсия равны _ _ T / = K Jp(X)F(Z-X) dx, о ____ t (/ _7)² К Jp(X)F²(Z-X) dx. (2.6-10) о Если S(f) выражается уравнением (2.1—2), а s(f) — (2.6—5), то, полагая длительность F(Z) малой сравнительно с 7, среднее значение \|S(/)\|² можно получить, подставив (1.3—1) в (2.1—2): ад= ад+~^21://'^А 1



Глава III СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ

В* этой главе применены изложенные в разделе 2.8 представления о шумовых токах для вывода некоторых статистических свойств /(Z). Первые шесть разделов посвящены распределению вероятностей тока /(Z) и его нулям и выбросам. Разделы 3.7 ц 3.8 связаны со статистическими свойствами огибающей /(Z). В разделе 3.9 рассмотрены флуктуации интегралов, в которые входит Z²(Z). Распределению вероятностей суммы из синусоидального тока и тока шумов посвящен раздел 3.10, а в разделе 3.11 кратко описан другой метод получения выводов главы III. Большинство материала этой главы тесно связано с теорией процессов Маркова.

3.1. РАСПРЕДЕЛЕНИЕ ТОКА ШУМОВ

В разделе 1.4 было показано, что распределение тока.дробового эффекта сходится к нормальному закону, когда ожидаемое число событий в 1 сек. V безгранично возрастает. В соответствии с задачами этой части будем пользоваться n

Ht)= J К cos (о_п Z + Ь_п sin (O_nZ)		(2.8-1)

для того чтобы показать, что функция /(Z) распределена по нормальному закону. Этот результат немедленно может быть получен, если следовать процедуре раздела 2.8. Так как а_п и Ь_п распределены нормально, то таково же распределение а_п Cosco_nZ и b_n sinco_nZ, если рассматривать Z как фиксированное. Поэтому /(Z) есть сумма 2N независимых нормально распределенных переменных, а следовательно, и сама распределена по нормальному закону. Среднее значение /(Z) по (2.8—1) равно нулю, так как

а	о,
а	(3.1-1)

Средний квадрат /(/) равен n



ГЛ. Ш. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 135

1 Г—Y (0) T/» «L ф(0) I	о_ OO			(3.3-11)

Для идеального полосового фильтра, полоса пропускания которого простирается от f_a до f_bf ожидаемое число нулей в 1 сек. равно

' L 3 /*-/« J				(3.3-12)

Когда /_а=0, это выражение равно 1,155 f_b, а когда f_a весьма близко к f_b, то оно стремится к f_b+f_a. В недавней работе М. Кэк¹) дает выражение, которое после небольшого обобщения приводит к

-/²/2ф₀ 1 /—+V^a			dt	(3.3-13)
2п		фо	dt	(3.3-13)

для вероятности того, что ток шумов пройдет через значение / с положительной крутизной в интервале (Z, t+df). Ожидаемое число таких прохождений в 1 сек. равно -/^а/2ф₀ _ч Г 1 „ . _л 1 /о о 1>1\ е X ~2~ ожидаемое число нулей в 1 сек. . (3.3—14) Уравнение (3.3—13) может быть также получено из выражения, аналогичного (3.3—5), в котором в p{O_yy\;xi) нуль заменен на у. В некоторых случаях интеграл

не сходится. В качестве примера можно указать на случай воздействия на цепь, состоящую из последовательно включенных сопротивления и конденсатора, напряжения шумов, занимающего широкую полосу частот. Энергетический спектр напряжения на конденсаторе имеет вид M/)=y+i. (3-3-15) Хотя ф₀ бесконечно велико, ф₀ конечно и равно */2а. Непосредственная подстановка в (3.3—11) дает для ожидаемого числа нулей в 1 сек. бесконечное значение.

¹I См. «О распределении значений тригонометрических сумм с линейно независимыми частотами», Amer. Journ. Math., LXV, 609—615, 1943.



	ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ 145

	н+и,- Б уравнении (3.4—12) X₁ и X₂ играют роль параметров. Этот вывод может быть найден во многом аналогично способу получения (3.3—5). Если установить идентичность F с одним из представлений тока шумов /(Z), т. е. с (2.8—1), либо с (2.8—6),. то видно, что р подчиняется нормальному закону во всех четырех измерениях. Можно получить моменты втброго порядка непосредственно из этого представления, как это было сделано в уравнениях, приведенных вслед за (3.3—7). Тот же самый результат можно получить из определения ф(т) и, для разнообразия, можно выбрать этот второй метод. Положим x₁=Z₁, x₂=Z₁+^. Тогда Ц=Ц=Щ=%у M~2=/(Z) /(* + •*) =ф, , (3.4-13)

	w (Ш+\Ф^М₀ W+WWdt, где штрихи обозначают дифференцирование по аргументам. Интегрируя по частям, найдем T T *\l'(t* + *+dl{t)* =[/'(' + )/(/) J⁷" —j I"(t* + *x)I(t)dt.* О 0 0 Полагаем, что / и ее производные остаются конечными, так что при делении на T интегрируемые части в пределе исчезают. Так как I"(t + *)=+Kt+z),

	то имеем

	WJl = — фм = — +.

	Полагая т=0, найдем TjJ = Tjf = - ф₀ в согласии со значением [х₂₂, полученным из (3.3—7). Таким же образом т

	Нъ = Ит 4" J /'(' + D Щ dt = 4 М^т) = U г-⁰⁰ о Г t Vn₁ = Hm +-J/'(/)/(/+_T) dZ=lim(-)-L j /'(/+т) /(Z) dZ = — ф' 1 **-ОС*** ¹ 0 t-OO 7 q



	ГЛ. III. СТАТИСТИЧЕСКИЕ СВОЙСТВА ФЛУКТУАЦИОННЫХ ШУМОВ_147

	проходит через нуль при x_3rc положительной крутизной:



	Это и есть (3.4—1). Выражение (3.4—10) дает также вероятность прохождения / через нуль в интервале dx, когда известно, что / проходит через нуль вначале с положительной крутизной. Эта вероятность может быть получена из (3.4—1) путем добавления вероятности прохождения / через нуль в интервале А с положительной крутизной, если известно, что этот ток проходит через нуль с положительной крутизной. Поэтому нужно добавить выражение, содержащее интеграл, в котором интегрирование по отношению к Tj₁ и ?]₂ производится в пределах от 0 до оо Этот интеграл, написанный при помощи введения переменных х и y_f равен 6 о Это эквивалентно изменению знака M₂₃ и, следовательно, и Н. После сложения надо рассмотреть 1 + H arcctg (—//) + 1 —Н arcctg H = 2+H [arcctg (—Н) — arcctg Н] = = 2+7/ (* —2 arcctg H) = 2 (1 + H arctg Н), а это приводит к (3.4—10). 3.5. КРАТНЫЕ ИНТЕГРАЛЫ, ВХОДЯЩИЕ В ФОРМУЛЫ Нужно вычислить интегралы вида J = Jdx₁ Jdx₂ *_в-!-2*«л-1. (3.5-1) о о* Одним из методов является сведение показательной функции к сумме квадратов путем соответствующей линейной замены переменной, а затем преобразование к полярным координатам. Этот метод пригоден также для тройных интегралов такого же типа, но если применить его к четырехкратным интегралам, то последнее интегрирование, повидимому, не может быть выполнено в конечной форме. Сведение показательной функции к сумме квадратов основано на следующем преобразовании. Если X₁=^y₁ Jh₂D₂₁y₂+h₃D₃₁y₃+.. .+h_nD_nAy_n> X₂ = O +h₂D₂₂y₂ + _+flnD_ni2y_n> (3.5-2) x« = 0 +0 + +KD_n,_ny_nt