РАСПОЗНАННЫЕ ФРАГМЕНТЫ
ПРЕДИСЛОВИЕ Цель настоящей книги состоит в том, чтобы дать систематическое изложение этой теории и тесно связанной с ней теории доверительных множеств вместе с их главными приложениями. В число последних входят стандартные задачи (как для одной, так и для двух выборок), касающиеся нормального, биномиального и пуас-соновского распределений; некоторые аспекты дисперсионного анализа и анализа регрессии (линейные гипотезы); некоторые многомерные проблемы и последовательный анализ. Книга знакомит также с непараметрическими критериями, хотя здесь теоретический подход не развит полностью. Большая область методологии, а именно класс методов, основанных на рассмотрении больших выборок, в частности критерий %2 и критерий отношения правдоподобия, по существу, не нашла отражения. Подход к ним и применяемый математический аппарат столь отличны от используемого в этой книге, что адекватное изложение потребовало бы отдельного тома. Краткие указания на теорию этих критериев содержатся в конце главы 7. В настоящее время теория проверки гипотез подвергается важным изменениям по меньшей мере в двух направлениях. Одно из них возникло на почве осознания того факта, что стандартная формулировка чрезмерно упрощает задачу. Как следствие, теория была пересмотрена с точки зрения статистических решающих функций, введенных Вальдом. Хотя эти исследования и проливают новый свет на классическую теорию, они в целом подтверждают ее открытия. Я сохранил формулировку Нецмана — Пирсона в основной части книги, но включил обсуждение понятий общей теории решений в главу 1 с тем, чтобы дать более широкую основу для оправдания некоторых результатов. Эти понятия служат также базисом для развития теорий проверки гипотез и доверительных интервалов. Значительно более важным является тот факт, что многие из рассматриваемых задач, которые обычно формулируют в терминах проверки гипотез, в действительности оказываются множественными проблемами решения. В этих носледних отклонение основной гипотезы приводит к необходимости выбора одного из нескольких решений. Развитие подходящих процедур в этих задачах представляет собой в настоящее время одну из важнейших проблем статистики. Однако поскольку значительная часть работ в этом направлении имеет пробный характер, я предпочел указывать традиционные критерии даже в тех случаях, где большинство применений создает впечатление необходимости более тонких процедур; в этих случаях я ограничивался лишь предостережением о том, что подход справедлив в таких-то пределах. Действительно, кажется правдоподобным, что упомянутые критерии, по причине своей простоты, останутся полезными и тогда, когда будет закончена более полная теория множественных решений. Естественную математическую основу систематического изложения способов проверки гипотез образует теория меры в абстрактных пространствах. Поскольку вводные курсы по теории действительного переменного или теории меры часто ограничиваются одной лишь мерой Лебега, в разделах 1 и 2 главы 2 приведены краткие формулировки, относящиеся к общей теории. В самом деле, большая часть книги может быть прочитана без знания теории меры, если символ р (х) d\i {х) интерпретировать или как р (х) dx, или как (х) и если не обращать внимания на теоретико-множественную природу некоторых доказательств. Формально знание статистики не предполагается — все необходимые понятия вводятся С самого начала. С другой стороны, так как читатель обычно уже имеет некоторый опыт обращения со статистическими методами, то применения каждого метода описываются в общих терминах — конкретные примеры с числовыми данными не приводятся. Их можно найти в большинстве стандартных учебников. В конце каждой главы помещены задачи, многие из которых сопровождаются указаниями на путь решения. Здесь встречаются упражнения, и дополнительные примеры, и задачи, вводящие в новые темы. В конце каждой главы имеется также аннотированный список литературы, послужившей источником как идей, так и отдельных результатов. Примечания не ставят целью привести основные результаты цитированных статей, а лишь указывают значение каждой из них для соответствующей главы. Составляя эти списки, я не стремился к полноте, а пытался дать полезный «путеводитель» по литературе. Набросок этой книги появился в 1949 году в форме записок лекций, составленных Колином Блитом (Colin Blyth) в летнем семестре в Калифорнийском университете. С тех пор я излагал те или иные части материала в Колумбийском, Принстонском и Стэнфордском университетах, и несколько раз — в Калифорнийском университете. Мне очень помогли замечания студентов, и я сожалею, что не могу поблагодарить их каждого в отдельности. На различных этапах работы я получил много полезных предложений от В. Готски (W. Gautschi), А. Хейланда (А. Ниу-land), Л. Д. Сэвиджа (L. J. Savage) и особенно от К. Стри-бел (С. Striebel); критическое чтение ею предпоследнего варианта рукописи привело ко многим усовершенствованиям. Также я хотел бы отметить с благодарностью ту пользу, которую мне принесли многие продолжительные беседы с Чарлзом Стейном (Charles Stein). Приятно отметить поддержку этой работы Бюро Морских исследований; без нее, вероятно, книга не была бы написана. Наконец, я хотел бы поблагодарить Дж. Рубал-кава (J. Rubalcava), которая печатала и перепечатывала различные черновые варианты рукописи с неослабевающим терпением, точностью и скоростью. Беркли, Калифорния, июнь 1959 Э. Л. Леман ОБЩАЯ ПРОБЛЕМА РЕШЕНИЯ 1. Статистические выводы и статистические решения «Сырьем» для статистического исследования служит совокупность результатов наблюдений; эти результаты представляют собой значения случайных величин X, распределение которых Р0 хотя бы частично неизвестно. О параметре 0 предполагается известным лишь то, что это один из элементов некоторого множества Q (пространства параметров). Статистические выводы используют материал наблюдений для получения информации относительно распределения X (или значения параметра 0, от которого оно зависит). Чтобы прийти к более точной формулировке задачи, мы рассмотрим цели статистических выводов. Необходимость статистического анализа возникает из того факта, что распределение X, а следовательно, и некоторые черты ситуации, лежащей в основе математической модели, неизвестны. Следствием этого недостаточного знания является неопределенность в выборе наилучшего поведения. Чтобы формализовать понятие «поведения», допустим, что необходимо выбрать одно из нескольких действий. Результаты наблюдений, давая информацию относительно исходного распределения, тем самым указывают путь к наилучшему решению. Задача состоит в определении правила, ставящего в соответствие каждому результату наблюдений решение, которое должно быть принято. С точки зрения математики, такое правило есть функция б, которая каждому возможному значению х случайных величин приписывает решение d = б (я), т. е. функция, областью определения которой является множество значений X и областью значений — множество возможных решений. Чтобы понять, как следует выбирать б, необходимо сравнить последствия использования различных правил. С этой целью предположим, что принятие решения d при условии, что распределение X равно Ре, приводит к потере, которая может быть выражена неотрицательным числом L (0, d). Тогда средний убыток, возникающий от применения б в длинном ряду повторений эксперимента, приближенно равен математическому ожиданию Ев [L(0, б(Х))], вычисленному в предположении, что распределение X является Ре. Это математическое ожидание, которое зависит от решающего правила б и распределения Ре, называется функцией риска для б и будет обозначаться Р(0, б). Принимая решение, исходя из результатов наблюдений, мы заменяем первоначальную задачу выбора решения d при функции потерь L (0, d) задачей выбора 6 при функции потерь R (0, б)*). Приведенные выше рассуждения наводят на мысль о том, что целью статистики является выбор решающей функции, минимизирующей возникающий риск. Как будет видно впоследствии, такое определение цели статистики недостаточно точно, чтобы быть вполне осмысленным; его надлежащая интерпретация в действительности оказывается одной из основных проблем теории. 2. Точная постановка проблемы решения Методы, требующиеся для решения какой-либо отдельной статистической задачи, существенно зависят от трех элементов, которые ее определяют: класса 9* = {Ре» 0gQ}, которому, по предположению, принадлежит распределение X; структуры пространства D возможных решений d; формы функции потерь L. Чтобы прийти к конкретным результатам, необходимо, следовательно, сделать определенные предположения относительно этих элет ментов. С другой стороны, если рассматривать теорию, *) Иногда принимают во внимание не только математическое ожидание потерь, связанных с решающим правилом, но и другие его качества........ |
☭ Борис Карлов 2001—3001 гг. ☭ |