РАСПОЗНАННЫЕ ФРАГМЕНТЫ
Пример 11.2 В исследовании [161 дано описание попыток связать индекс FT кур-са обычных акций промышленных предприятий с лаговыми переменными других экономических факторов, таких, как банковские ссуды, индекс курсов правительственных ценных бумаг в Соединенном Королевстве, индекс Standard and Poor1 по нью-йоркской фондовой бирже, учетная ставка банка Англии, обязательства в фунтах стерлингов и производство легковых автомобилей в Соединенном Королевстве. Была также рассмотрена мера, выражающая то, что было названо индексом эйфории. Назначение этого индекса состоит в измерении инерции фондовой биржи — если курсы росли в течение длительного времени, рынок может считать, что они будут продат жать расти. (Мы могли бы, наоборот, рассмотреть индекс дисфории, обратный индексу эйфории, указывающий, когда курсы падают, что владельцы ценных бумаг в целом могут ожидать их дальнейшее падение.) Соответствующие лаги в этом случае отыскивались путем исследования кросс-коррелограмм между индексом FT и различными лаговыми значениями других переменных. Величина лага определялась по точкам наибольшей корреляции (или наименьшей отрицательной корреляции). Ряды были квартальными, сезонные колебания устранялись с помощью одного из вариантов программы Census Mark XI. Большинство рядов имело тренд, и была предпринята попытка элиминировать его. В основном это делалось путем построения линейной регрессии от времени, а не скользящего среднего. При рассмотрении взаимосвязей в экономике имеются доводы в пользу использования не самих переменных, а их логарифмов. Например, выражение цены в виде суммы физического объема продукции, ставки процента и расстояния в милях, пройденного по железной дороге, выглядит слабым отражением действительности. Экономические уравнения такой степени сложности будут более реалистичными, если их выразить через произведения, как, например, это делается в функции Кобба—Дугласа. Разумеется, их можно эквивалентно выразить в виде уравнений линейных относительно логарифмов рассматриваемых величин, при условии (которое почти всегда выполняется), что переменные не являются отрицательными или малыми положительными величинами. В упомянутом исследовании оценивалось одно уравнение с исходными переменными и одно в логарифмах от них. Авторы считали, что, прежде чем представлять результаты для общего обсуждения, они должны дать достаточно хорошие прогнозы за тот или иной период. Некоторые из уравнений регрессии были удивительно простыми. Например, индекс FT в момент t связывался с индексом FT для товаров широкого потребления (Commodity Index) в момент t — 8 и с индексом эйфории в момент t. При этом значение R1 равнялось 0,95. 11.9. Обоснование уравнений этого типа представляет трудность. Программа исключения переменных типа тех, что рассматривались в разделах 11.6 и 11.7, может удалить переменные, присутствие которых экономист считает необходимым. И хотя, как упоминалось ранее, это может произойти при исследовании системы с сильными внутренними корреляциями, в которой переменные могут замещать друг друга, отсутствие в уравнении очевидных причинных переменных и присутствие переменных, причинный характер которых сомнителен, придают ому нереальный вид. По этому вопросу можно развернуть хорошую дискуссию. Бокс и Ньюболд 112] критиковали этот метод в целом как необоснованный. С другой стороны, история науки учит, что не следует отвергать эмпирически наблюдаемые взаимосвязи только потому, что их не удается объяснить при современном уровне знаний. Я считаю, что в действительности нужно проверять, являются ли взаимосвязи достаточно стабильными, чтобы их использовать при прогнозировании, «работают» ли они на деле. 11.10. Когда мы строим уравнение для всего ряда в целом и судим о качестве по /?*, фактически мы получаем преувеличенное представление о его точности при прогнозировании. Если бы мы, двигаясь вдоль ряда, рассчитывали уравнение в различных точках, нам следовало бы делать каждый прогноз, основываясь на информации, которая имелась в тот момент, и не использовать информацию, поступившую в более позднее время. Для того чтобы получить представление о ряде в ретроспективе, нужно, строго говоря, вернуться назад и в каждой точке рассчитать уравнение на основе имевшейся тогда информации (может быть, даже заново обращаясь к программе испытания и исключения переменных). Эго требует больше вычислений,чем обычно считается приемлемым даже при применении ЭВ]М. Подтверждение в будущем всегда выглядит более убедительно, чем подтверждение ретроспективой. Но не всегда имеется возможность ждать длительный период с тем, чтобы посмотреть, как «работает» метод. При большинстве процедур в качестве компромисса возвращаются на несколько точек назад, для каждой из этих точек подсчитывают значение по уравнению и смотрят, какие при этом получаются ошибки прогнозирования. 11.11. Эта тема далеко не исчерпана, и, по-видимому, потребуется намного больше исследований и опыта, прежде чем можно будет сделать какие-либо решительные выводы относительно того или иного метода прогнозирования в частных случаях. Поэтому мы заключаем эту главу перечислением некоторых моментов, которые специалист в области анализа временных рядов обычно учитывает в своей работе. 1) Если сравнивать метод автопроекции с методом лаговых соотношений, то сначала можно прийти к выводу, что от последнего следует ожидать лучшей работы в качестве предиктора, так как он в известном отношении использует больше информации, отвечающей поставленной задаче. Однако если переменные имеют ошибку (а у некоторых экономических переменных ошибка может быть существенной), то само введение в расчет дополнительных переменных может внести Добавочную ошибку, заглушающую систематическую часть процесса. Говоря.техническим языком, добавление дополнительных переменных может ввести шум, достаточный для уничтожения истинного сообщения. Выбор одного из этих двух методов будет, очевидно, зависеть от конкретных условий и отвеличины ошибки наблюдений во вводимых переменных. 2) Эконометрический подход, о котором мы говорили в разделе 11.3, приводит к так называемой «приведенной форме», и до сравнительно недавнего времени каждое из уравнений на практике оценивалось методом наименьших квадратов отдельно. В случае применения какого-либо конкретного метода прогнозирования по единственному уравнению из тех, что были рассмотрены в этой главе, остается только построить выписанное уравнение. Однако имеются основания полагать, что оценки могут быть смещенными, и остается открытым вопрос, будут ли результаты более точными при использовании нескольких уравнений (ср. (851). 3) Во всяком случае коэффициент множественной детерминации1, как было показано в примере 11.1, может быть обманчивой мерой точности прогнозирования в том смысле, что на него сильно влияют трендовые составляющие ряда. Здесь до некоторой степени предоставляется свобода выбора: работать ли с исходными рядами или попытаться исключить тренд и прогнозировать его отдельно. И в том, и другом случае подстерегают опасности. И в частности, в примере 4.4 на с. 57— 58 отмечалось, что метод последовательных разностей переменной может дать обманчивые результаты в том смысле, что с его помощью может быть принята модель, которая фактически не совпадает с действительной моделью процесса. 4) Несмотря на то что большая часть классической теории регрессии основывается на методе наименьших квадратов, имеются сомнения относительно оптимальности этого метода в эконометрических исследованиях. Остаточные члены в таких уравнениях, как приведенная форма в разделе 11.3, могут содержать случайно опущенные переменные, но даже если это не так, все равно нельзя с полной уверенностью предполагать, что члены ошибки распределены нормально. Например, лучше, может быть, строить уравнение путем минимизации суммы абсолютных разностей между прогнозом и наблюдением или возводить отклонения не во вторую, а в какую-либо другую степень. Это, видимо, приводит к новым вычислительным трудностям, но благодаря электронным компьютерам такие проблемы более не следует рассматривать как неразрешимые. 5) Использование программы исключения переменных типа той, что описана нами, очевидно, ничего не добавляет в показатель качества уравнения и может вызвать возражение у экономиста, который чувствует, что некоторые переменные следует оставлять в уравнении, какими бы ни были результаты работы этой программы. Эту проблему можно снять, составив программу для ЭВМ таким образом, чтобы она не исключала некоторых переменных — они, так сказать, «вне конкуренции». 6) В обычной регрессии одной переменной на р других под числом степеней свободы остатка, как правило, понимается величина п—р, где п — объем выборки. Как отмечалось в разделе 1.16, наблюдения в общем случае не являются независимыми и трудно увидеть, как можно построить точный критерий существенности значения R\ даже если остатки нормальны. 7) Еще одно обвинение, которое может быть брошено в адрес регрессионного метода, касается появляющихся время от времени больших лагов. Иногда находят, что наблюдение зависимой переменной в момент t связано с ее лаговыми значениями или лаговыми значениями других переменных, имевшими место несколько лет назад. А предположение о том, что столь большие лаги действительно отражают реальность, может противоречить здравому смыслу. В таких случаях не нужно быть догматиком, так как иногда удается объяснить, почему этого следовало ожидать. Однако при прогнозировании на сравнительно короткие периоды времени возможно еще одно объяснение, а именно, как отмечалось в предшествующих главах, авторегрессионная система осциллирует и осцилляциям может как бы не хватить времени, чтобы выпасть из синхронности, так что явление предстает в виде ложной цикличности, которая может означать, что соотношение с большими лагами объясняется просто повторяющейся историей. 8) Как мы уже говорили, почти всегда при построении таких соотношений предполагается, что переменные наблюдаются без ошибки. Если, однако, мы пытаемся построить модель, предполагая существование ошибок в переменных (в отличие от рассмотренных ранее методов, в которых обычно предполагаются ошибки в уравнениях), то при ее построении и оценивании возникает несколько новых труднопреодолимых проблем, даже когда речь идет лишь о нескольких переменных. Желающих ознакомиться с теорией этого вопроса можно отослать к гл. 29 третьего издания второго тома книги [52а). 9) Наконец необходимо остерегаться ложных связей, появляющихся при агрегировании. В примере 1.1 была дана иллюстрация эффектов, которые могут при этом возникнуть. Даже если изменения ряда при переходе от одного момента времени к другому более или менее случайны, его агрегирование за большие периоды может породить корреляции, заставляющие думать о явлениях, которых на самом деле и нет. К сожалению, как уже говорилось ранее, многие ряды, с которыми приходится иметь дело (особенно в экономике), агрегированные и маловероятно, чтобы кому-либо из специалистов удалось избежать этого эффекта. 11.12. И последнее замечание. На практике методы прогнозирования обычно испытывают на рядах, истинный механизм генерирования которых неизвестен. Как уже отмечалось, обосновать применение того или иного метода на основе имеющихся «истинных» значений без испытания на ретроспективном материале или последующих данных нелегко. По-видимому, здесь обычно имеется много возможностей для проверки различных методов на искусственно построенных рядах. Это позволяет увидеть, насколько точно эти методы могут определить истинный генерирующий механизм, который в таких случаях, конечно, известен. |
☭ Борис Карлов 2001—3001 гг. ☭ |