Методы экономического программирования
2.4.1.3.
Определение адекватности трендовой модели.
Независимо
от вида и способа построения экономико-математической модели вопрос о
возможности ее применения в целях анализа и прогнозирования экономического
явления может быть решен только после установления адекватности, т.е.
соответствия модели исследуемому процессу или объекту. При моделировании
имеется в виду адекватность не вообще, а по тем свойствам модели, которые
считаются существенными для исследования.
Трендовая
модель конкретного
временного ряда yt считается адекватной, если правильно
отражает систематические компоненты временного ряда. Это требование
эквивалентно требованию, чтобы остаточная компонента (t = 1, 2, ..., n) удовлетворяла
свойствам случайной компоненты временного ряда: случайность колебаний уровней
остаточной последовательности, соответствие распределения случайной компоненты
нормальному закону распределения, равенство математического ожидания случайной
компоненты нулю, независимость значений уровней случайной компоненты.
Проверка
случайности колебаний уровней остаточной последовательности означает проверку
гипотезы о правильности выбора вида тренда. Для исследования случайности
отклонений от тренда необходимо рассмотреть набор разностей
(t = 1, 2, …, n)
(49)
Характер
этих отклонений изучается с помощью ряда непараметрических критериев. Одним из
таких критериев является критерий серий, основанный на медиане выборки. Ряд из
величин εt располагают в порядке возрастания их значений и
находят медиану εm полученного
вариационного ряда, т.е. срединное значение при нечетном n или среднюю арифметическую из двух срединных значений при n четном. Возвращаясь к исходной последовательности εt и
сравнивая значения этой последовательности с εm, будем ставить знак «плюс», если значение εt,
превосходит медиану, и знак «минус», если оно меньше медианы; в случае
равенства сравниваемых величин соответствующее значение εt
опускается. Таким образом, получается последовательность, состоящая из плюсов
и минусов, общее число которых не превосходит n.
Последовательность подряд идущих плюсов или минусов называется серией. Для того
чтобы последовательность εt была случайной выборкой,
протяженность самой длинной серии не должна быть слишком большой, а общее число
серий - слишком малым.
Протяженность
самой длинной серии обозначается через Kmax, а общее число серий - через ν. Выборка признается случайной,
если выполняются следующие неравенства для 5%-ного уровня значимости:
; (50)
, (51)
где
квадратные скобки означают целую часть числа.
Если
хотя бы одно из этих неравенств нарушается, то гипотеза о случайном характере
отклонений уровней временного ряда от тренда отвергается и, следовательно,
трендовая модель признается неадекватной.
Другим
критерием для данной проверки может служить критерий пиков (поворотных точек).
Уровень последовательности εt считается максимумом, если он
больше двух рядом стоящих уровней, т.е.
εt-1
< εt > εt+1,
(52)
и
минимумом, если он меньше обоих соседних уровней, т.е.
εt-1
> εt < εt+1.
(52’)
В
обоих случаях εt считается поворотной точкой; общее число
поворотных точек для остаточной последовательности εt обозначим
через p.
В
случайной выборке математическое ожидание числа точек поворота р и
дисперсия выражаются
формулами:
; .
(53)
Критерием
случайности с 5%-ным уровнем значимости, т.е. с доверительной вероятностью 95%,
является выполнение неравенства
, (54)
где
квадратные скобки означают целую часть числа. Если это неравенство не выполняется,
трендовая модель считается неадекватной.
Проверка
соответствия распределения случайной компоненты нормальному закону
распределения может быть произведена лишь приближенно с помощью исследования
показателей асимметрии (γ1) и эксцесса (γ2),так
как временные ряды, как правило, не очень велики. При нормальном распределении
показатели асимметрии и эксцесса некоторой генеральной совокупности равны нулю.
Мы предполагаем, что отклонения от тренда представляют собой выборку из
генеральной совокупности, поэтому можно определить только выборочные
характеристики асимметрии и эксцесса и их ошибки:
; ;
(55)
; ; (56)
В
этих формулах -
выборочная характеристика асимметрии; - выборочная характеристика эксцесса; и - соответствующие
среднеквадратические ошибки.
Если
одновременно выполняются следующие неравенства:
; , (57)
то
гипотеза о нормальном характере распределения случайной компоненты принимается.
Если
выполняется хотя бы одно из неравенств
; , (58)
то
гипотеза о нормальном характере распределения отвергается, трендовая модель
признается неадекватной. Другие случаи требуют дополнительной проверки с
помощью более сложных критериев.
Кроме
рассмотренного метода известен ряд других методов проверки нормальности закона
распределения случайной величины: метод Вестергарда, RS-критерий
и т. д. Наиболее простой из них - основанный на RS-критерии.
Этот критерий численно равен отношению размаха вариации случайной величины R к стандартному отклонению S.
R = εmax - εmin, .
(59)
Вычисленное
значение RS-критерия сравнивается с табличными
(критическими) нижней и верхней границами данного отношения, и если это
значение не попадает в интервал между критическими границами, то с заданным
уровнем значимости гипотеза о нормальности распределения отвергается; в
противном случае эта гипотеза принимается.
Проверка
равенства математического ожидания случайной компоненты нулю, если она
распределена по нормальному закону, осуществляется на основе t-критерия Стьюдента. Расчетное значение этого критерия задается
формулой
. (60)
где - среднее арифметическое
значение уровней остаточной последовательности εt;
- стандартное
(среднеквадратическое) отклонение для этой последовательности.
Если
расчетное значение t меньше табличного значения tα статистики Стьюдента с заданным уровнем значимости α и числом
степеней свободы n-1, то гипотеза о равенстве нулю
математического ожидания случайной последовательности принимается; в противном
случае эта гипотеза отвергается и модель считается неадекватной.
Проверка
независимости значений уровней случайной компоненты, т.е. проверка отсутствия
существенной автокорреляции в остаточной последовательности может
осуществляться по ряду критериев, наиболее распространенным из которых является
d-критерий Дарбина—Уотсона. Расчетное значение этого
критерия определяется по формуле
.
(61)
Расчетное
значение критерия Дарбина-Уотсона в интервале от 2 до 4 свидетельствует об
отрицательной связи; в этом случае его надо преобразовать по формуле и в дальнейшем
использовать значение .
Расчетное
значение критерия d (или d') сравнивается с верхним d2 и нижним d1 критическими значениями статистики Дарбина-Уотсона.
Вывод
об адекватности трендовой модели делается, если все указанные выше четыре
проверки свойств остаточной последовательности дают положительный результат.
2.4.1.4. Точность прогноза трендовой модели.
Для
адекватных моделей имеет смысл ставить задачу оценки их точности. Точность
модели характеризуется величиной отклонения выхода модели от реального значения
моделируемой переменной (экономического показателя). Для показателя, представленного
временным рядом, точность определяется как разность между значением
фактического уровня временного ряда и его оценкой, полученной расчетным путем с
использованием модели, при этом в качестве статистических показателей точности
применяются следующие:
среднее
квадратическое отклонение
, (62)
средняя
относительная ошибка аппроксимации
, (63)
коэффициент
сходимости
, (64)
коэффициент
детерминации
. (65)
в
приведенных формулах n - количество уровней ряда,
k - число определяемых параметров модели,
- оценка
уровней ряда по модели,
- среднее
арифметическое значение уровней ряда.
На
основании указанных показателей можно сделать выбор из нескольких адекватных
трендовых моделей экономической динамики наиболее точной, хотя может
встретиться случай, когда по некоторому показателю более точна одна модель, а
по другому - другая.
Данные
показатели точности моделей рассчитываются на основе всех уровней временного
ряда и поэтому отражают лишь точность аппроксимации. Для оценки прогнозных
свойств модели целесообразно использовать так называемый ретроспективный
прогноз - подход, основанный на выделении участка из ряда последних уровней
исходного временного ряда в количестве, допустим, n2 уровней в качестве проверочного, а саму
трендовую модель в этом случае следует строить по первым точкам, количество
которых будет равно n1
= n – n2. Тогда для расчета показателей точности модели по ретроспективному
прогнозу применяются те же формулы, но суммирование в них будет вестись не по
всем наблюдениям, а лишь по последним n2 наблюдениям. Например, формула для среднего квадратического
отклонения будет иметь вид:
, (66)
где
- значения
уровней ряда по модели, построенной для первых n1 уровней.
Оценивание
прогнозных свойств модели на ретроспективном участке весьма полезно, особенно
при сопоставлении различных моделей прогнозирования из числа адекватных. Однако
оценки ретропрогноза - лишь приближенная мера точности прогноза и модели в
целом, так как прогноз на период упреждения делается по модели, построенной по
всем уровням ряда.
Стандартная (средняя квадратическая) ошибка
оценки прогнозируемого показателя определяется по формуле:
, (67)
где
yt — фактическое значение уровня
временного ряда для времени t;
-
расчетная оценка соответствующего показателя по модели (например, по уравнению
кривой роста);
n - количество уровней в исходном ряду;
k - число параметров модели.
В
случае прямолинейного тренда для расчета доверительного интервала можно
использовать аналогичную формулу для парной регрессии, таким образом доверительный
интервал прогноза Uy в этом случае будет иметь вид
, (68)
где
L - период упреждения;
-
точечный прогноз по модели на (n+L)-й момент времени;
n - количество
наблюдений во временном ряду;
-
стандартная ошибка оценки прогнозируемого показателя, рассчитанная по формуле (62)
для числа параметров модели, равного двум;
tα -
табличное значение критерия Стьюдента для уровня значимости α и для числа
степеней свободы, равного n-2.
Если
выражение
(69)
обозначить
через К, то формула для доверительного интервала примет вид
.
(70)
Значения
величины К для оценки доверительных интервалов прогноза относительно
линейного тренда табулированы.
Формула
для расчета доверительных интервалов прогноза относительно тренда, имеющего вид
полинома второго или третьего порядка, выглядит следующим образом:
. (71)
Аналогично
вычисляются доверительные интервалы для экспоненциальной кривой роста, а также
для кривых роста, имеющих асимптоту (модифицированная экспонента, кривая
Гомперца, логистическая кривая), если значение асимптоты известно.
Таким
образом, формулы расчета доверительного интервала для трендовых моделей разного
класса различны, но каждая из них отражает динамический аспект прогнозирования,
т.е. увеличение неопределенности прогнозируемого процесса с ростом периода
упреждения проявляется в постоянном расширении доверительного интервала.
2.4.1.5. Верификация прогноза.
При
экстраполяционном прогнозировании экономической динамики с использованием
трендовых моделей весьма важным является заключительный этап — верификация
прогноза. Верификация любых дескриптивных моделей, к которым относятся
трендовые модели, сводится к сопоставлению расчетных результатов по модели с соответствующими
данными действительности — массовыми фактами и закономерностями экономического
развития. Верификация прогнозной модели представляет собой совокупность
критериев, способов и процедур, позволяющих на основе многостороннего анализа
оценивать качество получаемого прогноза. Однако чаще всего на этапе верификации
в большей степени осуществляется оценка метода прогнозирования, с помощью
которого был получен результат, чем оценка качества самого результата. Это
связано с тем, что до сих пор не найдено эффективного подхода к оценке качества
прогноза до его реализации.
Проверка
точности одного прогноза недостаточна для оценки качества прогнозирования, так
как она может быть результатом случайного совпадения. Наиболее простой мерой
качества прогнозов при условии, что имеются данные об их реализации, является
отношение числа случаев, когда фактическая реализация охватывалась интервальным
прогнозом, к общему числу прогнозов. Данную меру качества прогнозов k
можно вычислить по формуле
,
(72)
где
р — число прогнозов, подтвержденных фактическими данными;
q — число прогнозов, не подтвержденных
фактическими данными.
Однако
в практической работе проблему качества прогнозов чаще приходится решать, когда
период упреждения еще не закончился и фактическое значение прогнозируемого
показателя неизвестно. В этом случае более точной считается модель, дающая
более узкие доверительные интервалы прогноза.
2.4.2. Адаптивные модели прогнозирования
Как
уже выше отмечено, в основе экстраполяционных методов прогнозирования лежит
предположение о том, что основные факторы и тенденции, имевшие место в прошлом,
сохраняются в будущем. Сохранение этих тенденций - непременное условие
успешного прогнозирования. При этом необходимо, чтобы учитывались лишь те
тенденции, которые еще не устарели и до сих пор оказывают влияние на изучаемый
процесс.
При
краткосрочном прогнозировании, а также при прогнозировании в ситуации изменения
внешних условий, когда наиболее важными являются последние реализации
исследуемого процесса, наиболее эффективными оказываются адаптивные методы,
учитывающие неравноценность уровней временного ряда.
Адаптивные
модели прогнозирования - это модели дисконтирования данных, способные быстро
приспосабливать свою структуру и параметры к изменению условий. Инструментом
прогноза в адаптивных моделях, как и в кривых роста, является математическая
модель с единственным фактором «время».
При
оценке параметров адаптивных моделей в отличие от рассматриваемых ранее моделей
«кривых роста» наблюдениям (уровням ряда) присваиваются различные веса в
зависимости от того, насколько сильным признается их влияние на текущий
уровень. Это позволяет учитывать изменения в тенденции, а также любые
колебания, в которых прослеживается закономерность. Все адаптивные модели
базируются на двух схемах: скользящего среднего (СС-модели) и авторегрессии
(АР-модели).
Согласно
схеме скользящего среднего, оценкой текущего уровня является взвешенное среднее
всех предшествующих уровней, причем веса при наблюдениях убывают по мере
удаления от последнего уровня, т. е. информационная ценность наблюдений
признается тем большей, чем ближе они к концу интервала наблюдений. Такие
модели хорошо отражают изменения, происходящие в тенденции, но в чистом виде не
позволяют отражать колебания.
Реакция
на ошибку прогноза и дисконтирование уровней временного ряда в моделях,
базирующихся на схеме СС, определяется с помощью параметров сглаживания
(адаптации), значения которых могут изменяться от нуля до единицы. Высокое
значение этих параметров (свыше 0,5) означает придание большего веса последним
уровням ряда, а низкое (менее 0,5) - предшествующим наблюдениям. Первый случай
соответствует быстроизменяющимся динамичным процессам, второй - более стабильным.
В
авторегрессионной схеме оценкой текущего уровня служит взвешенная сумма не
всех, а нескольких предшествующих уровней, при этом весовые коэффициенты при
наблюдениях не ранжированы. Информационная ценность наблюдений определяется не
их близостью к моделируемому уровню, а теснотой связи между ними.
Общая
схема построения адаптивных моделей может быть представлена следующим образом.
По нескольким первым уровням ряда оцениваются значения параметров модели. По
имеющейся модели строится прогноз на один шаг вперед, причем его отклонение от
фактических уровней ряда расценивается как ошибка прогнозирования, которая
учитывается в соответствии с принятой схемой корректировки модели. Далее по
модели со скорректированными параметрами рассчитывается прогнозная оценка на
следующий момент времени и т.д. Таким образом, модель постоянно «впитывает»
новую информацию и к концу периода обучения отражает тенденцию развития
процесса, существующую в данный момент.
В
практике статистического прогнозирования наиболее часто используются две
базовые СС-модели - Брауна и Хольта, первая из них является частным случаем
второй. Эти модели представляют процесс развития как линейную тенденцию с
постоянно изменяющимися параметрами.
В
моделях Брауна и Хольта параметры сглаживания характеризуют степень адаптации
модели к изменению ряда наблюдений Они определяют скорость реакции модели на
изменения, происходящие в развитии. Чем они больше, тем быстрее реагирует
модель на изменения. Обычно для устойчивых рядов их величина большая, а для неустойчивых
— маленькая. В различных методах прогнозирования используется различный подход
к их определению. Их можно взять фиксированными, а наилучшее значение
определить методом подбора, чтобы ошибка прогноза на один шаг вперед была
наименьшей. При использовании компьютера это не представляет труда.
Альтернативу
этому подходу составляет динамическое изменение параметров сглаживания. В
методах эволюции и симплекс-планирования параметры адаптации постоянно меняются
на каждом шаге. Для каждого параметра сглаживания формируется несколько
значений.
В
авторегрессионных (АР) моделях текущее значение процесса представляется как
линейная комбинация предыдущих его значений и случайной компоненты.
Идентификация
АР(р) модели состоит в определении ее порядка р. Одной из предпосылок
построения модели этого типа является применение их к стационарному процессу.
Поэтому в более широком смысле идентификация модели включает также выбор
способа трансформации исходного ряда наблюдений, как правило, имеющего
некоторую тенденцию, в стационарный (или близкий к нему) ряд. Один из
наиболее распространенных способов решения этой проблемы — последовательное
взятие разностей, т.е. переход от исходного ряда к ряду первых, а затем и
вторых разностей. «Чистые» авторегрессионные процессы имеют плавно затухающую
автокорреляционную функцию (АКФ). В этом случае в качестве порядка модели
выбирается лаг, после которого все частные автокорреляционные функции (ЧАКФ)
имеют незначительную величину. Однако на практике редко встречаются процессы,
которые легко было бы идентифицировать. Поэтому порядок модели обычно
определяется методом проб из нескольких альтернатив. В число кандидатов
включаются модели, у которых порядок соответствует ЧАКФ, превышающей
стандартное отклонение 1/N. При обработке разностных
рядов иногда ориентируются на АКФ, выбирая модели, у которых порядок
соответствует максимальному ее значению, при условии, что оно превышает
стандартное отклонение.
Ряды
без тенденции, как правило, не представляют интереса для экономистов. АР-модели
вообще не предназначены для описания процессов с тенденцией, однако они хорошо
описывают колебания, что весьма важно для отображения развития неустойчивых
показателей.
3. Практическая
часть
3.1. Постановка
задачи
Дан
временной ряд:
|