Выбор функциональных зависимостей и критериев связи временных рядов в задачах прогнозирования



Скачать 161.79 Kb.
Дата08.07.2016
Размер161.79 Kb.


УДК 519.677

В.В. Поцепаев (канд. тех. наук., доц.)

Донецкий национальный технический университет

Potsepaev56@mail.ru

Р.В. Поцепаев (канд. физ.-мат. наук, Phd)

Технологический центр Шлюмберже, Абингдон, Великобритания

RPotsepaev@slb.com
ВЫБОР ФУНКЦИОНАЛЬНЫХ ЗАВИСИМОСТЕЙ

И КРИТЕРИЕВ СВЯЗИ ВРЕМЕННЫХ РЯДОВ В ЗАДАЧАХ ПРОГНОЗИРОВАНИЯ
Рассматривается задача прогнозирования временных рядов, предложены критерии определения функциональных зависимостей между рядами известными в области прогнозирования и прогнозируемыми рядами для семейств монотонных, унимодальных и непрерывных функций, приведена настройка параметров выбранных критериев.

Прогнозирование, временной ряд, функциональная зависимость, критерии
Общая постановка задачи
Поведение временных рядов можно прогнозировать, изучив в достаточной степени их связь с совокупностью других временных рядов, которые оказывают на них основное влияние. Разделив набор рядов на те, для которых известно их поведение в будущем (т.е. в области прогнозирования) и те, значения которых необходимо предсказать, можно с успехом решать проблему прогнозирования, если удается выяснить существование и вид связей между выбранными группами рядов и доказать, что другие факторы оказывают незначительное влияние на прогнозируемые ряды. В связи с описанным подходом возникает следующая задача.

Предположим, что задан набор временных рядов



Необходимо выявить все или почти все существующие зависимости между данными рядами, т.е. зависимости вида



(1)

Ограничимся рассмотрением случая



(2)

То есть, предположим, что нет зависимости от предыстории, либо эта зависимость несущественна. Отметим, что задачу с зависимостью вида (1) можно свести к задаче (2) добавлением новых рядов вида



,

учитывая тем самым зависимость от предыстории. Очевидно, что ряд Аk далеко не всегда зависит от всех исследуемых рядов, поэтому часто число аргументов в функции (2) существенно меньше. Таким образом, если ряд Ak зависит от рядов А12,…, Аl, то эта зависимость может быть представлена в виде



где l m-1 (3)

Для многих предметных областей о зависимости (3) можно говорить лишь приблизительно, так как на значения рядов влияют многие факторы, не описываемые в виде (3), например – случайные процессы, вызывающие случайные отклонение , непрогнозируемые события, нарушающие вид связи (3) в течение небольшого промежутка времени, изменения функциональной зависимости со временем, влияние других, неучтенных временных рядов и т.п. Если все эти факторы не слишком сильно нарушают вид связи (3), т.е.



, (4)

где εt не слишком велико, то можно подобрать разумный критерий, выясняющий существование функциональной зависимости вида (4) между выбранными рядами.


Выбор семейств функциональных зависимостей
Очевидно, что для правильного выбора критерия, определяющего существование функциональной зависимости вида (4), необходимо выделить семейство функциональных зависимостей (далее просто «семейство функций»), существование которых может быть найдено с помощью выбранного критерия. Например, можно говорить о критерии для определения существования линейной зависимости между рядами. Необходимо выбрать набор семейств функций и соответствующий им набор критериев для выделения как можно большего числа различных зависимостей между временными рядами, характерных для исследуемой предметной области. Описанный набор семейств функций варьируется для различных предметных областей, однако, очевидно, что он должен быть существенно уже множества всевозможных отображений E‎1...ElEk, иначе невозможно отличить зависимость вида (4) от случайного набора точек для независимых рядов . Также он должен быть достаточно узок для того, чтобы с помощью созданных критериев можно было находить зависимости из заданного набора семейств функций при достаточно больших εt.

Рассмотрим вначале одномерный случай l=1, , т.е. выберем набор функциональных зависимостей для случая функции одной переменной. Через произвольный набор точек всегда можно провести ломанную, поэтому всегда существует непрерывная функция, проходящая через все точки и, следовательно, невозможно отличить зависимость вида (4) как непрерывную функцию от случайного набора точек, т.е. нельзя сказать, существует ли непрерывная зависимость между рядами А и В. Это затрудняет поиск непрерывных, тем более кусочно-непрерывных зависимостей в общем случае. Поэтому набор семейств функций должен обладать какими-то дополнительными свойствами. Можно выделить набор семейств функций, который достаточно широк - зависимости из этого набора наблюдаются во многих предметных областях и в тоже время достаточно узок в указанном выше смысле.

Рассмотрим следующий набор Ф = {C,M,U} , где

С - семейство непрерывных функций с ограниченным числом экстремумов, причем точки экстремума находятся друг от друга на достаточно большом расстоянии и отношение суммарной площади областей, ограниченных сверху частью кривой функции, содержащей один экстремум, а снизу горизонтальным отрезком длины Δ к общей площади графика меньше некоторой величины Σ (Δ, Σ – некоторые константы);

М - семейство монотонных функций;

U - семейство унимодальных функций (т.е. функций с одним экстремумом).

Заметим, что из монотонности и унимодальности ограниченных функций на отрезке следует их кусочная непрерывность. Для произвольной меры непрерывную функцию можно сколь угодно мало приблизить кусочно-непрерывной функцией, поэтому, для удобства будем считать, что все функции из Ф непрерывны. Вообще, если величина εt имеет случайных характер, то при определении существования зависимости, невозможно основываться на локальных свойствах функции, таких как непрерывность или гладкость. Все функции из М и почти все из U принадлежат семейству С, однако в связи с их простой конструкцией и тем фактом, что они достаточно часто встречаются в различных предметных областях, имеет смысл выделить их в отдельное семейство, что позволит в дальнейшем находить зависимости из семейств М и U при больших значениях εt.

Рассмотрим теперь функцию многих переменных . В данном случае рассмотрим набор, состоящий из семейства функций, для которых выполнено следующее условие: пусть Φ = 12,...,φs} - выбранный набор семейств функций одной переменной. Если для любого r1…l существует i1…s такое, что для любого произвольного фиксированного набора , равного С1 , функция принадлежит семейству Fi из выбранного набора семейств Φ для случая функции одной переменной, то функция принадлежит заданному семейству, т.е.



(5)

В данном случае Ф = {C,M,U}, причем предположим, что направление монотонности и унимодальности сохраняется, если функции принадлежат соответствующим семействам.



Критерии для случая функций одной переменной
Ниже будут описаны критерии для семейств из набора Φ={С,М,U} для функций одной переменной, то есть ограничимся пока случаем, когда ряды связаны попарно. Предположим, что заданы два временных ряда А и В, для которых необходимо установить существование зависимости из Ф. Ответ на вопрос о существовании зависимости неоднозначен в связи с существованием εt – случайного отклонения от истинного значения либо отклонения связанного с причинами, природа которых не выяснена. Задача состоит в том, чтобы для каждого семейства функций из набора создать критерий (другими словами алгоритм), позволяющий в большинстве случаев давать правильный ответ на вопрос о существовании зависимости между рядами из выбранного семейства, если εt не слишком велико. Для случая двух рядов, существование зависимости можно определить, например, зрительно, если рассмотреть график зависимости at, от bt, . Например, на рис. 1. вероятно наблюдается некоторая зависимость. Нижеописанные критерии для определения существования функциональной зависимости того или иного типа заключаются в вычислении некоторой величины λF, определяющей степень отсутствия зависимости выбранного типа, например, степень немонотонности функции. Далее, выбрав некоторое пороговое значение μF, критерий можно представить в виде параметризированного предиката

(6)

где F - семейство функциональных зависимостей, для которых данный критерий предназначен.



Рисунок 1. Зависимость at от bt




  1. Непрерывные функции.

Выберем максимальное и минимальное значение из последовательностей at и из последовательности bt. Рассмотрим прямоугольную область, образованную из этих четырех точек. Очевидно, что все остальные точки (bt, at) лежат внутри этой области. Пусть S0- площадь указанной области. Выберем некоторое значение Δ. Из множества точек (bt,at) выберем два подмножества следующим образом – в первое подмножество входят точки (bt, at), для которых известно, что в прямоугольной области либо в области нет других точек , см. рис. 2. Во второе подмножество входят точки, для которых известно, что в прямоугольной области либо в области нет других точек.





Рисунок 2. К определению меры отсутствия зависимости рядов
Для каждого полученного подмножества рассмотрим ломаную, полученную последовательным соединением точек. Каждая ломанная делит область S0 на две части. Пусть ломанная, образованная точками первого подмножества, ограничивает снизу область с площадью S1, ломаная, образованная точками второго подмножества, ограничивает снизу область с площадью S2. Мерой отсутствия зависимости из С назовем отношение

(7)

Легко показать, что ломанные не пересекаются, но могут частично совпадать, следовательно, величина неотрицательна, и λC принимает значения из отрезка [0,1].




  1. Монотонные функции.

По определению функция называется монотонно возрастающей, если для любых х, у, таких что x<у, выполнено условие f(x) f(y). Исходя из определения, можно определить следующий простой критерий монотонности. Пусть N1 – количество пар точек , для которых выполнено следующее условие: ; N2 – количество пар точек, для которых выполнено следующее условие: , тогда мерой немонотонности функции будем называть величину



, (8)

где - общее количество пар . Заметим, что мера (8) применима как к возрастающим, так и к убывающим функциям.




  1. Унимодальные функции.

Пусть - экстремум унимодальной функции, d – количество точек , для которых . Тогда для точек слева и справа от можно вычислить меру немонотонности функции. Складывая эти величины, получим меру отсутствия унимодальности. Так как экстремум заранее не известен, то можно выбрать точку так, чтобы мера принимала наименьшее значение. Таким образом, мерой отсутствия унимодальности функции будем называть величину



(9)

где - количество пар точек , для которых выполнено условие (соответственно ) и которые лежат левее экстремума, аналогично - количество пар точек с указанными условиями, лежащие правее экстремума.


Общий критерий поиска зависимостей для функции многих переменных
Определим меру зависимости ряда Ak от рядов для функций многих переменных , для которых выполнено условие (5). Рассмотрим вначале набор Ф = {М,U}. Так как в этом случае при произвольных фиксированных функция является либо монотонной, либо унимодальной, то, выбрав несколько наборов , можно предварительно определить вид зависимости , которая предположительно может существовать. То есть для большинства выбранных наборов необходимо, чтобы функция была одновременно либо возрастающая, либо убывающая, либо унимодальная с одним максимумом, либо унимодальная с одним минимумом. Если это не так, то можно утверждать, что нет зависимости ряда Аk от ряда Аr, или же вид зависимости нам неизвестен. В обоих случаях будем считать, что нет зависимости ряда Аk от рядов в виде функции многих переменных с условием (5). Рассмотрим ряды Аr, для которых функция является унимодальной. Допустим, что рассмотрев несколько наборов (обозначим эти наборы С1, С2 ,...,С p), мы пришли к выводу, что возможна унимодальная зависимость, причем положение экстремума (например, максимума) в рассмотренных случаях было в точках По указанным точкам можно построить процедуру вычисления положения точки экстремума функции для произвольного набора - например, можно исходить из предположения, что экстремум мало меняется при изменении набора , в таком случае можно принять за точку экстремума среднее значение точек Другой способ заключается в интерполяции функции положения экстремума по точкам

Допустим, что для рядов предположительно наблюдается монотонно возрастающая функция , для рядов - монотонно убывающая функция, для рядов - унимодальная с максимумом, и для рядов - унимодальная с минимумом. Рассмотрим пару точек , для которых выполнены следующие условия:



, (10)

где - значения экстремума унимодальной функции при равном (соответственно ).

Описанное выше условия выделяет те пары точек, для которых не выполнено сделанное предположение о монотонности и унимодальности рядов. Также можно указать условие, описывающее те точки, для которых предположение полностью выполнено:

, (11)

Мерой отсутствия зависимости назовем отношение количества пар точек n, для которых условие (10) выполнено к количеству пар точек m, для которых выполнено условие (11)



(12)

Рассмотрим теперь семейство Ф = {С}. Критерий для семейства С для случая одной переменной можно обобщить на случай функции двух переменных следующим образом. Мерой отсутствия зависимости назовем величину , где V0 – общий объем, V1, V2 – объемы, ограничиваемые снизу поверхностями, образованными точками, для которых хотя бы в одном из четырех параллелепипедов (построенных аналогично прямоугольникам для одномерного случая) нет ни одной точки (ct, bt, at).

Подобное обобщение неприменимо для случая l>2 в связи с вычислительной сложностью численного интегрирования. Рассмотрим семейство функций одной переменной D, которое имеет более простую конструкцию, чем семейство С. Рассмотрим семейство непрерывных функций с ограниченной в точках существования производной.

Простота конструкции семейства D позволяет создать следующий критерий – определим меру зависимости ряда Аk от рядов следующим образом: рассмотрим пары точек , расстояние между которыми меньше некоторой константы δ. Мерой отсутствия зависимости назовем отношение количества k тех пар, для которых к количеству k> тех пар, для которых .

Недостатком выбора семейства D можно считать то, что в него входят функции с произвольно большим количеством локальных экстремумов, однако не входят, например, монотонные функции с отрезками быстрого возрастания.
Настойка пороговых значений μF для выбранных критериев
Пусть Ф = {1, φ2,…, φs} – выбранный набор семейств функций. Сопоставим каждому из семейств набора соответствующий критерий из множества К = {} .

Введем предикат F(A, В), принимающий истинное значение тогда и только тогда, когда ряд А зависит от ряда В, т.е. bt входит как аргумент в (3). Очевидно, что если ряд А зависит от ряда В , ряд В зависит от С, то ряд А зависит от ряда С, т.е.



(13)

Другими словами, формула (6) означает, что если



(14)

Если для любых известно, что принадлежит одному из семейств набора Ф, например, , то семейства имеют преимущества перед семействами, для которых указанное свойство не выполняется. Дело в том, что если не принадлежит ни одному из семейств, то для этой функции у нас нет критерия, проверяющего зависимость непосредственно, и сделать вывод о том, что ряд А зависит от ряда С можно лишь по косвенной информации. Если же указанное свойство выполнено, то для критериев Ki, Kj, Kk становиться необходимым следующее групповое условие: если с помощью критерия Ki установлено существование зависимости φi между рядами А и В и с помощью критерия Кj установлено существование зависимости φj между рядами В и С, то необходимо, чтобы с помощью критерия Кk была выявлена зависимость φk между рядами А и С.



, (15)

где обозначает тот факт, что с помощью критерия установлено, что ряд А зависит от ряда В.

Если и , причем Сt не входит в f как параметр и bt не входит в как параметр, то необходимо . Для критериев сформулируем условие, аналогичное описанному выше.

Если с помощью критерия Ki установлено существование зависимости φ1 между рядами А и В, причем С не входит в эту зависимость, и с помощью критерия Кk установлено существование зависимости φk между рядами А и С , причем В не входит в эту зависимость, то необходимо, чтобы с помощью критерия Кj была выявлена зависимость φj между рядами В и С.



(16)

При выполнении этих условий мы располагаем дополнительной информацией для настройки параметров критериев и проверки правильности их работы.

Вначале рассмотрим случай одной переменной. В этом случае второе условие для функций и для критериев можно записать в виде:

(17)

В общем случае для произвольного набор критериев К = {К1, K2,...,Ks}, для которых должны быть выполнены вышеописанные условия (15)-(16), настройка критериев заключается в выборе пороговых значений , минимизирующих количество несоответствий данным условиям. Допустим, что получены оценки , несоответствие может возникнуть в случае, если пороговые значения для критериев выбраны так, что - несоответствие условию (15), либо - несоответствие условию (17).

Известно, что суперпозиция монотонных функций является монотонной функцией, суперпозиция монотонной и унимодальной функции является унимодальной функцией, однако суперпозиция унимодальных функций, вообще говоря, не входит ни в одно из выбранных семейств. Для набора Ф = {М ,U} для случая функции одной переменной можно составить таблицу





M

U

M

M

U

U

U

?

Введем предикаты М (А, В), U (A, В), принимающие истинное значение тогда и только тогда, когда ряд А монотонно (унимодально) зависит от ряда В, т.е. bt входит как аргумент в (3). Из вышесказанного следует, что

(18а)

(18б)

(18в)

(18г)

(18д)

(18е)

Условия (15) - (16) для критериев для определения монотонности и унимодальности, описанных в пункте 3, можно записать в виде



(19а)

(19б)

(19в)

(19г)

(19д)

(19е)

Покажем, что для описанных критериев для монотонной и унимодальной зависимости условия (19) не всегда выполняются. Рассмотрим, например, условие (19а) – суперпозицию двух функций , к которым применяется критерий монотонности. Допустим, что количество пар точек, для которых выполняется условие немонотонности (bt<bsat>as – для возрастающей функции, bt<bsat<as – для убывающей) для рядов А и В равно n, а для рядов В и С равно k. Предположим, что обе зависимости возрастающие, т.е. min (N1, N2) = N1 для формулы (8). Тогда количество пар точек (t, s), таких, что bt<bsat<as равно . Среди n точек bt>bsat<as, может оказаться от 0 до min(k,n) точек, для которых bt>bsat<asct>cs. Среди точек bt<bsat<as может оказаться от 0 до min(k, ) точек, для которых bt<bsat<asct>cs. Таким образом, общее число точек, таких, что at<asct>cs варьируется от 0 до min (k, )+min (k,n), что больше k и больше n. Если выбрать значение μM так, что и , но , то (19а) не выполняется. Аналогичное доказательство можно провести для остальных условий из (19).

Для поиска зависимостей прогнозируемых рядов предложены виды семейств функциональных зависимостей: непрерывные функции с ограниченным числом экстремумов, монотонные функции и унимодальные. Для рассмотренных семейств предложены критерии поиска зависимостей прогнозируемых рядов. Также показан метод настройки параметров выбранных критериев.

Выбранные критерии распространены на случай функции многих переменных, т.е. случай зависимости между несколькими временными рядами.


Поступила в редакцию 18.12.2009 г. Рецензент:


В.В. Поцепаєв

Донецький національний технічний університет



Р.В. Поцепаєв

Технологічний центр Шлюмберже, Абінгдон, Великобританія


Вибір функціональних залежностей і критеріїв зв’язку часових рядів в задачах прогнозування. Розглядається задача прогнозування часових рядів, запропоновані критерії визначення функціональних залежностей між рядами відомими в області прогнозування і рядами, які прогнозуються для сімейств монотонних, унімодальних та нерозривних функцій, наведене налаштування параметрів обраних критеріїв.

Прогнозування, часовий ряд, функціональна залежність, критерії
V.V. Potsepaev

Donetsk National Technical University



R.V. Potsepaev

Technology center Shlumberge, Abingdon, United Kingdom


Selection of functional dependences and criteria for time series relationships in forecasting problems. The problem of time series forecasting is discussed; criteria for determining functional relationships between series known in the interval of forecasting and series subject to prediction are suggested for monotone, unimodal and continuous functions; the algorithm for the adjustment of parameters of selected criteria is proposed.

Forecasting, time series, functional dependence, criteria


© Поцепаев В.В., Поцепаев Р.В.


Каталог: bitstream -> 123456789 -> 8366
123456789 -> 40 – летию кафедры тэлаиад мгту га посвящается
123456789 -> Лекция Общее устройство авиамоделей. Материалы для авиамоделирования
123456789 -> Пособие по изучению дисциплины Москва 2007 Рецензент: канд истор. Наук В. И. Хорин. Пименов В. И
123456789 -> Методические указания по проведению практических занятий на тему: "Особенности конструкции и технической эксплуатации планера самолета"
123456789 -> Задачах: а определение терминов «концепт» и«концепто-сфера»
123456789 -> Восстановление твердых тканей зубов вкладками и штифтовыми конструкциями
123456789 -> Фольклорное наследие александра потебни
123456789 -> Сердечно-сосудистые заболевания и сахарный диабет


Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©uverenniy.ru 2019
обратиться к администрации

    Главная страница