Построение модели регрессии для урожайности озимой пшеницы




Скачать 128.8 Kb.
Дата15.07.2016
Размер128.8 Kb.

Построение модели регрессии для урожайности озимой пшеницы

На урожайность зерновых культур влияет большое число факторов. Необходимо учитывать требования культуры к температуре, влаге, свету, почве, питанию, агротехнике, предшественникам и т.д. Для решения задачи повышения урожайности полезно знать количественную оценку связи между продуктивностью растения и факторами, влияющими на нее. Поэтому воспользуемся корреляционно регрессионными методами анализа.

Среди зерновых культур в Краснодарском крае наибольшее значение имеет озимая пшеница. Регион обладает одними из самых благоприятных условий для ее возделывания, поэтому она занимает более 50% посевных площадей. Рассмотрим зависимость урожайности озимой пшеницы в различных районах края от выделенных факторов:

- количество осадков (мм);

- средняя температура воздуха (0С);

- численность работников (чел.);

- обеспеченность сельскохозяйственных организаций тракторами и комбайнами;

- количество удобрений на 1 га посева (кг);

- качество почвы (в баллах).

Первоначально рассмотрим влияние погодных условий на урожайность озимой пшеницы в Краснодарском крае. В таблице 2.1. приведены данные об урожайности по районам края. В таблице 2.2. приведены данные о температурном режиме в крае, а в таблице 2.3. данные об условиях увлажнения.



Таблица 2.1.

Урожайность озимой пшеницы по районам края



Район

Урожайность, ц/га



Район

Урожайность, ц/га

1

Абинский

45,7

21

Мостовский

37,5

2

Апшеронский

39,1

22

Новокубанский

70,3

3

Белоглинский

52,6

23

Новопокровский

48,9

4

Белореченский

44,8

24

Отрадненский

42,9

5

Брюховецкий

59,8

25

Павловский

53,4

6

Выселковский

65,3

26

Приморско-Ахтарский

49,0

7

Гулькевичский

65,5

27

Северский

39,1

8

Динской

61,0

28

Славянский

49,1

9

Ейский

40,4

29

Староминский

54,3

10

Кавказский

57,7

30

Тбилисский

60,2

11

Калининский

53,0

31

Темрюкский

47,2

12

Каневской

63,3

32

Тимашёвский

65,6

13

Кореновский

63,9

33

Тихорецкий

54,1

14

Красноармейский

49,5

34

Туапсинский

44,8

15

Крыловский

41,2

35

Успенский

48,2

16

Крымский

38,3

36

Усть-Лабинский

67,1

17

Курганинский

51,0

37

Щербиновский

48,9

18

Кущёвский

48,8










19

Лабинский

59,7










20

Ленинградский

61,2









Рассмотрим влияние температурного режима на изменение урожайности.

Для этого рассчитаем матрицу коэффициентов парной корреляции для следующих переменных:

y – урожайность озимой пшеницы, ц/га;

– средняя температура воздуха в осенний период вегетации (октябрь-ноябрь), 0С;

– средняя температура воздуха в период перезимовки (декабрь- февраль), 0С;

- средняя температура воздуха в весенний период вегетации (март);

- средняя температура воздуха в фазу формирования зерновки (апрель-май), 0С.

Таблица 2.2.

Сводные данные о температурном режиме в Краснодарском крае





Октябрь-Ноябрь

Декабрь-Февраль

Март

Апрель-Май

Средняя минимальная температура, 0С

3,8

-4,4

-0,9

8,1

Средняя температура, 0С

7,7

-1,3

3,3

13,8

Средняя максимальная температура, 0С

13,5

3

8,9

20,3


Таблица 2.3.

Сводные данные об условиях увлажнения в Краснодарском крае




Октябрь-Ноябрь

Декабрь-Февраль

Март

Апрель

Май

Среднее кол-во осадков в одном районе, мм

100,5

96,2

96,1

30,1

94,1

Матрица парных коэффициентов линейной корреляции приведена в таблице 2.4. Как видно, выделенные переменные сильно коррелируют друг с другом, но не все находятся в тесной линейной зависимости с результативной переменной. Наибольший коэффициент парной корреляции у фактора Х3 с объясняемой переменной. Другими словами имеет место мультиколлинеарность факторов. Полностью исключать факторы, имеющие небольшие коэффициенты корреляции с урожайностью не будем, а методами факторного анализа сформируем обобщенный показатель – температурный режим вегетационного периода озимой пшеницы.



Таблица 2.4.

Матрица коэффициентов парной корреляции для урожайности и температурного режима

 

Х1

Х2

Х3

Х4

Х5

Х1

1













Х2

0,695422778

1










Х3

0,890768288

0,684389953

1







Х4

0,897176332

0,813037513

0,883169208

1




Y

0,411414072

0,295719662

0,614005307

0,281025699

1

Факторный анализ позволяет в условиях сильной взаимосвязи отдельных независимых переменных сформировать обобщенный показатель. В нашем случае имеются все предпосылки. Естественно предположить, что температурный режим в период вегетации совместно влияет на продуктивность озимой пшеницы, хотя по отдельности эта связь не ярко выражена. Расчеты выполним в ППП Statistica. На рис. 2.1. представлены факторные нагрузки для исходных переменных, которые имеют очень высокие коэффициенты корреляции с обобщенным фактором – температурный режим. При этом новый показатель объясняет 72% совместной вариации исходных. На рис. 2.2. приведены коэффициенты регрессии, с помощью которых рассчитаны значения обобщенного фактора по исходным значениям температуры в районах края в разные месяцы вегетационного периода озимой пшеницы.







Рис. 2.1. Факторные нагрузки для температурного режима

Рис. 2.2. Коэффициенты регрессии исходных показателей в формировании обобщенного фактора

Аналогично поступим с режимом увлажнения. Рассмотрим матрицу парных коэффициентов для следующих показателей (таблица 2.5):



y – урожайность озимой пшеницы, ц/га;

– количество осадков в осенний период вегетации (октябрь-ноябрь), мм;

– количество осадков в период перезимовки (декабрь-февраль), мм;

- количество осадков в весенний период вегетации (март), мм;

- количество осадков в фазу колошения-цветения (апрель), мм;

- количество осадков в фазу прорастания зерна (май), мм.

Таблица 2.5.

Матрица коэффициентов парной корреляции для урожайности и режима увлажнения

 

Х1

Х2

Х3

Х4

Х5

Y

Х1

1
















Х2

0,864002855

1













Х3

0,788753848

0,664657387

1










Х4

0,83762099

0,788099022

0,556506644

1







Х5

0,761464921

0,834736513

0,831564307

0,72083327

1




Y

0,366150283

0,426375841

0,568239841

0,516875267

0,6788754

1

Анализ матрицы коэффициентов парной корреляции позволяет сделать вывод о сильной взаимосвязи объясняющих переменных – количества осадков в разные месяцы года. При этом каждый из них в разной степени связан с результативной переменной. Можно только отметить, что результаты корреляционного анализа подтверждают тезис о возрастании значения количества влаги в период вегетации озимой пшеницы. Целесообразно сформировать обобщенный показатель. Воспользуемся методами факторного анализа. После выполнения необходимых расчетов средствами пакета статистического анализа Statistica получены факторные нагрузки – коэффициенты парной корреляции нового обобщенного показателя – режим увлажнения – с исходными переменными Х1, Х2, Х3, Х4, Х5 и Х6. Они приведены на рис. 2.3. Все коэффициенты корреляции имеют высокое значение, только одно значение , но и это достаточно высокое значение коэффициента корреляции, которое позволяет считать связь между новым обобщенным показателем и количеством осадков в апреле тесно связанными.







Рис. 2.3. Факторные нагрузки для режима увлажнения

Рис. 2.4. Коэффициенты регрессии исходных показателей в формировании обобщенного фактора режима увлажнения

На рис. 2.4. приводятся коэффициенты регрессии, по которым рассчитаны значения обобщенного показателя – режим увлажнения на основе количества осадков в разные месяцы вегетационного периода.

Теперь можно перейти к рассмотрению не климатических переменных, влияющих на урожайность озимой пшеницы. Отдельно остановимся на показателе качество почвы. Поскольку показатель измеряем в баллах (0 – черноземы; 1 – каштановые, подзолистые и дерново-глеевые почвы, 2 – песчаные, супесчаные, тяжелосуглинистые и глинистые почвы), т.е. в порядковой шкале, то необходимо использовать фиктивные переменные в уравнении множественной регрессии:





Интерпретация введенных фиктивных переменных следующая:

1) Чернозем:

2) Каштановые, подзолистые и дерново-глеевые почвы:

3) Песчаные, супесчаные, тяжелосуглинистые:

Теперь можно перейти к непосредственному моделированию урожайности средствами корреляционно-регрессионного анализа. Методом наименьших квадратов (средствами MS Excel) провели оценку параметров уравнения регрессии:



где – урожайность озимой пшеницы, ц/га;



– обобщенный фактор «температурный режим»;

– обобщенный фактор «режим увлажнения»;

– численность работников (чел/1000 га);

– обеспеченность сельскохозяйственных организаций тракторами и комбайнами (шт/1000 га);

– количество внесенных удобрений на 1 га посева (кг);



После обработки данных по 37 районам Краснодарского края (таблица 2.1) с помощью надстройки «Анализ данных» в MS Excel получены следующие результаты (рис. 2.5).



Рис. 2.5. Результаты регрессионного анализа с полным набором переменных

Как видно, по результатам регрессионного анализа показатели качества модели высокие, но коэффициент регрессии для одной переменной, а конкретно, для численности работников статистически не значимо отличен от нуля. Вероятность этого всего 36%. Такой вывод получен с помощью t-критерия Стьюдента, расчетные значения которого приведены для всех параметров модели. Доверительные интервалы для указанной переменной содержат ноль. Поэтому исключим этот фактор из модели и повторно проведем оценку параметров модели. На рис. 2.6. представлены результаты расчетов.

Рис. 2.6. Результаты регрессионного анализа с отобранными переменными


Теперь все коэффициенты регрессии являются статистически значимо отличными от нуля, в том числе и свободный член. Достаточно высокие значения t-статистики говорят о том, что полученные коэффициенты сформировались не под воздействием случайных факторов, а подчиняются статистическим закономерностям.

Уравнение линейной множественной регрессии для урожайности озимой пшеницы имеет вид:



где – урожайность озимой пшеницы, ц/га;



– обобщенный фактор «температурный режим»;

– обобщенный фактор «режим увлажнения»;

– обеспеченность сельскохозяйственных организаций тракторами и комбайнами (шт/1000 га);

– количество внесенных удобрений на 1 га посева (кг);



Полученные результаты означают, что все выбранные факторы положительно влияют на урожайность, но в разной степени. Сравнивать коэффициенты регрессии и ранжировать факторы по степени влияния на результат нельзя, так как это уравнение в естественной форме, но некоторые выводы сделать можно. Каждый коэффициент показывает на сколько ц/га в среднем увеличится урожайность озимой пшеницы, если соответствующий фактор увеличить на одну единицу, например, при увеличении количества внесенных удобрений на 1 кг на 1 га посева урожайность пшеницы увеличивается в среднем на 0,33 ц/га. Интерпретация коэффициентов при фиктивных переменных следующая: урожайность на черноземных почвах возрастает на 4,39 ц/га по сравнению с песчаными почвами при фиксированных (неизменных) значениях остальных факторов, а урожайность пшеницы на каштановых почвах на 3,44 ц/га выше, чем на песчаных почвах при неизменных значениях других факторов.

Рассмотрим показатели качества полученной модели. Коэффициент множественной детерминации равен 0,88, т.е. результативная переменная находится в тесной линейной связи с выбранными факторными переменными. Коэффициент множественной детерминации , т.е. 78% вариации урожайности озимой пшеницы в разных районах края удалось объяснить совместной вариацией температурного режима и режима увлажнения, обеспеченностью сельскохозяйственной техникой, а также количеством внесенных удобрений, ну и качеством почвы.

Полученное уравнение регрессии можно считать в целом статистически значимым, т.к. наблюдаемое значение F-критерия Фишера достаточно большое – 58,009, а соответствующая вероятность сделать ошибку при принятии этого утверждения близка к нулю для данного количества степеней свободы. Это означает, что полученные результаты регрессионного анализа отличаются от тех, которые могли сформироваться под воздействием случайных факторов.

Исследуем адекватность модели, рассмотрев остатки. Необходимо, чтобы они были случайными, независимыми и соответствовали нормальному закону распределения с нулевым математическим ожиданием: .

Для проверки независимости остатков воспользуемся анализом автокорреляционной (АКФ) и частичной автокрреляционной функций (ЧАКФ). Их графики представлены на рис. 2.7 и 2.8.







Рис. 2.7. График АКФ остатков регрессионной модели урожайности озимой пшеницы

Рис. 2.8. График ЧАКФ остатков регрессионной модели урожайности озимой пшеницы

Как видно на рисунках статистически значимо отличных от нуля коэффициентов автокорреляции на обеих графиках нет, поэтому остатки можно считать независимыми. С помощью критерия проверим соответствие остатков нормальному закону распределения с нулевым математическим ожиданием.

На рис. 2.9. приведена гистограмма остатков с рассчитанным значением критерия. Как видно, полученное распределение достаточно хорошо соответствует нормальному распределению. Этот же вывод получаем по нормальному вероятностному графику (рис. 2.10).






Рис. 2.9. Гистограмма остатков

Рис. 2.10. Нормальный вероятностный график

Таким образом, получена адекватная и статистически значимая регрессионная модель зависимости урожайности озимой пшеницы от природных агротехнических факторов.






База данных защищена авторским правом ©uverenniy.ru 2016
обратиться к администрации

    Главная страница