В экономике, как правило, исследуются причинно-следственные взаимосвязи между признаками. При этом результативный признак рассматривается как функция и обозначается у, а факторный признак - как аргумент и обозначается х. Предполагается, что связь между х и у может быть выражена некоторой аналитической формулой. В общей форме можно записать, что у = ƒ(х) или у = ƒ (х1, …, х2), когда одновременно изучается влияние многих факторов. Задача заключается в том, чтобы найти, раскрыть эту закономерность и выразить ее в виде конкретной формулы, например линейной: у = а+вх.
Различаются два типа связи между признаками:
а) функциональная,
б) корреляционная.
При функциональной связи изменению факторного признака (аргумента) соответствует строго определенное изменение результативного признака (функции). Размер заработной платы при неизменной оплате за единицу работы функционально зависит от объема выполненной работы.
В экономических явлениях чаще встречается и имеет особое значение нежесткая, неполная форма связи между признаками - корреляционная связь, которая обнаруживается лишь в среднем, по большому числу наблюдений. При этом сама закономерность проявляется как некоторая тенденция, завуалированная случайными отклонениями. Такова, например, зависимость заработной платы от объема выполненной работы, от производительности труда, от фондовооруженности и т.д. Во всех этих случаях изменение факторного признака не сопровождается строго определенными изменениями результативного показателя.
При исследовании взаимосвязей между признаками необходимо установить:
• существует ли связь между признаками;
• какова количественная мера тесноты этой связи;
• если между признаками существует причинно-следственная связь, то какова аналитическая форма ее выражения;
• какова надежность найденной закономерности и возможно ли ее использовать для решения практических задач.
Ответы на эти вопросы находятся в определенной последовательности, предусматриваемой схемой корреляционного анализа. Рассмотрим ее на упрощенном примере.
Следует заметить, что при использовании статистических методов, особенно корреляционного анализа, важно, чтобы число наблюдений было достаточно большим; необходимо иметь по крайней мере 20-30 наблюдений. При малом числе наблюдений достоверность выводов резко снижается. В данном примере мы рассматриваем лишь пять пар наблюдений, чтобы проиллюстрировать схему расчетов, обращая основное внимание на методические особенности анализа, в то же время избегая громоздких арифметических расчетов.
Имеются сведения о зависимости объемов продаж в течение 5 месяцев от расходов на рекламу (табл. 1). Приступая к анализу взаимосвязей между признаками, в первую очередь необходимо выяснить, какова общая форма зависимости у от х.
Данные о зависимости объема продаж в течение пяти месяцев от расходов на рекламу
Таблица 1
Месяц | |||||
1 январь |
2 февраль |
3 март |
4 апрель |
5 май | |
Расходы на рекламу (х) |
40 |
70 |
20 |
90 |
50 |
Объемы продаж (у) |
265 |
370 |
170 |
385 |
250 |
Анализ таблицы показывает, что форму зависимости в первом приближении можно выразить уравнением прямой линии у = а+вх, где у - объемы продаж, какие наблюдались бы при строго линейной зависимости; х - расходы на рекламу; а, в - неизвестные параметры уравнения, которые следует определить.
Рассмотрим прежде всего логику метода, положенного в основу определения параметров а и в.
Логика рассуждений такова: если бы объем продаж изменялся строго пропорционально дозам расходов на рекламу, то закономерность связи выражалась бы прямой линией с уравнением у1 = а + вх, значения же V продаж на графике соответственно располагались бы строго на прямой линии. Следовательно, чем меньше разность между фактическими значениями объема продаж (у) и теоретически ожидаемыми (у1), тем яснее выражена закономерность связи между признаками. Поэтому при определении параметров а и в важно обеспечить минимум отклонений у-у1. Поскольку отклонения имеют разные знаки, необходимо, чтобы минимальной была сумма квадратов отклонений. В этом состоит сущность метода наименьших квадратов.
Для определения искомых параметров а и в необходимо построить систему из двух уравнений (в общем случае число уравнений равно числу неизвестных параметров) и решить ее. При составлении системы можно пользоваться следующими правилами.
1. Первое уравнение получают почленным умножением исходной формулы на коэффициент при первом параметре и суммированием по всем наблюдениям. Итак, первый параметр - а, коэффициент при нем - единица. Умножим исходную формулу у = а + вх почленно на единицу и, суммируя, получим:
Σу = па + вΣх,
где п - число наблюдений;
Σу, Σу - суммы значений признаков.
2. Второе уравнение системы получают почленным умножением той же исходной формулы на коэффициент при втором параметре и суммированием по всем наблюдениям. Итак, второй параметр исходного уравнения - в, а при нем - х. Следовательно, умножая почленно уравнение у = а + вх на х и суммируя, получим:
Σух=аΣх+вΣх2.
Значения рассчитываются на основе исходной информации. Σух и Σх2.
Итак, система из двух уравнений имеет вид
Σу=па+вΣх, Σух=аΣх+вΣх2.
Для решения ее вычислим величины Σу, Σх, Σух, Σх2.
Расчет данных для определения параметров уравнения связи
Таблица 2
Номер наблюдения |
У |
X |
Ух |
х2 |
У2 |
1 |
265 |
40 |
10600 |
1600 |
70225 |
2 |
370 |
70 |
25900 |
4900 |
136900 |
3 |
170 |
20 |
3400 |
400 |
28900 |
4 |
385 |
90 |
34650 |
8 100 |
148225 |
5 |
250 |
50 |
12500 |
2500 |
62500 |
Всего |
1440 |
270 |
87050 |
17500 |
446750 |
В среднем |
288 |
54 |
17410 |
3500 |
89350 |