Главная страница
qrcode

Корреляция. Доклад исследователей нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых выборках.


Скачать 64.81 Kb.
НазваниеДоклад исследователей нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых выборках.
Дата01.12.2020
Размер64.81 Kb.
Формат файлаdocx
Имя файлаКорреляция .docx
ТипДоклад
#44250
Каталог



ДОКЛАД










































Исследователей нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых выборках. Например, такая связь может наблюдаться между погрешностью аппаратной обработки экспериментальных данных и величиной скачков сетевого напряжения. Другим примером может служить связь между пропускной способностью канала передачи данных и соотношением сигнал/шум.

В 1886 году английский естествоиспытатель Френсис Гальтон для обозначения характера подобного рода взаимодействий ввёл термин «корреляция». Позже его ученик Карл Пирсон разработал математическую формулу, позволяющую дать количественную оценку корреляционным связям признаков.
В данной работе мы рассмотрим корреляцию и ее характеристики.



Корреляция — это степень, в которой события или личные характеристики человека зависят друг от друга.

Понятие корреляции отражает, главным образом, степень выраженности связи между переменными.

Корреляционный метод — процедура в исследовании, использующаяся, чтобы определить взаимосвязь между переменными. Данный метод может, например, ответить на вопрос: «существует ли корреляция между количеством стресса, с которым сталкиваются люди и степенью испытываемой ими депрессии?» То есть, по мере того, как люди продолжают переживать стресс, насколько увеличивается вероятность того, что они впадут в депрессию?



Корреляционный анализ не позволяет установить причинную зависимость между исследуемыми переменными.

Он проводится с целью:

- установления зависимости между переменными;

- получения определенной информации о переменной на основе другой переменной;

- определения тесноты (связи) этой зависимости;

- определение направления установленной связи



Данный анализ может выполняться с использованием:

- метода квадратов Пирсона;

- рангового метода Спирмена.

Метод Пирсона применим для расчетов требующих точного определения силы, существующей между переменными. Изучаемые с его помощью признаки должны выражаться только количественно.

Для применения метода Спирмена или ранговой корреляции нет жестких требований в выражении признаков – оно может быть, как количественным, так и атрибутивным. Благодаря этому методу получается информация не о точном установлении силы связи, а имеющая ориентировочный характер.



Статистическая величина характеризующая характер изменения двух переменных получила название коэффициента корреляции либо парного коэффициента корреляции. В количественном выражении он колеблется в пределах от -1 до +1.

Коэффициент ранговой корреляции Спирмена – это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

Критерий корреляции Пирсона – это метод параметрической статистики, позволяющий определить наличие или отсутствие линейной связи между двумя количественными показателями, а также оценить ее тесноту и статистическую значимость. Другими словами, критерий корреляции Пирсона позволяет определить, есть ли линейная связь между изменениями значений двух переменных. В статистических расчетах и выводах коэффициент корреляции обычно обозначается как rxy или Rxy.

Коэффициенты Пирсона – применим для переменных принадлежащих к интервально шкале.

Коэффициенты Спирмена – для переменных порядковой шкалы.

Расчет коэффициента корреляции Пирсона производится по следующей формуле:


где хi– значения, принимаемые в выборке X,

yi– значения, принимаемые в выборке Y;

–средняя по X,  – средняя по Y.

Расчет коэффициента корреляции Пирсона предполагает, что переменные Х и У распределены нормально. 

Расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:

Сопоставить каждому из признаков их порядковый номер (ранг) по возрастанию или убыванию.

Определить разности рангов каждой пары сопоставляемых значений (d).

Возвесфти в квадрат каждую разность и суммировать полученные результаты.

Вычислить коэффициент корреляции рангов по формуле:


Определить статистическую значимость коэффициента при помощи t-критерия, рассчитанного по следующей формуле:


в которой: n – отображает количество ранжируемых признаков; d – не что иное как разность между рангами по двум переменным; а ∑(d2) – сумма квадратов разностей рангов.



Получение недостоверных данных при расчете коэффициента корреляции возможно в тех случаях, когда:

- в распоряжении имеется достаточное количество значений переменной (25-100 пар наблюдений);

- между изучаемыми переменными установлено, например, квадратичное соотношение, а не линейное;

- в каждом случае данные содержат больше одного наблюдения;

- наличие аномальных значений (выбросов) переменных;

- исследуемые данные состоят из четко выделяемых подгрупп наблюдений;

- наличие корреляционной связи не позволяет установить какая из переменных может рассматриваться в качестве причины, а какая – в качестве следствия.



Для оценки статистических величин используется понятие их значимости или же достоверности, характеризующей вероятность случайного возникновения величины либо крайних ее значений.

Наиболее распространенным методом определения значимости корреляции является определение критерия Стьюдента.

Его значение сравнивается с табличным, количество степеней свободы принимается как 2. При получении расчетного значения критерия больше табличного, свидетельствует о значимости коэффициента корреляции.

При проведении экономических расчетов достаточным считается доверительный уровень 0,05 (95%) либо 0,01 (99%).



Данный метод обработки статистических данных весьма популярен в экономике и социальных науках (в частности в психологии и социологии), хотя сфера применения коэффициентов корреляции обширна: контроль качества промышленной продукции, металловедение, агрохимия, гидробиология, биометрия и прочие. В различных прикладных отраслях приняты разные границы интервалов для оценки тесноты и значимости связи.

Популярность метода обусловлена двумя моментами: коэффициенты корреляции относительно просты в подсчете, их применение не требует специальной математической подготовки. В сочетании с простотой интерпретации, простота применения коэффициента привела к его широкому распространению в сфере анализа статистических данных.

Для обеспечения доказательности получаемых в исследованиях результатов должна быть выбрана «доказательная», т.е. адекватная задачам, методика исследования (дизайн исследования и методы статистического анализа), которую учитывают при выборке информации из массива данных.










Бююль А. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей / А. Бююль, П. Цёфель. – Минск : ДиаСофт, 2005. – 608 с.
  • Гржибовский А. М. Анализ порядковых данных / А. М. Гржибовский // Экология человека. – 2008. – № 8. – С. 56–62.
  • Наследов А. Д. SPSS 15: Профессиональный статистический анализ данных /А. Д. Наследов. – СПб. : Питер, 2007. – 416 с.

  • перейти в каталог файлов


    связь с админом