Подпишись и читай
самые интересные
статьи первым!

Линейный коэффициент корреляции. Коэффициент Фехнера (коэффициент корреляции знаков) Ношения, существуют и другие коэффициенты для оценки

Коэффициент Фехнера - это оценка степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от средних значений факторного и результативного признаков. Коэффициент Фехнера наряду с такими коэффициентами, как коэффициент Спирмэна и коэффициент Кэндэла, относится к коэффициентам корреляции знаков . Коэффициент корреляции знаков основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Вычисляется он следующим образом:

A #n b " data-id="a;b" data-formul="(a-b)/(a+b)" data-r="K ф ">Рассчитать свое значение


Коэффициент Фехнера может принимать значения от –1 до +1. Kф = 1 свидетельствует о возможном наличии прямой связи, Kф=-1 свидетельствует о возможном наличии обратной связи.

Назначение сервиса . Данный сервис предназначен для расчета коэффициент Фехнера в онлайн режиме. Также определяется значимость данного коэффициента.

Инструкция . Укажите количество данных (количество строк), нажмите Далее. Полученное решение сохраняется в файле Word . Также автоматически создается шаблон для проверки решения в Excel .

Расчет коэффициента Фехнера состоит из следующих этапов:

  1. Определяют средние значения для каждого признака (X и Y).
  2. Определяют знаки отклонения (-,+) от среднего значения каждого из признаков.
  3. Если знаки совпадают, присваивают значение А, иначе В.
  4. Считают количество А и В, вычисляя коэффициент Фехнера по формуле: K ф = (n a - n b)/(n a + n b) где n a - число совпадений знаков отклонений индивидуальных величин от средней; n b - число несовпадений.
Коэффициент Фехнера изменяется в пределах [-1;+1] и применяется для оценки тесноты связи качественных признаков (непараметрические методы).

Графическое представление коэффициента Фехнера


Пример №1 . При разработке глинистого раствора с пониженной водоотдачей в высокотемпературных условиях проводили параллельное испытание двух рецептур, одна из которых содержала 2% КМЦ и 1% Na2CO3, а другая 2% КМЦ, 1% Na2CO3 и 0,1% бихромата калия. В результате получена следующие значения Х (водоотдача через 30 с).

X1 9 9 11 9 8 11 10 8 10
X2 10 11 10 12 11 12 12 10 9
Проверит, различимы ли рассматриваемые растворы по значению водоотдачи.

Пример №2 . Коэффициент корреляции знаков , или коэффициент Фехнера, основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Вычисляется он следующим образом:

,

где n a - число совпадений знаков отклонений индивидуальных величин от средней; n b - число несовпадений.

Коэффициент Фехнера может принимать значения от -1 до +1. Kф = 1 свидетельствует о возможном наличии прямой связи, Kф =-1 свидетельствует о возможном наличии обратной связи.

Пример №2
Рассмотрим на примере расчет коэффициента Фехнера по данным, приведенным в таблице:
Средние значения:


Знаки отклонений от средней X

Знаки отклонений от средней Y

Совпадение (а) или несовпадение (b) знаков


Значение коэффициента свидетельствует о том, что можно предполагать наличие обратной связи.

Оценка Коэффициента корреляции знаков.

Для оценки коэффициента Фехнера достаточно оценить его значимость и найти доверительный интервал.
Значимость коэффициента Фехнера.

По таблице Стьюдента находим t табл:
t табл (n-m-1;a) = (6;0.05) = 1.943
Поскольку Tнабл > tтабл, то отклоняем гипотезу о равенстве 0 коэффициента корреляции знаков. Другими словами, коэффициент Фехнера статистически - значим.


Доверительный интервал для коэффициента Фехнера:
r(-1.0;-0.4495)

Пример №3 .
Рассмотрим на примере расчет коэффициента корреляции знаков по данным, приведенным в таблице.

Общее представление о корреляционно-регрессивном анализе

Существующие между явлениями формы и виды связей весьма разнообразны по своей классификации. являются только такие из них, которые имеют количественный характер и изучаются с помощью количественных методов. Рассмотрим метод корреляционно-регрессионного анализа, который является основным в изучении взаимосвязей явлений.

Данный метод содержит две свои составляющие части — корреляционный анализ и регрессионный анализ. Корреляционный анализ — это количественный метод определения тесноты и направления взаимосвязи между выборочными переменными величинами. Регрессионный анализ — это количественный метод определения вида математической функции в причинно-следственной зависимости между переменными величинами.

Для оценки силы связи в теории корреляции применяется шкала английского статистика Чеддока: слабая — от 0,1 до 0,3; умеренная — от 0,3 до 0,5; заметная — от 0,5 до 0,7; высокая — от 0,7 до 0,9; весьма высокая (сильная) — от 0,9 до 1,0. Она используется далее в примерах по теме.

Линейная корреляция

Данная корреляция характеризует линейную взаимосвязь в вариациях переменных. Она может быть парной (две коррелирующие переменные) или множественной (более двух переменных), прямой или обратной — положительной или отрицательной, когда переменные варьируют соответственно в одинаковых или разных направлениях.

Если переменные — количественные и равноценные в своих независимых наблюдениях при их общем количестве , то важнейшими эмпирическими мерами тесноты их линейной взаимосвязи являются коэффициент прямой корреляции знаков австрийского психолога Г.Т.Фехнера (1801-1887) и коэффициенты парной, чистой (частной) и множественной (совокупной) корреляции английского статистика-биометрика К.Пирсона (1857-1936).

Коэффициент парной корреляции знаков Фехнера определяет согласованность направлений в индивидуальных отклонениях переменных и от своих средних и . Он равен отношению разности сумм совпадающих () и несовпадающих () пар знаков в отклонениях и к сумме этих сумм:

Величина Кф изменяется от -1 до +1. Суммирование в (1) производится по наблюдениям, которые не указаны в суммах ради упрощения. Если какое-то одно отклонение или , то оно не входит в расчет. Если же сразу оба отклонения нулевые: , то такой случай считается совпадающим по знакам и входит в состав . В таблице 12.1. показана подготовка данных для расчета (1).

Таблица 12.1 Данные для расчета коэффициента Фехнера.

Число работников, тыс. чел.

Товарооборот, у.е.

Отклонение от средних

Сравнение знаков и

совпа-дение
(С к)

несов-падение (Н к)

По (1) имеем К ф = (3 — 2)/(3 + 2) = 0,20 . Направление взаимосвязи в вариациях!!Средняя численность работников|численности работников]] и — положительное (прямолинейное): знаки в отклонениях и и в своем большинстве (в 3 случаях из 5) совпадают между собой. Теснота взаимосвязи переменных по шкале Чеддока — слабая.

Коэффициенты парной, чистой (частной) и множественной (совокупной) линейной корреляции Пирсона, в отличие от коэффициента Фехнера, учитывают не только знаки, но и величины отклонений переменных. Для их расчета используют разные методы. Так, согласно методу прямого счета по несгруппированным данным, коэффициент парной корреляции Пирсона имеет вид:

Этот коэффициент также изменяется от -1 до +1. При наличии нескольких переменных рассчитывается коэффициент множественной (совокупной) линейной корреляции Пирсона. Для трех переменных x, y, z он имеет вид

Этот коэффициент изменяется от 0 до 1. Если элиминировать (совсем исключить или зафиксировать на постоянном уровне) влияние на и , то их "общая" связь превратится в "чистую", образуя чистый (частный) коэффициент линейной корреляции Пирсона:

Этот коэффициент изменяется от -1 до +1. Квадраты коэффициентов корреляции (2)-(4) называются коэффициентами (индексами) детерминации — соответственно парной, чистой (частной), множественной (совокупной):

Каждый из коэффициентов детерминации изменяется от 0 до 1 и оценивает степень вариационной определенности в линейной взаимосвязи переменных, показывая долю вариации одной переменной (y), обусловленную вариацией другой (других) — x и y. Многомерный случай наличия более трех переменных здесь не рассматривается.

Согласно разработкам английского статистика Р.Э. Фишера (1890-1962), статистическая значимость парного и чистого (частного) коэффициентов корреляции Пирсона проверяется в случае нормальности их распределения, на основании -распределения английского статистика В.С. Госсета (псевдоним "Стьюдент"; 1876-1937) с заданным уровнем вероятностной значимости и имеющейся степени свободы , где — число связей (факторных переменных). Для парного коэффициента имеем его среднеквадратическую ошибку и фактическое значение -критерия Стьюдента:

Для чистого коэффициента корреляции при расчете его вместо (n-2) надо брать , т.к. в этом случае имеется m=2 (две факторные переменные x и z). При большом числе n>100 вместо (n-2) или (n-3) в (6) можно брать n, пренебрегая точностью расчета.

Если t r > t табл. , то коэффициент парной корреляции — общий или чистый является статистически значимым, а при t r ≤ t табл. — незначимым.

Значимость коэффициента множественной корреляции R проверяется по F — критерию Фишера путем расчета его фактического значения

При F R > F табл. коэффициент R считается значимым с заданным уровнем значимости a и имеющихся степенях свободы и , а при F r ≤ F табл — незначимым.

В совокупностях большого объема n > 100 для оценки значимости всех коэффициентов Пирсона вместо критериев t и F применяется непосредственно нормальный закон распределения (табулированная функция Лапласа-Шеппарда).

Наконец, если коэффициенты Пирсона не подчиняются нормальному закону, то в качестве критерия их значимости используется Z — критерий Фишера, который здесь не рассматривается.

Условный пример расчета (2) — (7)дан в табл. 12.2, где взяты исходные данные табл.12.1 с добавлением к ним третьей переменной z — размера общей площади магазина (в 100 кв. м).

Таблица 12.2. Подготовка данных для расчета коэффициентов корреляции Пирсона

Показатели

Согласно (2) — (5), коэффициенты линейной корреляции Пирсона равны:

Взаимосвязь переменных x и y является положительной, но не тесной, составляя по их парному коэффициенту корреляции величину и по чистому — величину и оценивалась по шкале Чеддока соответственно как "заметная" и "слабая".

Коэффициенты детерминации d xy =0,354 и d xy . z = 0,0037 свидетельствуют, что вариация у (товарооборота) обусловлена линейной вариацией x (численности работников) на 35,4% в их общей взаимосвязи и в чистой взаимосвязи — только на 0,37% . Такое положение обусловлено значительным влиянием на x и y третьей переменной z — занимаемой магазинами общей площади. Теснота ее взаимосвязи с ними составляет соответственно r xz =0,677 и r yz =0,844 .

Коэффициент множественной (совокупной) корреляции трех переменных показывает, что теснота линейной взаимосвязи x и z c y составляет величину R = 0,844 , оцениваясь по шкале Чеддока как "высокая", а коэффициент множественный детерминации — величину D=0,713 , свидетельствуя, что 71,3 % всей вариации у (товарооборота) обусловлены совокупным воздействием на нее переменных x и z . Остальные 28,7% обусловлены воздействием на y других факторов или же криволинейной связью переменных y, x, z .

Для оценки значимости коэффициентов корреляции возьмем уровень значимости . По исходным данным имеем степени свободы для и для . По теоретической таблице находим соответственно t табл.1. = 3,182 и t табл.2. = 4,303. Для F-критерия имеем и и по таблице находим F табл. = 19,0. Фактические значения каждого критерия по (6) и (7) равны:

Все расчетные критерии меньше своих табличных значений: все коэффициенты корреляции Пирсона статистически незначимы.

Выводы:

Полученная величина коэффициента корреляции знаков равна нулю, так как число совпадений и число несовпадений знаков равны. Это основной недостаток данного показателя. По этому показателю можно предполагать, что взаимосвязь отсутствует.

Линейный коэффициент корреляции

Проверка существенности коэффициента корреляции:

Выводы:

Полученная величина линейного коэффициента корреляции указывает на то, что связь между долей в общем объеме поставок сжигаемых видов топлива и ожидаемой продолжительностью жизни при рождении умеренна, свидетельствует о наличии обратной зависимости.

Следовательно, с вероятностью 95% можно предположить, что корреляционная связь все же существенна.

Эмпирическое корреляционное отношение:

Проверка значимости эмпирического корреляционного отношения:

Выводы:

Полученное значение эмпирического корреляционного отношения свидетельствует о умеренной связи между исследуемыми признаками.

Следовательно, с вероятностью 95% можно сделать вывод о несущественности корреляционной связи между анализируемыми показателями.

Коэффициент корреляции рангов Спирмэна:

Выводы:

По результатам расчета коэффициента Спирмэна можно предположить о наличии слабой обратной зависимости между долей в общем объеме поставок сжигаемых видов топлива и ожидаемой продолжительностью жизни при рождении.

Коэффициент корреляции рангов Кендэла:

Выводы:

По рассчитанному коэффициенту корреляции рангов можно полагать о наличии слабой обратной зависимости между исследуемыми признаками.

· Проверка возможности использования линейной функции в качестве формы взаимосвязи

Считается возможным применять линейное уравнение корреляционной зависимости, но для проверки гипотезы о линейной зависимости более эффективно использовать величину .

Выводы:

Следовательно, гипотеза о линейности связи между долей в общем объеме поставок сжигаемых видов топлива и ожидаемой продолжительностью жизни при рождении верна.



Страны со средним уровнем развития человеческого потенциала

· Выявление факта наличия взаимосвязи между факторным и результативным признаком

Аналитическая группировка

Эмпирическая линия регрессии


Выводы:

Сравнив средние значения результативного признака по группам, можно увидеть следующую тенденцию: чем выше доля в общем объеме поставок сжигаемых видов топлива, тем больше ожидаемая продолжительность жизни при рождении (если не учитывать скачки, возможно обусловленные прочими факторами), т. е. можно предположить наличие прямой корреляционной зависимости между признаками.

Поле корреляции


Выводы:

Основная часть единиц формирует облако, располагающееся в основном из левого нижнего угла системы координат в правый верхний угол, можно предположить наличие прямой взаимосвязи между признаками.

Корреляционная таблица

При группировке по факторному признаку число групп равняется 6. При группировке по результативному признаку установим число групп, равное числу групп по факторному признаку, т. е. . Также исключим страны, по которым отсутствуют данные по факторному признаку, число стран сократилось до тридцати, т. е. .

Теперь составляем корреляционную таблицу:

Корреляционная таблица Средняя ожидаемая продолжительность жизни при рождении, лет
52,0-57,2 57,2-62,4 62,4-67,6 67,6-70,1 70,1-72,6 72,6-75,1 Итого
Доля в общем объеме поставок сжигаемых видов топлива, % 15-30
30-45
45-60
60-75
75-90
90-100
Итого

Выводы:

Затруднительно определить направление корреляционной связи, в основном частоты в корреляционной таблице расположены на диагонали из левого верхнего угла в правый нижний угол, т. е. большим значениям факторного признака соответствуют большие значения результативного, следовательно, можно предположить наличие прямой корреляционной зависимости между признаками.

· Показатели оценки степени тесноты взаимосвязи

Для устранения недостатка ковариации был введён линейный коэффициент корреляции (или коэффициент корреляции Пирсона), который разработали Карл Пирсон, Фрэнсис Эджуорт и Рафаэль Уэлдон (англ.)русск. в 90-х годах XIX века. Коэффициент корреляции рассчитывается по формуле :

где , - среднее значение выборок.

Коэффициент корреляции изменяется в пределах от минус единицы до плюс единицы .

    Коэффициент ранговой корреляции Кендалла

Применяется для выявления взаимосвязи между количественными или качественными показателями, если их можно ранжировать. Значения показателя X выставляют в порядке возрастания и присваивают им ранги. Ранжируют значения показателя Y и рассчитывают коэффициент корреляции Кендалла:

большим значением рангов Y.

Суммарное число наблюдений, следующих за текущими наблюдениями с меньшим значением рангов Y. (равные ранги не учитываются!)

  1. Коэффициент ранговой корреляции Спирмена

Степень зависимости двух случайных величин (признаков) X и Y может характеризоваться на основе анализа получаемых результатов . Каждому показателю X и Y присваивается ранг. Ранги значений X расположены в естественном порядке i=1, 2, . . ., n. Ранг Y записывается как Ri и соответствует рангу той пары (X, Y), для которой ранг X равен i. На основе полученных рангов Х i и Yi рассчитываются их разности и вычисляется коэффициент корреляции Спирмена:

Значение коэффициента меняется от −1 (последовательности рангов полностью противоположны) до +1 (последовательности рангов полностью совпадают). Нулевое значение показывает, что признаки независимы.

  1. Коэффициент корреляции знаков Фехнера

Подсчитывается количество совпадений и несовпадений знаков отклонений значений показателей от их среднего значения.

C - число пар, у которых знаки отклонений значений от их средних совпадают.

H - число пар, у которых знаки отклонений значений от их средних не совпадают.

Литература: http://ru.wikipedia.org/wiki/%CA%EE%F0%F0%E5%EB%FF%F6%E8%FF

9. вычислите коэффициент корреляции Спирмэна.

Оценка взаимосвязи показателей: X – место занятое в стрельбе из винтовки; Y – количество попаданий в десятку. Все прочие условия примерно одинаковы. Результаты соревнований представлены в Таблице №1

Таблица №1 Расчет рангового коэффициента корреляции Спирмэна.

Пояснение:

шаг 1. Проранжировать (упорядочить и приписать порядковые номера) показатели X и Y. Так как X упорядочен и обозначает соответствующие ранги, перепишем его в столбец 3. показателю Y приписываем ранги следующим образом: значению 10 – ранг 1; 9 – ранг (2+3)/2=2,5; 8 – ранг 4; 7 – ранг 5 и т. д. (столбец 4)

шаг 2. вычислить разность рангов d=Dx-Dy(столбец 5)

шаг 3. вычислить квадрат разности d=(Dx-Dy)2 (столбец 6)

шаг 4. вычислить сумму квадратов разности

Коэффициент Фехнера - это оценка степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от средних значений факторного и результативного признаков. Коэффициент Фехнера наряду с такими коэффициентами, как коэффициент Спирмэна и коэффициент Кэндэла, относится к коэффициентам корреляции знаков . Коэффициент корреляции знаков основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Вычисляется он следующим образом:

A #n b " data-id="a;b" data-formul="(a-b)/(a+b)" data-r="K ф ">Рассчитать свое значение


Коэффициент Фехнера может принимать значения от –1 до +1. Kф = 1 свидетельствует о возможном наличии прямой связи, Kф=-1 свидетельствует о возможном наличии обратной связи.

Назначение сервиса . Данный сервис предназначен для расчета коэффициент Фехнера в онлайн режиме. Также определяется значимость данного коэффициента.

Инструкция . Укажите количество данных (количество строк), нажмите Далее. Полученное решение сохраняется в файле Word . Также автоматически создается шаблон для проверки решения в Excel .

Расчет коэффициента Фехнера состоит из следующих этапов:

  1. Определяют средние значения для каждого признака (X и Y).
  2. Определяют знаки отклонения (-,+) от среднего значения каждого из признаков.
  3. Если знаки совпадают, присваивают значение А, иначе В.
  4. Считают количество А и В, вычисляя коэффициент Фехнера по формуле: K ф = (n a - n b)/(n a + n b) где n a - число совпадений знаков отклонений индивидуальных величин от средней; n b - число несовпадений.
Коэффициент Фехнера изменяется в пределах [-1;+1] и применяется для оценки тесноты связи качественных признаков (непараметрические методы).

Графическое представление коэффициента Фехнера


Пример №1 . При разработке глинистого раствора с пониженной водоотдачей в высокотемпературных условиях проводили параллельное испытание двух рецептур, одна из которых содержала 2% КМЦ и 1% Na2CO3, а другая 2% КМЦ, 1% Na2CO3 и 0,1% бихромата калия. В результате получена следующие значения Х (водоотдача через 30 с).

X1 9 9 11 9 8 11 10 8 10
X2 10 11 10 12 11 12 12 10 9
Проверит, различимы ли рассматриваемые растворы по значению водоотдачи.

Пример №2 . Коэффициент корреляции знаков , или коэффициент Фехнера, основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Вычисляется он следующим образом:

,

где n a - число совпадений знаков отклонений индивидуальных величин от средней; n b - число несовпадений.

Коэффициент Фехнера может принимать значения от -1 до +1. Kф = 1 свидетельствует о возможном наличии прямой связи, Kф =-1 свидетельствует о возможном наличии обратной связи.

Пример №2
Рассмотрим на примере расчет коэффициента Фехнера по данным, приведенным в таблице:
Средние значения:


Знаки отклонений от средней X

Знаки отклонений от средней Y

Совпадение (а) или несовпадение (b) знаков


Значение коэффициента свидетельствует о том, что можно предполагать наличие обратной связи.

Оценка Коэффициента корреляции знаков.

Для оценки коэффициента Фехнера достаточно оценить его значимость и найти доверительный интервал.
Значимость коэффициента Фехнера.

По таблице Стьюдента находим t табл:
t табл (n-m-1;a) = (6;0.05) = 1.943
Поскольку Tнабл > tтабл, то отклоняем гипотезу о равенстве 0 коэффициента корреляции знаков. Другими словами, коэффициент Фехнера статистически - значим.


Доверительный интервал для коэффициента Фехнера:
r(-1.0;-0.4495)

Пример №3 .
Рассмотрим на примере расчет коэффициента корреляции знаков по данным, приведенным в таблице.

Включайся в дискуссию
Читайте также
Что такое гост (государственный стандарт), значение и важность
Бухгалтерский учет - Ю. Бабаев. Бухгалтерский учет.  Бабаева Ю.А Бухгалтерский учет. Под ред. А
Из главбуха в финдиры Финансовый директор функции главного бухгалтера