Основное содержание
Статистика для средней школы
Course: Статистика для средней школы > Модуль 1
Урок 1: Построение и понимание диаграмм рассеяния- Построение диаграммы рассеяния
- Пример разных направлений зависимости на диаграмме рассеяния
- Положительная и отрицательная корреляция на диаграммах рассеяния
- Пример на интуитивное понимание коэффициента корреляции
- Анализ корреляции между переменными на диаграммах рассеяния
- Корреляция и причинно-следственная связь
Пример на интуитивное понимание коэффициента корреляции
Сэл на интуитивном уровне объясняет смысл коэффициента корреляции и решает задачу на сопоставление коэффициентов корреляции диаграммам рассеяния.
Хотите присоединиться к обсуждению?
Пока нет ни одной записи.
Транскрипция к видео
нам даны несколько коэффициентов корреляции и нужно сопоставить какой диаграмме какой коэффициент соответствует в данный момент нас не интересует как эти коэффициенты вычисляются сейчас нам достаточно понять что именно они означают коэффициент корреляции показывает насколько хорошо линейная модель описывает связь между двумя переменными рассмотрим пример предположим у нас есть координатная плоскость вот одна переменная y вот вторая переменная x и пусть у нас при небольших значениях x y тоже будет небольшим а при увеличении значения x y тоже будет возрастать соотношение таких переменных прекрасно описывается линейной моделью мы легко можем провести прямую через все эти точки так вот в таком случае коэффициент корреляции то есть r равен единице переменные идеально описываются линейные моделью а их зависимость положительная то есть с увеличением одной переменной увеличивается и 2 с уменьшением одной переменной уменьшается и 2 как выглядит зависимость где р равно минус единица в этом случае линейная модель также идеально описывает взаимосвязь между переменными но с увеличением одной переменной 2 будет уменьшаться и наоборот я снова нарисую координатную плоскость и приведу пример когда р равно минус единицы если y большой то x будет наоборот очень маленьким то есть y уменьшается тогда когда x увеличивается здесь с увеличением значения x y уменьшается несмотря на то что значение x и y движется в разном направлении их зависимость все равно идеально укладывается в прямую в этом примере р равно минус единицы а если r равно нулю значит зависимость вообще невозможно представить в виде прямой нарисую маленький график если r равно нулю точки могут располагаться примерно так здесь . тут еще вот здесь и так далее они не обязательно будут располагаться и в виде ровной решетки но суть надеюсь понятно невозможно провести прямую вдоль которые лягут эти точки ее можно провести так вот так или так ни одна из этих прямых не описывает линейную зависимость между переменными а теперь давайте перейдем к примерам можно ли здесь провести некую прямую достаточно хорошо описывающих зависимость между величинами есть много способов как рассчитать эту прямую на всех этих диаграммах у меня зависимости не идеальная я приводил примеры идеальной зависимости но в реальном мире зависимости часто не идеальны очень редко точки будут расположены идеально вдоль прямой здесь я попытаюсь нарисовать эти прямые для первой диаграммы прямая будет выглядеть примерно вот так моя задача минимизировать разброс точек относительно прямой здесь хорошо видна закономерность в основном точки расположены так что если значение y маленькая то x будет большим а где x большой там и y маленький поэтому похоже что r будет меньше нуля причем достаточно меньше нуля ближе к минус единице если посмотреть на варианты ответов то 0,65 отпадает это больше нуля второй вариант тоже не подходит а в третьем варианте взаимосвязи практически нет здесь r равен минус 200m это почти что 0 то есть зависимости нет значит скорее всего здесь r равен минус 70 200 хочу обратить ваше внимание что если бы у меня не было вариантов ответа я бы не смогла посмотреть на диаграмму и без вычислений сказать что р равно минус 72 сотым я лишь основываюсь на том что вижу отрицательную зависимость причем достаточно явно наглядно видно что там где значение x маленькое значение y большое и наоборот поэтому еще ответ близкий к минус единице вычеркнем этот вариант диаграмма b здесь опять же связь не идеальная но у явно прослеживается примерно вот такая закономерность прямая достаточно хорошо ее описывает при этом все равно есть отдельные точки которые находятся далеко от прямой и корреляция похоже положительная с увеличением значения x возрастает значение y значит коэффициент корреляции будет положительным причем достаточно близкие к единице у меня здесь два подходящих варианта и я пока не знаю какой из них лучше подходит здесь r равно либо 65 сотым либо 84 сотым перейдем к диаграмме c здесь точки разбросанные хаотично как в этом примере тогда как же здесь провести прямую и и можно провести вот так или так или вот таким образом в любом случае мы не видим закономерности не видим направление в котором нужно начертить прямую чтобы точки выстроились вдоль нее не видно увеличивается y или уменьшается например с увеличением значений x то есть зависимости не наблюдается точки на этой диаграмме не коррелирует не связаны друг с другом значит коэффициент корреляции должен быть очень близким к нулю здесь есть такой вариант р равно минус 200m то есть если все же попытаться провести прямую она будет наклонена вниз обратите внимание несмотря на то что мы попытались угадать вдоль какой прямой выстроенной точки многие из них находятся очень далеко от этой прямой линейная модель довольно плохо описывает эту диаграмму и так р равно минус 200m вычеркнем осталось диаграммы д здесь у нас два положительных коэффициенты корреляции и явно прослеживается прямая зависимость где значение x маленькое значение y тоже маленькая а в том месте где значение x возрастает значение y тоже увеличивается значит здесь точки лежат более менее вдоль вот такой прямой но на этой диаграмме точки разбросаны больше чем на 2 обратите внимание на этой диаграмме есть точки располагающиеся достаточно далеко от прямой поэтому здесь линейная модель хуже описывает картину а на диаграмме б лучше диаграмма б лучше укладывается в линейную модель чем д значит у диаграммы б значение r будет больше а меньшее значение r 65 сотых соответствует диаграмме b почему так потому что здесь прослеживается закономерность но точки слишком сильно разбросаны многие из них находится достаточно далеко от прямой а на диаграмме б точки расположены более плотно некоторые из них тоже далеки от прямой но на диаграмме д таких гораздо больше и они находятся дальше спасибо что подписывайтесь на наш канал нам очень важно знать ваше мнение если у вас возникают вопросы касательно данного видеоролика то не стесняйтесь задавать их в комментариях мы с удовольствием на них постараемся ответить