If you're seeing this message, it means we're having trouble loading external resources on our website.

Если вы используете веб-фильтр, пожалуйста, убедитесь, что домены *.kastatic.org и *.kasandbox.org разблокированы.

Основное содержание

Виды статистических исследований

Создатели: Сэл Хан.

Хотите присоединиться к обсуждению?

Пока нет ни одной записи.
Знаете английский? Нажмите здесь, чтобы увидеть обсуждение, которое происходит на английской версии сайта.

Транскрипция к видео

представьте что кто-то выдвинул гипотезу что сахар каким-то образом вызывает сердечные заболевания и вы хотите исследовать этот вопрос каким образом вы должны провести ваши исследования чтобы выяснить действительно ли сахар является причиной сердечных заболеваний первую очередь вам надо узнать потребление сахара естественно вы не можете опросить всех жителей россии все 150 миллионов человек сколько именно сахара потребляет каждый из них все что мы можем это изучить некую выборку мы берем всю генеральную совокупность все 150 миллионов человек и делаем из нее выборку причем максимально случайно нет смысла опрашивать на выходе посетителей скажем кондитерского магазина или спортзала выборка должна быть максимально случайно чтобы не было перекоса в сторону явных потребителей сахара или наоборот и дальше мы узнаем сколько сахара потребляют люди из нашей выборке например просим их заполнить некую анкету и на основании нее уже собираем данные понятно что чем больше данных мы соберем чем больше людей опросим тем лучше мы к этому еще вернемся в других видеороликах как лучше всего сделать эту выборку по которой можно предсказать некий параметр и генеральной совокупности данных в любом случае мы получаем некий примерный показатель среднего потребления россиянами сахара такое исследование в котором мы делаем случайную выборку из генеральной совокупности данных и пытаемся судить о каком-либо параметры в данном случае количество употребляемого сахара такое исследование называется выборочным и в нем мы пытаемся выяснить сколько сахара потребляют люди каждый день но мы хотим пойти дальше и ведь мы должны не просто узнать количество потребляемого сахара а еще как это связано с сердечными заболеваниями для этого мы снова делаем опрос предположим мы хотим попросить случайных людей в возрасте 60 лет опять же нет смысла опрашивать только тех кто например лежит в больнице нет смысла опрашивать только тех кто занимается спортом выборка должна быть максимально случайной из разных мест чтобы результат не склонялся искусственно в одну или в другую сторону и так мы скажем опросили 300 человек в возрасте 60 лет и каждому задали вопрос сколько сахара вы съели за последние 30 лет а кроме этого мы спрашиваем как у них дела сердцем и результаты отмечаем на вот такой диаграмме на горизонтальной оси мы отмечаем количество съеденного сахара а на вертикальной степени риска сердечных заболеваний скажем в возрасте 60 лет и дальше мы отмечаем результаты на диаграмме этот респондент например потреблял 200 граммов сахара в день и к 60 годам у него чем большая вероятность проблем с сердцем а у другого респондента наоборот очень низкая вероятность сердечных заболеваний несмотря на такое же потребление сахара так мы отмечаем каждую точку я конечно не буду рисовать все 300 точек и вы смотрите на диаграмму и видите что явно просматривается зависимость естественно есть люди которые из нее выбиваются но в основном результаты сосредоточены в долю вот такой прямой таким образом вы делаете вывод что количество употребляемого сахара и риск сердечных заболеваний к 60 годам действительно связаны они коррелируют друг с другом они зависят друг от друга если кто-то последние 30 лет ел много сахара то у него сердце менее здоровая а у тех кто ел меньше сахара сердце здоровее в медицине часто встречается ситуация когда изучая вот такую диаграмму люди приходят к выводу что употребление сахара вызывает проблемы с сердцем так делать не в коем случае нельзя такая диаграмма не означает что потребление сахара является причиной сердечных заболеваний возможны все наоборот например люди у которых проблемы сердцем по какой-то причине вынуждены потреблять больше сахара или есть какая-то третья причина которая вызывает такую зависимость из такой диаграммы невозможно выявить причины следственную связь то ли это потребление сахара ведет к проблемам сердцем то ли люди со слабым сердцем вынуждены потреблять больше сахара то ли есть некая третья причина возможно излишнее потребление жиров ведет к проблемам с сердцем и вызывает тягу к сладкому или наоборот и из этой схемы можно лишь сделать вывод что данные связаны они коррелируют такое исследование называется обсервационное или наблюдателем вы наблюдаете связь но не знаете чем оно вызвано и вы спросите так как же доказать что сахар вызывает сердечные заболевания как доказать причинно-следственную связь для этого необходимо провести эксперимент для проведения эксперимента нужно выбрать две группы людей первая группа будет называться экспериментальной давайте изобразим ее кружком это некая группа людей пусть а нас в экспериментальной группе будет 100 человек и есть вторая группа контрольная и что мы делаем дальше имейте ввиду данные конкретные эксперимента которым я расскажу вряд ли кто проведет в реальности потому что он будет признан негуманным и я с этим полностью согласна я лишь приведу его в качестве примера итак мы случайным образом выбираем людей в возрасте 30 лет и делим их на две группы именно случайным нам не нужно всех больных поместить в одну группу а всех здоровых во вторую или наоборот не должно быть такого что в одной группе окажется все представители какой-то определенной демографической группы веса роста экономического статуса и так далее разбивка должна быть случайной и в экспериментальной группе мы искусственным меняем один конкретный фактор в нашем случае потребление сахара скажем вы ставите условии что все представители экспериментальной группы помимо свои обычные ежедневные дозы сахара выпивали скажем перед сном по стакану сахарного сиропа или наоборот пусть полностью откажется от сахара таким образом вы искусственно меняйте в этой группе потребления сахара а в контрольной группе не меняйте ничего повторюсь это не гуманный эксперимент нельзя заставлять людей есть то что с большой вероятностью навредит их здоровью но пусть мы 30 лет заставляем первую группу пить сироп и через 30 лет когда всем представителям экспериментальной группы исполнится 60 мы посмотрим на состоянии их сердца какое у них к 60 годам здоровья и сравниваем с контрольной группой исключая вероятность случайных погрешностей если скажем в конце эксперимента окажется что у первой группы среднем состоянии сердце лишь чуть-чуть хуже чем у второй мы не сможем сделать явный вывод о зависимости здоровья от сахара возможно так совпало случайно но если спустя 30 лет вероятно сердечных заболеваний в первой группе превышает этот показатель у второй группы скажем в 10 раз то вероятность что это просто совпадение крайне мало в таком случае мы можем прийти к выводу что видимо действительно проблемы с сердцем скорее всего из за сахара следующих видеороликах мы по подробнее расскажем о каждом из трех методов но цель данного урока показать вам как именно проводится статистические исследования в первом случае мы пытаемся установить истинность некоего параметры для всей генеральной совокупности по некоторые выборки сколько сахара потребляют все жители россии мы делаем случайную выборку и по результатам уже делаем окончательные выводы для всего населения в обсервационное или наблюдателем исследовании мы наблюдаем за зависимостью неких параметров за потреблением сахара и за здоровьем мы видим связь и решаем провести эксперимент и только эксперимент позволяет нам установить причинно-следственную связь спасибо что подписывайтесь на наш канал нам очень важно знать ваше мнение если у вас возникают вопросы касательно данного видеоролика то не стесняйтесь задавать их в комментариях мы с удовольствием на них постараемся ответить