Основное содержание
Статистика для средней школы
Качественное представление о нормальном распределении
В этом видео мы рассмотрим несколько распределений из реальной жизни и попытаемся интуитивно догадаться, какие из них будут нормальными, а какие — нет. Создатели: Сэл Хан.
Хотите присоединиться к обсуждению?
Пока нет ни одной записи.
Транскрипция к видео
эту задачу я взяла сайта сетей 12 . орк это открытый бесплатный учебник в нем есть разделы нормальном распределении и так задаче номер один распределение какого из перечисленных ниже наборов данных ближе всего к нормальному объясните почему остальные распределения не будут нормальными итак посмотрим что нам дано вариант а расстояние от кончика большого пальца до кончика мизинца раскрытой ладони давайте я постараюсь нарисовать руку и поясню о чем идет речь и то у меня указательный палец средний безымянный и мизинец и нас интересует вот это расстояние от кончика большого пальца до кончика мизинца если взять случайный набор старшеклассников и замерить у них это расстояние на что будет похоже распределение очевидно она будет зависеть от наследственности генетики от ваших привычек то есть этот показатель является следствием огромного количества случайных факторов поэтому мне кажется что его распределение будет близка к нормальному и в этой задаче меня просят описать свои рассуждения мне кажется что распределение этой величины близко к нормальному я сама не замеряла и не изучала выборки но вполне может быть что и и математическое ожидание лежит где-то в районе 20 сантиметров и кривая распределения выглядит примерно вот так при этом распределение не будет абсолютно точно нормальным нормальное распределение должно распространяться в обе стороны до бесконечности но не бывает людей с отрицательном расстояние между пальцами поэтому слева распределения не будет идеально нормальным на 0 и она прервется справа тоже самое размер руки ограничен законами природы она не может измеряться астрономическими единицами в общем очень большие размеры руки физически невозможны например в настоящем нормальном распределении если я скажем миллионы раз брошу монетку существует вероятность выпадения миллионы раз подряд орлов пусть очень-очень маленькое эта вероятность близко к нулю но не равна нулю случае с рукой нет даже мизерной вероятности встретить старшеклассника у которого расстояния от большого пальца и мизинца будет равно например километру таким образом чем дальше от среднего значения тем меньше распределения будет похожей на нормальные но до какой-то степени она будет достаточно близко аппроксимировать а нормальным распределением хотя я нарисовала это со своей точки зрения возможно обнаружится что у юношей размер руки в среднем больше чем у девушек тогда такое распределение будет by модальным то есть вместо такого графика возможно будет такой у него будет одна волна для юношей скажем 20 сантиметров и еще одна для девушек некое значение поменьше скажем 18 сантиметров а дальше распределение пойдет примерно вот так так что есть вероятность что распределение окажется by модальным но в целом первый пункт задачи будет достаточно хорошо описывается моделью нормального распределения посмотрим что у нас во втором пункте зарплаты всех сотрудников крупной транспортной компании итак во-первых мы сразу упираемся снизу в законы о минимальной оплате труда во вторых в любой компании всегда есть самый низкооплачиваемый работник и скорее всего таких работников будет несколько например они заняты самым низко квалифицированным трудом дальше наверняка большая часть рядовых сотрудников будет получать достаточно невысокую зарплату дальше пойдут например менеджеры среднего звена и зарплаты будет расти а затем у нас получается прямая после которой следует несколько человек из высшего руководства директора и так далее их заработная плата может оказаться во много раз больше зарплата рядовых сотрудников причем даже не в разы а на порядок выше и так мое предположение что зарплаты не будут распределены нормально и она точно будет как минимум by модальным потому что где-то далеко будет ещё одна волна высшего руководства она может быть дальше может быть ближе в зависимости от ряда условий но в любом случае такое распределение не будет нормальным слева она упрется в некий порог минимальной оплаты труда если хвост распределение справа длиннее чем слева такое распределение называется правосторонний симметрий а поскольку у него две волны здесь и здесь то а ну плюс к этому будет by моделям конечно зарплата еще зависит от самой компании но я предполагаю что у крупной транспортной компании распределение зарплат будет примерно таким перейдём к третьему пункту зарплаты случайной выборки из 50 генеральных директоров крупных компаний из которых 25 мужчины и 25 женщины разном уточняют пол значит видимо подразумевается что гендерный разрыв в оплате труда до сих пор не преодолен то есть зарплаты различаются если бы задача просто взяли бы 50 случайных директоров мне кажется распределение было бы достаточно близким к нормальному слева снова было бы зарплаты меньше которой ни один генеральный директор крупной компании получать не согласиться то есть некая базовая минимальная зарплата от которой отталкиваются при найме на должность генерального директора затем кривая идет вверх до самой вероятной зарплаты а дальше скорее всего будет длинный хвост вправо вот такая ситуация была бы при отсутствии гендерного разрыва мы бы получили правостороннее а симметричное распределение с длинным правым хвостом но при наличии гендерного разрыва мы увидим здесь две волны распределение скорее всего будет by модальным сначала будет самая вероятная зарплата для женщин считается что при наличии гендерного разрыва она меньше затем будет ещё одна волна от для мужчин и мужчин и женщин по 25 так что волны будут примерно одинаковой высоты и дальше снова пойдет длинный хвост вправо и не исключено что где-то там будет еще одна маленькая волна зарплатами директоров крупнейших транснациональных мега компаний то есть это распределение еще может оказаться 3 модальным и так это у нас пункт c пока первый вариант кажется наиболее приближенным к нормальному распределению посмотрим что у нас пункте d даты выпуска 100 монет взятых из кассы магазина а вот это интересный эксперимент поскольку в этой задаче нет точного ответа а меня просят объяснить свои догадки то я снова порассуждаю правильные ответы в нашей задаче это правильные и логичные рассуждения и так мне кажется что большая часть монет в кассе будут достаточно новыми старые монеты со временем могут заржаветь портится стираться теряться выходить из обращение и вместо них на замену выпускаются новые поэтому как мне кажется график такого распределения будет выглядеть примерно вот так сейчас 2019 год очень много монет будет выпущено за последние несколько лет отметим на графике 2019 год он еще только начался поэтому монет которые выпущены в 2019 году будет очень мало за то скорее всего вы найдете много монет 2018 года а дальше влево график будет уменьшаться конечно вы не встретите там дат раньше чем появились монеты современного вида поэтому левый хвост не уйдет в минус бесконечность а будет иметь некий предел таким образом мне кажется что распределение будет левосторонний асимметрий это распределение у которого большая часть значений находится справа от длинный хвост уходит влево такое распределение еще называют отрицательным если у левостороннего распределения одна волна тогда его среднее значение будет лежать левее медианы на этом графике медианы будет примерно вот здесь а из-за длинного хвоста слева среднее значение окажется левее где-нибудь здесь аналогично в правостороннем распределение медиана может быть например где-то здесь но поскольку график сильно вытянут вправо и пусть там где-то далеко есть ещё одна волна но она небольшая и сильно на результат не повлияет среднее значение этого распределения окажется правее итак ответим на вопрос нас просили какой из этих распределений ближе всего к нормальному так вот на мой взгляд ближе всего к нормальному распределению вариант а спасибо что подписывайтесь на наш канал нам очень важно знать ваше мнение если у вас возникают вопросы касательно данного видеоролика то не стесняйтесь задавать их в комментариях мы с удовольствием на них постараемся ответить