Главная » Патофизиология » Биномиальное распределение дискретной случайной величины. Биномиальное распределение. Дискретные распределения в MS EXCEL

Биномиальное распределение дискретной случайной величины. Биномиальное распределение. Дискретные распределения в MS EXCEL

Глава 7.

Конкретные законы распределения случайных величин

Виды законов распределения дискретных случайных величин

Пусть дискретная случайная величина может принимать значения х 1 , х 2 , …, х n , … . Вероятности этих значений могут быть вычислены по различным формулам, например, при помощи основных теорем теории вероятностей, формулы Бернулли или по каким-то другим формулам. Для некоторых из этих формул закон распределения имеет свое название.

Наиболее часто встречающимися законами распределения дискретной случайной величины являются биномиальный, геометрический, гипергеометрический, закон распределения Пуассона.

Биномиальный закон распределения

Пусть производится n независимых испытаний, в каждом из которых может появиться или не появиться событие А . Вероятность появления этого события в каждом единичном испытании постоянна, не зависит от номера испытания и равна р =Р (А ). Отсюда вероятность не появления события А в каждом испытании также постоянна и равна q =1–р . Рассмотрим случайную величину Х равную числу появлений события А в n испытаниях. Очевидно, что значения этой величины равны

х 1 =0 – событие А в n испытаниях не появилось;

х 2 =1 – событие А в n испытаниях появилось один раз;

х 3 =2 – событие А в n испытаниях появилось два раза;

…………………………………………………………..

х n +1 = n – событие А в n испытаниях появилось все n раз.

Вероятности этих значений могут быть вычислены по формуле Бернулли (4.1):

где к =0, 1, 2, …, n .

Биномиальным законом распределения Х , равной числу успехов в n испытаниях Бернулли, с вероятностью успеха р .

Итак, дискретная случайная величина имеет биномиальное распределение (или распределена по биномиальному закону), если ее возможные значения 0, 1, 2, …, n , а соответствующие вероятности вычисляются по формуле (7.1).

Биномиальное распределение зависит от двух параметров р и n .

Ряд распределения случайной величины, распределенной по биномиальному закону, имеет вид:

Х			…	k	…	n
Р			…		…

Пример 7.1 . Производится три независимых выстрела по мишени. Вероятность попадания при каждом выстреле равна 0,4. Случайная величина Х – число попаданий в мишень. Построить ее ряд распределения.

Решение. Возможными значениями случайной величины Х являются х 1 =0; х 2 =1; х 3 =2; х 4 =3. Найдем соответствующие вероятности, используя формулу Бернулли. Нетрудно показать, что применение этой формулы здесь вполне оправдано. Отметим, что вероятность не попадания в цель при одном выстреле будет равна 1-0,4=0,6. Получим

Ряд распределения имеет следующий вид:

Х
Р	0,216	0,432	0,288	0,064

Нетрудно проверить, что сумма всех вероятностей равна 1. Сама случайная величина Х распределена по биномиальному закону. ■

Найдем математическое ожидание и дисперсию случайной величины, распределенной по биномиальному закону.

При решении примера 6.5 было показано, что математическое ожидание числа появлений события А в n независимых испытаниях, если вероятность появления А в каждом испытании постоянна и равна р , равно n ·р

В этом примере использовалась случайная величина, распределенная по биномиальному закону. Поэтому решение примера 6.5, по сути является доказательством следующей теоремы.

Теорема 7.1. Математическое ожидание дискретной случайной величины, распределенной по биномиальному закону, равно произведению числа испытаний на вероятность "успеха", т.е. М (Х )= n ·р.

Теорема 7.2. Дисперсия дискретной случайной величины, распределенной по биномиальному закону, равна произведению числа испытаний на вероятность "успеха" и на вероятность "неудачи", т.е. D (Х )= nрq.

Асимметрия и эксцесс случайной величины, распределенной по биномиальному закону, определяются по формулам

Эти формулы можно получить, воспользовавшись понятием начальных и центральных моментов.

Биномиальный закон распределения лежит в основе многих реальных ситуаций. При больших значениях n биномиальное распределение может быть аппроксимировано с помощью других распределений, в частности с помощью распределения Пуассона.

Распределение Пуассона

Пусть имеется n испытаний Бернулли, при этом число испытаний n достаточно велико. Ранее было показано, что в этом случае (если к тому же вероятность р события А очень мала) для нахождения вероятности того, что событие А появиться т раз в испытаниях можно воспользоваться формулой Пуассона (4.9). Если случайная величина Х означает число появлений события А в n испытаниях Бернулли, то вероятность того, что Х примет значение k может быть вычислена по формуле

, (7.2)

где λ = nр .

Законом распределения Пуассона называется распределение дискретной случайной величины Х , для которой возможными значениями являются целые неотрицательные числа, а вероятности р т этих значений находятся по формуле (7.2).

Величина λ = nр называется параметром распределения Пуассона.

Случайная величина, распределенная по закону Пуассона, может принимать бесконечное множество значений. Так как для этого распределения вероятность р появления события в каждом испытании мала, то это распределение иногда называют законом редких явлений.

Ряд распределения случайной величины, распределенной по закону Пуассона, имеет вид

Х					…	т	…
Р					…		…

Нетрудно убедиться, что сумма вероятностей второй строки равна 1. Для этого необходимо вспомнить, что функцию можно разложить в ряд Маклорена, который сходится для любого х . В данном случае имеем

. (7.3)

Как было отмечено, закон Пуассона в определенных предельных случаях заменяет биномиальный закон. В качестве примера можно привести случайную величину Х , значения которой равны количеству сбоев за определенный промежуток времени при многократном применении технического устройства. При этом предполагается, что это устройство высокой надежности, т.е. вероятность сбоя при одном применении очень мала.

Кроме таких предельных случаев, на практике встречаются случайные величины, распределенные по закону Пуассона, не связанные с биномиальным распределением. Например, распределение Пуассона часто используется тогда, когда имеют дело с числом событий, появляющихся в промежутке времени (число поступлений вызовов на телефонную станцию в течение часа, число машин, прибывших на авто мойку в течение суток, число остановок станков в неделю и т.п.). Все эти события должны образовывать, так называемый поток событий, который является одним из основных понятий теории массового обслуживания. Параметр λ характеризует среднюю интенсивность потока событий.

Пример 7.2 . На факультете насчитывается 500 студентов. Какова вероятность того, что 1 сентября является днем рождения для трех студентов данного факультета?

Решение . Так как число студентов n =500 достаточно велико и р – вероятность родится первого сентября любому из студентов равна , т.е. достаточно мала, то можно считать, что случайная величина Х – число студентов, родившихся первого сентября, распределена по закону Пуассона с параметром λ = np = =1,36986. Тогда, по формуле (7.2) получим

Теорема 7.3. Пусть случайная величинаХ распределена по закону Пуассона. Тогда ее математическое ожидание и дисперсия равны друг другу и равны значению параметра λ , т.е. M (X ) = D (X ) = λ = np .

Доказательство. По определению математического ожидания, используя формулу (7.3) и ряд распределения случайной величины, распределенной по закону Пуассона, получим

Прежде, чем найти дисперсию, найдем вначале математическое ожидание квадрата рассматриваемой случайной величины. Получаем

Отсюда, по определению дисперсии, получаем

Теорема доказана.

Применяя понятия начальных и центральных моментов, можно показать, что для случайной величины, распределенной по закону Пуассона, коэффициенты асимметрии и эксцесса определяются по формулам

Нетрудно понять, что, так как по смысловому содержанию параметр λ = np положителен, то у случайной величины, распределенной по закону Пуассона, всегда положительны и асимметрия и эксцесс.

Распределения вероятностей дискретных случайных величин. Биномиальное распределение. Распределение Пуассона. Геометрическое распределение. Производящая функция.

6. Распределения вероятностей дискретных случайных величин

6.1. Биномиальное распределение

Пусть производится n независимых испытаний, в каждом из которых событие A может либо появится, либо не появится. Вероятность p появления события A во всех испытаниях постоянна и не изменяется от испытания к испытанию. Рассмотрим в качестве случайной величины X число появлений события A в этих испытаниях. Формула, позволяющая найти вероятность появления события A ровно k раз в n испытаниях, как известно, описывается формулой Бернулли

Распределение вероятностей, определяемое формулой Бернулли, называется биномиальным .

Этот закон назван "биномиальным" потому, что правую часть можно рассматривать как общий член разложения бинома Ньютона

Запишем биномиальный закон в виде таблицы


	p n	np n –1 q				q n

Найдем числовые характеристики этого распределения.

По определению математического ожидания для ДСВ имеем

Запишем равенство, являющееся бином Ньютона

и продифференцируем его по p. В результате получим

Умножим левую и правую часть на p :

Учитывая, что p + q =1, имеем

(6.2)

Итак, математическое ожидание числа появлений событий в n независимых испытаниях равно произведению числа испытаний n на вероятность p появления события в каждом испытании .

Дисперсию вычислим по формуле

Для этого найдем

Предварительно продифференцируем формулу бинома Ньютона два раза по p :

и умножим обе части равенства на p 2:

Следовательно,

Итак, дисперсия биномиального распределения равна

. (6.3)

Данные результаты можно получить и из чисто качественных рассуждений. Общее число X появлений события A во всех испытаниях складываются из числа появлений события в отдельных испытаниях. Поэтому если X 1 – число появлений события в первом испытании, X 2 – во втором и т.д., то общее число появлений события A во всех испытаниях равно X=X 1 +X 2 +…+X n . По свойству математического ожидания:

Каждое из слагаемых правой части равенства есть математическое ожидание числа событий в одном испытании, которое равно вероятности события. Таким образом,

По свойству дисперсии:

Так как , а математическое ожидание случайной величины, которое может принимать только два значения, а именно 1 2 с вероятностью p и 0 2 с вероятностью q , то
. Таким образом,
В результате, получаем

Воспользовавшись понятием начальных и центральных моментов, можно получить формулы для асимметрии и эксцесса:

. (6.4)

Рис. 6.1

Многоугольник биномиального распределения имеет следующий вид (см. рис. 6.1). ВероятностьP n (k ) сначала возрастает при увеличении k , достигает наибольшего значения и далее начинает убывать. Биномиальное распределение асимметрично, за исключением случая p =0,5. Отметим, что при большом числе испытаний n биномиальное распределение весьма близко к нормальному. (Обоснование этого предложения связано с локальной теоремой Муавра-Лапласа.)

Число m 0 наступлений события называется наивероятнейшим , если вероятность наступления события данное число раз в этой серии испытаний наибольшая (максимум в многоугольнике распределения) . Для биномиального распределения

Замечание. Данное неравенство можно доказать, используя рекуррентную формулу для биномиальных вероятностей:

(6.6)

Пример 6.1. Доля изделий высшего сорта на данном предприятии составляет 31%. Чему равно математического ожидание и дисперсия, также наивероятнейшее число изделий высшего сорта в случайно отобранной партии из 75 изделий?

Решение. Поскольку p =0,31, q =0,69, n =75, то

M[X ] = np = 750,31 = 23,25; D[X ] = npq = 750,310,69 = 16,04.

Для нахождения наивероятнейшего числа m 0 , составим двойное неравенство

Отсюда следует, что m 0 = 23.

Теория вероятности незримо присутствует в нашей жизни. Мы не обращаем на это внимания, но каждое событие в нашей жизни имеет ту или иную вероятность. Принимая во внимание огромное количество вариантов развития событий, нам становится необходимым определять наиболее вероятные и наименее вероятные из них. Наиболее удобно анализировать такие вероятностные данные графически. В этом нам может помочь распределение. Биномиальное - одно из самых лёгких и самых точных.

Прежде чем перейти непосредственно к математике и теории вероятности, разберёмся с тем, кто же первый придумал такой вид распределения и какова история развития математического аппарата для этого понятия.

История

Понятие вероятности известно ещё с древних времён. Однако древние математики не придавали ей особо значения и смогли заложить только основы для теории, ставшей впоследствии теорией вероятности. Они создали некоторые комбинаторные методы, которые сильно помогли тем, кто позже создал и развил саму теорию.

Во второй половине семнадцатого века началось формирование основных понятий и методов теории вероятности. Были введены определения случайных величин, способы вычисления вероятности простых и некоторых сложных независимых и зависимых событий. Продиктован такой интерес к случайным величинам и вероятностям был азартными играми: каждый человек хотел знать, какие у него шансы победить в игре.

Следующим этапом стало применение в теории вероятности методов математического анализа. Этим занялись видные математики, такие как Лаплас, Гаусс, Пуассон и Бернулли. Именно они продвинули эту область математики на новый уровень. Именно Джеймс Бернулли открыл биномиальный закон распределения. Кстати, как мы позже выясним, на основе этого открытия были сделаны ещё несколько, которые позволили создать закон нормального распределения и ещё множество других.

Сейчас, прежде чем начать описывать распределение биномиальное, мы немного освежим в памяти понятия теории вероятностей, наверняка уже забытые со школьной скамьи.

Основы теории вероятностей

Будем рассматривать такие системы, в результате действия которых возможны только два исхода: "успех" и "не успех". Это легко понять на примере: мы подбрасываем монетку, загадав то, что выпадет решка. Вероятности каждого из возможных событий (выпадет решка - "успех", выпадет орёл - "не успех") равны 50 процентам при идеальной балансировке монеты и отсутствии прочих факторов, которые могут повлиять на эксперимент.

Это было самое простое событие. Но бывают ещё и сложные системы, в которых выполняются последовательные действия, и вероятности исходов этих действий будут различаться. Например, рассмотрим такую систему: в коробке, содержимое которой мы не можем разглядеть, лежат шесть абсолютно одинаковых шариков, три пары синего, красного и белого цветов. Мы должны достать наугад несколько шариков. Соответственно, вытащив первым один из белых шариков, мы уменьшим в разы вероятность того, что следующим нам тоже попадётся белый шарик. Происходит это потому, что меняется количество объектов в системе.

В следующем разделе рассмотрим более сложные математические понятия, вплотную подводящие нас к тому, что означают слова "нормальное распределение", "биномиальное распределение" и тому подобные.

Элементы математической статистики

В статистике, которая является одной из областей применения теории вероятностей, существует множество примеров, когда данные для анализа даны не в явном виде. То есть не в численном, а в виде разделения по признакам, например, по половым. Для того чтобы применить к таким данным математический аппарат и сделать из полученных результатов какие-то выводы, требуется перевести исходные данные в числовой формат. Как правило, для осуществления этого положительному исходу присваивают значение 1, а отрицательному - 0. Таким образом, мы получаем статистические данные, которые можно подвергнуть анализу с помощью математических методов.

Следующий шаг в понимании того, что такое биномиальное распределение случайной величины, - это определение дисперсии случайной величины и математического ожидания. Об этом поговорим в следующем разделе.

Математическое ожидание

На самом деле понять то, что такое математическое ожидание, несложно. Рассмотрим систему, в которой существует много разных событий со своими различными вероятностями. Математическим ожиданием будет называться величина, равная сумме произведений значений этих событий (а математическом виде, о котором мы говорили в прошлом разделе) на вероятности их осуществления.

Математическое ожидание биномиального распределения рассчитывается по той же самой схеме: мы берём значение случайной величины, умножаем его на вероятность положительного исхода, а затем суммируем полученные данные для всех величин. Очень удобно представить эти данные графически - так лучше воспринимается разница между математическими ожиданиями разных величин.

В следующем разделе мы расскажем вам немного о другом понятии - дисперсии случайной величины. Оно тоже тесно связано с таким понятием, как биномиальное распределение вероятностей, и является его характеристикой.

Дисперсия биномиального распределения

Эта величина тесно связана с предыдущей и также характеризует распределение статистических данных. Она представляет собой средний квадрат отклонений значений от их математического ожидания. То есть дисперсия случайной величины - это сумма квадратов разностей между значением случайной величины и её математическим ожиданием, умноженная на вероятность этого события.

В общем, это всё, что нам нужно знать о дисперсии для понимания того, что такое биномиальное распределение вероятностей. Теперь перейдём непосредственно к нашей основной теме. А именно к тому, что же кроется за таким на вид достаточно сложным словосочетанием "биномиальный закон распределения".

Биномиальное распределение

Разберёмся для начала, почему же это распределение биномиальное. Оно происходит от слова "бином". Может быть, вы слышали о биноме Ньютона - такой формуле, с помощью которой можно разложить сумму двух любых чисел a и b в любой неотрицательной степени n.

Как вы, наверное, уже догадались, формула бинома Ньютона и формула биномиального распределения - это практически одинаковые формулы. За тем лишь исключением, что вторая имеет прикладное значение для конкретных величин, а первая - лишь общий математический инструмент, применения которого на практике могут быть различны.

Формулы распределения

Функция биномиального распределения может быть записана в виде суммы следующих членов:

(n!/(n-k)!k!)*p k *q n-k

Здесь n - число независимых случайных экспериментов, p- число удачных исходов, q- число неудачных исходов, k - номер эксперимента (может принимать значения от 0 до n),! - обозначение факториала, такой функции числа, значение которой равно произведению всех идущих до неё чисел (например, для числа 4: 4!=1*2*3*4=24).

Помимо этого, функция биномиального распределения может быть записана в виде неполной бета-функции. Однако это уже более сложное определение, которое используется только при решении сложных статистических задач.

Биномиальное распределение, примеры которого мы рассмотрели выше, - одно из самых простых видов распределений в теории вероятностей. Существует также нормальное распределение, являющееся одним из видов биномиального. Оно используется чаще всего, и наиболее просто в расчётах. Бывает также распределение Бернулли, распределение Пуассона, условное распределение. Все они характеризуют графически области вероятности того или иного процесса при разных условиях.

В следующем разделе рассмотрим аспекты, касающиеся применения этого математического аппарата в реальной жизни. На первый взгляд, конечно, кажется, что это очередная математическая штука, которая, как обычно, не находит применения в реальной жизни, и вообще не нужна никому, кроме самих математиков. Однако это далеко не так. Ведь все виды распределений и их графические представления были созданы исключительно под практические цели, а не в качестве прихоти учёных.

Применение

Безусловно, самое важное применение распределения находят в статистике, ведь там нужен комплексный анализ множества данных. Как показывает практика, очень многие массивы данных имеют примерно одинаковые распределения величин: критические области очень низких и очень высоких величин, как правило, содержат меньше элементов, чем средние значения.

Анализ больших массивов данных требуется не только в статистике. Он незаменим, например, в физической химии. В этой науке он используется для определения многих величин, которые связаны со случайными колебаниями и перемещениями атомов и молекул.

В следующем разделе разберёмся, насколько важно применение таких статистических понятий, как биномиальное распределение случайной величины в повседневной жизни для нас с вами.

Зачем мне это нужно?

Многие задают себе такой вопрос, когда дело касается математики. А между прочим, математика не зря называется царицей наук. Она является основой физики, химии, биологии, экономики, и в каждой из этих наук применяется в том числе и какое-либо распределение: будь это дискретное биномиальное распределение, или же нормальное, не важно. И если мы получше присмотримся к окружающему миру, то увидим, что математика применяется везде: в повседневной жизни, на работе, да даже человеческие отношения можно представить в виде статистических данных и провести их анализ (так, кстати, и делают те, кто работают в специальных организациях, занимающихся сбором информации).

Сейчас поговорим немного о том, что же делать, если вам нужно знать по данной теме намного больше, чем то, что мы изложили в этой статье.

Та информация, что мы дали в этой статье, далеко не полная. Существует множество нюансов, касаемо того, какую форму может принимать распределение. Биномиальное распределение, как мы уже выяснили, является одним из основных видов, на котором зиждется вся математическая статистика и теория вероятностей.

Если вам стало интересно, или в связи с вашей работой вам нужно знать по этой теме гораздо больше, нужно будет изучить специализированную литературу. Начать следует с университетского курса математического анализа и дойти там до раздела теории вероятностей. Также пригодятся знания в области рядов, ведь биномиальное распределение вероятностей - это ни что иное, как ряд последовательных членов.

Заключение

Прежде чем закончить статью, мы хотели бы рассказать ещё одну интересную вещь. Она касается непосредственно темы нашей статьи и всей математики в целом.

Многие люди твердят, что математика - бесполезная наука, и ничто из того, что они проходили в школе, им не пригодилось. Но знание ведь никогда не бывает лишним, и если вам что-то не пригодилось в жизни, значит, вы просто этого не помните. Если у вас есть знания, они могут вам помочь, но если их нет, то и помощи от них ждать не приходится.

Итак, мы рассмотрели понятие биномиального распределения и все связанные с ним определения и поговорили о том, как же это применяется в нашей с вами жизни.

Здравствуйте! Мы уже знаем, что такое распределение вероятностей. Оно может быть дискретным или непрерывным, и мы узнали, что его называют плотностью распределения вероятностей. Теперь давайте изучим парочку более распространенных распределений. Предположим, у меня есть монета, причем правильная монета, и я собираюсь ее подбросить 5 раз. Также я определю случайную величину Х, обозначу ее заглавной буквой X, она будет равна количеству «орлов» при 5 подбрасываниях. Может, у меня есть 5 монет, я подброшу их все сразу и посчитаю, сколько у меня выпало «орлов». Или у меня могла бы быть одна монета, я могла бы ее подбросить 5 раз и посчитать, сколько раз у меня выпал «орел». Это, собственно, не имеет значения. Но давайте предположим, что у меня одна монета, и я подброшу ее 5 раз. Тогда у нас не будет неопределенности. Итак, вот определение моей случайной величины. Как мы знаем, случайная величина немного отличается от обычной переменной, она больше похожа на функцию. Она присваивает какое-то значение эксперименту. И эта случайная величина довольно проста. Мы просто считаем, сколько раз выпал «орел» после 5 подбрасываний, – это и есть наша случайная величина X. Давайте подумаем, какие могут быть вероятности разных значений в нашем случае? Так, какова вероятность того, что Х (заглавная Х) равна 0? Т.е. какова вероятность того, что после 5 подбрасываний ни разу не выпадет «орел»? Ну, это, по сути, то же самое, что вероятность выпадения одних «решек» (это так, небольшой обзор теории вероятностей). У вас должны выпасть одни «решки». Какова вероятность каждой из этих «решек»? Это 1/2. Т.е. здесь должно быть 1/2 умножить на 1/2, на 1/2, на 1/2 и снова на 1/2. Т.е. (1/2)⁵. 1⁵=1, разделить на 2⁵, т.е. на 32. Вполне логично. Так… Я немного повторю то, что мы проходили по теории вероятностей. Это важно для того, чтобы понимать, куда мы сейчас движемся и как, собственно, формируется дискретное распределение вероятностей. Итак, а какова вероятность того, что у нас ровно 1 раз выпадет «орел»? Ну, «орел» мог бы выпасть при первом подбрасывании. Т.е. могло бы быть так: «орел», «решка», «решка», «решка», «решка». Или «орел» мог бы выпасть при втором подбрасывании. Т.е. могла бы быть такая комбинация: «решка», «орел», «решка», «решка», «решка» и так далее. Один «орел» мог бы выпасть после любого из 5 подбрасываний. Какова вероятность каждой из этих ситуаций? Вероятность выпадения «орла» равна 1/2. Затем вероятность выпадения «решки», равная 1/2, умножить на 1/2, на 1/2, на 1/2. Т.е. вероятность каждой из этих ситуаций равна 1/32. Так же, как и вероятность ситуации, где Х=0. По сути, вероятность любого особого порядка выпадений «орла» и «решки» будет равна 1/32. Итак, вероятность этого равна 1/32. И вероятность этого равна 1/32. И вот такие ситуации имеют место потому, что «орел» мог бы выпасть при любом из 5 подбрасываний. Следовательно, вероятность того, что точно выпадет один «орел», равна 5*1/32, т.е. 5/32. Вполне логично. Теперь начинается интересное. Какова вероятность… (буду писать каждый из примеров другим цветом)… какова вероятность того, что моя случайная величина равна 2? Т.е. я подброшу монету 5 раз, и какова вероятность того, что 2 раза точно выпадет «орел»? Это уже интереснее, правда? Какие возможны комбинации? Могла бы быть «орел», «орел», «решка», «решка», «решка». Также могла бы быть «орел», «решка», «орел», «решка», «решка». И если подумать, что эти два «орла» могут стоять в разных местах комбинации, то можно немного запутаться. Уже нельзя размышлять о размещениях так, как мы это делали здесь, вверху. Хотя… можно, только рискуете запутаться. Вы должны понять одно. Для каждой из этих комбинаций вероятность равна 1/32. ½*½*½*½*½. Т.е. вероятность каждой из этих комбинаций равна 1/32. И мы должны подумать над тем, сколько существует таких комбинаций, удовлетворяющих нашему условию (2 «орла»)? Т.е. по сути, нужно представить, что есть 5 подбрасываний монеты, и нужно из них выбрать 2, при которых выпадает «орел». Давайте представим, что наши 5 подбрасываний собрались в кружочек, также представим, что у нас есть только два стула. И мы говорим: «Хорошо, кто из вас сядет на эти стулья для «орлов»? Т.е. кто из вас будет «орлом»? И нас не интересует то, в каком порядке они сядут. Я привожу такой пример, надеясь, что так вам будет понятнее. И может, вам захочется посмотреть некоторые уроки по теории вероятностей на эту тему, когда я буду говорить о биноме Ньютона. Потому что там я более детально углублюсь во все это. Но если вы будете рассуждать таким путем, то поймете, что такое биномиальный коэффициент. Потому что если будете думать так: хорошо, у меня 5 подбрасываний, при каком подбрасывании выпадет первый «орел»? Ну, здесь 5 возможностей того, при каком по счету подбрасывании выпадет первый «орел». А сколько возможностей для второго «орла»? Ну, первое подбрасывание, которое мы уже использовали, забрало одну возможность выпадения «орла». Т.е. одна позиция «орла» в комбинации уже занята одним из подбрасываний. Теперь осталось 4 подбрасывания, значит, второй «орел» может выпасть при одном из 4 подбрасываний. И вы это видели, вот здесь. Я выбрала так, что «орел» выпал при 1-м подбрасывании, и предположила, что при 1 из 4 оставшихся бросков также должен выпасть «орел». Итак, здесь только 4 возможности. Все, что я говорю, означает, что для первого «орла» у вас есть 5 различных позиций, на которые он может выпасть. А для второго уже остается только 4 позиции. Подумайте над этим. Когда мы вычисляем вот так, то порядок учитывается. Но для нас сейчас неважно, в какой последовательности выпадают «орлы» и «решки». Мы не говорим, что это «орел 1» или что это «орел 2». В обоих случаях это просто «орел». Мы могли бы предположить, что это «орел 1», а это – «орел 2». Или могло бы быть наоборот: это мог бы быть второй «орел», а это – «первый». И я говорю это потому, что важно понять, где использовать размещения, а где – сочетания. Нас не интересует последовательность. Так что, собственно, есть только 2 способа происхождения нашего события. Значит, делим это на 2. И как вы позже увидите, здесь 2! способов происхождения нашего события. Если было бы 3 «орла», тогда здесь было бы 3!, и я покажу вам, почему. Итак, это будет равно… 5*4=20 и разделить на 2 – получится 10. Поэтому здесь 10 различных комбинаций из 32, в которых у вас точно будет 2 «орла». Итак, 10*(1/32) равно 10/32, а чему это равно? 5/16. Запишу через биномиальный коэффициент. Это значение, вот здесь, вверху. Если подумать, то это – то же самое, что и 5!, деленный на… Что означает вот это 5*4? 5! – это 5*4*3*2*1. Т.е. если мне здесь нужно только 5*4, то для этого я могу разделить 5! на 3! Это равно 5*4*3*2*1, деленное на 3*2*1. И остается только 5*4. Значит, это – то же самое, что и этот числитель. И затем, т.к. нас не интересует последовательность, нам нужно здесь 2. Собственно, 2!. Умножить на 1/32. Такой была бы вероятность того, что у нас выпало бы точно 2 «орла». Какова вероятность того, что у нас точно 3 раза выпадет «орел»? Т.е. вероятность того, что Х=3. Итак, по той же логике, первый случай выпадения «орла» может иметь место при 1 из 5 подбрасываний. Второй случай выпадения «орла» может иметь место при 1 из 4 оставшихся подбрасываний. А третий случай выпадения «орла» может иметь место при 1 из 3 оставшихся подбрасываний. А сколько существует различных способов расставить 3 подбрасывания? В общем, сколько есть способов, чтобы расставить 3 предмета по местам? Это 3! И вы можете это вычислить или, возможно, захотите пересмотреть те уроки, в которых я подробнее это объясняла. Но если вы, например, возьмете буквы A, B и C, то всего есть 6 способов, с помощью которых вы их можете расставить. Можете рассматривать это как случаи выпадения «орлов». Здесь могли бы быть ACB, CAB. Могло бы быть BAC, BCA, и… Какой последний вариант, который я не назвала? CBA. Есть 6 способов расставить 3 разных предмета. Мы делим на 6, потому что не хотим повторно засчитывать эти 6 разных способов, потому что рассматриваем их как равнозначные. Здесь нас не интересует, при каком по счету подбрасывании выпадет «орел». 5*4*3… Это можно переписать, как 5!/2!. И разделить это еще на 3!. Это он и есть. 3! равен 3*2*1. Тройки сокращаются. Это становится равным 2. Это – равным 1. Еще раз, 5*2, т.е. равно 10. Каждая ситуация имеет вероятность 1/32, потому это опять равно 5/16. И это интересно. Вероятность того, что у вас выпадет 3 «орла» равна вероятности того, что у вас есть 2 орла. И причина этому… Ну, есть много причин тому, что так получилось. Но если подумать, что вероятность того, что выпадет 3 «орла» – то же самое, что вероятность выпадения 2 «решек». И вероятность выпадения 3 «решек» должна быть такой же, как и вероятность выпадения 2-х «орлов». И хорошо, что значения вот так срабатывают. Хорошо. Какова вероятность того, что Х=4? Мы можем использовать ту же формулу, что использовали прежде. Это могло бы быть 5*4*3*2. Итак, здесь запишем 5*4*3*2… Сколько есть различных способов расставить 4 предмета? Это 4!. 4! – это, по сути, вот эта часть, вот здесь. Это 4*3*2*1. Так, это сокращается, остается 5. Затем, каждая комбинация имеет вероятность 1/32. Т.е. это равно 5/32. И еще раз заметьте, что вероятность того, что 4 раза выпадет «орел» равна вероятности того, что 1 раз выпадет «орел». И в этом есть смысл, т.к. 4 «орла» – это то же самое, что случай выпадения 1 «решки». Вы скажете: ну, и при каком же подбрасывании выпадет эта одна «решка»? Ага, для этого здесь есть 5 различных комбинаций. И каждая из них имеет вероятность 1/32. И наконец, какова вероятность того, что Х=5? Т.е. выпадает «орел» 5 раз подряд. Должно быть так: «орел», «орел», «орел», «орел», «орел». Каждый из «орлов» имеет вероятность 1/2. Вы их перемножаете и получаете 1/32. Можно пойти другим путем. Если всего есть 32 способа, с помощью которых вы можете получить «орлы» и «решки» в этих экспериментах, то это – только один из этих способов. Здесь таких способов было 5 из 32. Здесь - 10 из 32. Тем не менее, вычисления мы провели, а теперь готовы нарисовать распределение вероятностей. Но мое время истекло. Позвольте продолжить на следующем уроке. А если вы в настроении, то, может, нарисуете перед тем, как смотреть следующий урок? До скорой встречи!

Рассмотрим Биномиальное распределение, вычислим его математическое ожидание, дисперсию, моду. С помощью функции MS EXCEL БИНОМ.РАСП() построим графики функции распределения и плотности вероятности. Произведем оценку параметра распределения p, математического ожидания распределения и стандартного отклонения. Также рассмотрим распределение Бернулли.

Определение . Пусть проводятся n испытаний, в каждом из которых может произойти только 2 события: событие «успех» с вероятностью p или событие «неудача» с вероятностью q =1-p (так называемая Схема Бернулли, Bernoulli trials ).

Вероятность получения ровно x успехов в этих n испытаниях равна:

Количество успехов в выборке x является случайной величиной, которая имеет Биномиальное распределение (англ. Binomial distribution ) p и n – являются параметрами этого распределения.

Напомним, что для применения схемы Бернулли и соответственно Биномиального распределения, должны быть выполнены следующие условия:

каждое испытание должно иметь ровно два исхода, условно называемых «успехом» и «неудачей».
результат каждого испытания не должен зависеть от результатов предыдущих испытаний (независимость испытаний).
вероятность успеха p должна быть постоянной для всех испытаний.

Биномиальное распределение в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Биномиального распределения имеется функция БИНОМ.РАСП() , английское название - BINOM.DIST(), которая позволяет вычислить вероятность того, что в выборке будет ровно х «успехов» (т.е. функцию плотности вероятности p(x), см. формулу выше), и интегральную функцию распределения (вероятность того, что в выборке будет x или меньше «успехов», включая 0).

До MS EXCEL 2010 в EXCEL была функция БИНОМРАСП() , которая также позволяет вычислить функцию распределения и плотность вероятности p(x). БИНОМРАСП() оставлена в MS EXCEL 2010 для совместимости.

В файле примера приведены графики плотности распределения вероятности и .

Биномиальное распределения имеет обозначение B (n ; p ) .

Примечание : Для построения интегральной функции распределения идеально подходит диаграмма типа График , для плотности распределения – Гистограмма с группировкой . Подробнее о построении диаграмм читайте статью Основные типы диаграмм.

Примечание : Для удобства написания формул в файле примера созданы Имена для параметров Биномиального распределения : n и p.

В файле примера приведены различные расчеты вероятности с помощью функций MS EXCEL:

Как видно на картинке выше, предполагается, что:

В бесконечной совокупности, из которой делается выборка, содержится 10% (или 0,1) годных элементов (параметр p , третий аргумент функции =БИНОМ.РАСП() )
Чтобы вычислить вероятность, того что в выборке из 10 элементов (параметр n , второй аргумент функции) будет ровно 5 годных элементов (первый аргумент), нужно записать формулу: =БИНОМ.РАСП(5; 10; 0,1; ЛОЖЬ)
Последний, четвертый элемент, установлен =ЛОЖЬ, т.е. возвращается значение функции плотности распределения .

Если значение четвертого аргумента =ИСТИНА, то функция БИНОМ.РАСП() возвращает значение интегральной функции распределения или просто Функцию распределения . В этом случае можно рассчитать вероятность того, что в выборке количество годных элементов будет из определенного диапазона, например, 2 или меньше (включая 0).

Для этого нужно записать формулу:
= БИНОМ.РАСП(2; 10; 0,1; ИСТИНА)

Примечание : При нецелом значении х, . Например, следующие формулы вернут одно и тоже значение:
=БИНОМ.РАСП(2 ; 10; 0,1; ИСТИНА)
=БИНОМ.РАСП(2,9 ; 10; 0,1; ИСТИНА)

Примечание : В файле примера плотность вероятности и функция распределения также вычислены с использованием определения и функции ЧИСЛКОМБ() .

Показатели распределения

В файле примера на листе Пример имеются формулы для расчета некоторых показателей распределения:

=n*p;
(квадрата стандартного отклонения) = n*p*(1-p);
= (n+1)*p;
=(1-2*p)*КОРЕНЬ(n*p*(1-p)).

Выведем формулу математического ожидания Биномиального распределения , используя Схему Бернулли .

По определению случайная величина Х в схеме Бернулли (Bernoulli random variable) имеет функцию распределения :

Это распределение называется распределение Бернулли .

Примечание : распределение Бернулли – частный случай Биномиального распределения с параметром n=1.

Сгенерируем 3 массива по 100 чисел с различными вероятностями успеха: 0,1; 0,5 и 0,9. Для этого в окне Генерация случайных чисел установим следующие параметры для каждой вероятности p:

Примечание : Если установить опцию Случайное рассеивание (Random Seed ), то можно выбрать определенный случайный набор сгенерированных чисел. Например, установив эту опцию =25 можно сгенерировать на разных компьютерах одни и те же наборы случайных чисел (если, конечно, другие параметры распределения совпадают). Значение опции может принимать целые значения от 1 до 32 767. Название опции Случайное рассеивание может запутать. Лучше было бы ее перевести как Номер набора со случайными числами .

В итоге будем иметь 3 столбца по 100 чисел, на основании которых можно, например, оценить вероятность успеха p по формуле: Число успехов/100 (см. файл примера лист ГенерацияБернулли ).

Примечание : Для распределения Бернулли с p=0,5 можно использовать формулу =СЛУЧМЕЖДУ(0;1) , которая соответствует .

Генерация случайных чисел. Биномиальное распределение

Предположим, что в выборке обнаружилось 7 дефектных изделий. Это означает, что «очень вероятна» ситуация, что изменилась доля дефектных изделий p , которая является характеристикой нашего производственного процесса. Хотя такая ситуация «очень вероятна», но существует вероятность (альфа-риск, ошибка 1-го рода, «ложная тревога»), что все же p осталась без изменений, а увеличенное количество дефектных изделий обусловлено случайностью выборки.

Как видно на рисунке ниже, 7 – количество дефектных изделий, которое допустимо для процесса с p=0,21 при том же значении Альфа . Это служит иллюстрацией, что при превышении порогового значения дефектных изделий в выборке, p «скорее всего» увеличилось. Фраза «скорее всего» означает, что существует всего лишь 10% вероятность (100%-90%) того, что отклонение доли дефектных изделий выше порогового вызвано только сучайными причинами.

Таким образом, превышение порогового количества дефектных изделий в выборке, может служить сигналом, что процесс расстроился и стал выпускать бо льший процент бракованных изделий.

Примечание : До MS EXCEL 2010 в EXCEL была функция КРИТБИНОМ() , которая эквивалентна БИНОМ.ОБР() . КРИТБИНОМ() оставлена в MS EXCEL 2010 и выше для совместимости.

Связь Биномиального распределения с другими распределениями

Если параметр n Биномиального распределения стремится к бесконечности, а p стремится к 0, то в этом случае Биномиальное распределение может быть аппроксимировано .
Можно сформулировать условия, когда приближение распределением Пуассона работает хорошо:

p <0,1 (чем меньше p и больше n , тем приближение точнее);
p >0,9 (учитывая, что q =1- p , вычисления в этом случае необходимо производить через q (а х нужно заменить на n - x ). Следовательно, чем меньше q и больше n , тем приближение точнее).

При 0,1<=p<=0,9 и n*p>10 Биномиальное распределение можно аппроксимировать .

В свою очередь, Биномиальное распределение может служить хорошим приближением , когда размер совокупности N Гипергеометрического распределения гораздо больше размера выборки n (т.е., N>>n или n/N<<1).

Подробнее о связи вышеуказанных распределений, можно прочитать в статье . Там же приведены примеры аппроксимации, и пояснены условия, когда она возможна и с какой точностью.

СОВЕТ : О других распределениях MS EXCEL можно прочитать в статье .