Distribution binomiale : définition, formule, exemples. Distribution binomiale d'une variable aléatoire discrète Caractéristiques de la distribution binomiale

- (distribution binomiale) Une distribution qui permet de calculer la probabilité d'occurrence de quelque chose Événement aléatoire, obtenu à la suite de l'observation d'un certain nombre d'événements indépendants, si la probabilité d'apparition de son élément constitutif... ... Dictionnaire économique

- (distribution de Bernoulli) distribution de probabilité du nombre d'occurrences d'un certain événement lors d'essais indépendants répétés, si la probabilité d'occurrence de cet événement dans chaque essai est égale à p(0 p 1). Justement, le numéro ? les occurrences de cet événement sont... ... Grand dictionnaire encyclopédique

distribution binomiale- - Sujets de télécommunications, concepts de base FR distribution binomiale ...

- (distribution de Bernoulli), la distribution de probabilité du nombre d'occurrences d'un certain événement lors d'essais indépendants répétés, si la probabilité d'occurrence de cet événement dans chaque essai est égale à p (0≤p≤1). A savoir, le nombre µ d'occurrences de cet événement... ... Dictionnaire encyclopédique

distribution binomiale- 1.49. distribution binomiale Distribution de probabilité de discret Variable aléatoire X, en prenant n'importe quelle valeur entière de 0 à n, telle que pour x = 0, 1, 2, ..., n et les paramètres n = 1, 2, ... et 0< p < 1, где Источник … Dictionnaire-ouvrage de référence des termes de la documentation normative et technique

Distribution de Bernoulli, la distribution de probabilité d'une variable aléatoire X, prenant respectivement des valeurs entières avec des probabilités (coefficient binomial ; paramètre p du B. r., appelé probabilité d'un résultat positif, prenant les valeurs... Encyclopédie mathématique

Distribution de probabilité du nombre d'occurrences d'un certain événement au cours d'essais indépendants répétés. Si lors de chaque essai la probabilité qu'un événement se produise est égale à p, avec 0 ≤ p ≤ 1, alors le nombre μ d'occurrences de cet événement pour n indépendant... ... Grand Encyclopédie soviétique

- (distribution de Bernoulli), la distribution de probabilité du nombre d'occurrences d'un certain événement lors d'essais indépendants répétés, si la probabilité d'occurrence de cet événement dans chaque essai est égale à p (0<или = p < или = 1). Именно, число м появлений … Sciences naturelles. Dictionnaire encyclopédique

Distribution de probabilité binomiale- (distribution binomiale) Une distribution qui est observée dans les cas où le résultat de chaque expérience indépendante (observation statistique) prend l'une des deux valeurs possibles : victoire ou défaite, inclusion ou exclusion, plus ou... Dictionnaire économique et mathématique

distribution de probabilité binomiale- Une distribution qui est observée dans les cas où le résultat de chaque expérience indépendante (observation statistique) prend l'une des deux valeurs possibles : victoire ou défaite, inclusion ou exclusion, plus ou moins, 0 ou 1. C'est-à-dire... ... Guide du traducteur technique

Livres

  • Théorie des probabilités et statistiques mathématiques dans les problèmes. Plus de 360 ​​problèmes et exercices, D. A. Borzykh. Le manuel proposé contient des tâches de différents niveaux de complexité. Cependant, l'accent est mis sur les tâches de complexité moyenne. Ceci est fait intentionnellement pour encourager les étudiants à...
  • Théorie des probabilités et statistiques mathématiques dans les problèmes Plus de 360 ​​problèmes et exercices, D. Borzykh. Le manuel proposé contient des problèmes de différents niveaux de complexité. Cependant, l'accent est mis sur les tâches de complexité moyenne. Ceci est fait intentionnellement pour encourager les étudiants à...

Tous les phénomènes ne se mesurent pas sur une échelle quantitative telle que 1, 2, 3... 100500... Un phénomène ne peut pas toujours prendre une infinité ou un grand nombre d'états différents. Par exemple, le sexe d'une personne peut être M ou F. Le tireur atteint la cible ou la rate. Vous pouvez voter « Pour » ou « Contre », etc. et ainsi de suite. En d'autres termes, ces données reflètent l'état d'un attribut alternatif - soit « oui » (l'événement s'est produit) soit « non » (l'événement ne s'est pas produit). L’événement qui se produit (résultat positif) est également appelé « succès ».

Les expériences avec de telles données sont appelées Schéma de Bernoulli, en l'honneur du célèbre mathématicien suisse qui a découvert qu'avec un grand nombre d'essais, le rapport des résultats positifs au nombre total d'essais tend vers la probabilité d'occurrence de cet événement.

Variable caractéristique alternative

Afin d'utiliser un appareil mathématique dans l'analyse, les résultats de ces observations doivent être enregistrés sous forme numérique. Pour ce faire, un résultat positif se voit attribuer le numéro 1, un résultat négatif - 0. Autrement dit, nous avons affaire à une variable qui ne peut prendre que deux valeurs : 0 ou 1.

Quel bénéfice peut-on en tirer ? En fait, pas moins qu'à partir de données ordinaires. Ainsi, il est facile de calculer le nombre de résultats positifs - il suffit de résumer toutes les valeurs, c'est-à-dire tout 1 (succès). Vous pouvez aller plus loin, mais cela nécessitera d’introduire quelques notations.

La première chose à noter est que des résultats positifs (qui sont égaux à 1) ont une certaine probabilité de se produire. Par exemple, obtenir face en lançant une pièce de monnaie équivaut à ½ ou 0,5. Cette probabilité est traditionnellement désignée par la lettre latine p. La probabilité qu’un événement alternatif se produise est donc égale à 1-p, qui est également désigné par q, c'est q = 1 – p. Ces notations peuvent être clairement systématisées sous la forme d'un tableau de répartition des variables X.

Nous avons reçu une liste de valeurs possibles et leurs probabilités. Peut être calculé valeur attendue Et dispersion. L'espérance est la somme des produits de toutes les valeurs possibles et de leurs probabilités correspondantes :

Calculons l'espérance en utilisant la notation dans les tableaux ci-dessus.

Il s'avère que l'espérance mathématique d'un signe alternatif est égale à la probabilité de cet événement - p.

Définissons maintenant quelle est la variance d'un attribut alternatif. La dispersion est le carré moyen des écarts par rapport à l'espérance mathématique. La formule générale (pour les données discrètes) est :

D’où la variance de l’attribut alternatif :

Il est facile de constater que cette dispersion a un maximum de 0,25 (avec p=0,5).

L'écart type est la racine de la variance :

La valeur maximale ne dépasse pas 0,5.

Comme vous pouvez le constater, l’espérance mathématique et la variance de l’attribut alternatif ont une forme très compacte.

Distribution binomiale d'une variable aléatoire

Regardons la situation sous un autre angle. En effet, peu importe que la perte moyenne de têtes par lancer soit de 0,5 ? C'est même impossible à imaginer. Il est plus intéressant de se poser la question du nombre de têtes qui surviennent pour un nombre de lancers donné.

Autrement dit, le chercheur s’intéresse souvent à la probabilité qu’un certain nombre d’événements réussis se produisent. Il peut s'agir du nombre de produits défectueux dans le lot testé (1 - défectueux, 0 - bon) ou du nombre de récupérations (1 - sain, 0 - malade), etc. Le nombre de ces « succès » sera égal à la somme de toutes les valeurs de la variable X, c'est à dire. nombre de résultats uniques.

Valeur aléatoire B est appelé binôme et prend des valeurs de 0 à nB= 0 – toutes les pièces conviennent, avec B = n– toutes les pièces sont défectueuses). On suppose que toutes les valeurs X indépendants les uns des autres. Considérons les principales caractéristiques d'une variable binomiale, c'est-à-dire que nous établirons son espérance mathématique, sa dispersion et sa distribution.

L’espérance d’une variable binomiale est très facile à obtenir. L'espérance mathématique de la somme des quantités est la somme des espérances mathématiques de chaque quantité ajoutée, et elle est la même pour tout le monde, donc :

Par exemple, l’espérance mathématique du nombre de têtes tombées en 100 lancers est de 100 × 0,5 = 50.

Nous dérivons maintenant la formule de dispersion d’une variable binomiale. La variance de la somme des variables aléatoires indépendantes est la somme des variances. D'ici

Écart type, respectivement

Pour 100 lancers de pièces, l’écart type du nombre de faces est

Enfin, considérons la distribution de la valeur binomiale, c'est-à-dire la probabilité que la variable aléatoire B prendra des valeurs différentes k, Où 0≤k≤n. Pour une pièce de monnaie, ce problème pourrait ressembler à ceci : quelle est la probabilité d’obtenir 40 faces sur 100 lancers ?

Pour comprendre la méthode de calcul, imaginez que la pièce ne soit lancée que 4 fois. Chaque camp peut se disputer à chaque fois. On se demande : quelle est la probabilité d’obtenir 2 faces sur 4 lancers. Chaque lancer est indépendant les uns des autres. Cela signifie que la probabilité d'obtenir une combinaison sera égale au produit des probabilités d'un résultat donné pour chaque lancer individuel. Soit O la tête, P la queue. Alors, par exemple, une des combinaisons qui nous convient peut ressembler à OOPP, c'est-à-dire :

La probabilité d'une telle combinaison est égale au produit de deux probabilités d'obtenir face et de deux probabilités supplémentaires de ne pas obtenir face (l'événement inverse, calculé comme 1-p), c'est à dire. 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. C'est la probabilité d'une des combinaisons qui nous convient. Mais la question portait sur le nombre total d’aigles, et non sur un ordre spécifique. Ensuite, vous devez additionner les probabilités de toutes les combinaisons dans lesquelles il y a exactement 2 faces. De toute évidence, ils sont tous identiques (le produit ne change pas lorsque les facteurs changent). Par conséquent, vous devez calculer leur nombre, puis multiplier par la probabilité d’une telle combinaison. Comptons toutes les combinaisons de 4 lancers de 2 têtes : RROO, RORO, ROOR, ORRO, OROR, OORR. Il y a 6 options au total.

Par conséquent, la probabilité souhaitée d’obtenir 2 faces après 4 lancers est de 6 × 0,0625 = 0,375.

Cependant, compter de cette façon est fastidieux. Déjà pour 10 pièces, il sera très difficile d'obtenir le nombre total d'options par force brute. Par conséquent, les gens intelligents ont inventé il y a longtemps une formule avec laquelle ils calculent le nombre de combinaisons différentes de néléments par k, Où n– nombre total d'éléments, k– le nombre d'éléments dont les options de disposition sont comptées. Formule combinée de néléments par k est-ce:

Des choses similaires se produisent dans la section combinatoire. J'y envoie toute personne souhaitant améliorer ses connaissances. D’où, d’ailleurs, le nom de la distribution binomiale (la formule ci-dessus est un coefficient dans le développement du binôme de Newton).

La formule pour déterminer la probabilité peut être facilement généralisée à n'importe quelle quantité n Et k. En conséquence, la formule de la distribution binomiale a la forme suivante.

Le nombre de combinaisons qui remplissent la condition est multiplié par la probabilité de l’une d’entre elles.

Pour une utilisation pratique, il suffit de connaître la formule de la distribution binomiale. Ou vous ne le savez peut-être même pas – nous montrons ci-dessous comment déterminer la probabilité à l’aide d’Excel. Mais il vaut mieux savoir.

En utilisant cette formule, nous calculons la probabilité d’obtenir 40 faces en 100 lancers :

Soit seulement 1,08 %. A titre de comparaison, la probabilité que l'espérance mathématique de cette expérience, soit 50 têtes, soit égale à 7,96 %. La probabilité maximale d'une valeur binomiale appartient à la valeur correspondant à l'espérance mathématique.

Calculer la probabilité d'une distribution binomiale dans Excel

Si vous utilisez uniquement du papier et une calculatrice, les calculs utilisant la formule de distribution binomiale, malgré l'absence d'intégrales, sont assez difficiles. Par exemple, la valeur est 100 ! – comporte plus de 150 caractères. Auparavant, et encore aujourd'hui, des formules approximatives étaient utilisées pour calculer ces quantités. Pour le moment, il est conseillé d'utiliser un logiciel spécial, tel que MS Excel. Ainsi, tout utilisateur (même humaniste de formation) peut facilement calculer la probabilité de la valeur d'une variable aléatoire distribuée de manière binomiale.

Pour consolider le matériel, nous utiliserons pour l'instant Excel comme calculatrice ordinaire, c'est-à-dire Effectuons un calcul étape par étape en utilisant la formule de distribution binomiale. Calculons, par exemple, la probabilité d'obtenir 50 faces. Ci-dessous une image avec les étapes de calcul et le résultat final.

Comme vous pouvez le constater, les résultats intermédiaires sont d'une telle échelle qu'ils ne rentrent pas dans une cellule, bien que des fonctions simples comme FACTEUR (calcul d'une factorielle), PUISSANCE (élever un nombre à une puissance), ainsi que des opérateurs de multiplication et de division sont utilisés partout. De plus, ce calcul est assez lourd ; de toute façon, il n'est pas compact, car de nombreuses cellules sont impliquées. Oui, et c’est un peu difficile à comprendre tout de suite.

En général, Excel fournit une fonction prête à l'emploi pour calculer les probabilités d'une distribution binomiale. La fonction s'appelle BINOM.DIST.

Nombre de succès – nombre de tests réussis. Nous en avons 50.

Nombre d'essais – nombre de lancers : 100 fois.

Probabilité de succès – la probabilité d’obtenir face en un seul lancer est de 0,5.

Intégral – soit 1, soit 0. Si 0, alors la probabilité est calculée P(B=k); si 1, alors la fonction de distribution binomiale sera calculée, c'est-à-dire la somme de toutes les probabilités de B=0 avant B = k compris.

Cliquez sur OK et obtenez le même résultat que ci-dessus, seul tout a été calculé par une seule fonction.

Très confortablement. Par souci d'expérimentation, au lieu du dernier paramètre 0, on met 1. On obtient 0,5398. Cela signifie qu'avec 100 lancers de pièces, la probabilité d'obtenir face entre 0 et 50 est de près de 54 %. Mais au début, il semblait que ce devrait être 50 %. En général, les calculs sont effectués rapidement et facilement.

Un véritable analyste doit comprendre comment se comporte la fonction (quelle est sa distribution), nous calculerons donc les probabilités pour toutes les valeurs de 0 à 100. Autrement dit, nous poserons la question : quelle est la probabilité que pas une seule tête apparaîtra, qu'1 aigle apparaîtra, 2, 3, 50, 90 ou 100. Le calcul est présenté dans l'image suivante. La ligne bleue est la distribution binomiale elle-même, le point rouge est la probabilité d'un nombre spécifique de succès k.

On pourrait se demander si la distribution binomiale est similaire à... Oui, très similaire. Même Moivre (en 1733) a dit que la distribution binomiale avec de grands échantillons se rapproche (je ne sais pas comment on l'appelait alors), mais personne ne l'a écouté. Seuls Gauss, puis Laplace 60 à 70 ans plus tard, ont redécouvert et étudié attentivement la loi de distribution normale. Le graphique ci-dessus montre clairement que la probabilité maximale tombe sur l'espérance mathématique et qu'à mesure qu'elle s'en écarte, elle diminue fortement. Tout comme la loi normale.

La distribution binomiale est d'une grande importance pratique et se produit assez souvent. Grâce à Excel, les calculs sont effectués rapidement et facilement.


Bien entendu, lors du calcul de la fonction de distribution cumulative, vous devez utiliser le lien mentionné entre les distributions binomiale et bêta. Cette méthode est évidemment meilleure que la sommation directe lorsque n > 10.

Dans les manuels classiques de statistique, pour obtenir les valeurs de la distribution binomiale, il est souvent recommandé d'utiliser des formules basées sur des théorèmes limites (comme la formule de Moivre-Laplace). Il convient de noter que d'un point de vue purement informatique la valeur de ces théorèmes est proche de zéro, surtout maintenant, alors que presque tous les bureaux disposent d'un ordinateur puissant. Le principal inconvénient des approximations ci-dessus est leur précision totalement insuffisante pour les valeurs de n caractéristiques de la plupart des applications. Non moins un inconvénient est l'absence de recommandations claires sur l'applicabilité de telle ou telle approximation (les textes standards ne fournissent que des formulations asymptotiques ; ils ne sont pas accompagnés d'estimations de précision et sont donc de peu d'utilité). Je dirais que les deux formules ne conviennent que pour n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Je ne considère pas ici le problème de la recherche de quantiles : pour les distributions discrètes, c'est trivial, et dans les problèmes où de telles distributions se posent, ce n'est, en règle générale, pas pertinent. Si des quantiles sont encore nécessaires, je recommande de reformuler le problème de manière à travailler avec des valeurs p (significations observées). Voici un exemple : lors de la mise en œuvre d'algorithmes de recherche exhaustifs, il est nécessaire à chaque étape de tester l'hypothèse statistique sur une variable aléatoire binomiale. Selon l'approche classique, à chaque étape, il est nécessaire de calculer le critère statistique et de comparer sa valeur avec la limite de l'ensemble critique. Cependant, étant donné que l'algorithme est exhaustif, il est nécessaire de déterminer à chaque fois à nouveau la limite de l'ensemble critique (après tout, la taille de l'échantillon change d'étape en étape), ce qui augmente de manière improductive les coûts de temps. Approche moderne recommande de calculer la signification observée et de la comparer avec la probabilité de confiance, économisant ainsi la recherche de quantiles.

Par conséquent, dans les codes ci-dessous, il n'y a pas de calcul de la fonction inverse ; à la place, la fonction rev_binomialDF est donnée, qui calcule la probabilité p de succès dans un essai individuel étant donné le nombre n d'essais donné, le nombre m de succès dans ceux-ci et la valeur y de la probabilité d'obtenir ces m succès. Cela utilise la connexion susmentionnée entre les distributions binomiale et bêta.

En fait, cette fonction permet d'obtenir les limites des intervalles de confiance. En effet, supposons que dans n essais binomiaux nous obtenions m succès. Comme on le sait, la limite gauche de l'intervalle de confiance bilatéral pour le paramètre p avec un niveau de confiance est égale à 0 si m = 0, et for est une solution de l'équation . De même, la limite droite est 1 si m = n, et for est une solution de l'équation . Il s’ensuit que pour trouver la frontière gauche, nous devons résoudre l’équation relative , et pour trouver la bonne – l’équation . Ils sont résolus dans les fonctions binom_leftCI et binom_rightCI, qui renvoient respectivement les limites supérieure et inférieure de l'intervalle de confiance bilatéral.

Je voudrais noter que si vous n'avez pas besoin d'une précision absolument incroyable, alors pour n suffisamment grand, vous pouvez utiliser l'approximation suivante [B.L. van der Waerden, Statistiques mathématiques. M : IL, 1960, ch. 2, section 7]: , où g est un quantile de la distribution normale. L'intérêt de cette approximation est qu'il existe des approximations très simples qui permettent de calculer les quantiles d'une distribution normale (voir le texte sur le calcul de la distribution normale et la section correspondante de cet ouvrage de référence). Dans ma pratique (principalement avec n > 100), cette approximation a donné environ 3-4 chiffres, ce qui, en règle générale, est largement suffisant.

Pour calculer à l'aide des codes suivants, vous aurez besoin des fichiers betaDF.h, betaDF.cpp (voir la section sur la distribution bêta), ainsi que logGamma.h, logGamma.cpp (voir l'annexe A). Vous pouvez également voir un exemple d’utilisation des fonctions.

Fichier binomialDF.h

#ifndef __BINOMIAL_H__ #include "betaDF.h" double binomialDF(doubles essais, doubles succès, double p); /* * Soit des "essais" d'observations indépendantes * avec une probabilité "p" de succès dans chacun. * Calculez la probabilité B(succès|essais,p) que le nombre de * succès soit compris entre 0 et "succès" (inclus). */ double rev_binomialDF(doubles essais, doubles succès, double y); /* * Soit connue la probabilité y d'au moins m succès * dans les essais testant le schéma de Bernoulli. La fonction trouve la probabilité p* de réussite dans un essai individuel. * * La relation suivante est utilisée dans les calculs * * 1 - p = rev_Beta(essais-succès| succès+1, y). */ double binom_leftCI(doubles essais, doubles réussites, double niveau) ; /* Soit des "essais" d'observations indépendantes * avec une probabilité "p" de succès dans chacun * et un nombre de succès égal à "succès". * La limite gauche de l'intervalle de confiance bilatéral est calculée * avec le niveau de signification. */ double binom_rightCI(double n, double succès, double niveau) ; /* Soit des "essais" d'observations indépendantes * avec une probabilité "p" de succès dans chacun * et un nombre de succès égal à "succès". * La limite droite de l'intervalle de confiance bilatéral est calculée * avec le niveau de signification. */ #endif /* Termine #ifndef __BINOMIAL_H__ */

Fichier binomialDF.cpp

/************************************************ * *********/ /* Distribution binomiale */ /******************************** * **************************/ #inclure #inclure #include "betaDF.h" ENTRY double binomialDF(double n, double m, double p) /* * Soit "n" observations indépendantes * avec une probabilité "p" de succès dans chacune. * On calcule la probabilité B(m|n,p) que le nombre de succès soit * compris entre 0 et « m » (inclus), soit * somme des probabilités binomiales de 0 à m : * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Les calculs n'impliquent pas une sommation brutale - * est utilisé la relation suivante avec la distribution bêta centrale : * * B(m|n,p) = Beta(1-p|n-m,m+1). * * Les arguments doivent être positifs, avec 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (p<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) renvoie 1 ; sinon, retourne BetaDF(n-m, m+1).value(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * Supposons que la probabilité y d'au moins m succès se produise * dans n essais du schéma de Bernoulli. La fonction trouve la probabilité p* de réussite dans un essai individuel. * * La relation suivante est utilisée dans les calculs * * 1 - p = rev_Beta(y|n-m,m+1). */ ( assert((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

La théorie des probabilités est invisiblement présente dans nos vies. Nous n’y prêtons pas attention, mais chaque événement de notre vie a une probabilité ou une autre. Compte tenu du grand nombre de scénarios possibles, il devient nécessaire de déterminer le plus probable et le moins probable d’entre eux. Il est plus pratique d’analyser graphiquement ces données probabilistes. La distribution peut nous y aider. Le binôme est l’un des plus simples et des plus précis.

Avant de passer directement aux mathématiques et à la théorie des probabilités, voyons qui a été le premier à proposer ce type de distribution et quelle est l’histoire du développement de l’appareil mathématique pour ce concept.

Histoire

La notion de probabilité est connue depuis l’Antiquité. Cependant, les mathématiciens de l’Antiquité n’y attachaient pas beaucoup d’importance et ne purent que jeter les bases de la théorie qui devint plus tard la théorie des probabilités. Ils ont créé des méthodes combinatoires qui ont grandement aidé ceux qui ont ensuite créé et développé la théorie elle-même.

Dans la seconde moitié du XVIIe siècle, la formation des concepts et méthodes de base de la théorie des probabilités a commencé. Des définitions de variables aléatoires et des méthodes de calcul de la probabilité d'événements indépendants et dépendants simples et complexes ont été introduites. Cet intérêt pour les variables aléatoires et les probabilités était dicté par le jeu : chacun voulait savoir quelles étaient ses chances de gagner le jeu.

L'étape suivante fut l'application des méthodes d'analyse mathématique à la théorie des probabilités. D'éminents mathématiciens tels que Laplace, Gauss, Poisson et Bernoulli se sont chargés de cette tâche. Ce sont eux qui ont fait progresser ce domaine des mathématiques à un nouveau niveau. C'est James Bernoulli qui a découvert la loi de distribution binomiale. D'ailleurs, comme nous le découvrirons plus tard, sur la base de cette découverte plusieurs autres ont été faites, ce qui a permis de créer la loi de distribution normale et bien d'autres.

Maintenant, avant de commencer à décrire la distribution binomiale, rafraîchissons légèrement notre mémoire des concepts de théorie des probabilités, que nous avons probablement déjà oubliés de l'école.

Bases de la théorie des probabilités

Nous considérerons de tels systèmes, à la suite desquels seules deux issues sont possibles : le « succès » et l’« échec ». C'est facile à comprendre avec un exemple : on lance une pièce de monnaie en espérant qu'elle tombera face. Les probabilités de chacun des événements possibles (chutes de faces - "succès", chutes de faces - "échec") sont égales à 50 pour cent si la pièce est parfaitement équilibrée et qu'il n'y a pas d'autres facteurs pouvant affecter l'expérience.

C'était l'événement le plus simple. Mais il existe également des systèmes complexes dans lesquels des actions séquentielles sont exécutées, et les probabilités des résultats de ces actions seront différentes. Par exemple, considérons le système suivant : dans une boîte dont on ne voit pas le contenu, il y a six boules absolument identiques, trois paires de couleurs bleu, rouge et blanc. Nous devons récupérer quelques balles au hasard. En conséquence, en retirant d'abord l'une des boules blanches, nous réduirons considérablement la probabilité que nous obtenions également une boule blanche ensuite. Cela se produit parce que le nombre d'objets dans le système change.

DANS section suivante regardons les plus complexes concepts mathématiques, nous rapprochant de ce que signifient les mots " distribution normale", "distribution binomiale" et autres.

Éléments de statistiques mathématiques

En statistique, qui est l'un des domaines d'application de la théorie des probabilités, il existe de nombreux exemples où les données à analyser ne sont pas fournies explicitement. C'est-à-dire non pas numériquement, mais sous forme de division par caractéristiques, par exemple par sexe. Afin d'appliquer des outils mathématiques à de telles données et de tirer des conclusions des résultats obtenus, il est nécessaire de convertir les données originales dans un format numérique. Généralement, pour ce faire, un résultat positif se voit attribuer une valeur de 1 et un résultat négatif une valeur de 0. Ainsi, nous obtenons des données statistiques qui peuvent être analysées à l'aide de méthodes mathématiques.

La prochaine étape pour comprendre ce qu'est une distribution binomiale d'une variable aléatoire consiste à déterminer la variance de la variable aléatoire et l'espérance mathématique. Nous en parlerons dans la section suivante.

Valeur attendue

En fait, comprendre ce qu’est une espérance mathématique n’est pas difficile. Considérons un système dans lequel il y a plusieurs divers événements avec des probabilités différentes. L'espérance mathématique sera appelée une valeur égale à la somme des produits des valeurs de ces événements (sous la forme mathématique dont nous avons parlé dans la dernière section) et de la probabilité de leur apparition.

L'espérance mathématique d'une distribution binomiale est calculée selon le même schéma : nous prenons la valeur d'une variable aléatoire, la multiplions par la probabilité d'un résultat positif, puis additionnons les données résultantes pour toutes les variables. Il est très pratique de présenter ces données sous forme graphique - de cette façon, la différence entre les attentes mathématiques des différentes valeurs est mieux perçue.

Dans la section suivante, nous vous parlerons un peu d'un autre concept : la variance d'une variable aléatoire. Il est également étroitement lié au concept de distribution de probabilité binomiale et constitue sa caractéristique.

Variance de la distribution binomiale

Cette valeur est étroitement liée à la précédente et caractérise également la distribution des données statistiques. Il représente le carré moyen des écarts des valeurs par rapport à leur attente mathématique. Autrement dit, la variance d'une variable aléatoire est la somme des carrés des différences entre la valeur d'une variable aléatoire et son espérance mathématique, multipliée par la probabilité de cet événement.

En général, c’est tout ce que nous devons savoir sur la variance pour comprendre ce qu’est une distribution de probabilité binomiale. Passons maintenant directement à notre sujet principal. À savoir ce qui se cache derrière une expression aussi complexe en apparence : « loi de distribution binomiale ».

Distribution binomiale

Voyons d'abord pourquoi cette distribution est binomiale. Cela vient du mot « binom ». Peut-être avez-vous entendu parler du binôme de Newton, une formule qui peut être utilisée pour étendre la somme de deux nombres a et b à n'importe quelle puissance n non négative.

Comme vous l'avez probablement déjà deviné, la formule binomiale de Newton et la formule de distribution binomiale sont presque les mêmes formules. À la seule exception que le second a une signification pratique pour des quantités spécifiques, et le premier n'est qu'un outil mathématique général dont les applications dans la pratique peuvent être différentes.

Formules de répartition

La fonction de distribution binomiale peut s'écrire comme la somme des termes suivants :

(n!/(n-k)!k!)*p k *q n-k

Ici n est le nombre de indépendants expériences aléatoires, p est le nombre de résultats réussis, q est le nombre de résultats infructueux, k est le numéro de l'expérience (peut prendre des valeurs de 0 à n), ! - désignation de factorielle, fonction d'un nombre dont la valeur est égale au produit de tous les nombres qui le précèdent (par exemple, pour le nombre 4 : 4!=1*2*3*4=24).

De plus, la fonction de distribution binomiale peut être écrite comme une fonction bêta incomplète. Cependant, il s'agit d'une définition plus complexe, utilisée uniquement pour résoudre des problèmes statistiques complexes.

La distribution binomiale, dont nous avons examiné des exemples ci-dessus, est l'un des types de distribution les plus simples de la théorie des probabilités. Il existe également une distribution normale, qui est une sorte de binôme. Il est le plus souvent utilisé et est le plus simple à calculer. Il existe également des distributions de Bernoulli, des distributions de Poisson et des distributions conditionnelles. Tous caractérisent graphiquement les plages de probabilité d'un processus particulier dans différentes conditions.

Dans la section suivante, nous examinerons les aspects liés à l'utilisation de cet appareil mathématique dans vrai vie. À première vue, bien sûr, il semble qu'il ne s'agisse que d'une autre chose mathématique qui, comme d'habitude, ne trouve pas d'application dans la vie réelle et n'est généralement nécessaire à personne, à l'exception des mathématiciens eux-mêmes. Cependant, ce n'est pas le cas. Après tout, tous les types de distributions et leurs représentations graphiques ont été créés exclusivement à des fins pratiques et non par caprice de scientifiques.

Application

Bien sûr, le plus application importante les distributions se trouvent dans les statistiques, car elles ont besoin Analyse complète beaucoup de données. Comme le montre la pratique, de nombreux ensembles de données ont à peu près les mêmes distributions de valeurs : les régions critiques de valeurs très faibles et très élevées contiennent généralement moins d'éléments que les valeurs moyennes.

L’analyse de grands ensembles de données n’est pas seulement nécessaire dans le domaine des statistiques. Il est indispensable, par exemple, dans chimie physique. Dans cette science, il est utilisé pour déterminer de nombreuses quantités associées aux vibrations et aux mouvements aléatoires des atomes et des molécules.

Dans la section suivante, nous comprendrons à quel point il est important d'utiliser des concepts statistiques tels que le binôme distribution d'une variable aléatoire dans Vie courante pour toi et moi.

Pourquoi en ai-je besoin ?

Beaucoup de gens se posent cette question lorsqu’il s’agit de mathématiques. D’ailleurs, ce n’est pas pour rien que les mathématiques sont appelées la reine des sciences. C'est la base de la physique, de la chimie, de la biologie, de l'économie, et dans chacune de ces sciences une certaine distribution est également utilisée : qu'il s'agisse d'une distribution binomiale discrète ou normale, cela n'a pas d'importance. Et si nous regardons de plus près le monde qui nous entoure, nous verrons que les mathématiques sont utilisées partout : dans la vie quotidienne, au travail, et même les relations humaines peuvent être représentées sous forme de données statistiques et analysées (ceci d'ailleurs , c'est ce que disent ceux qui travaillent organisations spéciales impliqué dans la collecte d’informations).

Parlons maintenant un peu de ce qu'il faut faire si vous avez besoin d'en savoir beaucoup plus sur ce sujet que ce que nous avons décrit dans cet article.

Les informations que nous avons données dans cet article sont loin d’être complètes. Il existe de nombreuses nuances quant à la forme que peut prendre la distribution. La distribution binomiale, comme nous l'avons déjà découvert, est l'un des principaux types sur lesquels l'ensemble statistiques mathématiques et la théorie des probabilités.

Si vous êtes intéressé, ou dans le cadre de votre travail, vous avez besoin d'en savoir beaucoup plus sur ce sujet, vous devrez étudier la littérature spécialisée. Vous devriez commencer par un cours universitaire en analyse mathématique et progresser jusqu'à la section sur la théorie des probabilités. La connaissance des séries sera également utile, car une distribution de probabilité binomiale n'est rien d'autre qu'une série de termes successifs.

Conclusion

Avant de terminer l’article, nous aimerions vous dire encore une chose intéressante. Cela concerne directement le sujet de notre article et toutes les mathématiques en général.

Beaucoup de gens disent que les mathématiques sont une science inutile et que rien de ce qu’ils ont étudié à l’école ne leur a été utile. Mais la connaissance n’est jamais superflue, et si quelque chose ne vous est pas utile dans la vie, cela signifie que vous ne vous en souvenez tout simplement pas. Si vous avez des connaissances, ils peuvent vous aider, mais si vous ne les avez pas, vous ne pouvez pas attendre d’eux.

Nous avons donc examiné le concept de distribution binomiale et toutes les définitions qui y sont associées et parlé de la manière dont il est appliqué dans nos vies.

Chapitre 7.

Lois spécifiques de distribution des variables aléatoires

Types de lois de distribution de variables aléatoires discrètes

Laissez une variable aléatoire discrète prendre les valeurs X 1 , X 2 , …, xn,…. Les probabilités de ces valeurs peuvent être calculées à l'aide de diverses formules, par exemple en utilisant les théorèmes de base de la théorie des probabilités, la formule de Bernoulli ou d'autres formules. Pour certaines de ces formules, la loi de répartition possède son propre nom.

Les lois de distribution les plus courantes d'une variable aléatoire discrète sont les lois de distribution binomiale, géométrique, hypergéométrique et de Poisson.

Loi de distribution binomiale

Qu'il soit produit népreuves indépendantes, dans chacune desquelles l'événement peut apparaître ou non UN. La probabilité que cet événement se produise dans chaque essai est constante, ne dépend pas du numéro de l'essai et est égale à R.=R.(UN). D'où la probabilité que l'événement ne se produise pas UN dans chaque test est également constant et égal q=1–R.. Considérons la variable aléatoire Xégal au nombre d'occurrences de l'événement UN V n essais. Évidemment, les valeurs de cette quantité sont égales

X 1 =0 – événement UN V n les tests ne sont pas apparus ;

X 2 =1 – événement UN V n est apparu une fois lors des procès;

X 3 =2 – événement UN V n les tests sont apparus deux fois ;

…………………………………………………………..

xn +1 = n- événement UN V n tout est apparu lors des tests n une fois.

Les probabilités de ces valeurs peuvent être calculées à l'aide de la formule de Bernoulli (4.1) :

À=0, 1, 2, …,n .

Loi de distribution binomiale X, égal au nombre succès dans n Tests de Bernoulli, avec probabilité de succès R..

Ainsi, une variable aléatoire discrète a une distribution binomiale (ou est distribuée selon la loi binomiale) si ses valeurs possibles sont 0, 1, 2, ..., n, et les probabilités correspondantes sont calculées à l'aide de la formule (7.1).

La distribution binomiale dépend de deux paramètres R. Et n.

La série de distribution d'une variable aléatoire distribuée selon la loi binomiale a la forme :

X k n
R.

Exemple 7.1 . Trois coups indépendants sont tirés sur la cible. La probabilité de réussir chaque coup est de 0,4. Valeur aléatoire X– nombre de coups sur la cible. Construire sa série de distribution.

Solution. Valeurs possibles d'une variable aléatoire X sont X 1 =0; X 2 =1; X 3 =2; X 4 =3. Trouvons les probabilités correspondantes en utilisant la formule de Bernoulli. Il n’est pas difficile de montrer que l’emploi de cette formule est ici tout à fait justifié. A noter que la probabilité de ne pas toucher la cible d'un seul coup sera égale à 1-0,4=0,6. On a

La série de distribution a la forme suivante :

X
R. 0,216 0,432 0,288 0,064

Il est facile de vérifier que la somme de toutes les probabilités est égale à 1. La variable aléatoire elle-même X distribué selon la loi binomiale. ■

Trouvons l'espérance mathématique et la variance d'une variable aléatoire distribuée selon la loi binomiale.

Lors de la résolution de l'exemple 6.5, il a été montré que l'espérance mathématique du nombre d'occurrences de l'événement UN V n essais indépendants, si la probabilité d'occurrence UN dans chaque test est constant et égal R., équivaut à n· R.

Cet exemple utilisait une variable aléatoire distribuée selon la loi binomiale. Par conséquent, la solution de l’exemple 6.5 est essentiellement une preuve du théorème suivant.

Théorème 7.1. L'espérance mathématique d'une variable aléatoire discrète distribuée selon la loi binomiale est égale au produit du nombre d'essais et de la probabilité de « succès », c'est-à-dire M.(X)=n· R.

Théorème 7.2. La variance d'une variable aléatoire discrète distribuée selon la loi binomiale est égale au produit du nombre d'essais par la probabilité de « succès » et la probabilité d'« échec », c'est-à-dire D(X)=nрq.

L'asymétrie et l'aplatissement d'une variable aléatoire distribuée selon la loi binomiale sont déterminés par les formules

Ces formules peuvent être obtenues en utilisant la notion de moments initiaux et centraux.

La loi de distribution binomiale est à la base de nombreuses situations réelles. Pour les grandes valeurs n La distribution binomiale peut être approximée à l'aide d'autres distributions, notamment la distribution de Poisson.

Distribution de Poisson

Qu'il y ait n Tests de Bernoulli, avec le nombre de tests n assez gros. Il a été montré plus haut que dans ce cas (si d'ailleurs la probabilité R.événements UN très petit) pour trouver la probabilité que l'événement UN apparaître T Une fois dans les tests, vous pouvez utiliser la formule de Poisson (4.9). Si la variable aléatoire X désigne le nombre d'occurrences de l'événement UN V n Tests de Bernoulli, puis la probabilité que X prendra la valeur k peut être calculé à l'aide de la formule

, (7.2)

λ = nr.

Loi de distribution de Poisson s'appelle la distribution d'une variable aléatoire discrète X, pour lesquelles les valeurs possibles sont des entiers non négatifs, et les probabilités r t ces valeurs sont trouvées à l'aide de la formule (7.2).

Ordre de grandeur λ = nr appelé paramètre Distributions de Poisson.

Une variable aléatoire distribuée selon la loi de Poisson peut prendre un nombre infini de valeurs. Puisque pour cette distribution la probabilité R. L'occurrence d'un événement dans chaque essai est faible, alors cette distribution est parfois appelée loi des événements rares.

La série de distribution d'une variable aléatoire distribuée selon la loi de Poisson a la forme

X T
R.

Il est facile de vérifier que la somme des probabilités de la deuxième ligne est égale à 1. Pour ce faire, vous devez vous rappeler que la fonction peut être développée en une série de Maclaurin, qui converge pour tout X. Dans ce cas nous avons

. (7.3)

Comme indiqué, la loi de Poisson remplace la loi binomiale dans certains cas limites. Un exemple est la variable aléatoire X, dont les valeurs sont égales au nombre de pannes sur une certaine période de temps lors d'une utilisation répétée d'un appareil technique. On suppose qu'il s'agit d'un appareil très fiable, c'est-à-dire La probabilité d’échec dans une application est très faible.

En plus de ces cas limites, il existe en pratique des variables aléatoires distribuées selon la loi de Poisson qui ne sont pas associées à la distribution binomiale. Par exemple, la distribution de Poisson est souvent utilisée pour traiter le nombre d'événements survenant au cours d'une période donnée (le nombre d'appels reçus à un central téléphonique pendant une heure, le nombre de voitures arrivant à une station de lavage pendant une journée, le nombre d'arrêts machine par semaine, etc.). Tous ces événements devraient former ce qu'on appelle le flux d'événements, qui est l'un des concepts de base de la théorie des files d'attente. Paramètre λ caractérise l'intensité moyenne du flux des événements.

Exemple 7.2 . Il y a 500 étudiants à la faculté. Quelle est la probabilité que le 1er septembre soit l'anniversaire de trois étudiants de ce département ?

Solution . Puisque le nombre d'étudiants n=500 est assez grand et R.– la probabilité d'être né le 1er septembre pour l'un des élèves est égale à , c'est-à-dire est suffisamment petite, alors nous pouvons supposer que la variable aléatoire X– le nombre d’élèves nés au 1er septembre se répartit selon la loi de Poisson avec le paramètre λ = n.p.= =1,36986. Alors, d’après la formule (7.2) on obtient

Théorème 7.3. Laissez la variable aléatoire X distribué selon la loi de Poisson. Alors son espérance mathématique et sa variance sont égales entre elles et égales à la valeur du paramètre λ , c'est à dire. M.(X) = D(X) = λ = n.p..

Preuve. Par définition de l'espérance mathématique, à l'aide de la formule (7.3) et de la série de distribution d'une variable aléatoire distribuée selon la loi de Poisson, on obtient

Avant de trouver la variance, on trouve d'abord l'espérance mathématique du carré de la variable aléatoire considérée. On a

De là, par définition de la dispersion, on obtient

Le théorème a été prouvé.

En utilisant les notions de moments initiaux et centraux, on peut montrer que pour une variable aléatoire distribuée selon la loi de Poisson, les coefficients d'asymétrie et d'aplatissement sont déterminés par les formules

Il n'est pas difficile de comprendre que, puisque le contenu sémantique du paramètre λ = n.p. est positif, alors une variable aléatoire distribuée selon la loi de Poisson a toujours une asymétrie et un aplatissement positifs.