Rozkład Pascala

dyskretny rozkład prawdopodobieństwa


Rozkład Pascala (ujemny rozkład dwumianowy)dyskretny rozkład prawdopodobieństwa opisujący m.in. liczbę sukcesów i porażek w niezależnych i posiadających równe prawdopodobieństwo sukcesu próbach Bernoulliego. Jest uogólnieniem rozkładu geometrycznego dla wielu prób.

Rozkład Pascala
Funkcja rozkładu prawdopodobieństwa
Ilustracja
Czerwona linia oznacza wartość oczekiwaną, a zielona ma w przybliżeniu długość 2σ.
Parametry

(liczba rzeczywista)
(liczba rzeczywista)

Poniższe wzory dotyczą wariantu opisującego liczbę sukcesów przed porażką Inne parametryzacje opisują inne wzory.

Nośnik

Funkcja rozkładu prawdopodobieństwa

Dystrybuanta

jest regularyzowaną niekompletną funkcją Beta

Wartość oczekiwana (średnia)

Moda


Wariancja

Współczynnik skośności

Kurtoza

Entropia

Funkcja tworząca momenty

Funkcja charakterystyczna

Termin „ujemny rozkład dwumianowy” nie jest w pełni usystematyzowany. Może dotyczyć jednego z kilku wariantów funkcji opisujących te same zmienne losowe z subtelnymi różnicami w parametryzacji – liczby prób, albo sukcesów lub porażek (czasem liczonych bez ostatniego), przy określonej wartości jednej z tych zmiennych. Momenty i inne charakterystyki poszczególnych wersji rozkładu różnią o proste transformacje[1][2][3]. Nazwa „rozkład Pascala” opisuje z reguły warianty dla wartości całkowitych, liczonych bez ostatniego zdarzenia[3].

Wariant dla liczby sukcesów przed porażką

edytuj

Rozważmy ciąg   niezależnych prób Bernoulliego z prawdopodobieństwem sukcesu równym   Ustalmy liczbę   Obserwujemy ten ciąg do momentu stwierdzenia  -tej porażki. Oznaczmy ten moment przez   O zmiennej losowej   mówimy, że ma ujemny rozkład dwumianowy NB(r,p) z parametrami   oraz  

Niech   ma rozkład NB(r,p). Wtedy   (gdzie  ) jeśli w  -tym momencie zaszła porażka oraz w ciągu   zaszło   porażek. Zatem

 

czyli

 

Na rozkład ten można spojrzeć w następujący sposób: rozważamy ciąg niezależnych zmiennych   o rozkładzie geometrycznym z parametrem sukcesu   odpowiadające obserwacji naszego ciągu po porażce   do porażki   włącznie. Niech   Wtedy zmienna losowa   zliczająca jedynie liczbę sukcesów, ma rozkład ujemny dwumianowy z parametrami   oraz   Z tego otrzymujemy natychmiast wzór na wartość oczekiwaną zmiennej losowej o tym rozkładzie

 

W podobny sposób można wyprowadzić wzór na wariancję.

Dla porównania, w trochę innej definicji ujemnego rozkładu dwumianowego, porażkę zastępuje się sukcesem oraz nie odejmuje się parametru   od momentu zajścia  -tego sukcesu. Otrzymujemy wtedy zmienną losową   o następujący rozkładzie

 

Zmienna ta jest sumą r niezależnych zmiennych o rozkładzie geometrycznym z parametrem sukcesu  

Inne warianty

edytuj

Rozkład był prezentowany w literaturze na kilka różnych sposobów, z subtelnymi zmianami parametryzacji[1][2][3]. Różnice w notacji dotyczą m.in. stosowania równoważności pomiędzy liczbą prób   sukcesów   i porażek   np.   tego, czy nośnik zaczyna się od 0 czy 1, oraz z możliwości przedstawienia wzoru z użyciem różnych form symbolu Newtona, także z wykorzystaniem tożsamości kombinacji dopełniających:

 

Poniższa tabela przedstawia niektóre spotykane formy rozkładu.

  zlicza: Nośnik i funkcja rozkładu prawdopodobieństwa Wzór
  sukcesów, przy danych   porażkach dla     [4][5]
  (wariant opisany powyżej)
 
  prób, przy danych   porażkach dla   
 
 
  porażek, przy danych   sukcesach dla     [2][6]
 [7][8][9][10]
 
  prób, przy danych   sukcesach dla   
 [2][10][11][12][13][14]
 
  sukcesów, przy danych   próbach (rozkład dwumianowy – dla porównania) dla     

Wzór można także rozszerzyć dla niecałkowitych wartości   z użyciem funkcji gamma, np.:

 

opisuje, jakie jest prawdopodobieństwo, że czas oczekiwania na  -ty sukces będzie wynosił  

Przypisy

edytuj
  1. a b Gavin J.S. Ross, Donald Arthur Preece, The Negative Binomial Distribution, „The Statistician”, 34 (3), 1985, s. 323, DOI10.2307/2987659, JSTOR2987659 [dostęp 2019-06-17].
  2. a b c d John D. Cook, Notes on the Negative Binomial Distribution [online].
  3. a b c Samuel Kotz, Adrienne W. Kemp, Norman Lloyd Johnson, Univariate discrete distributions, wyd. 2, New York: Wiley, 1992, s. 199–213, ISBN 0-471-54897-9, OCLC 25547480 [dostęp 2019-06-17].
  4. Morris H. DeGroot, Mark J. Schervish, Probability and statistics, wyd. 4, Boston: Addison-Wesley, 2012, s. 297, ISBN 978-0-321-50046-5, OCLC 502674206 [dostęp 2019-06-17].
  5. William H. Beyer, CRC standard mathematical tables, wyd. 28, Boca Raton, Florida: CRC Press, 1987, s. 533, ISBN 0-8493-0628-0, OCLC 16167842 [dostęp 2019-06-17].
  6. Mathworks: Negative Binomial Distribution [online].
  7. Eric W. Weisstein, Negative Binomial Distribution, [w:] MathWorld, Wolfram Research [dostęp 2019-06-17] (ang.).
  8. SAS Institute, „Negative Binomial Distribution”, SAS(R) 9.4 Functions and CALL Routines: Reference, Fourth Edition, SAS Institute, Cary, NC, 2016.
  9. Michael J. Crawley, The R Book, Wiley, 2012, ISBN 978-1-118-44896-0.
  10. a b Set theory: Section 3.2.5 – Negative Binomial Distribution [online].
  11. Randomservices.org, Chapter 10: Bernoulli Trials, Section 4: The Negative Binomial Distribution [online].
  12. Stat Trek: Negative Binomial Distribution [online].
  13. Jacqueline Wroughton, Distinguishing Between Binomial, Hypergeometric and Negative Binomial Distributions [online].
  14. Sheldon M. Ross, A first course in probability, wyd. 8, Upper Saddle River, N.J.: Pearson Prentice Hall, 2010, s. 157, ISBN 978-0-13-603313-4, OCLC 237199460 [dostęp 2019-06-17].

Bibliografia

edytuj
  • William Feller: Wstęp do rachunku prawdopodobieństwa. Warszawa: PWN, 2007, s. 159–160. ISBN 978-83-01-14684-9.