Täthetsfunktion normalfördelning

Hem / Historia, Vetenskap & Forskning / Täthetsfunktion normalfördelning

täthetsfunktion normalfördelning

Vi tittar på några exempel.

Exempel 1, sannolikhetsfördelning för kast med en tärning

Vi tittar på ett exempel som inte är en diskret sannolikhetsfördelning

Exempel 2, utifrån data från SMHI kan vi skapa en sannolikhetsfördelning för slumpvariabeln x nederbörd i mm och y-axeln motsvarar sannolikheten, likt föregående exempel.

Notera att summan av sannolikheterna, som vi oftast betecknar P (från engelskans probability), för alla utfall vid slumpförsök är alltid 1 eller i procent 100%.

Då ligger 95% av komponenterna mellan 100±2×2 = 96-104 mm.

Vanliga misstag

❌ Anta normalfördelning utan kontroll

Många fördelningar är skeva eller har tyngre svansar än normalfördelningen

Exempel: Inkomster är ofta log-normalfördelade, inte normalfördelade

❌ Förväxla standardavvikelse med varians

Standardavvikelsen σ är kvadratroten ur variansen σ²

Exempel: N(0,4) har σ=2, inte σ=4

Tillämpningar

Kvalitetskontroll

Mätdata och produktspecifikationer följer ofta normalfördelning

Exempel: Kontrollkort i tillverkning baseras på normalfördelning

Hypotestestning

Många teststatistiker är approximativt normalfördelade

Exempel: z-test och t-test baseras på normalfördelning

Övningar

X ~ N(50, 25).

Beräkna P(45 < X < 55).

IQ följer N(100, 225). Lagen om total varians

  • Oberoende slumpvariabler
  • Kovarians och korrelation
  • Multinomialfördelning
  • Kontinuerlig tvådimensionell likformig fördelning
  • Bivariat normalfördelning. I tidigare exemplet med nederbörd skulle täthetsfunktionen bli den räta linjen \(f(x) = -0,000078125x+0,0125.\)

    Normalfördelningen känner vi igen från Matte 2.

    Beräkna hur stor sannolikheten att en slumpvis vald person i landet är mellan 170 och 180 cm lång.

    Detta intervall utgör medelvärde \(\pm\) 1 standardavvikelse och från våra tidigare kunskaper från Matte 2 och bilden ovan kan vi direkt veta att sannolikheten utgör blocken \(34,1%+34,1%=68,2%\), men vi vill bekräfta detta med hjälp av täthetsfunktionen, som vi för denna normalfördelning sätter in \(\mu = 175\) och \(\sigma = 5\)

    $$f(x) = \frac{1}{5 \sqrt{2\pi}} e^{\frac{-1}{2}{\left(\frac{x-175}{5}\right)}^2}$$

    Vi kan nu beräkna sannolikheten \(P(170 \leq x \leq 180)\) med integralen

    $$ P(170 \leq x \leq 180) = \int_{170}^{180} \frac{1}{5 \sqrt{2\pi}} e^{\frac{-1}{2}{\left(\frac{x-175}{5}\right)}^2} \: dx \approx 0,682$$

    Integralen löser vi med hjälp av digitala verktyg och bekräftar att sannolikheten var 0,682 = 68,2%.

    Nästa exempel kan vi demonstrera hur täthetsfunktionen kan hjälpa oss beräkna sannolikheten för andra intervall än de som utgörs av en eller flera standardavvikelser.

    Exempel 4: I en trädgård växer äppelträd och deras höjd är normalfördelad med medellängd \(\mu =  169\) cm och standardavvikelsen \(\sigma = 13\) cm.

    Ändlighets korrektion

  • Poisson-fördelning
  • Geometrisk fördelning
  • Negativ binomialfördelning
  • Kontinuerlig likformig fördelning
  • Exponentialfördelning
  • Normalfördelning
  • Standardiserad normalfördelning
  • Lognormalfördelning
  • Gammafördelning
  • Cauchy-fördelning
  • Simultana fördelningar
  • Marginalfördelning
  • Betingad fördelning
  • Betingad väntevärde.

    Alltså kan vi beräkna sannolikheten att en slumpvariabel ligger inom ett intervall.

    Vi tittar på ett exempel där vi kan bekräfta att det är 68,2% chans att ett värde ligger plus/minus en standardavvikelse från medelvärdet i en normalfördelning.

    Exempel 3: Längden på personer i land är normalfördelad och har medelvärde 175 cm och standardavvikelsen är 5 cm.

    Vi påminner oss om kurvan som normalfördelningen utgör ser ut så här:

    Normalfördelningens täthetsfunktion är

    $$f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{\frac{-1}{2}{\left(\frac{x-\mu}{\sigma}\right)}^2}$$

    där \(\mu\) (grekisk bokstav som heter my) är medelvärdet och \(\sigma\) (grekisk bokstav som heter sigma) är standardavvikelsen.

    Täthetsfunktion är den funktion \(f(x)\) som beskriver sannolikhetsfördelningen och med hjälp av denna integral

    $$\int_a^b f(x) \: dx$$

    så kan vi svara på hur stor sannolikhet det är att en slumpvariabel x ligger i intervallet \(a \leq x \leq b\).

    Vi kommer mer specifikt lära oss hur vi kan integraler ska hjälpa oss att göra beräkningar inom sannolikhet med fokus på sannolikhetsfördelning. Alla normalfördelningar kan transformeras till denna genom standardisering Z = (X-μ)/σ.

    68-95-99.7 regeln

    För normalfördelningen gäller att ungefär 68% av värdena ligger inom ±1σ från μ, 95% inom ±2σ, och 99.7% inom ±3σ.

    Kvalitetskontroll

    En maskin tillverkar komponenter med längd N(100, 4) mm.

    Täthetsfunktionen för de normalfördelade äppelträden blir

    $$f(x) = \frac{1}{13 \sqrt{2\pi}} e^{\frac{-1}{2}{\left(\frac{x-169}{13}\right)}^2}$$

    och vi kan sätta upp integralen för att beräkna sannolikheten

     $$ P(180\leq x \leq 200) = \int_{180}^{200} \frac{1}{13 \sqrt{2\pi}} e^{\frac{-1}{2}{\left(\frac{x-169}{13}\right)}^2} \: dx$$

    Hur beräknar vi denna funktion med hjälp av digitala hjälpmedel?

    Vi visar med GeoGebra. Fullständigt oberoende.

  • Lagen om total sannolikhet
  • Bayes sats
  • Apriori- och aposteriorisannolikheter
  • Dragning med återlägning
  • Dragning utan återlägning
  • Slumpvariabler
  • Diskreta slumpvariabler
  • Sannolikhetsfunktion
  • Kontinuerliga slumpvariabler
  • Täthetsfunktion
  • Fördelningsfunktion
  • Väntevärde och dess egenskaper
  • Median, kvartil, kvantil och percentil
  • Varians och dess egenskaper
  • Standard avvikelse
  • Variationskoefficient
  • Markovs olikhet
  • Chebyshevs olikhet
  • Tre-sigma regeln för normalfördelning
  • Standardiserad slumpvariabel
  • Indikatorvariabel
  • Bernoulli-fördelning
  • Diskret likformig fördelning
  • Binomialfördelning
  • Hypergeometrisk fördelning.

    Standardisering gör att alla normalfördelningar kan behandlas enhetligt. Dess karakteristiska klockform är så vanlig att den kallas 'den normala fördelningen'. Beräkna sannolikheten att ett slumpmässigt valt träd, x har en höjd som ligger på intervallet \(180 \leq x \leq 200\).

    Eftersom intervallet \(180 \leq x \leq 200\) inte utgörs av olika multiplar av 13 från 169 måste vi använda täthetsfunktionen.

    Sannolikhetsteori & Statistik

    Normalfördelningen är matematikens superstjärna - den dyker upp överallt, från IQ-tester till kvalitetskontroll på fabriker.