Arama

Normal Dağılım (Gauss Tipi Dağılım)

Güncelleme: 14 Ağustos 2011 Gösterim: 10.711 Cevap: 1
HipHopRocK - avatarı
HipHopRocK
Ziyaretçi
12 Mart 2009       Mesaj #1
HipHopRocK - avatarı
Ziyaretçi
Normal dağılım

Sponsorlu Bağlantılar
Normal dağılım, aynı zamanda Gauss tipi dağılım olarak isimlendirilen birçok alanda pratik uygulaması olan çok önemli bir sürekli olasılık dağılım ailesinden biridir. Bu dağılım ailesinin her bir üyesi sadece iki parametre ile, tam olarak tanımlanabilir: Bunlar konum gösteren ortalama (μ aritmetik ortalama) ve ölçek gösteren varyans (σ2 "yayılım")dır.
Standart normal dağılım ortalama değeri 0 ve varyans değeri 1 olan normal dağılım ailesinin tek bir elemanıdır. Carl Friedrich Gauss bu dağılımlar grubu ile, astronomik verileri analiz etmekte iken, ilgilenmiş ve bu dağılım için olasılık yoğunluk fonksiyonunu ilk defa tanımlamıştır [1]. Bu olasılık fonksiyonunun grafik şekli bir çan gibi görüntü verdiği için çoğu kez çan eğrisi olarak da anılır.
Doğa ve davranış bilimleri içinde bulunan birçok fenomenin niceliksel modeli yapılmasında normal dağılımın kullanılmasına neden merkezsel limit teoreminin uygulanmasından doğmaktadır. Birçok psikolojik ölçümler ve fiziksel fenomen normal dağılım kullanılarak çok iyi yaklaşık olarak açıklanmaktadır. Bu fenomenlerin altında yatan mekanizmalar çoğu zaman bilinmemekte fakat normal dağılım modelinin açıklamada uygulanmaktadır. Bunun pratik yaklaşımın teorik olarak savunması ise her bir reel gözlemin oluşması için geri planda çok sayıda birbirinden bağımsız etkilerin ayrı ayrı toplam olarak katkıda bulundukları varsayımıdır.
Normal dağılım istatistik biliminin birçok alanında kullanılmaktadır. Örneğin örneklem ortalaması için örnek dağılımı, örneğin kaynağı olan anakütle için dağılımın normal olmadığı gayet açık olsa bile, yaklaşık olarak normal dağılım göstermektedir. Bunun yanında, değerleri bilinen ortalaması ve varyansı olan bütün dağılımlar içinde enformasyon entropisini maksimum yapan dağılımın normal olduğu ispat edilmiştir. Böylece örnek ortalaması ve varyansı ile özetlenen her veri için bilinmeyen kaynak dağılımı olarak normal dağılımı kullanmak gayet doğal bir yaklaşım olması çok uygun bir davranıştır. İstatistikte kullanılan dağılımlar aileleri arasında normal dağılım pratikte en çok kullanılanıdır ve birçok istatistiksel test, normal dağılımın varolduğu varsayımına dayanılarak geliştirilmiştir ve kullanılmaktadır. Olasılık kuramı içinde birkaç sürekli olasılık dağılımları ve ayrık olasılık dağılımlarının limite giden dağılımları yani rassal değişkenlerin yakınsama analizinde kullanılmaktadır.

Tarihçe

İstatistik ve olasılığın önemli dağılımlarından biri olan normal dağılım, ilk olarak 1733'te Abraham de Moivre tarafından yayınlanan bir yazıda ilk ortaya çıkartılmıştır ve 1738'de yayınlanan The Doctrine of Chances (Şanslar Doktrini) adlı kitabının ikinci baskısında p değişmemek koşuluyla n değerinin artısıyla binom dağılımının limit şekli yaklaşım olarak gösterilmiştir. de Moivre'in bu sonucu Laplace tarafından 1812'de bastırılan Analytical Theory of Probabilities (Olasılıklar İçin Analitik Teori) geliştirilmiştir ve bu sonuç şimdi de Moivre-Laplace teoremi olarak isimlendirilmektedir.
Laplace normal dağılımı incelemkte olduğu deneylemelerde hataların analizi konusunda uygulamıştır. 1805'de Legendre çok önemli olan en küçük kareler yöntemini ortaya atmıştır. Gauss, bu yöntemi 1794'ten beri kullandığını iddia etmiştir ama en kesin surette hataların normal dağılımı varsayımı ile birlikte yayınladığı eser 1809'dadır.
Çan eğrisi teriminin ilk kullanılışı Jouffret tarafından 1875'te bir bağımsız parçalardan oluşan ikideğişirli normal hakkında yazıda çan yüzeyi teriminin kullanmasına kadar götürülebilir. Normal dağılım sözcüğü ise Charles S. Peirce, Francis Galton ve Wilhelm Lexis tarafından ayrı ayrı 1875 civarlarında ortaya atılmıştır.
Bu dağılıma normal adı vermek bazen hatalı görülmektedir; çünkü bazı hallerde diğer dağılımlar pratiğe çok daha uygunluk göstermektedirler.

Karakteristikler

Bir olasılık dağılımını çeşitli şekilde matematiksel ifadelerle karakterize etmek mümkündür. Bunlar arasında göze en iyi hitap edeni olasılık yoğunluk fonksiyonu ile olur. Aynı gerçeklerin diğer türlerde karakterize edilmeleri yığmalı dağılım fonksiyonu, momentler, kümülantlar, karakteristik fonksiyon, moment üreten fonksiyon, kümülant üreten fonksiyon ve Maxwell'in teoremi vasıtasıyla da karakterize edilebilir. Bu kavramların ayrıntıları için olasılık dağılımları maddesine bakınız.
Matematiksel notasyon kullanılması ile, X rassal değeri için ortalama değeri μ ve varyansı σ² ≥ 0, olan bir normal dağılımın bulunduğu şöyle ifade edilir:

3a53382a03360033edc63fb08a592d9a

Normal dağılım için fazla kullanılmayan bir değişik parametreleme şekli de bulunmaktadır. Bu (bir üssü varyans yani 1/ σ²), değerine eşit olan kesinlik parametresi τ kullanılarak yapılır. Bunun avantajı sıfır değerine çok yakin varyans (σ²) değerlerinin böler olmalarından doğan limit problemlerinden ayrılma imkânı sağlaması ve normal dağılımı bir üstel ailesi bireyi olarak kullanılması gerektiği halde ortaya çıkar.
Bazı merkezsel limit teoremleri için (örneğin kestirimlerin asimtotik normalliği) ve Gauss tipi sürecler teorisi kullanışlı olmakla beraber, tüm olasılığı μ etrafında konsantre eden ve bir normal dağılıma benzer olarak ortalama μ ve varyans σ² = 0 değerleri bulunan Dirac ölçümü bir normal dağılım olarak kabul edilmemektedir; buna matematiksel açıklama bu ölçümde Lebesque ölçümü kurallarına göre gereken yoğunluğun bulunmamasıdır.

Olasılık yoğunluk fonksiyonu

325px Normal distribution pdf

Normal dağılım için sürekli olasılık yoğunluk fonksiyonu şu Gauss-tipi fonksiyondur:

e8cf730ec1a7587ee84403dbc1c64008

Burada σ > 0 standart sapmadır; bir reel parametre olan μ beklenen değerdir; ve

29dee61e6dcb70f30216631d8c97890b

ifadesi standart normal dağılım için yoğunluk fonksiyonudur. Standart normal dağılım μ = 0 ve σ = 1 parametreleri olan bir normal dağılımdır.
dc9632c51d1d882c947182e4bae14b72 ifadesinin reel doğru üzerindeki entegral değeridir. (Ayrıtıları için Gauss-tipi entegral maddesine bakınız.)

Olasılık yoğunluk fonksiyonunun özellikleri arasında şunlar başta gelenlerdir:
  • ortalama değer μ etrafında simetrik olma;
  • hem modun hem de medyanın ortalama μ değerine eşit olması;
  • yoğunluk eğrisinin üzerindeki, ortalamadan birer standart sapma altında ve üstündeki noktalar arasında (yani μσ ve μ + σ noktalarında) bir [[enfleksyon nokta]]sı bulunması.

Yığmalı dağılım fonksiyonu

325px Normal distribution cdf

Bir olasılık dağılımı için yığmalı dağılım fonksiyonu, bir rassal değişken X için olay olasılığının dağılımının x sayısına eşit veya daha düşük olmasına kadar değerlendirilmesiden ortaya çıkar. Normal dağılım için yığmalı dağılım fonksiyonu (yoğunluk fonksiyonunda kullanılan ayn terimlerle) şöyle ifade edilir:

f26a8934f9cfafa33024e7ade8201463

Burada, parametreleri μ = 0 ve σ = 1 olan standart normal dağılımı için yığmalı dağılım fonksiyonu, Φ, ile ifade edilmiştir ve bu fonksiyon şudur:

ee6afc55216c30d88141b7036ac08fc1

Standart normal yığmalı dağılım fonksiyonu ayni zamanda hata fonksiyonu adı verilen bir özel fonksiyon ifade edilebilir. Hata fonksiyonu şöyle ifade edilir:

003dabb870f6a1fc0521a85000ea8090

Böylece hata fonksiyonu terimleri ile standart normal dağılımı için yığmalı dağılım fonksiyonu şöyle yazılır:

3537f96b6dfa850f2e6fcb765a03c28c

Standart normal dağılım için yığmalı dağılım fonksiyonunun tamlayıcı fonksiyonu (yani Q(x) = 1 − Φ(x)), çok kere Q-fonksiyonu olarak isimlendirilir ve özellikle bu kavram mühendislik kitaplarında büyük önemle yer almaktadır.
Standart normal yığmalı dağılım fonksiyonunun tersine kuantil fonksiyonu adı verilir. Bunun formülünü ifade için önce şu ters hata fonksiyonu bulunur:

216bd2d30bee874f23df5025501fc11a


ve bu fonksiyon kullanılarak şu ters yığmalı dağılım fonksiyonu ortaya çıkartılır:

8760685b66c896427f92e5252c13f4fe

Bu kuantil fonksiyonuna bazan probit fonksiyonu adı da verilir. Bir probit fonksiyonu için bir elemanter basit entegral bulunamayacağı matematiksel olarak ispat edilmiştir. Normal dağılım için çok iyi sonuçlar verdiği anlaşılan yaklaşık fonksiyonlar ve yöntemler ortaya çıkarılmıştır. Bunlar arasında sayısal entegrasyon, Taylor serileri, asimtotik seriler ve devam eden kesirler yöntemlerinin kullanılması anılabilir.

Yığmalı dağılım fonksiyonu için kesin alt ve üst sınırlar

Büyük değerde bir x sayısı için standart normal dağılım yığmalı dağılım fonksiyonun cc57e4f204394489bae179e29e37342e değerinin bire, 1, yakınsalandığı ve 718022d3a4e16e2cc9bcb0fa4af44b76ın ise sıfıra,0, yakınsaladığı aşikardır. Yoğunluk 455136e0a43e7634fcc7d2904c0612d9 terimleri kullanılarak, şu basit üst sınır

e78b5da834658b5e515529f0dc9f1d2e

ifadesi yeterlidir.
Yerine koymak suretiyle entegresyon yöntemi kullanarak, üst sınır şöyle ortaya çıkartılabilir:

f935cea14742da939222bbafe1276d3a

Aynı şekilde 4c477cf2ebb1709861de34160880d771 ifadesini ve bölüm kuralını kullanarak

3b20ea237bc27a24b461d75d45e9b79a

ifadesi ortaya çıkartılır. Bunun 72d8d9eac77ab922c98663247b1f5ee3 terimleri ile çözümlenmesı yukarıda ifade edilen üst sınırı verir.

Üreten fonksiyonlar

Moment üreten fonksiyon

Genel olarak moment üreten fonksiyon, exp(tX) için beklenti olarak tanımlanır. Bir normal dağılım için moment üreten fonksiyonu şu olur:

ec3e32bd3a987126f3c3b40e239fa768

Bu ifade, tanımda verilen üssel değerin, karesini tamamlamak yöntemi dönüştürülmesi ile elde edilmiştir.

Kümülant üreten fonksiyon

Kümülant üreten fonksiyon, moment üreten fonksiyonun logaritmasidir:
g(t) = μt + σ²t²/2. Bu t terimleri ile bir kuadratik polinom olduğu için yalnız ilk iki kümülant için sıfır olmayan değer bulunabilinir.

Karakteristik fonksiyon

Karakteristik fonksiyon, i sanal birim ile gösterilen exp(itX) ifadesinin beklentisi olarak tanımlanmıştır. Bu nedenle karakteristik fonksiyon, moment üreten fonksiyon içindeki t teriminin it ile değiştirilmesi ile elde edilir.
Bir normal dağılımı için karakteristik fonksiyonu şudur:

37e8462c5cc0193558226a94aa4f2a03

Özellikleri

Normal dağılımın şu özellikleri vardır:
  1. Eğer X˜N(μ,σ2) ve a ile b reel sayılar ise, o zaman aX + b˜N(aμ + b,(aσ)2) (Beklenti ve varyans maddelerine bakınız.).
  2. Eğer eac9f1d639c15276cf22d85ff11a7b6a ve 2e26b49dbd44bb0b4650744a65f83097 ifadeleri bağımsız normal rassal değişkenler ise, o halde -
    • Bunların toplamı 81fcbdfdcfb20f9af35db82829da43b0 normal dağılım gösterir (proof). Daha ilgi çekici olarak bunun tersi de geçerlidir: Eğer iki bağımsız rassal değişkenlerin toplamı normal dağılım gösteriyorsa, her iki değişken de ayrı ayrı normal dağılım gösterirler. Bu Cramer'in teoremi olarak isimlendirilmiştir.
    • Bunların arasındaki fark şu şekilde normal dağılım gösterir: Yani 8b22e1778fd0e4548eda237bad71aa44.
    • Eğer X ve Y rassal değişkenlerinin varyansları birbirine eşitse, U (toplam için rassal değişken) ve V (fark için rassal değişken) birbirinden bağımsızdırlar.
    • Kullback-Leibler ayırımı şöyle ifade edilir 3343df5d9bc94fa8ced3d0f921566c57
  3. Eğer 1a368150e2171639da10166086a11bd3 ve 9d49cf31b33111492ae2884c760231e9 birbirinden bağımsız normal rassal değişkenler ise; o zaman
    • Bunların çarpımı, yani XY, p ile şöyle ifade edilen yoğunluk fonksiyonu olan özel bir dağılım gösterir b009e9a11285d981783c4467debe66e0 burada K0 bir değiştirilmiş ikinci derecede Bessel fonksiyonudur.
    • Bunların birbirine oranı X / Y˜Cauchy(0,σX / σY) şekilde Cauchy dağılımı gösterir. Böylece bu Cauchy dağılımı özel bir tip orantı dağılımı olur.
  4. Eğer e8eacc087b64e56391a3b8ddf4216d77 bir seri bağımsız standart normal değişkenler ise, o zaman bunların toplamı, yani 4b82e42397459f7359433c6673601109 n serbestlik dereceli bir ki-kare dağılımı gösterir.

Normal rassal değişkenlerin standart forma dönüşümleri

Yukarıda verilen 1. özellik sonucu olarak tüm normal rassal değişkenleri standart normale dönüştürmek imkânı vardır: Eğer X ~ N(μ,σ2) ise, bu halde

f7aa6c4c6f1dc137bb57a719ca20edb0

bir standart normal rassal değişken olur; yani Z ~ N(0,1).
Bunun bir önemli sonucu yığmalı olasılık fonksiyonun bir genel normal dağılımı olmasıdır:

7b0e968a9422be89bc5054772359a82a

Tersini ele alırsak, eğer Z bir standart normal dağılım ise, yani Z ~ N(0,1) ise o halde
X = σZ + μ ifadesi de beklenen değeri μ ve varyansı σ2 olan bir normal rassal değişkendir.
Standart normal dağılım için çeşitli tablolar bulunmaktadır. Çok kere bu tablolar yığmalı dağılım fonksiyonu, Φ şeklindedirler. Diğer normal dağılımlar basit bir dönüşüm ile standart normal dağılıma dönüştürülüp bu tablolardan biri kullanılabilir.

Momentler

Normal dağılım için ilk birkaç momentleri şunlardır:
Sayı Ham moment Merkezsel moment Kümülant 0 1 1
1 μ 0 μ 2 μ2 + σ2 σ2 σ2 3 μ3 + 3μσ2 0 0 4 μ4 + 6μ2σ2 + 3σ4 3σ4 0 5 μ5 + 10μ3σ2 + 15μσ4 0 0 6 μ6 + 15μ4σ2 + 45μ2σ4 + 15σ6 15σ6 0 7 μ7 + 21μ5σ2 + 105μ3σ4 + 105μσ6 0 0 8 μ8 + 28μ6σ2 + 210μ4σ4 + 420μ2σ6 + 105σ8 105σ8 0 Normal dağılım için ilk iki kümülant dışındaki kümülant değerler hep sıfıra eşittir.
Daha büyük sayıya bağlı (2k derecede ve μ = 0) merkezsel momenti şu formül kullanılarak elde edilebilir:

87be2f8cfc6b14cb59d6b1988c6a5014

Normal rassal değişirler için üretici değerler

Bilgisayarla simulasyon yapılmakta iken, çok kere bir normal dağılım için değerlerin üretilmesi gerekir. Bunun için birkaç değişik yöntem kullanılabilir. En basit şekilde bir standart normal dağılım yığmalı olasılık fonksiyonunun tersini almak suretiyle elde edilir. Daha etkin yöntemler de geliştirilmiştir.
Çok popüler olarak kullanılan yöntem Box-Muller dönüşümüdür. Box-Muller algoritması kullanılması, [0,1] arasında bulunan sürekli tekdüze dağılım gösteren iki sayı a ve b ile başlar; bunlardan şu formüllere göre iki standart normal dağılım gösteren c ve d sayıları şöyle elde edilir:

e612616fbcba1c6bb0ee280654d03c18 b73902a901286a4b9840b89ce6ad87ff

Bunların elde edilmesi, dönüşümün bazında (yukarıda 4. özellikte gösterilen) 2 serbestlik derecesi olan bir ki-kare dağılımının kolayca üretilebilinen bir üstel rassal değişken olması gerçeğine dayandırılır.
Halen en etkin şekilde normal dağılımı simulasyonu için, ziggurat algoritması kullanılmaktadır.

Merkezsel limit teoremi

325px Normal approximation to binomialsvg

n=48 ve p=1/4 parametreleri olan bir binom dağılımının olasılık kütle fonksiyonun yaklaşımı olarak μ = 12 ve σ = 3 parametreli bir normal dağılımın olasılık yoğunluk fonksiyonunun gösterinimi.

Sonlu varyansları olan bağımsız ve aynı dağılımlı rassal değişkenler ve benzeri koşullar altında, büyük sayıda rassal değişkenlerin toplamı yaklaşık olarak normal dağılım gösterir. Bu merkezsel limit teoremidir.
Merkezsel limit teoreminin pratik önemi normal yığmalı dağılım fonksiyonunun bazı diğer yığmalı dağılım fonksiyonunun yaklaşıkı olarak kullanabilmesindedir. Örneğin
  • Parametreleri n ve p olan bir binom dağılım için, eğer büyük değerlerde, ama 0 veya 1e çok yakın olmayan n ve p bulunursa bir normal dağılımına yaklaşmış oldukları kabul edilebilir. (Bazı istatistik kitapları bu yaklaşımın np ve n(1 − p değerlerinin her ikisi için en aşağı 5 olması halinde uygulanmasını ve eğer 5 olurlarsa bir devamlılık doğrulaması kullanılmasını tavsiye ederler.)
    Eğer yaklaşık olarak normal dağılımı kullanılırsa bunun parametreleri μ = np ve σ2 = np(1 − p) olarak bulunması gerekir.
  • Eğer λ'nin değeri büyük ise, λ parametreli [[Poisson dağılımı] için yaklaşık olarak normal dağılım kullanılabilir ve bu halde yaklaşık normal dağılımın parametreleri μ = σ2 = λ olarak bulunur.
Bu yaklaşımların yeter derecede doğru olup olmayacağı, sonuçların ne maksatlarla kullanacaklarına ve normal dağılımın yakınsalama oranına bağlıdır. Bu tip yaklaşımlar dağılımın kuyruk değerlerine yaklaştıkça gittikce daha çok hatalı olacaklardır. Berry-Essen teoremi yığmalı dağılım fonksiyonu için yaklaşım hatası için genel üst sınırları gösterir.

Sonsuz olarak bölünebilme

Normal dağılımlar sonsuz olarak bölünebilen olasılık dağılımlarıdır: Bir ortalama değeri μ, bir varyans değeri σ 2 ≥ 0, ve bir doğal sayı değeri n verildiği zaman, n bağımsız rassal değişkenlerin toplamı olan 'X1 + . . . + Xn' şu normal dağılımı gösterir:

09be8f8bffbfafdaaa5618c76ad0ed9b

(Daha fazla ayrıntı için matematik tümevarım ile normal dağılım gösteren rassal değişkenlerin toplamı maddelerine bakınız.)

Dengelilik

Normal dağılımlar kesinlikle dengelilik gösteren olasılık dağılımlarıdır.

Standart sapma ve güvenme açıklıkları

325px Standard deviation diagramsvg

Koyu mavi ortalamadan bir standart sapma daha küçüktür. Bir normal dağılım için bu (koyu mavi) eğrinin altında kalan alan, toplam alanın %68'ini kapsar. Ortalamadan iki standart sapma aralığında noktalar için eğrinin altında kalan alan (açık, orta ve koyu mavi alan) toplam alanın %99.7sini kapsar.

Bir normal dağılımdan seçilmiş değerlerin %68i ortalama olan μ'in bir standart sapma σ > 0 uzaklığındaki noktalar arasındadır; değerlerin neredeye %97si μ'den iki standart sapma uzaklıklar aralığında; ve %99,7 üç standart sapma uzaklıklar aralıgında bulunur. Buna empirik kural veya 68-55-99.7 kuralı adı da verilir.
Daha doğru bir kesin ifadeyle μ − nσ ve μ + nσ arasındaki çan eğrisinin altında kalan alanın yığmalı normal dağılım fonksiyonu şöyle verilir:

eda145b29049a270ea9ac8a93852f66c

Burada erf [[hata fonsiyonu] dur. Ondalık sayılarla 12 basamak kullanilarak 1-, 2- .. 6- sigma noktalarına kadar değerler soyle verilir:

a957404c96e59f1746f97ab668c8e1f8 f9be6bb9366eb6957592702f1aeb8852
1 0.682689492137
2 0.954499736104
3 0.997300203937
4 0.999936657516
5 0.999999426697
6 0.999999998027

İkinci tablo çan eğrisinin altındaki alan için değerlerin bulunmasını sağlamak üzere, çok zaman kullanılan katsayı değerlerindeki, sigma çarpanlarinin ters ilişkisini gösterir. Normal dağılım gösteren veya asimtotda normal olan kestirimler için belirtilmiş olan seviyelerde (asimtotik) güvenlik aralığını saptamak için bu değerler çok kullanışlıdır:

fa67ac81cc20ebe494d103dbaf82aa86 a957404c96e59f1746f97ab668c8e1f8

0.80 1.28155
0.90 1.64485
0.95 1.95996
0.98 2.32635
0.99 2.57583
0.995 2.80703
0.998 3.09023
0.999 3.29052

Bu tabloda sol taraftaki sütun bilinen bir aralığa düşecek değerlerin oranı verilmekte ve soldaki n sütunu ise aralığın genişliğinin kaç tane standart sapma birimini ihtiva ettiğini göstermektedir.

Üstel ailesi şekli

Normal dağılım bir iki parametreli üstel ailesi elemanıdır. İki tane doğal parametresi μ ve 1/σ2

olur ve doğal istatistikleri X ve X2 dir. Kanonik şeklinin parametreleri 66df9aac994e6a8ea9cc06b1cc0c776f ve 3fe28694087012d2ba28ab97f4a6b418 olup yeterli
istatistikleri 350173c119b3d463b62e0b4652b236d4 ve 5f833f90ae9d575818f9fa4aed61234e olur.

İlişkili dağılımlar

  • Eğer 82394d64f910992fbd59654ae09d1016 ise ve burada X˜N(0,σ2) aveY˜N(0,σ2) iki bağımsız normal dağılımlarsa, o halde R˜Rayleigh(σ2) bir Rayleigh dağılımı olur.
  • Eğer f866c1f5f0db1418fb7c8adae6043808 ise ve burada 3266063c0c346f762ca500127846e0fa için Xk˜N(0,1) ise ve bunlarin hepsi
  • bağımsızlarsa; o zaman 263b03672200fc829ba95f4651f1607d serbestlik derecesi ν olan bir ki-kare dağılımı olur.
  • Eğer iki bağımsız normal dağılımlı XN(0,1) ve XN(0,1)
için Y = X1 / X2 ise, o zaman Y˜Cauchy(μ = 0,θ = 1) bir Cauchy dağılımıdır.
  • Eğer Y = eX ve X˜N(μ,σ2) ise, o zamanY˜Log-N(μ,σ2) bir log-normal dağılımıdır.
  • Lévy çarpık alpha-durağan dağılımına ilişki : Eğer
  • 6a3dd2cce762e7581ae9d1e652943699 ise o halde X˜N(μ,σ2).
  • Kesilmiş normal dağılımı. Eğer 4b5014ecb9e82cc8fcb1fe51d29a3b1b o halde Xi alttan A'da ve üstten B'de kesmek suretiyle, ortalaması 338ea5f5da32ea4e8c66715f472d014d olan bir rassal değişken ortaya çıkarılır.
Burada

d585042effa2995bbdde4f98076d6e4f

olur ve 3538eb9c84efdcbd130c4c953781cfdb bir standart normal rassal değişken için bir olasılık yoğunluk fonksiyonu olur.
  • Eğer X normal dağılım gösteren bir rassal değişken ise ve Y = | X | ise, o halde Y bir katlanmış normal dağılım gösterir.

Betimsel ve çıkarımsal istatistikler

Puanlar

Puan verme çeşitlerinin çoğu normal dağılıma bağlı olarak ortaya çıkarılmıştır. Değişik puanlama yöntemleri arasında yüzbirliklerle sıralamalar, normal eğri eşitliklikleri, staninler, z puanı ve T-puanlaması vb. sayılabilir. Davranışsal bilimlerde kullanılan birçok istatistiksel yordamlar puanlarin normal dağılım gösterdiği varsayımına dayanılarak geliştirilmiştir. Örneğin çok kişiye uygulanan imtihan veya zeka testleri için bir çan eğrisine dayanan not verilip imtihan veya test sonuçlarının gruplanması veya sıralanması imtihan veya test notlarının normal dağılım gösterdiği varsayımına dayandırılır.

Normallik sınamaları

Normallik sınamaları, verilmiş bir veri dizisinin normal dağılıma benzerliğinin incelenmesidir. Bu sınamalarda sıfır hipoztez veri dizisinin normal dağılıma benzer olmasıdır. Bu nedenle normal olmayan veri için yeter derecede küçük bir p-değeri (yani genellikle %0,05den veya 0,01den küçük) ortaya çıkacak ve sıfır hipotez olan veri dizisinin normal dağılıma benzerliği hipotezinin ret edilmesine neden olacaktır.
  • Kolmogorov-Smirnov sınaması
  • Lilliefors sınaması
  • Anderson-Darling sınaması
  • Ryan-Joiner sınaması
  • Shapiro-Wilk sınaması
  • Normal olasılık gösterimi (rankit gösterimi)
  • Jarque-Bera sınaması
Parametrelerin kestirimi

Parametrelerin maksimum olabilirlik kestirimi

Bir düşünce denemesi olarak, bir seri normal dağılım için
e8eacc087b64e56391a3b8ddf4216d77 ifadesinin herbiri diğerinden bağımsız olduğu düşünülsün. Herbir ifade beklentisi μ ve varyansı σ2>0 olan normal dağılımlar göstermektedir. İstatistikçiler bu n rassal değişkenin gözümlenen değerlerinin normal dağılım gösteren bir anakütleden ortaya çıkan bir n büyüklüğüde bir örneklem olduğunu kabul etmektedirler. Bu örneklemden gözlenen değerlere dayanarak "anakütle ortalaması" μ ve "anakütle standart sapması" kestirimcilerini bulmak arzu edilmektedir. Bu n sayıdaki bağımsız rassal değişken için sürekli ortak olasılık yoğunluk fonksiyonu şöyle verilir:

1ef5fd09c4942300b6edf89167412ab6
μ
ve σ fonksiyonlari olarak, X1, ..., Xn gözlemlerine dayanan olabilirlilik fonksiyonu şudur:

9661f489fcefc8c08551fadfa03f1108

Burada C>0 herhangi bir sabittir. Bunun genellikle X1,...,Xn değişkenlerine bile dayanarak bağlandığı kabul edilmektedir; ama hesaplanan parametrelere göre log-olabilirlilik fonksiyonlarin kısmî türevleri bulunduğu zaman sabit oldukları için elimine edilmektedirler.
Maksimum olabilirlilik yöntemine göre olabilirlilik fonksiyonu maksimize eden μ ve σ değerleri, teorik anakütle parametreleri olan μ ve σ için kestirim oldukları kabul edilmektedir. Genel olarak iki değişkenli bir fonksiyonun maksimum değerini hesaplanmaktayken kısmî türevler kullanılır. Ancak burada maksimum hesaplama daha kolaylaşmaktadır çünkü olabilirlilik fonksiyonunu maksimize eden μ değeri bulunmakta iken σ anakütle parametresi olan σya bağımlı olmayan bir sabittir. Bundan dolayı ilk olarak μ değeri bulunur; bu değer olabilirlilik fonsiyonundaki μ değişkeni yerine konulur ve bu yeni tek değişkenli fonksiyonu maksimize eden σ değeri bulunur.
Olabilirlilik fonksiyonunun şu toplam ifadesinin bir azalan fonksiyonu olduğu bilinmektedir:

dcdb239464bff0c2e7116c297542fd6f

Bu toplam ifadeyi minimize edecek μ değerini bulmak istenmektedir. Şu ifade

099f51351a0745068723b888b290803c

n
gözleme dayanan bir "örneklem ortalamasıdır. Böylece

0e373807170105a24cfaaa4742d92c46
Bu ifadede so terim μ değişkenine bağlıdır ve bu terimin minimum değeri şöyle bulunur:

c7d6e35b614f7bd59400bddb5dbc7c5a İşte bu ifade n sayıda X1,....,Xn gözlem kullanarak μnun maksimum olabilirlilik
kestirimidir. Sonuç olarak

185f223ff69fcf06c2d9a472cfcb8d32

elde edilir. Olabilirlilik fonksiyonunun logaritmasi olan log-olabilirlilik fonksiyonu matematik notasyona göre küçük harflerle (yani 334ce9eb79df1178b0380461c9eaa09e, yazılması alışılagelmiştir.

ca0731f310bc4a80c60ae04c46bf97df

Sonra

3b349f10f4c462a40cc60c7020090276

olur. Bu türev, σ2 değeri 0 ile

f6162edb59042594e6066c09affff7bb

değeri arasında ise pozitif olur; bu değere eşitse türev sıfıra eşittir; bu değerden büyükse türev negatif olur.
Bu analizin sonucu olarak bu bulunan artıklar n gözlemli örneklem için σ2 bir maksimum olabilirlilik kestirimidir ve bunun kare kökü σ için maksimum olabilirlilik kestirimdir. Bu kestirim yani 8dea9ba052f2685db2327ec200daa5b8 bir yanlı kestirimdir. Alışılagelen yansız kestirim n/(n − 1) çarpı bu kestirimdir. Ancak yanlı maksimum olabilirlik kestirimi için ortalama hata karesi yansız kestirimden daha küçüktür.

Parametrelerin yansız kestirimi

Bir örneklemden elde edilen anakütle ortalamasının maksimum olabilirlilik kestirimcisi, anakütle ortalamasının yansız kestirimcisi olarak bilinir. Aynı şekilde anakütle ortalaması önsel olarak bilinirse, varyans için maksimum olabilirlilik kestrimcisi de yansız kestirimcidir. Ancak eğer elimizde bir örneklem bulunuyorsa ama bu örneklemin geldiği anakütlenin ne ortalamasının ne de varyansının değerlerin bilmiyorsak, anakütle varyansının yansız kestrimicisi, σ2, şöyle ifade edilir:

0debce5d084f617b4cd82f2278eef7fd

Eğer tüm Xi birbirinden bağımsız ve aynı şekilde dağılım gösterirlerse, bu "örneklem varyansı" bir Gamma dağılımı gösterir:

9ba72155ecbf48109d97b91641e07dd7


Daisy-BT - avatarı
Daisy-BT
Ziyaretçi
14 Ağustos 2011       Mesaj #2
Daisy-BT - avatarı
Ziyaretçi

Gauss Dağılımı

Sponsorlu Bağlantılar

X sürekli seçkisiz değişkeninin olasılık yoğunluk fonksiyonu "çan eğrisi" denilen grafikle temsil edilebildiğinde X'in sahip olduğu dağılım. Normal dağılım da denir.

X'in olasılık yoğunluk fonksiyonu ortalama (_) ve varyansa (_2) bağlı üstel bir fonksiyondur ve x=_ doğrusuna göre simetriktir. Ayrıca bu noktada maksimum değerine erişir. Ortalama ve varyansı bilinen bir seçkisiz değişkenin a ve b değerleri arasında bulunma olasılığı, fonksiyonun bu aralıkta integrasyonuyla bulunur. Fakat bu integralin hesabı zor olduğu için, uygulamada Z=(x-_)/ _ dönüşümü yapılarak "standart normal dağılım"a geçilir ve değerler, hazırlanmış cetvellerden bulunur. Standart normal dağılımın ortalaması sıfır, varyansı 1'dir.

MsXLabs.org & Morpa Genel Kültür Ansiklopedisi


Benzer Konular

13 Mart 2009 / HipHopRocK Matematik
19 Haziran 2009 / ener X-Sözlük