Arama

T Dağılımı (Student'in T Dağılımı)

Güncelleme: 15 Mart 2009 Gösterim: 5.924 Cevap: 0
HipHopRocK - avatarı
HipHopRocK
Ziyaretçi
15 Mart 2009       Mesaj #1
HipHopRocK - avatarı
Ziyaretçi
Student'in t Dağılımı

Sponsorlu Bağlantılar
Olasılık kuramı ve istatistik bilim dallarında t-dağılımı ya da Student'in t dağılımı genel olarak örneklem sayısı veya sayıları küçük ise ve anakütle normal dağılım gösterdiği varsayılırsa çıkarımsal istatistik uygulaması için çok kullanılan bir sürekli olasılık dağılımıdır. Çok popüler olarak tek bir anakütle ortalaması için kestirim aralıkları ve hipotez sınamaları ve iki anakütle ortalamasının arasındaki fark için kestirim aralıkları ve hipotez sınamalarında, yani çıkarımsal istatistik analizlerde, uygulama görmektedir.
t-dağılımının ortaya çıkarılmasi ilk defa 1908de Dublinde Guinness Bira Fabrikasında çalışan William Sealy Gosset tarafından yayımlanan bir makale ile olmuştur. Çalıştığı firma yazıya adının koyulmasını kabul etmeyince, bu yayının yazarı Student (öğrenci) olarak verilmişti. Sonradan t-sınamaları ve ilişkili teori R.A. Fisher tarafından geliştirilmiş ve bu dağılıma Student'in t dağılım adı popularize edilmiştir.
Çıkarımsal istatiksel çalışmalarda normal dağılımın yerine küçük orneklem bulunan problemler için kullanılmakla (ve bu nedenle normal dağılımın bir özel hali olarak yanlış intiba vermekle) beraber Student'in t-dağılımı teorik bakımdan genelleştirilmiş hiperbolik dağılımının bir özel halidir.

Dağılım ile ilgili teoremler

Farzedelim ki X1, ..., Xn istatistiksel olarak birbirlerinden bağımsız rassal değişkenlerdir ve beklenen değer μ ile dağılma σ değerleri ile normal dağılmaktadırlar.

099f51351a0745068723b888b290803c

örneklem ortalaması ve

ceea50b7bee86ec87bbd8089912665c1

örneklem varyansı olsun. Aşağıdaki ifadenin 0 ortalama ve 1 varyans ile normal dağıldığı bilinmektedir.

570eb9e60e2a17499dd3608b2de9c569

Gosset buna ilişkili olan eksensel miktarı, yani

f338ec74d591e1bcf826d953fa21b1e0

ifadesini incelemiştir. Bu Z den, kesin standart sapma ifadesi olan f4e5e9b4a606d6c79a50680bef36ef45 yerine bir rassal değişken olan 1f6d7513cfc928897ce9a5bdf7633905 konulması suretiyle değişiklik gösterir. Teknik olarak :

7298273a8dcb5f8985cffb0474a642fd

Cochran'ın teoremine göre bir ki-kare dağılımı gösterir. Gosset yazısında Tnin şu olasılık yoğunluk fonksiyonu gösterdiğini isbat atmiştir:

8c6bb36c6500840ae81f691d1ed85f5b

Burada ν n − 1 ifadesine eşittir ve Γ bir Gamma fonksiyonudur.
Bu ifade şöyle de yazılabilir:

3015169169cbe3c7e9cdfa72d85cacbf

Burada B bir Beta fonksiyonudur.
Sonradan T dağılımı t-dağılımı olarak anılmaya başlanmıştır. ν parametresi serbestlik derecesi olarak anılmaktadır. Dikkat edilirse t-dağılımı sadece ν parametresine dayanır ve (sonuç verici analiz için bilinmeyen anakütle değerleri olan) μ veya σ t-dağılımı için parametre değildirler. İşte bu gerçek (yani μ ve σ nin parametre olmaması) hem teorik bakımdan ve daha belirgin olarak pratik sonuç çıkartıcı istatistik analizi bakımından t-dağılımı istatistik bilimi için çok önemlidir.
t-dağılımının momentleri şunlardır:

98c8c042611fb307713157484506c524

Bir diğer işlemle de 0 < k < ν terimi, k çift sayı ise, Gamma fonksiyonunun özellikleri kullanılarak daha basitleştirilebilinir:

5c94cd02b9dbbfdd759e3ce80ffdc4af

Daha ileri teori

Gosset'in sonuçlarının daha da genelleştirilmesi mümkündür.
Z, standart normal dağılıma ve V ise, ν serbestlik derecesi ile ki-kare dağılımına sahip olsun, Z ve V bağımsız ise, Cochran'in teoremine göre, şu orantı

7de3d663d493ba82068a11e7a3452ee3

ν serbestlik derecesi olan bir t-dağılımı olur.
Serbestlik derecesi ν olan bir t-dağılımı için beklenen değer 0 dır ve varyans
ν/(ν − 2) eğer ν > 2. Çarpıklık 0 olur ve basıklık eğer ν > 4 ise.
6/(ν − 4) olur. Yığmalı dağılım fonksiyonu bir tamamlanmamış beta fonkiyonu olup

254ee55d1af56f5c21e83aacb6119a67

ifadesi ile verilir ve burada

beddc9ccede278a6c0fb2571ebf41f89

olur.
t-dağılımı ile F-dağılımı ilişkisi şöyle açıklanabilir; ν serbestlik derecesi olan t için kare değeri serbestlik derecesi 1 ve &nu olan bir F-dağılımıdır.
t dağılımının olasılık yoğunluk fonksiyonunu grafik şekli, ortalaması 0 ve varyansı 1 olan standart normal dağılımı grafik şekline benzerlik gösterir. Ancak t-dağılımı daha yaygındır ve biraz daha basıktır. Serbestlik derecesi büyüdükce, t-dağılımı standart normal dağılımına yaklaşım göstermektedir. Serbestlik derecesi 30 olduğu zaman t-dağılımı ve standart normal dağılım nerede ise aynı şekildedirler.
Aşağıdaki gösterimler ν serbestlik derecesi artış gösterirse t-dağılımı yoğunluk fonksiyonunun nasıl değiştiğini gösterirler. Karşılaştırma sağlamak için normal dağılım mavi çizgi ile gösterilmiştir. t-dağılımını gösteren kırmızı çizginin ν değeri artıkça normal dağılıma yakınlaşma gösterdigi açıkca gözlenebilmektedir. Eğer ν=30 t-dağılımı hemen hemen normal dağılım ile aynı olmaktadır.

Serbestlik dereceleri 1, 2, 3, 5, 10 ve 30 için t-dağılımı yoğunluk fonksiyonu (kırmızı ve yeşil).
Normal dağılımla (mavi) karşılaştırın.

240px T distribution 1df 240px T distribution 2df240px T distribution 3df 240px T distribution 5df 240px T distribution 10df 240px T distribution 30df

Özel haller


Serbestlik derecesini ν için belli değerler özellikle basit olan bazı şekilleri verirler:

ν = 1

Dağılım fonksiyonu şu olur:

196057b1c8eebd79529da0bd86d7fd98 Yoğunluk fonksiyonu şudur:

ef836fca1a54b5d041beefc86c8edd4e Bakın Cauchy dağılımı

ν = 2

Dağılım fonksiyonu şu olur:

f92fe71ba5acb2a400a941c9d32209a4 Yoğunluk fonksiyonu şudur:

2183cbe93d0805dd0a39b728810d7ce3

Student'in t-dağılımı kullanarak kestirim aralığı bulunması

Bir sayı olan A öyle şekilde seçilsin ki

b4c8908701ab6a44294d550e0d05bf96

olsun. Burada T n − 1 serbestlik derecesi bulunan bir t-dağılımı göstersin. Bu ifade


523d87cd0684d79b3fa2613d38ee91e3

ifadesi ile aynı olup A bu olasılık dağılımının 95inci yüzdebirlik değeridir veya
A = t(0.05,n − 1). Bu halde


482ba01ada856632dc5d9b10f3255d2d

olmaktadır ve bu da

12945e6e8f720cc7ec8ad44298f2d5a2

ifadesine aynen eşittir. Bunun için uç-noktaları

05fea25767aa39e3f1d36a610b586a48

olan açıklık μ için bir %90 güven aralığıdır.
Böylece eğer normal dağılım gösterdiğine epeyce emin olabilaceğimiz bir grup gözlem için ortalama değeri bulursak, t-dağılımını kullanarak bulunan ortalama için güvenlik limitlerinin (belki bir sıfır hipotez için tahmin edilmiş değerin) yahut daha önce teorik olarak tahmin edilmiş bir değerin, bu limitlerin arasında bulunup bulunmadığı araştırılabilir.
Bu sonuc Student'in t-testlerinde kullanılmaktadır. İki normal dağılımdan alınan örneklemlerin ortalamalarının farkı da normal dağılım gösterdiği için, anakütle ortalamalarının arasındaki farkın sıfıra eşit olduğuna dair bir sonuç çıkarmanın makul olup olmadığını incelemede kullanılabilir.
Eğer veriler normal olarak dağılım gösterirlerse, ortalama için tek taraflı bir (1-a)-üst güvenlik limiti (UGL), şu verilen denklemi kullanarak hesaplanabilir:


6ce264eaa78bfbbad9e72dfea6293b29

Ortaya çıkarılan UGL değeri, bir verilmiş güvenlik aralığı ve anakütle büyüklüğü için ortaya çıkacak en büyük ortalama değeri olacaktır. Diğer bir terimle, f0bfdda79888072da010991bd6b05d70 değeri bir grup gözlemler için bir ortalama olursa, bu dağılımın ortalamasının UCL1 − a değerinden daha düşük olmasının olasılığı güvenlik oranına (yani 1 − a ye) eşittir.
Uygun büyüklükteki örneklemler için t-dağılımlarının ilgili sıfır hipotezi için uygulanabileceği birkaç diğer istatistikler bulunmaktadır. Böylece t-dagılımı, yalnizca tek ortalama ve iki ortalama arasındaki fark problemleri için uygulanan sonuç verici istatistik için bir özel teknik olmadığı açıktır. Örneğin Spearman'ın sıralama korelasyon katsayısı için sıfır hipotez bu katsayının 0 olabileceği ise, bu sıfır korelasyon için, eğer örneklem büyüklüğü 20 civarında ise, yaklaşık olarak bir t-dağılımı kullanılabilir.

Güçlü parametrik modelleme

t-dağılımı çok kere veri modeli kurmak için normal dağılıma bir alternatif olarak kullanılır. Çok kere pratik hayattan gelen gerçek veriler normal dağılımın kabul ettiğinden daha fazla ağırlıklı dağılım (şişman-kuyruklu dağılım) gösterir. Bu halde klasik çözum yolu bu alışılanın çok dışında olan değerleri (dışlak değerleri) teşhis edip bunların ağırlıklarını özel işlemlerle azaltmaya çaba göstermekle yapılmaktaydı. Ancak dışlak değerlerin teşhis edilmesi (özellikle yüksek boyut gösteren veriler arasında) hiç kolay olmamaktadır. Bu nedenle bu türlü verileri modellemek için doğasal seçim konusu olan ve güçlü istatistikler için bir parametrik yaklaşım sağlayan t-dağılımının alternatif olarak kullanılması tavsiye edilmektedir.
Lange ve işbirlikcileri (1989) çesitli kullanım alanlarında ağır kuyruklu veriler için güçlü modelleme içinde t-dağılımının kullanılması sorunu ayrıntılı olarak incelemişlerdir. Gelman ve işbirlikçilerinin (2003) yazısında bir Bayes tipi yaklaşım gösterilmektedir. Serbestlik derecesi parametresi dağılımının basıklığını kontrol etmek için kullanılmakta ve bu ölçek parametresi ile korelasyon bağlantısı göstermektedir. Olabilirlilik çok sayıda yerel maksimum değerleri gösterdigi için, çok kere serbestlik derecesini ufak olan değerlerde sabitleştirmek ve bu sabit değer verilmiş gibi diğer parametreler için kestirimde bulunmak gerekmektedir. Bazı araştırıcılar bunun için en uygun değerlerin 3 ile 9 arasında olduğunu beyan etmişlerdir. Venebale ve Ripley (2002) ise 5 değerinin iyi bir seçim olacağını bildirmektedirler.

İlişkili dağılımlar

  • Eğer d715d68670abe90fd0cb3a397617df9c bir ölçeği değişmiş ters-χ2 dağılımı ve 2ef3cfee1dd80f6e69b47848a6217a8a ise bir normal dağılım gösteriyorlarsa, o halde X˜t(ν) bir t-dağılımı gösterir.
  • Eğer bb7aab6f9966c51dfcb664e93bb85b38 ve 4b208b0d267686812c20ff045e4b0637 Student'in t-dağılımı gösteriyorlarsa Y˜F(ν1 = 1,ν2 = ν) ifadesi bir F-dağılımı gösterir.
  • X˜t(ν) iken 8bcb7d76361b6a04b4fb43213346e056 ise 0ff14eaa767f160cedcc1148e84546da bir normal dağılımı gösterir.
  • Eğer X˜t(ν = 1) ise X˜Cauchy(0,1) bir Cauchy dağılımı gösterir.



Benzer Konular

13 Mart 2009 / HipHopRocK Matematik
14 Mart 2009 / HipHopRocK Matematik
14 Mart 2009 / HipHopRocK Matematik
3 Nisan 2009 / HipHopRocK Taslak Konular