Arama

İstatistik - Tek Mesaj #2

ThinkerBeLL - avatarı
ThinkerBeLL
VIP VIP Üye
8 Eylül 2009       Mesaj #2
ThinkerBeLL - avatarı
VIP VIP Üye
İstatistik
MsXLabs.org & Temel Britannica

İstatistik, sayısal bilgilerin işlenmesi ve yorumlanmasıyla ilgili yöntemlerle ilgilenen matematik dalıdır. İstatistikçi topladığı sayısal bilgileri amacına uygun olarak düzenleyip özetler; sonra bu bilgileri çözümler ve genellikle belirli teknikler kullanarak yeni bilgiler elde etmeye çalışır.
Bilgi toplamanın bir yolu kamuoyu yoklamasıdır. Örneğin, bir genel seçimde verilecek oyların önceden kestirilmesi için kamuoyu yoklamasına başvurulur. Bir kamuoyu yoklamasında toplumun tümünün içinden alınan birkaç bin kişilik bir örneğe sorular sorulur. Alınan yanıtlardan toplumun tümünün eğilimleri kestirilmeye çalışılır. Özellikleri ya da eğilimleri araştırılacak olan kümeye nüfus, onun içinden seçilen altkümeye örneklem denir. Kamuoyu yoklaması için istatistikçiler önce bir "rasgele örneklem" seçer. Nüfusun her öğesinin örnekleme girme olasılığının eşif olduğu bu rasgele örneklem, yeterince büyükse toplumun bütün kesimlerini temsil eder. Kamuoyu yoklaması sonuçlarının ne kadar doğru çıkacağını, başka bir deyişle doğru çıkma olasılığını saptamaya yarayan istatistik yöntemleri vardır.

İstatistikçilerin ellerindeki verileri nasıl çözümlediğini bir örnekle görelim.
25 öğrenci bulunan bir sınıfta matematik ve İngilizce sınavlarında alınan notlar aşağıda gösterilmiştir. Her öğrencinin notlarını gösteren rakam çiftinden ilki matematik, ikincisi İngilizce notunu göstermektedir.




Bu bilgileri grafikle gösterebiliriz. Matematik notlarının sıklık grafiğini çizelim. Grafikteki her sütunun uzunluğu, belirli bir notu alan öğrenci sayısını gösterir. Örneğin iki öğrencinin 3 aldığı, altı öğrencinin notunun da 5 olduğu grafikte görülmektedir.
Öğrencilerin matematik notlarının sıklık grafiği.


Benzer bir grafiği İngilizce notları için de çizebiliriz.
Öğrencilerin İngilizce notlarının sıklık grafiği.


Çizdiğimiz bu grafiklerden yararlanarak iki sınavın sonuçlarını karşılaştırabiliriz. Acaba öğrencilerin bir sınavdaki başarısı öbüründekinden daha fazla mıdır? Çizdiğimiz grafiklere bakarak bunu söylemek kolay değildir. Matematik notlarının İngilizce notlarına göre daha geniş bir aralığa dağıldığı grafiklerde çok açık olarak görülüyor. Gerçekten de matematik notlan, en düşük not olan 2 ile en yüksek not olan 10 arasında, dokuz notu kapsayan bir aralığa yayılmıştır. İngilizce'de alınan notlar ise 3 ile 7 arasındaki beş notluk bir aralık içinde yer almaktadır.
Matematikte daha çok öğrencinin yüksek not almış olduğu grafikte görülüyor. Bu görünüm doğrudur, ama biz sınıfın bir bölümünü değil tümünü değerlendirmeye çalışıyoruz. En çok sayıda öğrencinin aldığı notun matematikte 5, İngilizce'de 6 olduğu grafikte görülüyor. Bir değerler kümesinde en sık rastlanan değere (örneğimizde en çok sayıda öğrencinin aldığı not) istatistikte mod denir. Kümenin bütünüyle ilgili bir fikir verebilmek için mod bir tür ortalama değer olarak kullanılabilir. İstatistikçiler belirli bir kümeyle ilgili fikir verebilmek için değişik türde ortalamalar kullanırlar.
Başka tür bir ortalama bulmak için örneğimizdeki notlan büyüklüklerine göre sıraya koyup bu sıranın tam ortasında kalan elemanı alabiliriz. Ortanca (medyan) denen bu eleman, örneğimizdeki sıralamada 13. sıraya gelen öğrencinin aldığı nottur; her iki sınav için de bulunacak olan ortanca 5'tir.
En yaygın olarak kullanılan ortalama türü ise aritmetik ortalama'dn. Örneğimizde aritmetik ortalamayı bulmak için, sınavda alınan notları toplayıp öğrenci sayısına böleriz.
Matematik sınavında alman notların toplamı 130, öğrenci sayısı 25 olduğuna göre notlann aritmetik ortalaması kolayca bulunur:

İngilizce sınavında alınan notların toplamı da 130 olduğu için, o sınavda da notlann aritmetik ortalaması 5,2'dir.
Görülüyor ki, hangi tür ortalamayı kullanırsak kullanalım, iki sınavdaki notlann ortalama değeri ya aynı ya da birbirine çok yakındır. Ama notların dağılımı farklıdır; matematik sınavında alınan notlar daha geniş bir aralığa yayılmıştır.
Kimi zaman yalnızca bir öğrencinin aldığı çok yüksek ya da çok düşük bir not bu aralığı genişletebilir. Aşağıdaki grafiklerde böyle bir durumun dağılım üzerindeki etkisi görülüyor.




Grafikte görülen simetrik dağılımda aritmetik ortalamanın, ortancanın ve modun değeri 3'tür.



Ortanca ve mod değerleri bu grafikte de aynıdır; ama alınan biryüksek not (10) nedeniyle aritmetik ortalama yükselmiştir.
Eğer sınıfın bütünüyle ilgileniyorsak, sınıfın genel durumundan çok farklı bir öğrencinin notunu dikkate almamız gerekmez. Öğrencilerin büyük çoğunluğunun notlarının nasıl dağıldığını incelemenin bir yolu notların belirli bir değerden farkına bakmaktır. Bu farka sapma diyoruz. Çeşitli ortalamalar olduğu gibi, farklı yollardan bulunan değişik sapmalar da vardır. En basit yollardan biri aritmetik ortalamadan sapmaların aritmetik ortalaması olan ortalama sapmayı bulmaktır.
Matematik notlanndaki ortalama sapmayı bulmak için önce, alınan notları ve her birinin karşısına, alınan notların aritmetik ortalaması olan 5,2 ile farkını yazarız:




Ortalamadan farkların toplamını bulmak için, her notun ortalamadan farkını o notu alan öğrenci sayısı ile çarpar, bulduğumuz değerleri toplarız.

Bütün öğrencilerin aldıkları notların ortalamadan farklarının toplamı 40, öğrenci sayısı da 25 olduğuna göre ortalama sapma kolayca bulunur:

İngilizce notlanndaki ortalama sapmayı da aynı biçimde hesaplarsak 1,064 buluruz.
Ortalama çevresindeki dağılımı incelemekte çok kullanılan ölçülerden biri de varyans ve standart sapma hesaplamaktır. Varyans, ortalamadan sapmaların karelerinin ortalaması alınarak bulunur. Standart sapma ise varyansın kareköküdür.
Eğer her öğrencinin bu iki dersteki durumunu karşılaştırmak ve bir derste iyi olan öğrencinin ötekinde de iyi olup olmadığını incelemek istersek, başka bir istatistik yöntemi kullanırız. İki değişkenin karşılıklı ilişkilerinin bulunmasına yarayan bu yönteme korelasyon diyoruz. Bu yöntemi uygulamanın en basit yolu bir korelasyon grafiği çizmektir. Örneğimizin korelasyon grafiğini çizelim.
İki sınavda alınan notların karşılıklı ilişkisini gösteren korelasyon grafiği.


Her öğrencinin iki sınavdan aldığı notlar grafikteki noktaların koordinatlarını oluşturur. Herhangi bir öğrencinin matematik ve İngilizce'den aldığı notlar birbirine yakın ya da aynı olduğunda, bu öğrencinin notlarını gösteren nokta sol alt köşeden sağ üst köşeye uzanan köşegende ya da yakın çevresinde yer alan kareler içinde gösterilir. Noktalar bu kareler içinde ne kadar fazla yoğunlaşmışsa, öğrencilerin matematik ve İngilizce'deki başarıları arasındaki ilişkinin de o kadar güçlü olduğunu söyleyebiliriz.
Korelasyon yöntemini dikkatle kullanmak gerekir. Örneğin sigara içmekle akciğer kanseri arasında yüksek bir korelasyon yani güçlü bir ilişki olduğu ortaya konmuştur. Ama sigara içmenin akciğer kanserine neden olduğunu söyleyebilmemiz başka tıbbi kanıtlara dayanmaktadır. Eğer yalnızca korelasyona bakarak bir sonuç çıkarmak istersek, sigara içmenin akciğer kanserine neden olduğu sonucuna varabileceğimiz gibi, akciğer kanserinin sigara içmeye yol açtığı sonucuna da varabilirdik. Görüldüğü gibi korelasyon yöntemi ilişkiyi ortaya koyar, ama ilişkinin yönünü, hangi olayın hangisine yol açtığını göstermez.
Tanrı varsa eğer, ruhumu kutsasın... Ruhum varsa eğer!