Arama

Fizikte kullanılan ölçme araçları nelerdir?

En İyi Cevap Var Güncelleme: 12 Nisan 2009 Gösterim: 15.053 Cevap: 1
emre2213 - avatarı
emre2213
Ziyaretçi
12 Nisan 2009       Mesaj #1
emre2213 - avatarı
Ziyaretçi
fizikte kullanılan olcme araclariarkadalsar bu konuda bana yardimci olursaniz sevinirim..
EN İYİ CEVABI Keten Prenses verdi
Ölçme ve Değerlendirme

Sponsorlu Bağlantılar
ÖLÇME KAVRAMI

Ölçme Nedir?
Ölçme görünüşte basit olmasına rağmen, göründüğü kadar basit olmayıp oldukça karmaşık bir işlemdir. Ölçme yapabilmek için sırasıyla şu soruları sorup cevap aramak gerekmektedir:

» Neyi ölçeceğiz?
» Nesini ölçeceğiz?
» Ne ile Ölçeceğiz?
» Kim ölçecek?
» Ne kadar?
Öyleyse bir ölçme işleminde şu üç öğenin mutlaka bulunması gerekmektedir:
1- Ölçülecek bir varlık (Varlığı bir veya birkaç niteliği yönünden ölçebiliriz.)
2- Ölçeceğimiz varlığı veya niteliği doğru olarak ölçebilen bir aracın olması,
3- Sonucun sayı ile anlatımı.
Bu üç öğenin dışında, ölçme işlemini gerçekleştirecek bir kişinin olacağı ve bu kişinin ölçme konusu ile ilgili bilgi ve beceriye sahip olması gerektiği de unutulmamalıdır.
Bir fikir vermesi bakımından bazı ölçme tanımları aşağıda verilmiştir.
Ölçme, bir ya da çok kişiye ilişkin bir değişken niteliğin, niceliğini ya da derecesini saptama ve sayısal olarak belirtme işidir. (Dr. A. Ferhan Oğuzkan-Eğitim Terimleri Sözlüğü)
Ölçme, öğrencilerin belli bir alan ya da konudaki, gelişme ve başarılarını, uygun araçlar ve yöntemler uygulayarak sayısal sonuçlarla belirtme işidir. (Dr. A. Ferhan Oğuzkan-Eğitim Terimleri Sözlüğü)
Ölçme, gözlem sonuçlarının sayı ile ifade edilmesi demektir. (M. Fuat Turgut - Başarının Değerlendirilmesi (Broşür))
Ölçme, objelere, bireylere belirli bir özelliğe sahip oluş dereceleri­ni belirtmek için, belirli kurallara uyarak sembolik değerler verme işlemidir. (Dr. Saim Kaptan - Bilimsel Araştırma Teknikleri)
Ölçme, bir birimi kullanarak, bir varlığın bu birime göre farkını bulmadır. (Öğretmenlik Meslek Dersleri Sözlüğü)
Ölçme, en, boy, hacim, süre gibi nicelikleri, kendi cinsinden seçilmiş bir birimle karşılaştırıp, kaç birim geldiklerini belirtmektir. (Türkçe Sözlük)
Sonuç olarak ölçmeyi, «Bir varlığı veya varlıklara ait özellikleri, uygun araçlar kullanarak, bir birim cinsinden sayı ile ifade etmektir» şeklinde tanımlayabiliriz.
BİLİNMESİ GEREKEN ÖLÇME
Eğitimcilerin, özellikle öğretmenlerin, ölçme ve test tekniği konusunda bilmeleri gerekli görülen noktaların başlıcaları aşağıda sıralanmıştır.

1. Okutulan derslerdeki başarı ya da gelişmeleri ölçme amacı güden testler (bu arada özellikle standart testler) hakkında bilgi sahibi olmak: bu testleri hazırlama, uygulama, puanlama ve sonuçları doğru yorumlama ve kaydetme tekniklerini bilmek.
2. Test sonuçlarını çözümleme ve yorumlama için gerekli basit istatistiksel işlemlerle normların çeşit ve kullanılışını bilmek.
3. Ham puanları standart puanlara çevirebilmek.
4. Testlerin geçerlik ve güvenirlik katsayılarını yorumlayabilmek, bunların testin içeriği, madde sayısı, öğrenci grubunun özellikleri ve bunları etkileyen durumsal koşullarıyla olan ilişkileri bilmek.
5. Ölçme hatası kavramını bilmek, verilen herhangi bir puanı bu anlayışın ışığında yorumlayabilmek.
6. Çeşitli kollardaki eğitim-öğretim etkinlikleri çerçevesinde öğrencilerin tek tek ya da tüm sınıfın durumunu profille göstermek, değişme ve gelişmeleri profilden izlemek.
7. Bir test programının yapı, amaç ve özelliklerini bilmek, program gereğince kullanılan testleri amaca uygunluğu, uygulamaya elverişliliği yönlerinden eleştirebilmek, test programını daha yeterli ve etkin bir niteliğe kavuşturmak için gerekli önerilerde bulunabilmek ve bu yoldaki çalışmalara katılabilmek.
8. Sınav veya test sonuçlarının ve genellikle öğrencilerin tek tek veya grup olarak gösterdikleri gelişimleri anne-babalara, ilgililere ve gerektiğinde kamuya anlatabilmek.
9. Genel ve özel yetenek testleri ile başarı testlerinin kullanılış yer ve amaçlarını ayırt edebilmek, aralarındaki fark ve ilişkileri görebilmek.
10. Ölçme ve değerlendirmeyi bir eğitim süreci olarak kullanabilmek, sonuçları sınıflarda tartışarak öğrencilerin kendi kendilerini değerlendirme güçlerini geliştirmeyi sağlamak.
11. Ölçme ve değerlendirme etkinliğinin çok yanlı olduğunu bilmek; özellikle eğitim ve öğretimi çocukların öğrenme yeteneklerine ilgi ve kişisel eğilimlerine uygun düşecek yönde düzenlemek için ölçme ve değerlendirme sonuçlarından yararlanmak.

Ölçmenin Öğeleri
Varlık: Ölçme yönünden önemli olan varlığın canlı-cansız oluşu değil, somut-soyut oluşudur.
Ölçme aracı: Ölçme işlemlerinde kullanılan araçları, 1) standart. 2) standart olmayanlar, şeklinde iki gruba ayırabiliriz.
Sayısal sonuç: Ölçme aracı ile elde edilen sonuç birbiriyle yakından ilgilidir. Standart bir araç kullanarak yapılan ölçmede elde edilen sayısal sonuç kesinlik arzeder. Ölçmede kullanılan araç standart değilse, elde edilen sonuç kesin bir anlam taşımaz. Ölçülecek varlık veya özellik somut, ölçme aracı da standart ise sonuç kesin olacaktır.
Başlıca Ölçme Çeşitleri
Varlıkların veya ölçmek istediğimiz niteliklerin ölçülmesi, dolaylı (endirekt) ve dolaysız (direkt) olmak üzere iki şekilde olur. Ölçmede kullanılan ölçek ya da birime göre, elde edilen sonuç mutlak (kesin) veya bağıl (izafî) olabilir. Bu yönden de ölçme, mutlak ve bağıl olmak üzere ikiye ayrılmaktadır. Böylece ölçmeyi, yapılış şekline göre dolaylı ve dolaysız, kullanılan birim ve elde edilen sonuca göre de, mutlak ve bağıl olarak çeşitleyebiliyoruz.
Dolaylı ve dolaysız ölçme: Çoğunlukla, ölçülecek varlık ya da özellik, kullanılan araçla doğrudan ölçülebildiği halde, bazı hallerde varlığın kendisini doğrudan ölçmek mümkün olmamaktadır.
Mutlak ve bağıl ölçme : Bir uzunluk veya ağırlık söylendiği zaman herkes tarafından anlaşılan ve şüphe uyandırmayan bir kesinlik vardır. Bu şekil ölçmelere mutlak ölçme denir.
1- Mutlak ölçmede başlangıç noktası sıfırdır. Bağıl ölçmelerde, sıfır yokluğu göstermez.
2- Mutlak ölçme, her yerde ve herkes tarafından aynı anlamı taşır. Bağıl ölçmenin herkesçe kabul edilen kesin bir anlamı yoktur.
Ölçmede Hassaslık ve Hata Kavramı
Bir ölçme işleminde hatayı en az seviyeye indirebiliriz. Fakat, aracımız çok hassas bile olsa, tamamen hatasız bir ölçmeyi kolay kolay yapamayız.
Her ölçmede mutlaka hata payı vardır. Bu hata ölçme yönteminden, ölçmeyi yapan bireyden, ölçme yapılan ortamdan vb. olabilir.
Eğitimdeki ölçmelerde hatadan sakınmak için, hata kaynakları ve bu kaynakların ölçme sonuçlarını nasıl etkilediği bilinmelidir.
1- Ölçmeyi yapan kişiden gelen hatalar; Bireylerin, ölçme konusu ile ilgili bilgi ve becerilerinin noksan ve farklı oluşundan dolayı, herkes aynı derecede hassas bir ölçme yapamaz.
2- Ölçme aracından gelen hatalar; Bir araç ne kadar iyi yapılırsa yapılsın, zamanla hassaslığı bozulabilir.
3- Ölçen kişinin ve ölçme aracının çevre ile etkileşiminden doğan hatalar; Özellikle insanla ilgili ölçme çalışmalarında bu durum daha çok etkili olur. Ölçen kişi ile, ölçülen kişinin etkileşmesi, ölçme sonucunu olumlu ve olumsuz şekilde etkileyebilir.
4- Kaynağı belli olmayan hatalar; Kaynağı iyi bilinmeyen, ölçmeciye veya ölçme aracına bağlı olan ve ölçme sonuçlarına gelişigüzel yansıyan hatalara tesadüfi hatalar denir.
Bir aracın ölçülmek isteneni doğru olarak ölçmesi, bu aracın geçerli olduğunu gösterir. Her uygulanışta aynı sonucu vermesi de onun güvenilir olduğuna işarettir. İnsanın ruhsal yönü ile ilgili nitelikleri, birbirinden tam olarak ayırmak mümkün olmadığı gibi, bu niteliklerin birbirlerini etkilemesi ölçme işlemini daha da zorlaştırır. Bunun için de, eğitim ve öğretimde kullanılan ölçme araçlarının geçerliliği ve güvenilirliği tam değildir.

Değişkenler
Ölçülecek olan durum ve niteliklere genellikle obje denmektedir. Varlık ve olaylar arasında değişiklik gösteren objelere de değişken denir. Boy, ağırlık, renk, sıcaklık, basınç, zekâ hepsi birer değişkendir. Değişkenlerin bir kısmını sayılarla gösterebildiğimiz halde (boy, ağırlık, sıcaklık, yaş gibi), bazılarını ancak özellik olarak belirleyebiliyoruz. Bu nedenle değişkenler ikiye ayrılırlar.
1. Nicel değişkenler
2. Nitel değişkenler
Nicel değişkenler sayılarla gösterilebilen değişkenlerdir. Nitel değişkenler ise, kalite ve çeşit yönünden ifade edilebilirler. Cinsiyet, renk, din, ilgi, davranış gibi. Bunlar sıfatlarla gösterilirler. Bu bakımdan nitel değişkenler, ölçmeden çok gruplama, sıralama ve derecelemeye uygun düşerler. Nicel değişkenler, her çeşit ölçme araçları ile ölçülerek sayısal olarak belirlenirler. Nitel değişkenleri bu şekilde ölçme olanağı yoktur. Ancak, aynı özelliklere sahip olanlar gruplanır, grupların frekansı bulunarak sonuç sayı ile gösterilebilir. Bu da ölçme değil bir sayma olur.

Ölçek Çeşitleri
Ölçekler; değişkenlerin sayısal olarak gösterilmelerini sağlayan şekil ve yöntemlerdir. Ölçeklerin başlıcaları, en yetersizinden, en yeterli olana doğru şöylece sıralanmaktadır;
1-Sınıflandırma ölçekleri: Bu ölçeklere aynı zamanda gruplama ölçekleri de denmektedir. Benzer özelliklerden yararlanmak ve aynı özellikleri taşıyanları bir grupta toplamaktır. Nitel değişkenlerdir. Ölçmeye ve bir birim cinsinden sayı ile gösterilmeye uygun düşmediklerinden gruplamaya tabi tutulurlar. Gruplarda bulunan elemanları sayarak, frekans dağılımını ve modunu bulmak mümkündür. Daha ileri istatistik işlemleri uygulama olanağı yoktur.
2-Sıraya Dizme Ölçekleri: Sıralama genellikle, gruplamadan sonra yapılan bir işlemdir. Objeleri, herhangi bir özelliğe sahip olma derecelerine göre sıraya koymaktır. Benzer özellikler bakımından, en üstün olandan en geri olana doğru 1 inci, 2 inci, 3 üncü, 4 üncü seklinde sıralamaktır. Sıraya konulduktan sonra ortak özellik önemini kaybeder. Önemli kimin kimden daha çok, daha az veya küçük-büyük oluşudur.
3-Aralıklı ölçekler (Eşit aralık Ölçeği) : Bu çeşit ölçeklerde bir başlangıç noktası vardır. Başlangıç noktasından itibaren, ölçek eşit aralıklara bölünmüştür. Ancak başlangıç noktası kesin değildir, mutlak yokluğu göstermez, izafi olarak kabul edilmiş bir noktadır. Bu bakımdan birimler birbirinin iki katı veya yarısı değildir. Biri diğerinden şu kadar fazla ya da eksiktir.
Aralık ölçekleri, objeler arasındaki farkın miktarını göstermektedir. Onun için toplama, çıkarma gibi hesaplama işlemleri yapılabilir. Her tür istatistik işlemi uygulanabilir. Termometreler, puanlar aralık ölçeklerine örnektir.
4-Oran Ölçekleri: Ölçeklerin en üstünü bu ölçeklerdir. Bu tip öl­çeklerin aralıklı ölçeklerden tek farkı mutlak yokluğu gösteren bir başlangıç noktasının bulunmasıdır. Başlangıç izafi olarak kabul edilmiş bir nokta değil, mutlak yokluğu gösteren bir sıfır noktasıdır. Başlangıcının kesin yokluğu göstermesi ve aralıklarının eşit olması, bu ölçeklerle elde edilen sonuçlara her çeşit hesaplamanın uygulanabilmesini sağlar.
Oran ölçeklerinin kullanıldığı ölçmeler kesindir. Nicelik cinsinden değişkenler bu çeşit ölçeklerle ölçülür. Oran ölçekleriyle elde edilen verilere her tür istatistik işlemler uygulanabilir.

Fiziksel ve Sosyal Bilimlerde Ölçme
1. Fiziksel bilimlerin ölçme konusu somuttur, maddenin nicel yönü ile ilgilenir. Sosyal bilimlerin konusu ise daha çok soyuttur. Somutun kesin olarak ölçülmesi mümkün olduğu halde, soyutun ölçülmesi çok zordur. Soyutun ölçülmesinin zorluğu yanında elde edilen sonuçlar da kesin değildir. Bu nedenle, fiziksel bilimlerde ölçme, sosyal bilimlere oranla daha kolay ve kesindir.
2. Somut varlıkları ölçmek üzere standart ve hassas ölçme araçları geliştirilmiştir. Fiziksel bilimler ölçek olarak en üstün seviyedeki bu ölçekten yararlanırlar. Sosyal bilimlerde kullanılan ölçeklerin, en üstün seviyede olanı aralıklı ölçeklerdir. Böylece, sosyal bilimlerdeki ölçme araçlarının yetersizliği, yapılan ölçmenin de yetersiz kalmasına neden olmaktadır.

DEĞERLENDİRME KAVRAMI
Değerlendirme Nedir?
Ölçmeyi belli bir amaçla yaparız. Sonra da elde ettiğimiz sonucun amacımıza uygun olup olmadığını araştırırız. Ölçme sonucunu amacımıza göre yorumlamak, az, çok, yeterli, iyi, kötü şeklinde bazı değer hükümlerine ulaşmak bir değerlendirmedir. Böylece değerlendirme, ölçmeden sonra gelen ve onu takip eden bir işlemdir.
Değerlendirme, her ne kadar ölçmeyi takip eden bir işlemse de, ölçme sonucunu kendi başına değerlendirme olanağı yoktur. Ölçme sonucunun değer kazanabilmesi, ya da ona değer biçilebilmesi için, mutlaka onu karşılaştırabileceğimiz bazı dayanakların olması gerekir. Ölçme sonuçlarının değerlendirilmesi için karşılaştırmaya ve yorumlamaya esas alınan dayanaklara ölçüt denmektedir. Ölçüt olmadan değerlendirme olmaz.
Yukarıdaki açıklamalardan da anlaşılacağı gibi değerlendirme, üç basamaklı bir işlem olarak karşımıza çıkmaktadır. Bunlar sırasıyla şunlardır:
1- Ölçme ya da ölçme yerine geçebilen gözlem verileri: Ölçme yapılmazsa veya ölçme yerine geçebilecek gözlem verileri olmazsa değerlendirme olmaz. Çünkü, ortada değerlendirecek bir şey yok demektir.
2- Ölçme veya gözlem verilerini karşılaştıracak, yorumlamayı kolaylaştıracak dayanaklar: (Ölçüt, kıstas, kriter) Elimizdeki ölçme verilerine değer biçebilmek için, bazı dayanaklara gerek vardır.
3- Hüküm: Ölçme verilerinin ölçüt ya da ölçütlerle karşılaştırılması ile varılan sonuç. İyi, başarılı, başarısız, yeterli gibi değer hükümleri.
Bazı değerlendirme tanımları:
Değerlendirme, bir çalışmanın sonucu üzerinde varılan yargı, bir şeye değer biçmedir. (Türkçe Sözlük)
Değerlendirme, bir obje veya işin belli ölçütler karşısında niteliğini veya değerini tayin etme, bir konuda ölçütlerle gözlem verilerini karşılaştırmadır. (Öğretmenlik Meslek Dersleri Sözlüğü)
Değerlendirme, niceliği ya da niteliği üzerinde yapılan, çalışma sonucu varılan yargıdır. (Eğitim Terimleri Sözlüğü)
Değerlendirme, aynı biçimdeki olayların, birtakım ölçütlere göre önemini belirtmedir. (Eğitim Terimleri Sözlüğü)
Değerlendirme, türlü öğretim amaçlarının gerçekleşme oranını, değişik yollarla ölçme ve ortaya çıkan sonuçlar üzerinde değer biçmedir. (Eğitim Terimleri Sözlüğü)
Tanımlarda da görüldüğü gibi değerlendirme bir yorumlama işidir. Bunun için de yorumlanacak verilere ve bunların yorumlanmasını sağlayacak ölçütlere (dayanaklar) gerek vardır. Sonuç olarak bir tanım yaparsak, değerlendirme; «ölçme ya da gözlem verilerini, uygun ölçütlerle karşılaştırmak suretiyle, bazı değer hükümlerine (yargı) ulaşmaktır.» diyebiliriz.

ÖLÇME İLE DEĞERLENDİRMENİN İLİŞKİSİ
1-Ölçme bir değişkenin miktarını gösterir. Değerlendirme ise, bu miktarın yeterli olup olmadığını ya da amaca uygun olup olmadığını gösteren hükümdür.
2-Genel olarak ölçme objektiftir. Değerlendirme ise yargıya dayandığı ve ölçüte göre değiştiği için sübjektiftir.
3-Kapsam bakımından değerlendirme daha geniştir, ölçmeyi; içine alır.
4-Ölçme daha çok gözleme, değerlendirme ise, karşılaştırma; yorum ve yargıya dayanır.

İYİ BİR ÖLÇME ARACININ ÖZELLİKLERİ
Bir ölçme aracının en önemli özelliği, geçerli olmasıdır. Çünkü, geçerli olan bir araç, hemen hemen diğer bütün özelliklere de sahiptir. Aracın, bütün özellikleri birbiriyle ilgilidir. Her hangi bir özelliğin bulunup, bulunmayışı, aynı zamanda aracın diğer özelliklerine de tesir eder. İyi bir ölçme aracında bulunması gereken, en önemli altı özellik aşağıda açıklanmıştır.

İyi Bir Ölçme Aracı Geçerli Olmalıdır
Ölçme aracının ölçülmek istenen özelliği ölçme gücüne ölmedeki geçerliği denir.
Eğitim ve öğretimde kullanılan ölçme araçları tam standart olmadığı için geçerli bir ölçmenin yapılması oldukça zordur. Bir ölçme aracını oluşturan sorular tek tek geçerli ise, bu aracın tamamı da geçerlidir. Bundan dolayı, ölçme aracındaki soruları hazırlarken şu sorulara cevap aramalıyız.
1.Neyi ölçmek istiyoruz? Bu sorunun cevabını kesinlikle bilmeliyiz
2.Sorumuz, ölçmek istediğimizi doğru olarak ölçebilir mi?
  • Uyum geçerliği
  • Yapı geçerliği
Test geçerliğinin belirtilmesinde korelasyondan yararlanılır. Korelasyonun, değişik ölçülerle yapılan sıralamaların ne ölçüde birbirine benzediğini belirtmek için kullanışlı bir ölçü olması, onun bu amaçla da kullanılmasında önemli bir etkendir. Ancak, geçerlik göstergesi olarak kullanılan korelasyon, -1,00 ile 1,00 değerleri arasında değişebilir, ilişkinin miktarını korelasyonun mutlak değeri gösterdiğinden, sadece 1,00 veya ona yaklaşan değerler değil, -1,00 veya ona yaklaşan korelasyonlar da yüksek bir ilişki olduğunu gösterir. Ancak bu son durumda ilişkinin yönü terstir; birinin yüksek değerlerine ikincisinin düşük değerleri karşılık gelmektedir. Geçerlik göstergesi olan korelasyonun sıfıra yaklaşması, iki ölçü dizisi arasında ilişki bulunmadığını; geçerliğin düşük olduğunu gösterir.

PEARSON MOMENTLER ÇARPIMI KORELASYON KATSAYISININ HESAPLANMASI
( ån) ( åy)
R = åxy –
å (x2 – ( åx)2 ) í å y2 – ( å y)2 y
n n

İyi Bir Ölçme Aracı Güvenilir Olmalıdır
Aracın güvenilir olması, aynı şartlar altında hep aynı sonucu vermesi demektir. Buna kararlılık da denir. Bir testi aynı sınıfa değişik zamanlarda uyguladığımız zaman, aynı veya çok yakın sonuçları alıyorsak bu test güvenilir demektir. Her seferinde değişik sonuçlar alıyorsak, o taktirde test güvenilir değildir.
Saydığımız bu faktörleri dikkate almak suretiyle, bir ölçme aracının güvenilir olup olmadığını anlamak için, yapılabilecek başlıca çalışmaları şöylece sıralayabiliriz:
(a)Aracın tek ve çift sayılı sorularından iki ayrı araç elde edilir. Bu iki araç biraz arayla aynı sınıfa uygulanır. Elde edilen puanların bağıntısı (korelasyon) ne kadar yüksek ise, aracın güvenilirliği o derece iyi dernektir.
(b)Bir ölçme aracı hazırlanırken, eş değerli sorularla ikinci bir araç hazırlanır. Bu iki araç biraz arayla aynı sınıfa uygulanır. Alınan puanların bağıntısı bulunur. Bağıntı, katsayısının pozitif ve yük­sek olması aracın güvenilir olduğuna işarettir.
(c)Aynı araç belli aralıklarla, aynı sınıflara uygulanır, Puanlar arasındaki bağıntının derecesi bulunur. Böylece de, aracın güvenilir olup olmadığı anlaşılabilir.
(d)Sınıf eşit iki gruba ayrılır. Bu iki grubun aynı araçtan aldıkla­rı puanlar arasındaki bağıntının derecesi bulunur. Buna göre de aracın güvenilirlik durumu anlaşılır.
Geçerli olan her ölçme aracı güvenilir demektir. Fakat güvenilir olan her araç geçerli olmayabilir. Ölçmek istediğimizi en doğru şekilde ölçebilen araç geçerlidir. En doğru şekilde ölçtüğüne göre, aynı şartlar­da hep aynı sonucu verecektir. Bu bakımdan da güvenilir demektir. Aynı veya benzer şartlarda hep aynı sonucu veren -güvenilir- araç, ölçmek istediğimizi doğru olarak ölçmeyebilir.
Hangi yöntemle güvenirlik tahmini yapılırsa yapılsın, sonuçta 0.00 ile 1.00 arasında bir korelasyon elde edilir. Korelasyonun 1.00'e yakın olması testin güvenirliğinin yüksek olduğu, 0.00'a yakın olması ise düşük olduğu anlamına gelir. Testin güvenilirliğinin yüksek olması, test puanlarına yansıyan hataların az olduğu, güvenilirliğinin düşük olması ise hataların fazla olduğu anlamını taşır.

GÜVENİRLİK KATSAYISI HESAPLAMA
1. Güvenirlik katsayısı (R) "Kuder Rıchardsonz" formülü ile hesaplanabilir.
R = N / N-1 [ 1 – X (1-X/N) / S2 ]
N = madde (soru) sayısı
X = puanların ortalaması
S = standart sapma
Geçerlik ve güvenirlik ile ilgili bir noktanın daha belirtilmesinde yarar vardır. Testler için güvenirlik ve geçerliğin ikisinin de yüksek olması testin ölçülmek istenen özelliğinin gerçek değerine yakın değerler verdiğini gösterir. Ancak, testlerin geçerlikleri güvenirlikleri kadar yüksek olmaz. Örneğin, grup karşılaştırmasında kullanılmak üzere hazırlanan testlerin güvenirlikleri 0,60-0,80 arasında olabilir. Bireyler hakkında karar vermede kullanılacak testlerin güvenirliklerinin 0,80'in, karar çok ciddi sonuçlara yol açabilecekse 0,90'ın üzerinde olması beklenir. Öte yandan, grup karşılaştırmalarında kullanılacak testlerin geçerlikleri 0,20-0,60 arasında olabilirken bunun bireysel kararlar temel olacak ölçüleri elde etmede kullanılacak testler için biraz daha yüksek, 0,40-0,70 arasında olması iyi olur.

İyi Bir Ölçme Aracı Objektif (Nesnel) Olmalıdır
Ölçme aracının objektifliği (nesnelliği), aynı zamanda aracın geçerli ve güvenilir olmasına da etki eder. Objektiflik, kişiye göre değişmemesi ve kesin olması demektir. Ölçme aracının objektifliğinin 3 yönü vardır.

1-Sorularda objektiflik: Ölçme aracındaki soruların herkes tarafından aynı şekilde anlaşılması demektir.
2-Uygulamada objektiflik: Aracın uygulanışının kişiye göre değiş­memesi, herkes tarafından aynı şekilde uygulanabilmesi demektir.
3-Puanlamada objektiflik: Kâğıtları puanlayan kişinin, kanaatlerinin puanlamaya etki edememesi demektir.
Çoğunlukla, kısa cevaplı ve seçmeli tipindeki soruların objektifliği yüksektir. Uzun cevaplı kompozisyon tipindeki soruların objektifliği çok zayıftır.

İyi Bir Ölçme Aracı Ayırt edici Olmalıdır
Uygulanan aracın, bilenle bilmeyeni, zayıf ile başarılıyı birbirinden ayırması demektir. Bir soru bütün öğrenciler tarafından doğru olarak cevaplanmışsa veya hiçbir öğrenci tarafından doğru olarak cevaplanamamışsa, bu soru ayırdedici değildir. Bir sorunun ayırdediciliği, onun zorluk derecesi ile ilgilidir. Bir sorunun zorluk derecesi şöyle bulunur. Soruyu cevaplayanların sayısı, o soruyu cevaplamaya çalışanların (sınayanların) sayısına bölünüp, 100 ile çarpılır. Örneklersek; 45 kişilik bir sınıfta, testin son sorusuna doğru cevap veren 24, yanlış cevaplayan 16, erişemeyen de 5 kişi olsun. Demek ki, erişemeyen (son soruya kadar gelemeyen) 5 kişinin dışındaki 40 kişi soruyu sınamıştır. Bu sorunun güçlük derecesi, 24 : 40 x 100 = 60 eder. Sorunun güçlük derecesi ortanın üzerinde demektir.
Bir soruya doğru cevap verenlerin sayısı azaldıkça, sorunun ayırma gücü artar. Ancak, bir ölçme aracındaki soruların hepsinin ayırma gücünün yüksek olması gerekmez. Özellikle, başarı testleri değişik güçlükteki sorulardan oluşmalıdır. Seçme ve yarışma sınavlarında daha çok zor sorulara yer verilir. Aracın uygulanmasından elde edilen puanların, en düşüğü ile en yükseği arasındaki fark fazla ise, öğrencilerin puanları bu iki puan arasında dağılmışsa, bu araca ayırt edici denebilir.

İyi Bir Ölçme Aracı Örnekleyici Olmalıdır
En iyi ölçme, öğretilenlerin veya ölçülmek istenen alanın tamamını ölçmektir. Fakat bu çoğunlukla, özellikle ölçme alanımız çok geniş olduğu zaman pek mümkün olmaz. Bu durumda, yapılacak iş ölçme alanını en iyi şekilde örnekleyebilecek sorular seçmektir. Örneklemenin iyi ol­ması, bütünü kapsayacak şekilde çok sorunun sorulması ile sağlanır. Fakat, sadece çok soru sormak da bizi amacımıza ulaştırmaz. Sorunun çokluğu kadar, niteliği de önemlidir. Olanaklar ölçüsünde, her konudan soru çıkarılmalı, çıkarılan soru ilgili olduğu konuyu örnekleyebilmeli ve bu sorularla amaçların gerçekleşip gerçekleşmediği anlaşılabilmelidir. Hatta, sorular iyi hazırlandığı zaman, az soruyla bile örnekleme yapılabilir. Fakat çok sorunun ölçülecek alanı daha iyi örnekleyeceği muhakkaktır. Az sorulu klasik yazılı yoklamaların örnekleyiciliği azdır.

İyi Bir Ölçme Aracı Kullanışlı Olmalıdır
Ölçme aracının kullanışlı olması, kullanılışında bir takım kolaylıkların bulunmasıdır. Aracın kullanılışı ile ilgili olarak, aranan başlıca nitelikler şunlardır:
(1) Uygulanması kolay olmalıdır.
(2) Puanlaması kolay olmalı, uzun zaman almamalıdır.
(3) Kolay okunmalı, yanlış anlamaya fırsat vermemelidir.
(4) Aracın düzeni ve soruların yerleştirilmesi iyi olmalıdır.
(5) Ekonomik olmalı, farla masrafı gerektirmemelidir.
(6) Süre ayarlaması iyi yapılmalı, verilen zaman az veya çok olmamalıdır.
(7) Ayrı cevap kağıdı varsa, test defteri ile ikisi birbirine uymalı, karışıklığa meydan vermemelidir.
Bir testin kullanışlılığı, güvenirlik ve geçerlikten sonra düşünülmesi gereken bir özeliktir. Amacı için yeterli olabilecek güvenirlik ve geçerlikte olan testler arasında en kullanışlı olan seçilmelidir. Aksi durumda çok kullanışlı olduğu halde güvenirliği ve geçerliği düşük olan bir test amaca uygun sonuç vermez.

TEST SORULARININ ÇÖZÜMLENMESİ (MADDE ANALİZİ)
Bir ölçme aracındaki soruların iyi çalışıp çalışmadığını saptamak ve gerekli düzeltmeleri yapmak için yanıtları çözümlemek veya hiç değilse gözden geçirmek gerekir. Yanıtların gözden geçirilmesi aynı zamanda öğretimin başarılı ve başarısız yanlarını göstermek bakımından da önemlidir.

TABLO:
Madde: Aşağıdakilerden hangisi kimyasal bir değişimdir?
Yanıt seçenekleri Yanıt frekans dağılımı
a) Yağın donması 16
b) Suyun buharlaşması 5
c) Mumun erimesi 20
d) Benzinin yanması 56
e) Tuzla suyun karışması 23
Yanıt vermeyen öğrenci sayısı 0
Toplam : 120
Bu çözümleme bize madde hakkında kaba bir fikir vermekle birlikte kesin ve yeterli olmaktan çok uzaktır. Daha kesin ve yeterli bilgi için madde üzerindeki çözümlememizi şu iki soruya yanıt vermek üzere derinleştirmemiz gerekir:
1.Soru maddesinin zorluk derecesi nedir?
2.Soru maddesinin ayırma gücü nedir (iyi öğrenci ile zayıf öğrenciyi ayırıyor mu)?
Birinci soru maddenin güvenirlik niteliği, ikinci soru maddenin geçerlik niteliği ile ilgilidir. Başka bir deyişle, madde güçlüğü, kullanılışına göre, hem güvenirlik hem geçerlik ile ilgili bilgi verebilir.

Madde Analizi ile İlgili Bazı Kavramlar
Erişilmemiş sorular: Cevaplama sırasında yetiştirilememiş sorulardır. Bunlar daima testin sonundadır. Erişilmemiş soru miktarı, testin süresi dolduğu halde cevaplamayı tamamlayamamış öğrencilerde olur.
Atlanmış sorular: Üzerinde çalışılmış, fakat doğru cevap tam bilinemediği için veya soru anlaşılmadığı için işaretleme yapılmamış olan sorulardır. Erişilmemiş sorular testin sonunda olduğu halde, atlanmış sorular arada olmaktadır.
Soruyu sınayanlar: Testin bir sorusuna erişememişlerin dışında kalanlar soruyu sınayanların sayısını verirler. Başka bir deyişle, soruyu işaretlemiş olanlarla atlamış olanlara soruyu sınayanlar denir.
Doğru cevapların oranı: (Doğru cevap yüzdesi) Bir soruyu doğru cevaplayanlar sayısının, o soruyu sınayanlar sayısına oranı bu sorunun doğru cevap yüzdesini verir. Örneklersek; 40 kişilik bir sınıfta testin 45 inci sorusunu doğru cevaplayan 30, yanlış cevaplayan 7, atlayan 2 ve erişememiş de 1 kişi olsun. Burada erişememiş 1 kişi olduğuna göre, soruyu sınayanların sayısı 39 dur. Bu sorunun doğru cevap oranı şöyle bulunur
Doğru cevap sayısı 30
Doğru cevapların oranı = ----------------------------- = ----------- = 0,77 = %77
Sınayan sayısı 39
Yanlış cevapların oranı: Bir soruyu yanlış cevaplayan sayısının soruyu sınayanlar sayısına bölümüdür. Buna göre yukarıdaki sorunun yanlış cevap oranı veya yanlış cevapların yüzdesi: 7/39 = 0,18 Bu % 18 olarak söylenir.

Soruların çözümlenmesi için yapılacak çalışmalar sırasıyla;
1. Soru çözümlenmesine başlamak için yapılacak ilk çalışmalar: Puanlanmış bir testin kâğıtları veya puanları en yüksek puan en üstte ve en düşük puan en altta olacak şekilde sıraya konur. Sonra da üç gruba ayrılır. Gruplama şu oranlara göre yapılmalıdır. Sınıf sayısının 1/4 ü üst grup, 2/4 ü orta grup ve 1/4 ü de alt grupta olmalıdır. Burada gruplama 1/3 oranıyla yapıldığı gibi, yarıdan iki grup da yapılabilir. Fakat uygulamada çoğunlukla birinci yol tercih edilmektedir. Gruplamanın nasıl yapılacağını bir örnekle gösterelim. 18 kişilik bir sınıftaki öğrenciler ve puanları aşağıdaki şekilde olsun.
Öğrenciler A B C D E F G H I İ J K L M N O Ö P
Puanları 47 45 44 42 41 40 39 39 36 35 32 32 30 29 28 26 26 25
Üst grup (5) Orta grup (9) Alt grup (4)
2- Soruların zorluk derecelerinin bulunması: Bir sorunun zorluk derecesi o soruyu doğru cevaplayanların azlığı ve çokluğu ile ilgilidir. Doğru cevaplayan sayısının çokluğu sorunun kolay olduğunu, azlığı da zor olduğunu göstermektedir. Cevaplayamayanlar açısından durum bunun tersidir. Doğru cevaplayamayanların çokluğu sorunun zorluğunu, yanlış cevaplayanların azlığı da sorunun kolay olduğunu gösterir. Bir sorunun zorluk derecesini sayısal olarak, daha önce açıkladığımız doğru cevapların oranına veya yanlış cevapların oranına göre bulabiliriz. Bir sorunun doğru cevap oranı (yüzdesi) sayısal olarak büyükse soru kolay, küçükse soru zor demektir. Yanlış cevapların oranına göre de, yüzdenin yüksekliği sorunun zor olduğunu, düşüklüğü de kolay olduğunu belirler. Soruların zorluk dereceleri 0 ile 100 arasında değişmektedir. Buna göre:
- Doğru cevap oranı % 1 İle % 39 arasında olan sorular zor,
- Doğru cevap oranı % 40 ile % 69 arasında olan sorular orta güçlükte,
- Doğru cevap oranı % 70 den yukarı olan sorular da kolay sorulardır.
- Yanlış cevapların oranına göre % 1 ile % 30 arasında olanlar kolay, % 31 ile % 60 arasında olanlar orta güçlükte, % 61 den yukarı olan sorular­da zor sorulardır.
Genel bir kural olarak, orta zorlukta olan bir madde, çok kolay veya çok zor olan bir maddeden daha iyidir, denebilir? Şu kadar ki, her testte bir miktar kolay, bir miktar da zor maddeye ihtiyaç vardır. Çok kolay ya da çok zor maddelerden kurulu testler güvenirlik yönünden zayıf demektir.
Soruların zorluk dereceleri başka bir yoldan şu şekilde bulunmaktadır. Orta grup hiç hesaba katılmadan, üst grup doğru cevap yüzdesi ile alt grup doğru cevap yüzdesi toplanarak ikiye bölünmektedir. Bunu bir formülle aşağıdaki şekilde gösterebiliriz.
Üst grup doğru cevap % si + Alt grup doğru cevap % si
Zorluk derecesi = ------------------------------------------------------------------
Bu şekildeki hesaplamada orta grubun hiç etkisi olmamaktadır. Sorunun zorluk derecesi sınıfın iyi ve zayıf öğrencilerine bağlı olmaktadır. Sorunun zorluk derecesinin bu şekilde iki uçtaki % 50 ye göre bulun­ması ve ortada kalan % 50 lik bölümün dikkate alınmamasıyla, gerçek zorluk derecesi çıkmamaktadır. Bundan dolayı bu yolla zorluk derecesinin bulunması pek benimsenmemektedir.
Z.İ.= Zorluk indeksi
Dü= Üst ölçüt grupta doğru yanıtların sayısı
Da= Alt ölçüt grupta doğru yanıtların sayısı
Nü= Üst gruptaki öğrenci sayısı
Na= Üst gruptaki öğrenci sayısı
Dü+Da
Z.İ.= ---------------
Nü + Na
Örneğin, 120 kişinin yanıtladığı bir maddede Dü= 24, Da= 8, Nü=30, ve Na=30 ise, o maddenin zorluk indeksi,
24+8 32
Z.İ. = ----------- = ---------- = 0.53’e eşittir.
30+30 60
Ayırma gücü olan bir maddenin zorluk indeksi ideal olarak 0.50 etrafında olmalıdır. Genellikle iyi bir test için maddenin zorluk derecelerinin şöyle bir dağılım içinde olması beklenir.
Maddelerin yaklaşık,
— %35'i oldukça kolay (grubun %50-85'inin doğru yanıtlayabildiği),
— % 15'i çok kolay (grubun % 85-100'ünün doğru yanıtlayabildiği),
— % 35'i oldukça zor (grubun % 15-50'sinin doğru yanıtlayabildiği),
— % 15'i çok zor (grubun % 0-15'inin doğru yanıtlayabildiği), olmalıdır.
Maddenin ayırma gücü ile zorluk derecesi arasında doğrudan bir ilişki yoktur. Ayırma gücü olan bir madde zor olabileceği gibi kolay da olabilir. Örneğin üst ölçüt grubun ancak % 15'inin, alt ölçüt grubun %1'inin doğru yanıtlayabildiği son derece zor bir maddenin ayırma gücü 0.50’ ye yakındır. Buna karşılık üst ölçüt grubun % 92'sinin, alt ölçüt grubunun % 65'inin doğru yanıtlayabildiği çok kolay bir maddenin ayırma gücü 0.40'a yakındır. Zorluk dereceleri bir hayli farklı olan bu iki madde geçerlik yönünden hemen aynı derecede iyi sayılır.
Şu kadar ki, grubun % 100'ünün doğru yanıtlayabildiği, ya da hiç kimsenin doğru yanıtlayamadığı bir maddenin ayırma gücü yoktur. Böyle maddelerin testte yer almaması gerekir. Ancak çoğu kez yüreklendirme amacıyla testin baş bölümüne birkaç çok kolay, iyi öğrencileri ayırt etmek için testin sonuna birkaç son derece zor madde konur.

Madde Analiz Kartı'nın ön yüzü
Testin Adı Uygulandığı Grup
Madde 1. Şunlardan hangisi gel - git olayının nedenidir?
a) Denizlerin güneş tarafından çekimi
b) Deniz sularının rüzgarlarla itilmesi
c) Deniz suyunun karalar tararından çekimi
d) Denizlerin ay tarafından çekimi
e) Deniz sularının gizli depremlerle kabarması.
Kartın arka yüzü
Doğru
Yanıt seçenekleri a b c d e Boş yanıt % Toplam
Üst grup 6 3 4 19 0 0 60 32
Alt grup 8 6 6 10 2 0 30 32
Ayırma gücü (biserial r) =
Zorluk indeksi (Z.İ.) =
Madde analizi tekniğinden, testi düzeltme ve geliştirme için olduğu kadar, öğretimi yönlendirme ve daha etkin kılma için de faydalanılabilir.
Uygulayıcı her maddedeki yanıt seçeneklerine verilen yanıtları yukarıda gösterildiği şekilde çözümlemek ve yorumlamakla hangi noktalarda başarılı, hangi noktalarda başarısız sonuç aldığını görür, gereken önlemleri alma olanağını elde eder. Öte yandan madde analizi yoluyla test sonuçlarının gözden geçirilmesi öğrenciler yönünden de yararlıdır. Öğrenci böylece kendi durumunu daha gerçekçi bir yaklaşımla değerlendirmek fırsatını bulur. Ayrıca testle ölçülmek istenen nitelikler bakımından eksikliklerini giderme, bilgi ve anlayışını arttırma olanağına kavuşur.

3. Soruların ayırma güçlerinin bulunması:
Soru maddesinin ayırma gücüne gelince, bu maddenin geçerliği ile ilgili olup, testin uygulandığı grup içindeki en iyi öğrencilerle en zayıfları birbirinden ayırmasına bağlıdır. Grup içinde zayıflar da iyiler gibi bir maddeyi doğru yanıtlayabilmişse o maddenin ayırma gücü yok demektir. Aynı şekilde, grubun tümü bir maddeyi doğru yanıtlayamamışsa, böyle bir maddenin de ayırma gücünden söz edilemez. Ayırma gücünden yoksun, ya da ayırma gücü zayıf olan maddeler ve bu tür maddelerden kurulu testler, geçerlik yönünden zayıf demektir.
Test uygulayıcıları bazit bazı işlemler kullanarak testte yer alan maddelerin ayırma gücünü ve zorluk derecesini belirleyebilirler. Bu işlemleri şöyle sıralayabiliriz.
a) Test uygulamasından sonra cevap kağıtları en yüksek puandan en düşük puana doğru sıraya konur.
b) Sıraya konan cevap kağıtlarından üstten %25 ve alttan %25 alınır. Bu yüzdeler cevap kağıdı sayısı fazla değilse, arttırılabilir. Eğer cevap kağıdı sayısı 60'ın altında ise, hepsi alınır, üst ve alt gruplar %50'şer olur. Madde analizi bu durumda bu iki (üst ve alt) grubun karşılaştırılmasına dayanacaktır. (Bu gruplara "ölçüt" gruplar diyeceğiz.)
c) Her iki ölçüt grupta maddeye doğru yanıt verenlerin sayısı saptanır ve maddenin ayırma gücü (geçerlik) indeksi hesaplanır. Bu hesaplama şöyle olur. Üst-ölçüt grupta doğru yanıtların sayısından (bunu "Dü" ile gösterelim), alt ölçüt grupta doğru yanıtların sayısı (bunu "Da" ile gösterelim) çıkarılır, aradaki fark iki gruptaki doğru yanıtların toplamına (yani Dü + Da) bölünür.
Bunu kısaca şu formülle ifade edebiliriz:
Ayırma gücü indeksi = Dü —Da / Dü + Da
Bir örnek vermek için herhangi bir maddeyi üst ölçüt grubundan 24 kişinin, alt ölçüt grubundan 8 kişinin doğru yanıtladığını düşünelim. Buna göre, maddenin ayırma gücü indeksi,
24 — 8 / 24 + 8 = 16 / 32 = 0.50 ‘ye
eşit olacaktır. Eğer aynı maddeyi üst grubun tümü doğru yanıtlamış, alt grubun tümü yanlış yanıtlamış olsaydı, o zaman ayırma gücü indeksi,
30 – 0 / 30 + 0 = 1’e
eşit olacak, yani maddenin geçerlik derecesi en yüksek düzeye ulaşacaktır. İndeksin 0'a eşit olduğu hallerde maddenin ayırma gücü yok demektir. Örneğin, maddeye doğru yanıt verenler üst ve alt gruplarda aynı sayıda olursa, maddenin ayırma gücünden bahsedilemez; çünkü bu durumda geçerlik indeksi 0'dır. Demek oluyor ki, bir maddenin geçerlik veya ayırma gücü indeksi 0'dan 1'e kadar değer alır. Pek az görülen durumlarda, örneğin maddeye doğru yanıt verenler alt - ölçüt grubunda daha fazla olursa, geçerlik indeksi negatiftir, indeksin negatif, sıfır veya sıfıra yakın değerler aldığı hallerde maddenin ya düzeltilmesi ya da testten büsbütün çıkarılması gerekir.
Bir sorunun ayırma gücü, üst grup doğru cevap yüzdesinden alt grup doğru cevap yüzdesinin çıkarılmasıyla da bulunur. Bunu formül şeklinde yazarsak:
Ayırma gücü= Üst grup doğru cevap %si — Alt grup doğru cevap %si
Formülün sonucunda elde edilen sayı, o sorunun ayırma gücünü verir. Bu sayı pozitif olabilir, sıfır olabilir veya negatif olabilir.
Son düzenleyen Keten Prenses; 12 Nisan 2009 18:29
Keten Prenses - avatarı
Keten Prenses
Kayıtlı Üye
12 Nisan 2009       Mesaj #2
Keten Prenses - avatarı
Kayıtlı Üye
Bu mesaj 'en iyi cevap' seçilmiştir.
Ölçme ve Değerlendirme

Sponsorlu Bağlantılar
ÖLÇME KAVRAMI

Ölçme Nedir?
Ölçme görünüşte basit olmasına rağmen, göründüğü kadar basit olmayıp oldukça karmaşık bir işlemdir. Ölçme yapabilmek için sırasıyla şu soruları sorup cevap aramak gerekmektedir:

» Neyi ölçeceğiz?
» Nesini ölçeceğiz?
» Ne ile Ölçeceğiz?
» Kim ölçecek?
» Ne kadar?
Öyleyse bir ölçme işleminde şu üç öğenin mutlaka bulunması gerekmektedir:
1- Ölçülecek bir varlık (Varlığı bir veya birkaç niteliği yönünden ölçebiliriz.)
2- Ölçeceğimiz varlığı veya niteliği doğru olarak ölçebilen bir aracın olması,
3- Sonucun sayı ile anlatımı.
Bu üç öğenin dışında, ölçme işlemini gerçekleştirecek bir kişinin olacağı ve bu kişinin ölçme konusu ile ilgili bilgi ve beceriye sahip olması gerektiği de unutulmamalıdır.
Bir fikir vermesi bakımından bazı ölçme tanımları aşağıda verilmiştir.
Ölçme, bir ya da çok kişiye ilişkin bir değişken niteliğin, niceliğini ya da derecesini saptama ve sayısal olarak belirtme işidir. (Dr. A. Ferhan Oğuzkan-Eğitim Terimleri Sözlüğü)
Ölçme, öğrencilerin belli bir alan ya da konudaki, gelişme ve başarılarını, uygun araçlar ve yöntemler uygulayarak sayısal sonuçlarla belirtme işidir. (Dr. A. Ferhan Oğuzkan-Eğitim Terimleri Sözlüğü)
Ölçme, gözlem sonuçlarının sayı ile ifade edilmesi demektir. (M. Fuat Turgut - Başarının Değerlendirilmesi (Broşür))
Ölçme, objelere, bireylere belirli bir özelliğe sahip oluş dereceleri­ni belirtmek için, belirli kurallara uyarak sembolik değerler verme işlemidir. (Dr. Saim Kaptan - Bilimsel Araştırma Teknikleri)
Ölçme, bir birimi kullanarak, bir varlığın bu birime göre farkını bulmadır. (Öğretmenlik Meslek Dersleri Sözlüğü)
Ölçme, en, boy, hacim, süre gibi nicelikleri, kendi cinsinden seçilmiş bir birimle karşılaştırıp, kaç birim geldiklerini belirtmektir. (Türkçe Sözlük)
Sonuç olarak ölçmeyi, «Bir varlığı veya varlıklara ait özellikleri, uygun araçlar kullanarak, bir birim cinsinden sayı ile ifade etmektir» şeklinde tanımlayabiliriz.
BİLİNMESİ GEREKEN ÖLÇME
Eğitimcilerin, özellikle öğretmenlerin, ölçme ve test tekniği konusunda bilmeleri gerekli görülen noktaların başlıcaları aşağıda sıralanmıştır.

1. Okutulan derslerdeki başarı ya da gelişmeleri ölçme amacı güden testler (bu arada özellikle standart testler) hakkında bilgi sahibi olmak: bu testleri hazırlama, uygulama, puanlama ve sonuçları doğru yorumlama ve kaydetme tekniklerini bilmek.
2. Test sonuçlarını çözümleme ve yorumlama için gerekli basit istatistiksel işlemlerle normların çeşit ve kullanılışını bilmek.
3. Ham puanları standart puanlara çevirebilmek.
4. Testlerin geçerlik ve güvenirlik katsayılarını yorumlayabilmek, bunların testin içeriği, madde sayısı, öğrenci grubunun özellikleri ve bunları etkileyen durumsal koşullarıyla olan ilişkileri bilmek.
5. Ölçme hatası kavramını bilmek, verilen herhangi bir puanı bu anlayışın ışığında yorumlayabilmek.
6. Çeşitli kollardaki eğitim-öğretim etkinlikleri çerçevesinde öğrencilerin tek tek ya da tüm sınıfın durumunu profille göstermek, değişme ve gelişmeleri profilden izlemek.
7. Bir test programının yapı, amaç ve özelliklerini bilmek, program gereğince kullanılan testleri amaca uygunluğu, uygulamaya elverişliliği yönlerinden eleştirebilmek, test programını daha yeterli ve etkin bir niteliğe kavuşturmak için gerekli önerilerde bulunabilmek ve bu yoldaki çalışmalara katılabilmek.
8. Sınav veya test sonuçlarının ve genellikle öğrencilerin tek tek veya grup olarak gösterdikleri gelişimleri anne-babalara, ilgililere ve gerektiğinde kamuya anlatabilmek.
9. Genel ve özel yetenek testleri ile başarı testlerinin kullanılış yer ve amaçlarını ayırt edebilmek, aralarındaki fark ve ilişkileri görebilmek.
10. Ölçme ve değerlendirmeyi bir eğitim süreci olarak kullanabilmek, sonuçları sınıflarda tartışarak öğrencilerin kendi kendilerini değerlendirme güçlerini geliştirmeyi sağlamak.
11. Ölçme ve değerlendirme etkinliğinin çok yanlı olduğunu bilmek; özellikle eğitim ve öğretimi çocukların öğrenme yeteneklerine ilgi ve kişisel eğilimlerine uygun düşecek yönde düzenlemek için ölçme ve değerlendirme sonuçlarından yararlanmak.

Ölçmenin Öğeleri
Varlık: Ölçme yönünden önemli olan varlığın canlı-cansız oluşu değil, somut-soyut oluşudur.
Ölçme aracı: Ölçme işlemlerinde kullanılan araçları, 1) standart. 2) standart olmayanlar, şeklinde iki gruba ayırabiliriz.
Sayısal sonuç: Ölçme aracı ile elde edilen sonuç birbiriyle yakından ilgilidir. Standart bir araç kullanarak yapılan ölçmede elde edilen sayısal sonuç kesinlik arzeder. Ölçmede kullanılan araç standart değilse, elde edilen sonuç kesin bir anlam taşımaz. Ölçülecek varlık veya özellik somut, ölçme aracı da standart ise sonuç kesin olacaktır.
Başlıca Ölçme Çeşitleri
Varlıkların veya ölçmek istediğimiz niteliklerin ölçülmesi, dolaylı (endirekt) ve dolaysız (direkt) olmak üzere iki şekilde olur. Ölçmede kullanılan ölçek ya da birime göre, elde edilen sonuç mutlak (kesin) veya bağıl (izafî) olabilir. Bu yönden de ölçme, mutlak ve bağıl olmak üzere ikiye ayrılmaktadır. Böylece ölçmeyi, yapılış şekline göre dolaylı ve dolaysız, kullanılan birim ve elde edilen sonuca göre de, mutlak ve bağıl olarak çeşitleyebiliyoruz.
Dolaylı ve dolaysız ölçme: Çoğunlukla, ölçülecek varlık ya da özellik, kullanılan araçla doğrudan ölçülebildiği halde, bazı hallerde varlığın kendisini doğrudan ölçmek mümkün olmamaktadır.
Mutlak ve bağıl ölçme : Bir uzunluk veya ağırlık söylendiği zaman herkes tarafından anlaşılan ve şüphe uyandırmayan bir kesinlik vardır. Bu şekil ölçmelere mutlak ölçme denir.
1- Mutlak ölçmede başlangıç noktası sıfırdır. Bağıl ölçmelerde, sıfır yokluğu göstermez.
2- Mutlak ölçme, her yerde ve herkes tarafından aynı anlamı taşır. Bağıl ölçmenin herkesçe kabul edilen kesin bir anlamı yoktur.
Ölçmede Hassaslık ve Hata Kavramı
Bir ölçme işleminde hatayı en az seviyeye indirebiliriz. Fakat, aracımız çok hassas bile olsa, tamamen hatasız bir ölçmeyi kolay kolay yapamayız.
Her ölçmede mutlaka hata payı vardır. Bu hata ölçme yönteminden, ölçmeyi yapan bireyden, ölçme yapılan ortamdan vb. olabilir.
Eğitimdeki ölçmelerde hatadan sakınmak için, hata kaynakları ve bu kaynakların ölçme sonuçlarını nasıl etkilediği bilinmelidir.
1- Ölçmeyi yapan kişiden gelen hatalar; Bireylerin, ölçme konusu ile ilgili bilgi ve becerilerinin noksan ve farklı oluşundan dolayı, herkes aynı derecede hassas bir ölçme yapamaz.
2- Ölçme aracından gelen hatalar; Bir araç ne kadar iyi yapılırsa yapılsın, zamanla hassaslığı bozulabilir.
3- Ölçen kişinin ve ölçme aracının çevre ile etkileşiminden doğan hatalar; Özellikle insanla ilgili ölçme çalışmalarında bu durum daha çok etkili olur. Ölçen kişi ile, ölçülen kişinin etkileşmesi, ölçme sonucunu olumlu ve olumsuz şekilde etkileyebilir.
4- Kaynağı belli olmayan hatalar; Kaynağı iyi bilinmeyen, ölçmeciye veya ölçme aracına bağlı olan ve ölçme sonuçlarına gelişigüzel yansıyan hatalara tesadüfi hatalar denir.
Bir aracın ölçülmek isteneni doğru olarak ölçmesi, bu aracın geçerli olduğunu gösterir. Her uygulanışta aynı sonucu vermesi de onun güvenilir olduğuna işarettir. İnsanın ruhsal yönü ile ilgili nitelikleri, birbirinden tam olarak ayırmak mümkün olmadığı gibi, bu niteliklerin birbirlerini etkilemesi ölçme işlemini daha da zorlaştırır. Bunun için de, eğitim ve öğretimde kullanılan ölçme araçlarının geçerliliği ve güvenilirliği tam değildir.

Değişkenler
Ölçülecek olan durum ve niteliklere genellikle obje denmektedir. Varlık ve olaylar arasında değişiklik gösteren objelere de değişken denir. Boy, ağırlık, renk, sıcaklık, basınç, zekâ hepsi birer değişkendir. Değişkenlerin bir kısmını sayılarla gösterebildiğimiz halde (boy, ağırlık, sıcaklık, yaş gibi), bazılarını ancak özellik olarak belirleyebiliyoruz. Bu nedenle değişkenler ikiye ayrılırlar.
1. Nicel değişkenler
2. Nitel değişkenler
Nicel değişkenler sayılarla gösterilebilen değişkenlerdir. Nitel değişkenler ise, kalite ve çeşit yönünden ifade edilebilirler. Cinsiyet, renk, din, ilgi, davranış gibi. Bunlar sıfatlarla gösterilirler. Bu bakımdan nitel değişkenler, ölçmeden çok gruplama, sıralama ve derecelemeye uygun düşerler. Nicel değişkenler, her çeşit ölçme araçları ile ölçülerek sayısal olarak belirlenirler. Nitel değişkenleri bu şekilde ölçme olanağı yoktur. Ancak, aynı özelliklere sahip olanlar gruplanır, grupların frekansı bulunarak sonuç sayı ile gösterilebilir. Bu da ölçme değil bir sayma olur.

Ölçek Çeşitleri
Ölçekler; değişkenlerin sayısal olarak gösterilmelerini sağlayan şekil ve yöntemlerdir. Ölçeklerin başlıcaları, en yetersizinden, en yeterli olana doğru şöylece sıralanmaktadır;
1-Sınıflandırma ölçekleri: Bu ölçeklere aynı zamanda gruplama ölçekleri de denmektedir. Benzer özelliklerden yararlanmak ve aynı özellikleri taşıyanları bir grupta toplamaktır. Nitel değişkenlerdir. Ölçmeye ve bir birim cinsinden sayı ile gösterilmeye uygun düşmediklerinden gruplamaya tabi tutulurlar. Gruplarda bulunan elemanları sayarak, frekans dağılımını ve modunu bulmak mümkündür. Daha ileri istatistik işlemleri uygulama olanağı yoktur.
2-Sıraya Dizme Ölçekleri: Sıralama genellikle, gruplamadan sonra yapılan bir işlemdir. Objeleri, herhangi bir özelliğe sahip olma derecelerine göre sıraya koymaktır. Benzer özellikler bakımından, en üstün olandan en geri olana doğru 1 inci, 2 inci, 3 üncü, 4 üncü seklinde sıralamaktır. Sıraya konulduktan sonra ortak özellik önemini kaybeder. Önemli kimin kimden daha çok, daha az veya küçük-büyük oluşudur.
3-Aralıklı ölçekler (Eşit aralık Ölçeği) : Bu çeşit ölçeklerde bir başlangıç noktası vardır. Başlangıç noktasından itibaren, ölçek eşit aralıklara bölünmüştür. Ancak başlangıç noktası kesin değildir, mutlak yokluğu göstermez, izafi olarak kabul edilmiş bir noktadır. Bu bakımdan birimler birbirinin iki katı veya yarısı değildir. Biri diğerinden şu kadar fazla ya da eksiktir.
Aralık ölçekleri, objeler arasındaki farkın miktarını göstermektedir. Onun için toplama, çıkarma gibi hesaplama işlemleri yapılabilir. Her tür istatistik işlemi uygulanabilir. Termometreler, puanlar aralık ölçeklerine örnektir.
4-Oran Ölçekleri: Ölçeklerin en üstünü bu ölçeklerdir. Bu tip öl­çeklerin aralıklı ölçeklerden tek farkı mutlak yokluğu gösteren bir başlangıç noktasının bulunmasıdır. Başlangıç izafi olarak kabul edilmiş bir nokta değil, mutlak yokluğu gösteren bir sıfır noktasıdır. Başlangıcının kesin yokluğu göstermesi ve aralıklarının eşit olması, bu ölçeklerle elde edilen sonuçlara her çeşit hesaplamanın uygulanabilmesini sağlar.
Oran ölçeklerinin kullanıldığı ölçmeler kesindir. Nicelik cinsinden değişkenler bu çeşit ölçeklerle ölçülür. Oran ölçekleriyle elde edilen verilere her tür istatistik işlemler uygulanabilir.

Fiziksel ve Sosyal Bilimlerde Ölçme
1. Fiziksel bilimlerin ölçme konusu somuttur, maddenin nicel yönü ile ilgilenir. Sosyal bilimlerin konusu ise daha çok soyuttur. Somutun kesin olarak ölçülmesi mümkün olduğu halde, soyutun ölçülmesi çok zordur. Soyutun ölçülmesinin zorluğu yanında elde edilen sonuçlar da kesin değildir. Bu nedenle, fiziksel bilimlerde ölçme, sosyal bilimlere oranla daha kolay ve kesindir.
2. Somut varlıkları ölçmek üzere standart ve hassas ölçme araçları geliştirilmiştir. Fiziksel bilimler ölçek olarak en üstün seviyedeki bu ölçekten yararlanırlar. Sosyal bilimlerde kullanılan ölçeklerin, en üstün seviyede olanı aralıklı ölçeklerdir. Böylece, sosyal bilimlerdeki ölçme araçlarının yetersizliği, yapılan ölçmenin de yetersiz kalmasına neden olmaktadır.

DEĞERLENDİRME KAVRAMI
Değerlendirme Nedir?
Ölçmeyi belli bir amaçla yaparız. Sonra da elde ettiğimiz sonucun amacımıza uygun olup olmadığını araştırırız. Ölçme sonucunu amacımıza göre yorumlamak, az, çok, yeterli, iyi, kötü şeklinde bazı değer hükümlerine ulaşmak bir değerlendirmedir. Böylece değerlendirme, ölçmeden sonra gelen ve onu takip eden bir işlemdir.
Değerlendirme, her ne kadar ölçmeyi takip eden bir işlemse de, ölçme sonucunu kendi başına değerlendirme olanağı yoktur. Ölçme sonucunun değer kazanabilmesi, ya da ona değer biçilebilmesi için, mutlaka onu karşılaştırabileceğimiz bazı dayanakların olması gerekir. Ölçme sonuçlarının değerlendirilmesi için karşılaştırmaya ve yorumlamaya esas alınan dayanaklara ölçüt denmektedir. Ölçüt olmadan değerlendirme olmaz.
Yukarıdaki açıklamalardan da anlaşılacağı gibi değerlendirme, üç basamaklı bir işlem olarak karşımıza çıkmaktadır. Bunlar sırasıyla şunlardır:
1- Ölçme ya da ölçme yerine geçebilen gözlem verileri: Ölçme yapılmazsa veya ölçme yerine geçebilecek gözlem verileri olmazsa değerlendirme olmaz. Çünkü, ortada değerlendirecek bir şey yok demektir.
2- Ölçme veya gözlem verilerini karşılaştıracak, yorumlamayı kolaylaştıracak dayanaklar: (Ölçüt, kıstas, kriter) Elimizdeki ölçme verilerine değer biçebilmek için, bazı dayanaklara gerek vardır.
3- Hüküm: Ölçme verilerinin ölçüt ya da ölçütlerle karşılaştırılması ile varılan sonuç. İyi, başarılı, başarısız, yeterli gibi değer hükümleri.
Bazı değerlendirme tanımları:
Değerlendirme, bir çalışmanın sonucu üzerinde varılan yargı, bir şeye değer biçmedir. (Türkçe Sözlük)
Değerlendirme, bir obje veya işin belli ölçütler karşısında niteliğini veya değerini tayin etme, bir konuda ölçütlerle gözlem verilerini karşılaştırmadır. (Öğretmenlik Meslek Dersleri Sözlüğü)
Değerlendirme, niceliği ya da niteliği üzerinde yapılan, çalışma sonucu varılan yargıdır. (Eğitim Terimleri Sözlüğü)
Değerlendirme, aynı biçimdeki olayların, birtakım ölçütlere göre önemini belirtmedir. (Eğitim Terimleri Sözlüğü)
Değerlendirme, türlü öğretim amaçlarının gerçekleşme oranını, değişik yollarla ölçme ve ortaya çıkan sonuçlar üzerinde değer biçmedir. (Eğitim Terimleri Sözlüğü)
Tanımlarda da görüldüğü gibi değerlendirme bir yorumlama işidir. Bunun için de yorumlanacak verilere ve bunların yorumlanmasını sağlayacak ölçütlere (dayanaklar) gerek vardır. Sonuç olarak bir tanım yaparsak, değerlendirme; «ölçme ya da gözlem verilerini, uygun ölçütlerle karşılaştırmak suretiyle, bazı değer hükümlerine (yargı) ulaşmaktır.» diyebiliriz.

ÖLÇME İLE DEĞERLENDİRMENİN İLİŞKİSİ
1-Ölçme bir değişkenin miktarını gösterir. Değerlendirme ise, bu miktarın yeterli olup olmadığını ya da amaca uygun olup olmadığını gösteren hükümdür.
2-Genel olarak ölçme objektiftir. Değerlendirme ise yargıya dayandığı ve ölçüte göre değiştiği için sübjektiftir.
3-Kapsam bakımından değerlendirme daha geniştir, ölçmeyi; içine alır.
4-Ölçme daha çok gözleme, değerlendirme ise, karşılaştırma; yorum ve yargıya dayanır.

İYİ BİR ÖLÇME ARACININ ÖZELLİKLERİ
Bir ölçme aracının en önemli özelliği, geçerli olmasıdır. Çünkü, geçerli olan bir araç, hemen hemen diğer bütün özelliklere de sahiptir. Aracın, bütün özellikleri birbiriyle ilgilidir. Her hangi bir özelliğin bulunup, bulunmayışı, aynı zamanda aracın diğer özelliklerine de tesir eder. İyi bir ölçme aracında bulunması gereken, en önemli altı özellik aşağıda açıklanmıştır.

İyi Bir Ölçme Aracı Geçerli Olmalıdır
Ölçme aracının ölçülmek istenen özelliği ölçme gücüne ölmedeki geçerliği denir.
Eğitim ve öğretimde kullanılan ölçme araçları tam standart olmadığı için geçerli bir ölçmenin yapılması oldukça zordur. Bir ölçme aracını oluşturan sorular tek tek geçerli ise, bu aracın tamamı da geçerlidir. Bundan dolayı, ölçme aracındaki soruları hazırlarken şu sorulara cevap aramalıyız.
1.Neyi ölçmek istiyoruz? Bu sorunun cevabını kesinlikle bilmeliyiz
2.Sorumuz, ölçmek istediğimizi doğru olarak ölçebilir mi?
  • Uyum geçerliği
  • Yapı geçerliği
Test geçerliğinin belirtilmesinde korelasyondan yararlanılır. Korelasyonun, değişik ölçülerle yapılan sıralamaların ne ölçüde birbirine benzediğini belirtmek için kullanışlı bir ölçü olması, onun bu amaçla da kullanılmasında önemli bir etkendir. Ancak, geçerlik göstergesi olarak kullanılan korelasyon, -1,00 ile 1,00 değerleri arasında değişebilir, ilişkinin miktarını korelasyonun mutlak değeri gösterdiğinden, sadece 1,00 veya ona yaklaşan değerler değil, -1,00 veya ona yaklaşan korelasyonlar da yüksek bir ilişki olduğunu gösterir. Ancak bu son durumda ilişkinin yönü terstir; birinin yüksek değerlerine ikincisinin düşük değerleri karşılık gelmektedir. Geçerlik göstergesi olan korelasyonun sıfıra yaklaşması, iki ölçü dizisi arasında ilişki bulunmadığını; geçerliğin düşük olduğunu gösterir.

PEARSON MOMENTLER ÇARPIMI KORELASYON KATSAYISININ HESAPLANMASI
( ån) ( åy)
R = åxy –
å (x2 – ( åx)2 ) í å y2 – ( å y)2 y
n n

İyi Bir Ölçme Aracı Güvenilir Olmalıdır
Aracın güvenilir olması, aynı şartlar altında hep aynı sonucu vermesi demektir. Buna kararlılık da denir. Bir testi aynı sınıfa değişik zamanlarda uyguladığımız zaman, aynı veya çok yakın sonuçları alıyorsak bu test güvenilir demektir. Her seferinde değişik sonuçlar alıyorsak, o taktirde test güvenilir değildir.
Saydığımız bu faktörleri dikkate almak suretiyle, bir ölçme aracının güvenilir olup olmadığını anlamak için, yapılabilecek başlıca çalışmaları şöylece sıralayabiliriz:
(a)Aracın tek ve çift sayılı sorularından iki ayrı araç elde edilir. Bu iki araç biraz arayla aynı sınıfa uygulanır. Elde edilen puanların bağıntısı (korelasyon) ne kadar yüksek ise, aracın güvenilirliği o derece iyi dernektir.
(b)Bir ölçme aracı hazırlanırken, eş değerli sorularla ikinci bir araç hazırlanır. Bu iki araç biraz arayla aynı sınıfa uygulanır. Alınan puanların bağıntısı bulunur. Bağıntı, katsayısının pozitif ve yük­sek olması aracın güvenilir olduğuna işarettir.
(c)Aynı araç belli aralıklarla, aynı sınıflara uygulanır, Puanlar arasındaki bağıntının derecesi bulunur. Böylece de, aracın güvenilir olup olmadığı anlaşılabilir.
(d)Sınıf eşit iki gruba ayrılır. Bu iki grubun aynı araçtan aldıkla­rı puanlar arasındaki bağıntının derecesi bulunur. Buna göre de aracın güvenilirlik durumu anlaşılır.
Geçerli olan her ölçme aracı güvenilir demektir. Fakat güvenilir olan her araç geçerli olmayabilir. Ölçmek istediğimizi en doğru şekilde ölçebilen araç geçerlidir. En doğru şekilde ölçtüğüne göre, aynı şartlar­da hep aynı sonucu verecektir. Bu bakımdan da güvenilir demektir. Aynı veya benzer şartlarda hep aynı sonucu veren -güvenilir- araç, ölçmek istediğimizi doğru olarak ölçmeyebilir.
Hangi yöntemle güvenirlik tahmini yapılırsa yapılsın, sonuçta 0.00 ile 1.00 arasında bir korelasyon elde edilir. Korelasyonun 1.00'e yakın olması testin güvenirliğinin yüksek olduğu, 0.00'a yakın olması ise düşük olduğu anlamına gelir. Testin güvenilirliğinin yüksek olması, test puanlarına yansıyan hataların az olduğu, güvenilirliğinin düşük olması ise hataların fazla olduğu anlamını taşır.

GÜVENİRLİK KATSAYISI HESAPLAMA
1. Güvenirlik katsayısı Msn Rainbow "Kuder Rıchardsonz" formülü ile hesaplanabilir.
R = N / N-1 [ 1 – X (1-X/N) / S2 ]
N = madde (soru) sayısı
X = puanların ortalaması
S = standart sapma
Geçerlik ve güvenirlik ile ilgili bir noktanın daha belirtilmesinde yarar vardır. Testler için güvenirlik ve geçerliğin ikisinin de yüksek olması testin ölçülmek istenen özelliğinin gerçek değerine yakın değerler verdiğini gösterir. Ancak, testlerin geçerlikleri güvenirlikleri kadar yüksek olmaz. Örneğin, grup karşılaştırmasında kullanılmak üzere hazırlanan testlerin güvenirlikleri 0,60-0,80 arasında olabilir. Bireyler hakkında karar vermede kullanılacak testlerin güvenirliklerinin 0,80'in, karar çok ciddi sonuçlara yol açabilecekse 0,90'ın üzerinde olması beklenir. Öte yandan, grup karşılaştırmalarında kullanılacak testlerin geçerlikleri 0,20-0,60 arasında olabilirken bunun bireysel kararlar temel olacak ölçüleri elde etmede kullanılacak testler için biraz daha yüksek, 0,40-0,70 arasında olması iyi olur.

İyi Bir Ölçme Aracı Objektif (Nesnel) Olmalıdır
Ölçme aracının objektifliği (nesnelliği), aynı zamanda aracın geçerli ve güvenilir olmasına da etki eder. Objektiflik, kişiye göre değişmemesi ve kesin olması demektir. Ölçme aracının objektifliğinin 3 yönü vardır.

1-Sorularda objektiflik: Ölçme aracındaki soruların herkes tarafından aynı şekilde anlaşılması demektir.
2-Uygulamada objektiflik: Aracın uygulanışının kişiye göre değiş­memesi, herkes tarafından aynı şekilde uygulanabilmesi demektir.
3-Puanlamada objektiflik: Kâğıtları puanlayan kişinin, kanaatlerinin puanlamaya etki edememesi demektir.
Çoğunlukla, kısa cevaplı ve seçmeli tipindeki soruların objektifliği yüksektir. Uzun cevaplı kompozisyon tipindeki soruların objektifliği çok zayıftır.

İyi Bir Ölçme Aracı Ayırt edici Olmalıdır
Uygulanan aracın, bilenle bilmeyeni, zayıf ile başarılıyı birbirinden ayırması demektir. Bir soru bütün öğrenciler tarafından doğru olarak cevaplanmışsa veya hiçbir öğrenci tarafından doğru olarak cevaplanamamışsa, bu soru ayırdedici değildir. Bir sorunun ayırdediciliği, onun zorluk derecesi ile ilgilidir. Bir sorunun zorluk derecesi şöyle bulunur. Soruyu cevaplayanların sayısı, o soruyu cevaplamaya çalışanların (sınayanların) sayısına bölünüp, 100 ile çarpılır. Örneklersek; 45 kişilik bir sınıfta, testin son sorusuna doğru cevap veren 24, yanlış cevaplayan 16, erişemeyen de 5 kişi olsun. Demek ki, erişemeyen (son soruya kadar gelemeyen) 5 kişinin dışındaki 40 kişi soruyu sınamıştır. Bu sorunun güçlük derecesi, 24 : 40 x 100 = 60 eder. Sorunun güçlük derecesi ortanın üzerinde demektir.
Bir soruya doğru cevap verenlerin sayısı azaldıkça, sorunun ayırma gücü artar. Ancak, bir ölçme aracındaki soruların hepsinin ayırma gücünün yüksek olması gerekmez. Özellikle, başarı testleri değişik güçlükteki sorulardan oluşmalıdır. Seçme ve yarışma sınavlarında daha çok zor sorulara yer verilir. Aracın uygulanmasından elde edilen puanların, en düşüğü ile en yükseği arasındaki fark fazla ise, öğrencilerin puanları bu iki puan arasında dağılmışsa, bu araca ayırt edici denebilir.

İyi Bir Ölçme Aracı Örnekleyici Olmalıdır
En iyi ölçme, öğretilenlerin veya ölçülmek istenen alanın tamamını ölçmektir. Fakat bu çoğunlukla, özellikle ölçme alanımız çok geniş olduğu zaman pek mümkün olmaz. Bu durumda, yapılacak iş ölçme alanını en iyi şekilde örnekleyebilecek sorular seçmektir. Örneklemenin iyi ol­ması, bütünü kapsayacak şekilde çok sorunun sorulması ile sağlanır. Fakat, sadece çok soru sormak da bizi amacımıza ulaştırmaz. Sorunun çokluğu kadar, niteliği de önemlidir. Olanaklar ölçüsünde, her konudan soru çıkarılmalı, çıkarılan soru ilgili olduğu konuyu örnekleyebilmeli ve bu sorularla amaçların gerçekleşip gerçekleşmediği anlaşılabilmelidir. Hatta, sorular iyi hazırlandığı zaman, az soruyla bile örnekleme yapılabilir. Fakat çok sorunun ölçülecek alanı daha iyi örnekleyeceği muhakkaktır. Az sorulu klasik yazılı yoklamaların örnekleyiciliği azdır.

İyi Bir Ölçme Aracı Kullanışlı Olmalıdır
Ölçme aracının kullanışlı olması, kullanılışında bir takım kolaylıkların bulunmasıdır. Aracın kullanılışı ile ilgili olarak, aranan başlıca nitelikler şunlardır:
(1) Uygulanması kolay olmalıdır.
(2) Puanlaması kolay olmalı, uzun zaman almamalıdır.
(3) Kolay okunmalı, yanlış anlamaya fırsat vermemelidir.
(4) Aracın düzeni ve soruların yerleştirilmesi iyi olmalıdır.
(5) Ekonomik olmalı, farla masrafı gerektirmemelidir.
Msn Demon Süre ayarlaması iyi yapılmalı, verilen zaman az veya çok olmamalıdır.
(7) Ayrı cevap kağıdı varsa, test defteri ile ikisi birbirine uymalı, karışıklığa meydan vermemelidir.
Bir testin kullanışlılığı, güvenirlik ve geçerlikten sonra düşünülmesi gereken bir özeliktir. Amacı için yeterli olabilecek güvenirlik ve geçerlikte olan testler arasında en kullanışlı olan seçilmelidir. Aksi durumda çok kullanışlı olduğu halde güvenirliği ve geçerliği düşük olan bir test amaca uygun sonuç vermez.

TEST SORULARININ ÇÖZÜMLENMESİ (MADDE ANALİZİ)
Bir ölçme aracındaki soruların iyi çalışıp çalışmadığını saptamak ve gerekli düzeltmeleri yapmak için yanıtları çözümlemek veya hiç değilse gözden geçirmek gerekir. Yanıtların gözden geçirilmesi aynı zamanda öğretimin başarılı ve başarısız yanlarını göstermek bakımından da önemlidir.

TABLO:
Madde: Aşağıdakilerden hangisi kimyasal bir değişimdir?
Yanıt seçenekleri Yanıt frekans dağılımı
a) Yağın donması 16
b) Suyun buharlaşması 5
c) Mumun erimesi 20
d) Benzinin yanması 56
e) Tuzla suyun karışması 23
Yanıt vermeyen öğrenci sayısı 0
Toplam : 120
Bu çözümleme bize madde hakkında kaba bir fikir vermekle birlikte kesin ve yeterli olmaktan çok uzaktır. Daha kesin ve yeterli bilgi için madde üzerindeki çözümlememizi şu iki soruya yanıt vermek üzere derinleştirmemiz gerekir:
1.Soru maddesinin zorluk derecesi nedir?
2.Soru maddesinin ayırma gücü nedir (iyi öğrenci ile zayıf öğrenciyi ayırıyor mu)?
Birinci soru maddenin güvenirlik niteliği, ikinci soru maddenin geçerlik niteliği ile ilgilidir. Başka bir deyişle, madde güçlüğü, kullanılışına göre, hem güvenirlik hem geçerlik ile ilgili bilgi verebilir.

Madde Analizi ile İlgili Bazı Kavramlar
Erişilmemiş sorular: Cevaplama sırasında yetiştirilememiş sorulardır. Bunlar daima testin sonundadır. Erişilmemiş soru miktarı, testin süresi dolduğu halde cevaplamayı tamamlayamamış öğrencilerde olur.
Atlanmış sorular: Üzerinde çalışılmış, fakat doğru cevap tam bilinemediği için veya soru anlaşılmadığı için işaretleme yapılmamış olan sorulardır. Erişilmemiş sorular testin sonunda olduğu halde, atlanmış sorular arada olmaktadır.
Soruyu sınayanlar: Testin bir sorusuna erişememişlerin dışında kalanlar soruyu sınayanların sayısını verirler. Başka bir deyişle, soruyu işaretlemiş olanlarla atlamış olanlara soruyu sınayanlar denir.
Doğru cevapların oranı: (Doğru cevap yüzdesi) Bir soruyu doğru cevaplayanlar sayısının, o soruyu sınayanlar sayısına oranı bu sorunun doğru cevap yüzdesini verir. Örneklersek; 40 kişilik bir sınıfta testin 45 inci sorusunu doğru cevaplayan 30, yanlış cevaplayan 7, atlayan 2 ve erişememiş de 1 kişi olsun. Burada erişememiş 1 kişi olduğuna göre, soruyu sınayanların sayısı 39 dur. Bu sorunun doğru cevap oranı şöyle bulunur
Doğru cevap sayısı 30
Doğru cevapların oranı = ----------------------------- = ----------- = 0,77 = %77
Sınayan sayısı 39
Yanlış cevapların oranı: Bir soruyu yanlış cevaplayan sayısının soruyu sınayanlar sayısına bölümüdür. Buna göre yukarıdaki sorunun yanlış cevap oranı veya yanlış cevapların yüzdesi: 7/39 = 0,18 Bu % 18 olarak söylenir.

Soruların çözümlenmesi için yapılacak çalışmalar sırasıyla;
1. Soru çözümlenmesine başlamak için yapılacak ilk çalışmalar: Puanlanmış bir testin kâğıtları veya puanları en yüksek puan en üstte ve en düşük puan en altta olacak şekilde sıraya konur. Sonra da üç gruba ayrılır. Gruplama şu oranlara göre yapılmalıdır. Sınıf sayısının 1/4 ü üst grup, 2/4 ü orta grup ve 1/4 ü de alt grupta olmalıdır. Burada gruplama 1/3 oranıyla yapıldığı gibi, yarıdan iki grup da yapılabilir. Fakat uygulamada çoğunlukla birinci yol tercih edilmektedir. Gruplamanın nasıl yapılacağını bir örnekle gösterelim. 18 kişilik bir sınıftaki öğrenciler ve puanları aşağıdaki şekilde olsun.
Öğrenciler A B C D E F G H I İ J K L M N O Ö P
Puanları 47 45 44 42 41 40 39 39 36 35 32 32 30 29 28 26 26 25
Üst grup (5) Orta grup (9) Alt grup (4)
2- Soruların zorluk derecelerinin bulunması: Bir sorunun zorluk derecesi o soruyu doğru cevaplayanların azlığı ve çokluğu ile ilgilidir. Doğru cevaplayan sayısının çokluğu sorunun kolay olduğunu, azlığı da zor olduğunu göstermektedir. Cevaplayamayanlar açısından durum bunun tersidir. Doğru cevaplayamayanların çokluğu sorunun zorluğunu, yanlış cevaplayanların azlığı da sorunun kolay olduğunu gösterir. Bir sorunun zorluk derecesini sayısal olarak, daha önce açıkladığımız doğru cevapların oranına veya yanlış cevapların oranına göre bulabiliriz. Bir sorunun doğru cevap oranı (yüzdesi) sayısal olarak büyükse soru kolay, küçükse soru zor demektir. Yanlış cevapların oranına göre de, yüzdenin yüksekliği sorunun zor olduğunu, düşüklüğü de kolay olduğunu belirler. Soruların zorluk dereceleri 0 ile 100 arasında değişmektedir. Buna göre:
- Doğru cevap oranı % 1 İle % 39 arasında olan sorular zor,
- Doğru cevap oranı % 40 ile % 69 arasında olan sorular orta güçlükte,
- Doğru cevap oranı % 70 den yukarı olan sorular da kolay sorulardır.
- Yanlış cevapların oranına göre % 1 ile % 30 arasında olanlar kolay, % 31 ile % 60 arasında olanlar orta güçlükte, % 61 den yukarı olan sorular­da zor sorulardır.
Genel bir kural olarak, orta zorlukta olan bir madde, çok kolay veya çok zor olan bir maddeden daha iyidir, denebilir? Şu kadar ki, her testte bir miktar kolay, bir miktar da zor maddeye ihtiyaç vardır. Çok kolay ya da çok zor maddelerden kurulu testler güvenirlik yönünden zayıf demektir.
Soruların zorluk dereceleri başka bir yoldan şu şekilde bulunmaktadır. Orta grup hiç hesaba katılmadan, üst grup doğru cevap yüzdesi ile alt grup doğru cevap yüzdesi toplanarak ikiye bölünmektedir. Bunu bir formülle aşağıdaki şekilde gösterebiliriz.
Üst grup doğru cevap % si + Alt grup doğru cevap % si
Zorluk derecesi = ------------------------------------------------------------------
Bu şekildeki hesaplamada orta grubun hiç etkisi olmamaktadır. Sorunun zorluk derecesi sınıfın iyi ve zayıf öğrencilerine bağlı olmaktadır. Sorunun zorluk derecesinin bu şekilde iki uçtaki % 50 ye göre bulun­ması ve ortada kalan % 50 lik bölümün dikkate alınmamasıyla, gerçek zorluk derecesi çıkmamaktadır. Bundan dolayı bu yolla zorluk derecesinin bulunması pek benimsenmemektedir.
Z.İ.= Zorluk indeksi
Dü= Üst ölçüt grupta doğru yanıtların sayısı
Da= Alt ölçüt grupta doğru yanıtların sayısı
Nü= Üst gruptaki öğrenci sayısı
Na= Üst gruptaki öğrenci sayısı
Dü+Da
Z.İ.= ---------------
Nü + Na
Örneğin, 120 kişinin yanıtladığı bir maddede Dü= 24, Da= 8, Nü=30, ve Na=30 ise, o maddenin zorluk indeksi,
24+8 32
Z.İ. = ----------- = ---------- = 0.53’e eşittir.
30+30 60
Ayırma gücü olan bir maddenin zorluk indeksi ideal olarak 0.50 etrafında olmalıdır. Genellikle iyi bir test için maddenin zorluk derecelerinin şöyle bir dağılım içinde olması beklenir.
Maddelerin yaklaşık,
— %35'i oldukça kolay (grubun %50-85'inin doğru yanıtlayabildiği),
— % 15'i çok kolay (grubun % 85-100'ünün doğru yanıtlayabildiği),
— % 35'i oldukça zor (grubun % 15-50'sinin doğru yanıtlayabildiği),
— % 15'i çok zor (grubun % 0-15'inin doğru yanıtlayabildiği), olmalıdır.
Maddenin ayırma gücü ile zorluk derecesi arasında doğrudan bir ilişki yoktur. Ayırma gücü olan bir madde zor olabileceği gibi kolay da olabilir. Örneğin üst ölçüt grubun ancak % 15'inin, alt ölçüt grubun %1'inin doğru yanıtlayabildiği son derece zor bir maddenin ayırma gücü 0.50’ ye yakındır. Buna karşılık üst ölçüt grubun % 92'sinin, alt ölçüt grubunun % 65'inin doğru yanıtlayabildiği çok kolay bir maddenin ayırma gücü 0.40'a yakındır. Zorluk dereceleri bir hayli farklı olan bu iki madde geçerlik yönünden hemen aynı derecede iyi sayılır.
Şu kadar ki, grubun % 100'ünün doğru yanıtlayabildiği, ya da hiç kimsenin doğru yanıtlayamadığı bir maddenin ayırma gücü yoktur. Böyle maddelerin testte yer almaması gerekir. Ancak çoğu kez yüreklendirme amacıyla testin baş bölümüne birkaç çok kolay, iyi öğrencileri ayırt etmek için testin sonuna birkaç son derece zor madde konur.

Madde Analiz Kartı'nın ön yüzü
Testin Adı Uygulandığı Grup
Madde 1. Şunlardan hangisi gel - git olayının nedenidir?
a) Denizlerin güneş tarafından çekimi
b) Deniz sularının rüzgarlarla itilmesi
c) Deniz suyunun karalar tararından çekimi
d) Denizlerin ay tarafından çekimi
e) Deniz sularının gizli depremlerle kabarması.
Kartın arka yüzü
Doğru
Yanıt seçenekleri a b c d e Boş yanıt % Toplam
Üst grup 6 3 4 19 0 0 60 32
Alt grup 8 6 6 10 2 0 30 32
Ayırma gücü (biserial r) =
Zorluk indeksi (Z.İ.) =
Madde analizi tekniğinden, testi düzeltme ve geliştirme için olduğu kadar, öğretimi yönlendirme ve daha etkin kılma için de faydalanılabilir.
Uygulayıcı her maddedeki yanıt seçeneklerine verilen yanıtları yukarıda gösterildiği şekilde çözümlemek ve yorumlamakla hangi noktalarda başarılı, hangi noktalarda başarısız sonuç aldığını görür, gereken önlemleri alma olanağını elde eder. Öte yandan madde analizi yoluyla test sonuçlarının gözden geçirilmesi öğrenciler yönünden de yararlıdır. Öğrenci böylece kendi durumunu daha gerçekçi bir yaklaşımla değerlendirmek fırsatını bulur. Ayrıca testle ölçülmek istenen nitelikler bakımından eksikliklerini giderme, bilgi ve anlayışını arttırma olanağına kavuşur.

3. Soruların ayırma güçlerinin bulunması:
Soru maddesinin ayırma gücüne gelince, bu maddenin geçerliği ile ilgili olup, testin uygulandığı grup içindeki en iyi öğrencilerle en zayıfları birbirinden ayırmasına bağlıdır. Grup içinde zayıflar da iyiler gibi bir maddeyi doğru yanıtlayabilmişse o maddenin ayırma gücü yok demektir. Aynı şekilde, grubun tümü bir maddeyi doğru yanıtlayamamışsa, böyle bir maddenin de ayırma gücünden söz edilemez. Ayırma gücünden yoksun, ya da ayırma gücü zayıf olan maddeler ve bu tür maddelerden kurulu testler, geçerlik yönünden zayıf demektir.
Test uygulayıcıları bazit bazı işlemler kullanarak testte yer alan maddelerin ayırma gücünü ve zorluk derecesini belirleyebilirler. Bu işlemleri şöyle sıralayabiliriz.
a) Test uygulamasından sonra cevap kağıtları en yüksek puandan en düşük puana doğru sıraya konur.
b) Sıraya konan cevap kağıtlarından üstten %25 ve alttan %25 alınır. Bu yüzdeler cevap kağıdı sayısı fazla değilse, arttırılabilir. Eğer cevap kağıdı sayısı 60'ın altında ise, hepsi alınır, üst ve alt gruplar %50'şer olur. Madde analizi bu durumda bu iki (üst ve alt) grubun karşılaştırılmasına dayanacaktır. (Bu gruplara "ölçüt" gruplar diyeceğiz.)
c) Her iki ölçüt grupta maddeye doğru yanıt verenlerin sayısı saptanır ve maddenin ayırma gücü (geçerlik) indeksi hesaplanır. Bu hesaplama şöyle olur. Üst-ölçüt grupta doğru yanıtların sayısından (bunu "Dü" ile gösterelim), alt ölçüt grupta doğru yanıtların sayısı (bunu "Da" ile gösterelim) çıkarılır, aradaki fark iki gruptaki doğru yanıtların toplamına (yani Dü + Da) bölünür.
Bunu kısaca şu formülle ifade edebiliriz:
Ayırma gücü indeksi = Dü —Da / Dü + Da
Bir örnek vermek için herhangi bir maddeyi üst ölçüt grubundan 24 kişinin, alt ölçüt grubundan 8 kişinin doğru yanıtladığını düşünelim. Buna göre, maddenin ayırma gücü indeksi,
24 — 8 / 24 + 8 = 16 / 32 = 0.50 ‘ye
eşit olacaktır. Eğer aynı maddeyi üst grubun tümü doğru yanıtlamış, alt grubun tümü yanlış yanıtlamış olsaydı, o zaman ayırma gücü indeksi,
30 – 0 / 30 + 0 = 1’e
eşit olacak, yani maddenin geçerlik derecesi en yüksek düzeye ulaşacaktır. İndeksin 0'a eşit olduğu hallerde maddenin ayırma gücü yok demektir. Örneğin, maddeye doğru yanıt verenler üst ve alt gruplarda aynı sayıda olursa, maddenin ayırma gücünden bahsedilemez; çünkü bu durumda geçerlik indeksi 0'dır. Demek oluyor ki, bir maddenin geçerlik veya ayırma gücü indeksi 0'dan 1'e kadar değer alır. Pek az görülen durumlarda, örneğin maddeye doğru yanıt verenler alt - ölçüt grubunda daha fazla olursa, geçerlik indeksi negatiftir, indeksin negatif, sıfır veya sıfıra yakın değerler aldığı hallerde maddenin ya düzeltilmesi ya da testten büsbütün çıkarılması gerekir.
Bir sorunun ayırma gücü, üst grup doğru cevap yüzdesinden alt grup doğru cevap yüzdesinin çıkarılmasıyla da bulunur. Bunu formül şeklinde yazarsak:
Ayırma gücü= Üst grup doğru cevap %si — Alt grup doğru cevap %si
Formülün sonucunda elde edilen sayı, o sorunun ayırma gücünü verir. Bu sayı pozitif olabilir, sıfır olabilir veya negatif olabilir.
Quo vadis?

Benzer Konular

18 Nisan 2016 / yusuf hhhhhhhh Cevaplanmış
18 Nisan 2016 / Misafir Cevaplanmış
14 Mart 2015 / Ziyaretciyim Cevaplanmış
25 Nisan 2013 / sultimulti Soru-Cevap
8 Nisan 2010 / Misafir Taslak Konular