Arama

Eğitimde Ölçme ve Değerlendirme

Güncelleme: 8 Eylül 2008 Gösterim: 29.146 Cevap: 0
Misafir - avatarı
Misafir
Ziyaretçi
8 Eylül 2008       Mesaj #1
Misafir - avatarı
Ziyaretçi
Eğitimde Ölçme ve Değerlendirme

Sponsorlu Bağlantılar
1 – Ölçme ve değerlendirme kavramları arasında ne fark vardır?

Ölçme, bir varlık veya olayın belli bir özelliğe sahip oluş derecesini belirleme işlemidir. Eğitimde ölçme, genellikle öğrencilerin belli bir takım davranışları, öğrenme derecelerini belirlemesi olarak kullanılır.
Değerlendirme, ölçme ile ortaya konulan duruma bir anlam verme işlemidir. Eğitimde değerlendirme; belli bir takım davranışların öğrenilme derecesi ölçme ile ortaya konulduktan sonra bu ölçme sonuçlarına dayanarak neler yapılacağının kararlaştırılması şeklinde görülür.

2 – Ölçme de kullanılan ölçekler nelerdir?
Ölçmede kullanılan ölçekler çok çeşitli olmakla birlikte en çok kullanılanlar şunlardır.
a) Sınıflama ölçekleri.
b) Sıralama ölçekleri.
c) Eşit aralıklı ölçekler.
d) Oranlı ölçekler.
Eğitimde kullanılan ölçme araçları genellikle sıralama ölçekleri veya eşit aralıklı ölçekler grubuna girer.

3 – Sözlü sınavlarının yararlı ve sakıncalı yönleri nelerdir?
Normal olarak bir defada birkaç soru sorulabilir. Zaman alıcıdır her öğrenciye çok az soru sorulabilir. Her öğrenciye farklı soru sorulması gerekir. Bunlar sözlü sınavlarının sakıncalı yönleridir. Sözlü sınavlarla konuşma becerilerini, veya sözlü ifade gücünü ölçebiliriz. Bu yönüyle yararlıdır.

4 – Uzun cevaplı yazılı sınavların yararlı ve sakıncalı yönleri nelerdir?
Bu sınavlar subjektifler yazma becerileri ve yazılı anlatım gücünün ölçülmesi dışında başvurulmaması gerekir.

5 – Kısa cevaplı yazılı sınavların özellikleri nelerdir?
Dersin kapsamının iyi bir şekilde örneklenmesi sağlanabilir. Subjektiflik büyük ölçüde azalmaktadır. Planlama daha kolaydır. Her düzeyde öğrenme ürünleri yoklanabilir.

6 – Seçmeli testlerin özellikleri nelerdir?
Bilinen en gelişmiş testlerdir. Çok sayıda soru sorulabilmesi soruların açık ve anlaşılır birer biçimde ifade edilmesi şartıyla güvenirliği yüksektir.

7 – Değerlendirmede kullanılan ölçütler nelerdir?
Değerlendirmede, zamana, yere ve duruma göre değişmeyen, mutlak ölçütler veya zamana, yere veya duruma göre değişebilir bağıl ölçütler kullanılmaktadır. Eğitimde öğrencileri tanıma ve yerleştirme, öğrenme eksiklikleriyle güçlükleri belirleme ve öğrenci düzeylerini belirleme amacıyla değerlendirme yapılır.

8 – Bir test planında neler bulunmalıdır?
Test planında; testin amacı, testin davranış ve konu boyutlarıyla birlikte kapsamı yani belirtme tablosu, yararlanılacak test madde veya durumları, teste konacak test maddeleri sayısı, testin düzeni ve puanlama koşulları bulunur.

9 – Ölçme ve değerlendirmede kullanılan bazı kavramlar nelerdir?
ANKET: Bir veya daha fazla konularda belli kimselerin bilgi, tavır, ilgilerini öğrenmek amacıyla düzenlenen soru listesidir.
ARAŞTIRMA: Önemli bir soruya cevap bulmak veya bir probleme çözüm amacıyla yürütülen, gözlem, deney, ölçme, hipotez kurma ve doğrulama gibi bilimsel işlemleri içine alan sistematik inceleme,
ARİTMETİK ORTALAMA: Bir dizideki puanların toplamının diziyi teşkil eden puan sayısına bölünmesiyle elde edilen değer.
DEĞERLENDİRME: Öğrenci davranışlarında beklenen gelişmelerin ne derece gerçekleştiğini ortaya çıkarma işlemi.
DENEME GURUBU: Bir deneme sürecinde bağımsız değişkenin etkisine maruz tutulan grup.
DENEY: Bir hipotezi doğrulama amacıyla şartları kontrol edilen inceleme tipi;
EĞİTİM: İnsan davranışında bilgi, beceri, anlayış, ilgi, tavır, karakter v.b. önemli sayılan kişilik nitelikleri yönünden belli gelişimler sağlamak amacıyla yürütülen bir tesirler sistemidir.
FREKANS : Her hangi bir seri veya dizide aynı değerlerin geçiş sayısı.
FREKANS DAĞILIMI: Bir diziye ait her puan veya puan gurubu basamağı karşısında o basamaktaki puan sayısını gösteren dağılım.
GEÇERLİK: Bir testin ölçmek amacı güttüğü şeyi gerçekten ölçme niteliği, testin kullanılış maksadına uygunluk derecesi.
GRAFİK: Aynı aralıkta bir seri yatay ve dikey hatlar üzerinde bilgi vermek, mukayeseler yapmak ve ilişkileri canlandırmak üzere kullanılan diyagram.
GÜVENİRLİK: Bir testin ölçmesi gereken bir şeyi, her tekrarlanışında aynı olarak ölçme niteliği, ölçme hatasından uzaklık.
HAM PUAN: Bir test uygulamasında elde edilen ve henüz standart puan ve diğer ölçülere dönüştürülmemiş ilk puan.
HİPOTEZ: Bir problemi veya inceleme konusu, olayları açıklamaya, gözlem ve deneyimleri yönlendirmeye yarayan henüz doğrulanmamış veya yeteri kadar doğrulanmamış yargı, tahmin veya teori.
KORELASYON: Aynı gruba ait iki gözlem dizisi arasındaki ilişki veya münasebet.
KORELASYON KATSAYISI: İki gözlem dizisi arasındaki ilişki derecesinin ölçüsü veya indeksi (r) (-1’den +1’e kadar alır)
MADDE GEÇERLİĞİ: Maddenin ayırma gücü.
MERKEZİ EĞİLİM: Bir dağılımdaki gözlemlerin mutlak değer veya frekans bakımından bir noktada toplanma eğilimi.
MEYDAN: Bir seriyi teşkil eden sayı veya puan adedini ikiye bölen nokta veya değer (ORTANCA)
MOD: Bir seride frekansı en yüksek olan sayının isabet ettiği nokta veya değer.
NORMAL DAĞILIM: Bir serideki değer veya ölçülerin ortalamanın etrafında simetrik, çan biçiminde frekans dağılımı.
ORTALAMA: Bir grup puana ait tipik veya en fazla temsil gücü taşıyan sayı, Aritmetik ortalama, medyan, mod gibi. Ortalama denince aritmetik ortalama anlaşılır.
ÖLÇME: Bir veya daha fazla kişilerde var sayılan bir değişken niteliğinin miktarını veya derecesini tespit ve bunun sayı ile ifadesi işlemi.
ÖRNEKLEM: Bir evreni belli yönlerden teslim etmek üzere evren ünitelerinden bir kısmını içine alan bir parça.
PUAN: Kişinin bir test üzerindeki başarısını veya durumunu nicelik yönünden belirtmek için kullanılan sayı.
RANDOM (ÖRNEKLEM): İhtimaliyet hesaplarının uygulanmasına elverişle örneklem tipi. Evrene dahil her üniteye aynı ihtimaliyet derecesi ile içine alma özelliğini taşıyan örneklem.
SERİ GENİŞLİĞİ: Bir değişkenle ilgili olarak gözlenen en büyük ve en küçük değerler arasındaki fark; örneğin, bir sınıfın bir test uygulamasından aldığı puanların en yükseği ile en düşüğü arasındaki fark gibi.
SIRALAMA: Testten elde edilen puanları değerlerine göre yukarıdan aşağı dizme.
STANDART: Belli bir seviye ölçüsü, eğitimde ulaşılmak istenen hedef veya amaç: Örneğin, müfredatta herhangi bir sınıf için tespit edilen konuların bilgisi o sınıfın bilgi standardı demektir.
STANDART HATA: Bir gözlemin veya istatistiğin ihtiva ettiği ölçme hatası. Gözlem değerinin farazi doğru değerden olan sapması.
STANDART KAYMA: Bir seride ortalamadan olan kaymaların karelerinin ortalamasının karekökü.
STANDART PUAN: Bir ham puanın standart kayma birimi ile ifadesi.
T-PUANI: Bir ölçek üzerinde normalleştirilmiş standart puan. Normalleştirme, standart puanın (z-puanının kesirden kurtarılması için sabit bir sayı ile, örneğin 10 ile çarpılması ve (-) işaretinden kurtulması için çarpımın sabit bir sayı ile örneğin 50 ile toplanması işlemidir.
(T = z.10 + 50 böylece T – puanlarına dönüştürülmüş bir puan dağılımının ortalaması 50, standart kayması 10’dur.)
TEST: Yetenek, başarı, ilgi gibi kişiye ait değişken nitelikleri ölçmek üzere hazırlanmış bir imtihan, seçme veya teşhis aracı.
VARİYANS: Puanların ortalamaları etrafındaki yayılmaların ölçüsü. Ortalamalardan kaymaların karelerinin ortalaması alınarak bulunur. Karekökü standart kaymayı verir.
VERİ: Gözlem veya ölçme ile elde edilen, henüz yorumlanmamış bilgi.
YORUMLAMA: Tahlil veya tasnif edilen ham bilgileri değerlendirme veya manalandırma.
YÜZDELİK: Bir frekans dağılımında herhangi bir nokta altında kalan puanların yüzdesi o noktanın isabet ettiği yüzdeliği gösterir. Örneğin: Puanların % 50 si medyan noktası altında kaldığından, medyan 50. yüzdeliktir.
z - PUANI: Standart puan z puanlarının dağılımında ortalama sıfır standart kayma 1’e eşittir. Bir ham puanın z – puana dönüştürülmesi için, puanın ortalamadan olan uzaklığı dağılımın standart kaymasına bölünür. z – puanların değeri kabaca (-3’den +3’e kadar değişir)

Bir test ve maddeleri hazırlanırken yapılacak işlemler:
1- Sınavın amacının belirlenmesi
2- Ölçülecek hedef-davranışların belirlenmesi
3- Belirtke tablosunun hazırlanması
4- Soru sayısının belirlenmesi (soru sayısı uygulanacak olan testin ölçülmek istenen hedef davranışların yansıtması derecesinin sağlanması)
5- Soru tipinin belirlenmesi ( olumsuz soru öbeklerinden kaçınılmalı değildir ifadelerinin dikkat çekilecek şekilde yazılması gerekir, test maddeleri açık-anlaşılır olmalıdır)
6- Soru-maddelerin güçlük derecesinin belirlenmesi ( güçlük 0-1,00 arası değişen bir değerdir 0'a yaklaştıkça sorunun yapılabilirlik düzeyi düşer korelasyon, maddenin ayırtediciliği etkilenir uygun güçlük derecesi 0,50 dir. 1'e yaklaştıkça sorunun kolay olduğu ve ayırtetme gücünün zayıf olduğu öğrencilerin çoğunluğnun soruyu doğru yapma ihtimalinin artmasından etkilenir )
7- Sınav süresinin belirlenmesi (sınav içeriği itibariyle yeterli süre ile desteklenmelidir az veya gereğinden fazla verilen sınav süresi testin güvenirliliğini düşürebilir)
8- Soruların yazılması
9- Değerlendirme

Hazırlanan testler de güvenirlik, eşdeğerlik, iç tutarlık ölçümleri içi çeşitli yöntemler uygulanır:
1- Paralel testler yöntemi
2- Test tekrar test yöntemi
3- Bir testin iki eşdeğer parçaya bölünmesi
BİR ÖLÇME ARACINDA BULUNMASI GEREKEN ÖZELLİKLER
1- GEÇERLİK
2- GÜVENİRLİK
3- KULLANIŞLIK

1- GEÇERLİK: bir ölçme aracının ölçmeyi amaçladığı özelliği, başka herhangi bir özellikle karıştırmadan, doğru olarak ölçebilme derecesidir. Uygulamada ve özellikle eğitimde bir çok durumda ölçmek istediğimiz bilgi ve becerilerin tümünü bir sınavla ölçmek olanıksız olduğu gibi sınavdan elde edilen puana, ölçme konusu bilgi ve beceriler dışındaki başka etkenlerde etki eder. bu etkenlerden ötürü, elde edilen puana hata karışır. Bu nedenle özellikle eğitimde kullanılan ölçme araçlarının geçerliği hiç bi zaman tam değildir.
Bir başarı testinin niteliği ölçülecek olanın ne olduğunun ve onun nasıl ölçüleceğinin açıkça belirlenmiş olmasına bağlıdır
  • "NE ÖLÇÜLECEK" SORUSUNUN CEVABI TESTİN UYGUNLUK YA DA İLGİLİLİĞİNE DEĞİNDİR.
  • "NASIL ÖLÇÜLECEK" SORUSUNUN CEVABI İSE BÜYÜK ÖLÇÜDE TESTİN GÜVENİRLİĞİNİ İLGİLENDİRİR.
Ölçtüğü şeyle ilgili olan ve ölçtüğü şeyi tutarlı olarak ölçen bir test geçerlidir.
Geçerliliğin iki önemli özelliği vardır:
*Uygunluk ya da ilgililik
*Güvenirlik
- Uygunluk, onun ölçmek için düzenlendiği özellik ya da özellikler le ilgili olmasıdır mantıksal analiz ve uzman yargısı konusudur güvenirlik gibi testin uygulanmasından elde edilen veriler temelinde istatistiksel olarak belirlenemez bir test, kapsadığı maddeler dersin geliştirmek istediği davranışları yansıtıyor ve onları yeterlice örnekliyorsa ilgilir
- Güvenirlik ise ölçmenin tutarlığıyla ilgilidir, eğer bir test güvenilirse o ölçmek için düzenlendiği özellik ya da özellikleri tutarlıca ölçer, tutarlılığı ;
*Hatadan arınıklık, sıra değişimi olmamasıyla ilgilidir.
GEÇERLİK TÜRLERİ
KAPSAM GEÇERLİĞİ:bir ölçme aracının en önemli sayolabilecek özelliklerinden biridir, bir testin evreni örnekleme derecesinin gösterir , test bir bütün olarak ve testteski her maddenin maksada ne derece hizmet ettiğiidir bir testin kapsam geçerliği o testteki maddelerin ölçülecek davranışları ve konu içeriğini örnekleme derecesine ve testteki her bir maddenin ölçmek istediği davranışı ne derece iyi ölçtüğüne bağlıdır

Testin kapsam geçerliliğini belirlemede yararlanılan yaklaşımlar:
1- Mantıksal-rasyonel yaklaşım:
a- Testteki maddelerin dağılımını belirtke tablosunda ki dağılımna uygun olup olmadığına,
b- Her bir madde diğer maddelerce ölçülenlerin farklı bir davranışı ölçmeye yönelip yönelmediğine ve ölçmeye yöneldiği davranışı ölçmedeki elverişliliğine bakılır.
2- İstatistiksel yaklaşım:
a- Bir alanda geliştirilmiş (daha önce) ve o alanda geçerli olan bir testle eldeki yeni geliştirilen test kıyaslanılır ve aynı öğrenci gurubuna uygulanır puanlar arasında ki korelasyona bakılır
b- Başarılı-başarısı guruplara hazılanan test uygulanır gurupların aldıkları puanların arasındaki korelasyona bakılır belli bir fark olması gerekir.


Benzer Konular

19 Aralık 2008 / HerHangiBiri Sağlıklı Yaşam
17 Ağustos 2008 / eXcaLLaNT Sosyoloji
9 Ekim 2009 / ThinkerBeLL Ekonomi
9 Haziran 2007 / P.u.S.u Taslak Konular