Minggu, 11 Januari 2015

Evaluasi Pemb. (Rating Scale)

RATING SCALE
 Rating Scale

Rating scale merupakan hasil observasi yang dicatat oleh observer tentang kekuatan atau kelemahan dari salah satu sifat yang disebutkan dalam skala itu. Skala ini berupa penilaian guru tentang perilaku anak pada salah satu aspek tertentu. Rating scale dapat berupa seperangkat pertanyaan tentang karakteristik atau kualitas aspek tertentu yang diukur.
Beberapa jenis rating scale, antara lain: numerical rating scale, descriptive graphic rating scale, ranking methods rating scale, comparative rating scale, dan paired comparasion rating scale.
1.      Numerical Rating Scale
Jenis ini merupakan rating scale yang paling sederhana bentuk pengadministrasiannya. Bentuk ini terdiri dari pernyataan tentang suatu karakteristik tertentu dari aspek tertentu yang diukur, diikuti oleh angka yang menunjukan kualitas.
Contoh:
Petunjuk: nyatakanlah tingkatan ini dari setiap pernyataan dengan melingkari salah satu angka yang ada di depan pernyataan tersebut. Angka-angka tersebut menunjukan arti:
1 = tidak memuaskan
2= di bawah rata-rata
3 = rata-rata
4 = di atas rata-rata
5 = sempurna
1
partisipasi dalam keberhassilan kelas
1
2
3
4
5
2
Hubungan anak dengan kelompoknya
1
2
3
4
5
3
Partisipasi dalam diskusi kelas
1
2
3
4
5
Pengembangan numeric rating scale hendaknya mempertahankan prinsip-prinsip sebagai berikut:
a.       Jumlah pertanyaan atau pernyataan harus terbatas, tetapi tetap dapat menggambarkan keseluruhan yang diukur.
b.      Angka untuk perangkat rating scale harus mempunyai arti sama.
c.       Jumlah kategori angka agar bermakna, artinya jangan terlalu rinci tetapi juga jangan hanya dua kategori (dua kategori dipakai chek list).
d.      Pertanyaan atau pernyataan hanya mengukur satu karakteristik.
e.       Jika akan mengukur prosedur, hendaknya pertanyaan atau pernyataan disusun secara urut berdasarkan urutan pelaksanaan prosedur.
f.       Bila akan mengukur hasil, maka komponen rating scale disusun menurut urutan dari yang mudah diamati ke yang sulit untuk diamati.
Berikut contoh rating scale untuk mengukur kemampuan menulis murid kelas satu SD. Rating scale digunakan untuk mengukur prosedur dan hasil tulisan tangan siswa.
No.
Aspek yang diukur
1
2
3
4
5
1.
2.
3.
4.
5.
Cara memegang pensil
Posisi duduk saat menulis
Posisi tangan di atas kertas
Letak kertas yang akan di tulis
Jarak mata dari kertas





6.
7.
8.
9.
Bentuk huruf
Kejelasan tulisan
Keindahan tulisan
Kebenaran tulisan





Keterangan:
1 = tidak memuaskan
2 = kurang
3 = cukup
4 = baik
5 = sempurna

2.      Graphic Rating Scale
Rating scale jenis ini hamper sama dengan numerical rating scale, hanya dalam graphic rating scale yang digunakan bukan angka sebagai tanda deskripsi tingkah laku atau hasil tugas. Pengukuran karakteristik ini dilakukan dengan member tanda pada suatu kontinum grafis.
Rating scale ini sesuai unruk mendeskripsikan profil suatu kegiatan, prosedur, atau hasil dari kegiatan.
tidak
aktif
 
Sangat
aktif
 
Contoh:
a.       Akvivitas siswa dalam
mengikuti diskusikelompok
 

b.      Kemampuan murid dalam
mengemukakan pendapat

c.      
kacau
 
runtut
 
Bagaimana keruntutan
Penalaran pola berpikir murid

d.     
tidak

 
logis
 
Kemampuan menyanggah
Pendapat teman
 

e.      
kabur
 
tepat
 
Kemampuan mendukung
Pendapat teman
 

f.      
tapat
 
kabur
 
Kemampuan menarik
Kesimpulan
 

g.     
menghargai
 
Sikap terhadap pendapat
Orang
Melalui grafik kontinum kita dapat mengetahui secar akurat kemampuan masing-masing siswa, sehingga profil siswa secara keseluruhan dapat diketahui.

3.      Rangking Methods Rating Scale
Terdapat dua macam cara menyusun rangking, yaitu:
a.         Menyusun rangking kedudukan rangking kedudukan siswa suatu kelas dalam aspek tertentu atau keseluruhan aspek belajar.
b.         Memeriksa kemampuan murid untuk mementukan kedudukan relative suatu komponen dalam suatu prosedur tertentu.
Menyusun rangking sebaiknya dilakukan secara simultan dan disusun dalam satu garis kontinum dari rangkaing tertinggi atau terendah seterusnya bergerak ke titik tengah. Kesukaran akan dialami ketika berada ditengah-tengah.
 



Contoh:
Tentukan kedududkan relative murid dalam kelas dengan cara member nomor.Nomor satu berarti rangking 1 dan seterusnya.
Nama Murid
Rangking
…………………………………………
…………………………………………
…………………………………………
…………………………………………
Dst……………………………………
………………………………….
………………………………….
………………………………….
………………………………….
………………………………….
Untuk menghindari subjektivitas dapat dibuat table spesifikasi kemampuan tiap aspek, misalnya:
Petunjuk: Tentukan kedududkan relative murid dalam kelas dalam setiap aspek dengan cara member angka. Nomor satu berarti rangking 1 dan seterusnya.
Nama
Kecepatan
Ketepatan
Ucapan
Pengertian
Jumlah
Adam
Bella
Chaca
Dara
Elok
Fembri
Galih







4.      Comparative Rating scale
Rating scale jenis ini berupa pembuatan kriteria atau alat pembanding. Misalnya: standarisasi perkembangan menggambar berdasar perkembangan murid, sehingga pertama harus ditentukan contoh gambar sesuai perkembangan usia murid dengan cara memilih hasil gambar tertentu sebagai kriteria yang digunakan sebagai pembanding bagi hasil menggambar murid. Caranya dengan membandingkan hasil menggambar murid dengan kriteria, sehingga guru mengetahui hasil menggambar murid manakah yang mirip atau mendekati gambar contoh (yang digunakan sebagai kriteria).
Kelemahan yang sulit dihindari dengan cara ini adalah menentukan kriteria yang akan digunakan sebagai pembanding. Karena kesulitan tersebut perlu dilakukan penelitian yang seksama, hal ini sulit dilakukan guru SD. Cara yang termudah adalah melakukan analisis hasil kerja murid dalam jangka waktu lama, kemudian dipilih dan disusun dalam bentuk skala.

5.      Paired Comparison Rating Scale
Jenis ini dilakukan dengan cara membandingkan hasil kerja seorang murid dengan hasil kerja murid lainnya. Setiap hasil kerja atau tugas dilakukan pembandingan secara pemasangan, sehingga hasil perbandingan dapat diketahui hasil kerja manakah yang paling baik dan paling kurang.
Setiap membandingkan dua murid ditentukan hasil manakah yang lebih baik. Melalui cara ini pada akhir pembandingan diperoleh informasi lengkap tentang kedudukan murid diperbandingkan dengan teman satu kelas.
Contoh: Paired Comparison Rating Scale tentang hasil anyaman murid kelas III SD
NAMA
ADI
BUDI
CICI
DIDI
EFI
FERI
Jml.
ADI
X
1
0
1
1
0
3
BUDI
0
X





CICI
1

X




DIDI
0


X



EFI
0



X


FERI
1




X


Pelaksanaan perbandingan hasil karya sastra/kerja secara berpasangan. Bila tulisan lebih baik diberi skor 1 dan lebih jelek diberi skor 0 yang dilakukan satu siswa dengan seluruh kelas, kemudian hasil akhir dijumlah. Jumlah akan menunjukkan kedudukan murid dibandingkan dengan seluruh siswa di kelasnya.
Pengukuran dengan jenis ini memiliki beberapa keuntungan, antara lain: (1) hasil rating lebih objektif karena pembandingan dilakukan secara berpasangan, sehingga mudah memberikan keputusan murid mana lebih baik dibanding pasangan pembandingnya, (2) baik untuk membandingkan hasil kerja atau kegiatan tetapi kurang tepat bentuk prosedur kerja, (3) tanpa menggunakan kriteria secara rinci. Dari kesan umum sudah dapat digunakan bahan pembandingan, (4) memudahkan guru untuk melakukan pembandingan, karena tidak diperlukan adanya kriteria ketat.
Pengukuran dengan cara ini juga memiliki kelemahan, antara lain: (1) alat itu sendiri. Hal itu disebabkan hal yang diukur tidak didefinisikan secara jelas dan juga tidak menggunakan istilah umum yang berlaku, sehingga sering orang tidak tahu bagian manakah yang harus diamati, (2) kesalahan dari pengamat karena pengaruh “halo effect” , yaitu kesalahan bersumber dari generalisasi satu aspek pengamatan ke aspek lain (anak yang pandai Matematika cenderung memberi skor tinggi pada bidang lain), “severity effect”, yaitu kecenderungan memberi skor rendah kepada orang yang diamati, hal ini terjadi karena guru menganggap murid tidak mungkin melebihi guru. Kesalahan juga ddapat disebabkan karena tidak digunakannya kriteria yang baku untuk memberi skor. Centrel tendency error, yaitu kesalahan disebabkan kriteria yang tidak baik, karena takut salah guru sering memberi angka aman (misalnya memberi skor 6,7,8). Logical error adalah kesalahan karena penggunaan logika atau pengetahuan yang telah dimiliki. Seseorang membaca hasil tulisan murid yang runtut, maka secara logis kita mengasumsikan murid memiliki alur berpikir yang baik, karena itu pemberian skor tidak didasarkan pengamatan tetapi berdasar logika, (3) kesalahan lain adalah hakikat unsur atau karakter yang dinilai tidak mudah untuk diamati.
Untuk mengetahui kelemahan tersebut disarankan untuk menyusun rating scale dengan memperhatikan: (1) merumuskan secara spesifik trait yang akan diukur sehingga dapat diamati lebih rinci, (2) hanya mengukur hal yang bermakna dalam belajar, (3) gunakan istilah yang jelas, (4) gunakan istilah yang tidak kabur, misalnya: “sangat baik sekali” bersifat kabur gunakan “baik” saja, (5) pengadministrasian harus mengenal terlebih dahulu unsur atau orang yang dinilai, (6) dimensi tunggal, jangan sampai satu komponen mengandung dua hal sekaligus, (7) pelaksana tak perlu menginterpretasi, untuk itu seluruh petunjuk harus jelas.
Rating scale  dapat digunakan untuk tujuan pengajaran serta penilaian, karena Skala rating membantu siswa untuk memahami sasaran pembelajaran dan untuk memusatkan perhatian mereka pada aspek-aspek penting dari kinerja. Kita dapat memberikannya kepada siswa saat mereka mempersiapkan diri untuk tugas kinerja.Skala rating memberikan umpan balik yang spesifik kepada seorang mahasiswa mengenai kekuatan dan kelemahan kinerja. Kita dapat memberikan skala penilaian kepada siswa setelah kita menggunakannya untuk mengevaluasi kinerja mereka.Siswa tidak hanya mempelajari standar tetapi mungkin menginternalisasikan mereka. Ini berarti bahwa mereka akan secara otomatis menerapkan standar untuk pekerjaan mereka. Untuk mencapai hal ini, kita harus menilai standar atau kriteria yang sama kepada beberapa tugas khusus kinerja yang berbeda sepanjang tahun. Rating membantu kita untuk menunjukkan setiappertumbuhan siswa. Jika kita menyimpan salinan dari peringkat dalam file, maka kita akan memiliki catatan untuk membantu kita untuk memantau dan menilai kemajuan masing-masing siswa. Untuk melakukan ini secara efektif, kita perlu menggunakan skala (atau serupa) rating yang sama di semua tugas. Yang akan menjamin bahwa informasi yang kita kumpulkan sebanding otentik dan komperhensif.

Kesalahandalam Rating Scales
Anda harus menyadari beberapa kesalahan dapatterjadi saat kita menggunakan rating scale. Kesalahan terjadi ketika seorang guru cenderung membuat hampir semua peringkat menjelang akhir skala tinggi, menghindari akhir skala rendah. Keparahan kesalahan adalah kebalikan dari kesalahan kelonggaran: seorang guru cenderung membuat hampir peringkat menjelang akhir skala rendah. kecenderungan kesalahan Tengah terjadi ketika seorang guru ragu-ragu untuk menggunakan ekstrem dan menggunakan bagian tengah dari skala saja. Tengah kecenderungan kesalahan kadang terjadi ketika seorang guru harus membuat kesimpulan yang kuat tentang seorang mahasiswa (misalnya, sehubungan dengan "kreativitas" atau "dedikasi") dan, dalam keraguan, guru cenderung untuk menandai semua orang sebagai "rata-rata." Mungkin Tengah kecenderungan kesalahan terjadi ketika seorang guru tidak tahu siswa sangat baik. Kesalahan yang mengakibatkan kita hanya menggunakan bagian tertentu dari skala penilaian memiliki dua konsekuensi negatif. Pertama, ketika kita memberikan hanya sangat tinggi, hanya sangat rendah, atau hanya "tengah" peringkat, kita memperkenalkan pikiran kita pada peringkat bias, sehingga menurunkan validitas mereka untuk menjelaskan kemampuan siswa dalam melaksanakan tugas. Kedua, ketika rating tandan kita dan tidak membedakan kinerja satu siswa dari yang lain, mereka menjadi tidak dapat diandalikan, yang pada gilirannya juga mengurangi validitas skor. Sebuah Efek Halo terjadi ketika seorang guru memungkinkan kesan umum nya mahasiswa mempengaruhi bagaimana dia menilai siswa pada dimensi tertentu. Misalnya, jika Anda memberi siswa peringkat lebih tinggi untuk proyek-nya dari siswa berhak karena kita "hanya tahu" bahwa mahasiswa adalah "benar" sangat baik, kita akan melakukan kesalahan efek halo. The "halo" umum kita di sekitar siswa mempengaruhi kemampuan kita untuk menilai berdiri siswa terhadap kinerja tertentu. (Efek halo dapat bekerja secara terbalik, tentu saja: kesan umum kita terhadap seorang mahasiswa sebagai "tidak terlalu baik" dapat mengarahkan kita untuk menurunkan peringkat pada dimensi yang lebih spesifik dari siswa berhak.) Salah satu ekspresi dari efek halo dapat terjadi ketika guru perlu membuat keputusan grading untuk siswa yang hasil penilaian menempatkan mereka pada mereka di perbatasan antara dua kategori surat kelas: kesalahannya adalah bahwa orang-orang yang menguntungkan terkesan guru dipindahkan ke dalam kategori atas: orang yang kurang menguntungkan terkesan guru adalah pindah ke kategori yang lebih rendah. Personal Bias terjadi ketika seorang guru memiliki kecenderungan umum untuk menggunakan stereotip yang tidak tepat atau tidak relevan untuk mendukung satu kategori mahasiswa di atas yang lain, seperti mendukung anak laki-laki atas perempuan, kulit putih atas kulit hitam, atau bekerja atas penerima kesejahteraan keluarga. quirks Seorang guru dan bias pribadi juga dapat diberikan kepada para siswa dari keluarga tertentu serta masing-masing siswa guru mungkin tidak menyukai.  Sebuah Kesalahan logis terjadi ketika seorang guru memberikan peringkat yang sama pada dua atau lebih dimensi kinerja yang guru berpendapat secara logika terkait tetapi yang sebenarnya tidak terkait. Sebagai contoh, seorang guru mungkin percaya bahwa siswa dengan sangat skor tinggi pada tes bakat skolastik harus melakukan sangat baik di semua bidang mata pelajaran. kesalahan logis adalah hasil dari ketidaktahuan guru dan keyakinan tidak berdasar tentang seberapa kuat prestasi pendidikan pergi bersama, bukan yang quirks pribadi guru dan bias mengenai individu atau kelompok siswa. Kendala lain terjadi ketika "orang luar" penilaian tingkat kinerja, karya siswa sering dinilai oleh orang lain selain guru mereka. Dalam kasus ini, penilai dilatih dan praktek menggunakan rubrik penilaian tertentu. Rating Drift terjadi ketika penilai, yang peringkat awalnya setuju, mulai mendefinisi ulang rubrik untuk diri mereka sendiri. Sebagai hasilnya, penilai tidak lagi menghasilkan peringkat yang setuju, walaupun mereka telah dilatih di rubrik yang sama. Obat ini adalah untuk memonitor peringkat dan melatih orang-orang penilai yang tampaknya telah menyimpang / bergeser dari standar yang telah disepakati. 

Tidak ada komentar:

Posting Komentar