Pengembangan Dan Pengolahan Tes Hasil Belajar
Pengembangan Tes Hasil Belajar
Penyusunan Tes Hasil Belajar
Menyusun spesifikasi tes
Spesifikasi tes mencakup : menentukan tujuan tes, menyusun kisi-kisi tes, memilih bentuk tes, menentukan panjang tes. Dan kisi-kisi tes memenuhi persyaratan berikut:
mewakili isi kurikulum yang akan diujikan,
komponennya rinci, jelas, dan mudah dipahami,
indikator soal harus jelas dan dapat dibuat soalnya sesuai dengan bentuk soal yang telah ditetapkan.
Menulis soal
Menelaah soal tes
Setelah soal disusun perlu dilakukan telaah atas soal tersebut. Diperlukan untuk memperbaiki soal yang diamati terdapat kekurangan. Butir yang disusun diamati dari segi konstruksi, content (isi) dan bahasanya.
Melakukan ujicoba tes
Melakukan analisis butir soal
Memperbaiki tes
Merakit tes
Melaksanakan tes
Menafsirkan hasil tes
Analisis Butir Soal
Analisis butir soal yaitu menganalisis butir dari taraf sukar, daya beda, fungsi distraktor. Taraf sukar menganalisis tingkat kesukaran soal apakah terlalu sukar atau sebaliknya dan daya beda menganalisis apakah butir soal tersebut mempunyai kemampuan untuk membedakan antara siswa yang rajin dan yang malas, sedangkan fungsi distractor mempunyai fungsi sebagai pengecoh terhadap siswa yang malas belajar.
Analisis Butir Soal Secara Kualitatif
Sebelum dilakukan analisis butir soal secara empririk atau uji coba instrumen ke lapangan maka dilakukan analisis butir soal secara teoretik atau rasional yaitu meliputi analisis secara konstruksi, content (isi) dan bahasa.
Analisis Butir Soal Secara Empirik
Setelah dilakukan analisis butir soal secara kualitatif selanjutnya dilakukan proses uji coba instrumen ke lapangan, yang kemudian dianalisis taraf sukar, daya beda dan fungsi distraktor.
Bentuk Soal Obyektif
Tingkat Kesukaran
Proposi testee yang menjawab benar disebut tingkat kesukaran atau taraf sukar. Tingkat kesukaran soal berkisar antara 0,00 sampai dengan 1,00, artinya tingkat kesukaran soal paling rendah 0,00 dan paling tinggi 1,00. Tingkat kesukaran 0,00 menunjukan bahwa butir soal tersebut termasuk sukar, artinya tidak ada seorang testeepun yang menjawab betul dari butir soal tersebut. Sedangkan tingkat kesukaran 1,00 menunjukan bahwa butir soal tesrsebut terlalu mudah artinya seluruh testee dapat menjawab betul dari butir soal tersebut. Tingkat kesukaran soal dapat diperoleh melalui perhitungan dengan rumus:
P= R/T
Keterangan :
P = Tingkat kesukaran butir soal
R = Jumlah yang menjawab benar
T = Jumlah seluruh peserta tes
Kriteria Tingkat Kesukaran Butir Soal
– 0.30 = Sukar
0.31 – 0.70 = Sedang
0.71 – 1.00 = Mudah
Daya Pembeda
Daya pembeda soal yang baik adalah butir soal yang dapat membedakan antara kelompok atas yaitu kelompok testee yang berkemampuan tinggi (rajin belajar) dan kelompok bawah yaitu kelompok testee yang berkemampuan rendah (malas belajar).
Indeks daya pembeda soal berkisar antara -1 sampai dengan +1. Indeks daya pembeda bertanda plus (positif) hal ini merupakan petunjuk bahwa butir soal tersebut sudah memiliki daya pembeda, dalam arti testee yang berada pada kategori kemampuan tinggi (kelompok atas) lebih banyak dapat menjawab betul terhadap butir sol tersebut, sedangkan testee yang berada pada kategori kemampuan rendah (kelompok bawah) lebih banyak menjawab salah.
Jika indeks daya pembeda 0,00, keadaan ini menunjukkan bahwa butir soal tidak memiliki daya pembeda sama sekali. jika indeks daya pembeda bertanda minus (negatif), keadaan ini menunjukkan bahwa butir soal tersebut lebih banyak dijawab betul oleh testee kelompok bawah dari pada kelompok atas. Daya pembeda soal obyektif diperoleh melalui perhitungan dengan menggunkan rumus:
D= (FTI (X=1))/MT- (FRI (X=1))/MR
Keterangan:
D = Daya Beda
FTI = Kelompok Tinggi
FRI = Kelompok Rendah
MT = Jumlah responden kelompok tinggi
MR = Jumlah responden kelompok rendah
Indeks Daya Pembeda
<0.20 = Daya Pembeda Lemah (poor)
0.20–0.39 = Daya Pembeda cukup (satisfactory)
0.40 – 0.69 = Daya Pembeda baik (good)
0.70 – 1.00 = Daya Pembeda baik Sekali
Negatif = Daya Pembeda jelek
Dengan menghitung tingkat kesukaran dan daya beda soal tester dapat mengetahui kualitas butir soal yang disusun, sehingga dapat dihindari ketimpangan skor dalam bentuk ketidakwajaran skor. Selain dari ketidakwajaran skor dalam ketimpangan skor terdapat bias butir.
Instrumen valid akan mengukur apa yang hendak diukur sesuai dengan materi atau kisi-kisi instrumen, sehingga dapat diketahui apakah instrumen atau alat ukur tersebut sudah melakukan fungsi ukurnya dengan baik,
Instrumen reliabel yaitu tester dapat memperoleh data atau informasi yang tepat tentang kemampuan atau keadaan sebenarnya dari testee tersebut.
Fungsi Distraktor
Fungsi pengecoh terdapat pada tes objektif dalam bentuk alternatif pilihan jawaban (option). Pilihan jawaban dalam tes obyektif berkisar antara 3 sampai 5 buah, dan dari kemungkinan jawaban yang terpasang pada setiap butir item itu salah satunya adalah jawaban betul dan sisanya adalah jawaban salah, jawaban salah dikenal dengan istilah pengecoh atau distractor. Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta didik (testee) yang menjawaB salah. Distraktor berfungsi jika :
Sekurang kurangnya dipilih oleh 5% peserta tes atau siswa
Lebih banyak dipilih oleh kelompok bawah
Distraktor= (Jumlah Jawaban)/(Jumlah siswa) X 100%
Bentuk Soal Uraian
Tingkat Kesukaran Soal
Tingkat kesukaran soal dipergunakan untuk mengetahui seberapa besar tingkat kesukaran suatu soal. Tingkat kesukaran berkisar antara 0 sampai dengan 1. Makin besar tingkat kesukaran maka makin mudah soal begitu pula sebaliknya. Dengan rumus:
TK= Mean/(Skor Maksimum)
TK = tingkat kesukaran soal uraian
Mean = rata-rata skor testee
Skor Maksimum = skor maksimum yang ada pada pedoman penskoran
Kriterian Tingkat Kesukaran
0.00-0.30 = Sukar
0.31-0.70 = Sedang
0.71-1.00 = Mudah
Daya Beda
Indeks yang menunjukan tingkat kemampuan butir soal yang membedakan kelompok atas dari kelompok bawah diantara para peserta tes. Indeks daya pembeda soal berkisar antara -1 sampai dengan +1. Daya pembeda soal uraian diperoleh melalui perhitungan dengan menggunkan rumus:
DP= (Mean A (Kel.Atas)-Mean B (kel.Bawah))/(Skor Maksimum)
DP = daya pembeda soal uraian
Mean A = rata-rata skor testee kelompok atas
Mean B = rata-rata skor testee kelompok bawah
Skor maksimum = skor maksimum yang ada pada pedoman penskoran.
< 0, 20 =Daya pembeda lemah
0, 20 – 0, 39 Daya pembeda yang cukup
0, 40 – 0, 69 Daya pembeda yang baik
0, 70 – 1,00 Daya pembeda yang baik sekali
(-) Daya pembeda negatif (jelek sekali)
Analisis Perangkat Soal
Instrumen yang berkualitas adalah instrumen yang valid dan reliabel. Instrumen yang valid yaitu sahih, yang mampu mengukur sejauh mana ketepatan suatu alat ukur dalam melakukan fungsi ukurnya. Sedangkan reliabilitas adalah untuk mengetahui sejauh mana hasil suatu pengukuran dapat dipercaya yang memiliki daya keajegan yang tinggi.
Pengujian Validitas Tes Hasil Belajar
Validitas suatu instrumen didalamnya mempermasalahkan apakah tes atau instrumen tersebut benar-benar mengukur apa yang hendak diukur. Penganalisisan tes hasil belajar dapat dilakukan melalui validitas rasional dan validitas emprik.
Pengujian Tes Secara Rasional
Validitas rasional diperoleh atas dasar hasil pemikiran, atau berdasarkan hasil pemikiran yang logis. Apabila secara rasional setelah dianalisis bahwa tes hasil belajar tersebut secara rasional memang benar-benar telah dapat mengukur apa yang hendak diukur.
Validitas Isi
Validitas isi untuk mengetahui sejauh mana suatu tes mampu mengukur tingkat penguasaan terhadap isi atau materi tertentu sesuai dengan tujuan pengajaran atau sejauh mana pertanyaan, tugas atau butir dalam suatu tes atau instrumen mampu mewakili secara keseluruhan dan proposional perilaku sampel yang dikenai tes tersebut.
Validitas Konstruk
Validitas Konstruk adalah untuk mengetahui sejauh mana butir instrumen mampu mengukur apa yang benar hendak diukur sesuai dengan konsep khusus atau definisi konseptual. Validitas konstruk didalamnya mengukur variabel konsep dan perumusan konstruk dimulai berdasarkan sintesis dari teori mengenai konsep variabel yang hendak diukur melalui proses analisis.
Validitas Prediktif
Validitas prediktif adalah prestasi belajar siswa yang akan datang, karena validitas prediktif bermaksud melihat bagaimana suatu tes dapat dapat memprediksi atau memperkirakan perilaku siswa pada masa yang akan datang.
Validitas Konkuren
Validitas konkuren ialah jika kriteria standarnya adalah sama sama saat atau saat ini, dan bukan masa yang akan datang.
Validitas Empiris
Validitas Empiris adalah validitas yang ditentukan berdasarkan kriteria, baik kriteria internal maupun kriteria eksternal. Kriteria internal adalah tes atau instrumen itu sendiri yang menjadi kriteria. Sedangkan kriteria eksternal yaitu hasil ukur instrumen atau tes lain di luar instrumen yang menjadi kriteria, contoh validitas ramalan (predictive validity) dan validitas bandingan (concurrent validity).
Pengujian Validitas Item Tes Hasil Belajar
Validitas butir dari suatu tes adalah ketepatan mengukur yang dimiliki oleh sebuah item yang merupakan bagian tak terpisahkan dari tes sebagai suatu totaliats. Validitas butir adalah validitas internal dan yang dijadikan kriteria skor total di dalam instrumen (tes itu sendiri). Sebutir item dikatakan memiliki validitas tinggi jika telah memiliki kesesuaian atau kesejajaran arah dengan skor totalnya atau ada korelasi positif yang signifikant antara skor item dengan skor totalnya.
Pengujian Realibilitas Tes Hasil Belajar
Uji reliabilitas untuk mengetahui sejauhmana tingkat kepercayaan atau konsistennya dalam mengukur sehinnga dapat ditentukan apakah tes hasil belajar yg disusun telah memiliki daya keajegan atau kepercayaan yang tinggi, sehingga instrumen (tes hasil belajar) yang disusun dapat dikatakan adalah reliabel yang mempunyai tingkat konsisten hasil ukur atau dapat mengukur keadaan yang sebenaranya dari keadaan siswa atau subyek yang diukur. Dan dalam menghitung reliabilitas antara lain dapat menggunakan rumus Alpha Cronbach untuk tes uraian sedangkan untuk tes obyektif menggunakan rumus Kuder Richardson. Dan tingkat reliabilaitas yang diterima apabila ≥ 0,70.
Pengolahan Hasil Penilaian Tes Hasil Belajar
Pengolahan hasil penilaian tes tertulis
Hasil penilaian tes tertulis adalah skor yang diperoleh peserta didik dari hasil tes yang diikuti peserta didik, apakah itu pilihan ganda, benar salah, menjodohkan, jawaban singkat, uraian.
Tes Bentuk Pilihan Ganda
Cara menskor tes bentuk pilihan ganda ada dua, yaitu: pertama tanpa menerapkan sistem denda, dan yang kedua adalah dengan menerapkan sistem denda.
Tanpa menerapkan sistem denda
S = R
Diketahui :
S : Skor yang sedang dicari
R : Right (jumlah jawaban betul)
Penskoran dengan menerapkan denda
S=R- W/(O-1)
S : Skor yang sedang dicari
R : Right (jumlah jawaban betul)
W : Wrong (jumlah jawaban salah)
O : Banyaknya option (pilihan) yang terdapat pada soal
1 : Bilangan konstan (tetap)
Tes bentuk jawaban singkat dan menjodohkan
Pemberian skor untuk kedua bentuk tes ini umumnya tidak memperhitungkan sangsi berupa denda, rumus yang digunakan adalah :
S = R
Tes obyektif bentuk matching, fill in, dan completion, perhitungan skor akhirnya pada umumnya tidak memperhitungkan sistem denda
Tes Uraian
Pada umumnya tes uraian menggunakan sistem bobot ( weight) yang diberikan untuk setiap butir soal, atas dasar taraf kesukarannya, atau atas dasar banyak sedikitnya unsur yang harus terdapat dalam jawaban.
Pengolahan Hasil Penilaian Unjuk Kerja
Berdasarkan hasil penilaian unjuk kerja siswa maka diperoleh data atau skor yang menunjukan kemampuan siswa dalam mencapai kompetensi yang menunutut peserta didik melakukan tugas tertentu.
Rumus yang digunakan:
Nilai= (Skor Sesungguhnya)/(Skor Maksimum ideal) x 100
Keterangan :
Skor sesuangguhnya : Skor yang dicapai siswa
Skor Maksimum Ideal : Skor yang dicapai jika dijawab dengan benar
100 : Skala yang dipakai