TUGAS EPHB
(ANALISIS KUALITAS TES & BUTIR SOAL)

Disusun Oleh:
Ade Marlina ( 0801145002 )
Khairun nisa ( 0801145072 )
Miatun Natasya ( 0801145046 )
Silvia Raswati ( 0801145062 )
Retno

FAKULTAS: FKIP
PRODI: BIOLOGI 5B

UNIVERSITAS MUHAMMADIYAH PROF. DR.HAMKA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN BIOLOGI
2010
PENDAHULUAN

Salah satu upaya dalam meningkatkan kualitas proses dan hasil belajar sebagai bagian dari peningkatan kualitas pendidikan dapat dilakukan melalui sistem penilaian. Dalam penilaian proses dan hasil belajar siswa di sekolah, guru memberikan suatu evaluasi untuk mengetahui sejauh mana penguasaan materi yang telah dikuasai oleh siswa selama proses belajar mengajar mengenai materi yang disampaikan.
Dalam melaksanakan kegiatan evaluasi, berhasil atau tidaknya sangat ditentukan oleh tepat atau tidaknya pelaksanaan ujian. Untuk melaksanakan ujian ini memerlukan alat-alat. Bagi ujian tertulis maka alatnya adalah butir-butir soal tertulis. Bagi ujian lisan maka alatnya adalah butir soal tertulis yang disediakan bagi setiap testi, atau sekurang-kurangnya pokok pertanyaan yang sudah tertulis dan dipersiapkan sebelumnya. Bagi ujian praktek, maka alatnya adalah lembar pengamatan yang berisi segi-segi yang diamati beserta rentang skor masing-masing.
Idealnya sebelum suatu tes dipergunakan maka tes tersebut harus memenuhi syarat-syarat sebagi tes yang baik, maka tes yang bersangkutan perlu diuji cobakan. Namun sebelum diuji cobakan tes tersebut harus memperlihatkan indokator-indikator sebagai tes yang baik. Dalam hal ini dilakukan suatu analisis butir soal.

Analisis butir soal adalah pengkajian pertanyaan tes agar diperoleh perangkat pertanyaan yang memiliki kualitas memadai. Analisis yang dilakukan atas dasar uji coba dinamakan analisis empiris. Sedangkan analisis berdasarkan karakteristik yang tampak pada tes tersebut tanpa uji coba dinamakan analisis rasional, karena semata-mata dilakukan atas dasar pertimbangan rasio.

Ada beberapa analisis butir soal, yakni analisis tingkat kesukaran soal dan analisis daya pembeda disamping validitas dan reabilitas. Menganalisis tingkat kesukaran soal artinya mengakaji soal dari segi kesulitannya sehingga dapat diperoleh soal mana yang termasuk mudah, sedang dan sukar. Sedang menganalisis daya pembeda artinya mengkaji soal tes dari segi kesanggupan tes tersebut dalam membedakan siswa yang termasuk kategori kuat/tinggi prestasinya. Sedangkan validitas dan reabilitas mengkaji kesulitan dan keajegan pertanyaan tes.

ANALISIS BUTIR SOAL

Analisis butir soal yang dalam bahasa inggris disebut item analiysis dilakukan terhadap empirik.Maksudnya, analisis itu baru dapat dilakukan apabila suatu tes telah dilaksanakan dan hasil jawaban terhadap butir-butir soal telah kita peroleh.
Pengertian,Tujuan,dan Manfaat Analisis butir soal.
Analisis butir soal adalah suatu kegiatan analisis untuk menentukan tingkat kebaikan butir-butir soal yang terdapat dalam suatu tes sehingga informasi yang dihasilkan dapat kita pergunakan untuk memperbaiki butir soal dan tes tersebut.
Tujuan analisis butir soal yaitu untuk mengadakan identifikasi soal-soal yang baik,kurang baik dan soal yang buruk. Sehingga dapat petunjuk untuk mendapatkan perbaikan.
Manfaat yang dapat diberikan apabila dilakukan analisis terhadap butir soal,sebagai berikut :
Untuk mengetahui soal yang dianalisis telah berfungsi sebagaimana yang diharapkan.
Untuk mengetahui tingkat kesukaran soal.
Untuk mengetahui apakah tanggapan-tanggapan soal yang dianalisis sudah baik susunannya.
Untuk mengetahui apakah soal yang dianalisis sudah betul/baik konstruksinya.
Untuk bahan masukan menyusun program remedial teaching.
Untuk meningkatakan keterampilan guru dalam merencanakan dan mengolah hasil tes.

Jenis-jenis analisis
Ada dua jenis analisis butir soal yang dapat pendidik laksanakan, yaitu :
Analisis secara kualitatif  prosedur peningkatan secara judgement, terkait dengan isi dan bentuk soal.
Teknik analisis kualitatif
Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-sama dengan beberapa ahli dan dimoderatori oleh satu orang.
Kelebihan : Setiap butir soal dapat dituntaskan secara bersama-sama, perbaikannya seperti apa.
Kelemahan : Teknik ini adalah memerlukan waktu lama untuk rnendiskusikan setiap satu butir soal.
Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir soalnya ditelaah berdasarkan kaidah penulisan butir soal. Para penelaah dipersilakan memperbaiki langsung pada teks soal dan memberikan komentarnya serta memberikan nilai pada setiap butir soalnya yang kriterianya adalah: baik, diperbaiki, atau diganti.

Analisis secara kuantitatif  prosedur peningkatan secara empirik, terkait dengan ciri-ciri statistiknya. Penelaahan butir soal didasarkan pada data empirik dari butir soal terkait yang telah diujikan.
Pendekatan Analisis Kuantitatif
- Klasik
Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari jawaban peserta didik guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori tes klasik.
Kelebihan : mudah , murah, sederhana, familier digunakan guru-guru, dapat menggunakan data sampel kecil.
Kelemahan :
(1) Tingkat kemampuan dalam teori klasik adalah “true score”. Jika tes sulit artinya tingkat kemampuan peserta didik mudah. Jika tes mudah artinya tingkat kemampuan peserta didik tinggi.
(2) Tingkat kesukaran soal didefinisikan sebagai proporsi peserta didik dalam grup yang menjawab benar soal. Mudah/sulitnya butir soal tergantung pada kemampuan peserta didik yang dites dan kemampuan tes yang diberikan.
(3) Daya pembeda, reliabilitas, dan validitas soal/tes didefinisikan berdasarkan grup peserta didik.
-Modern
Penelaahan butir soal dengan menggunakan Item Response Theory (IRT) atau teori jawaban butir soal. Teori ini merupakan suatu teori yang menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu soal dengan kemampuan siswa. IRT merupakan hubungan antara probabilitas jawaban suatu butir soal yang benar dan kemampuan siswa atau tingkatan/level prestasi siswa.
Kelebihan :
(1) asumsi banyak soal yang diukur pada trait yang sama, perkiraan tingkat kemampuan peserta didik adalah independen;
(2) asumsi pada populasi tingkat kesukaran, daya pembeda merupakan independen sampel yang menggambarkan untuk tujuan kalibrasi soal;
(3) statistik yang digunakan untuk menghitung tingkat kemampuan siswa diperkirakan dapat terlaksana
Kelemahan : prosesnya cukup rumit dan sulit
Penghitungan dalam penelaahan butir soal secara kuantitatif dapat menggunakan bantuan kalkulator scientific atau program komputer.Program yang sudah dikenal secara umum adalah EXCEL, SPSS (Statitistical Program for Social Science), atau program khusus seperti ITEMAN (analisis secara klasik), RASCAL, ASCAL, BILOG (analisis secara item respon teori atau IRT), FACETS (analisis model Rasch untuk data kualitatif).
Dalam analisis butir soal secara kuantitatif ada empat yang perlu dianalisis pada setiap soal yang telah dikerjakan siswa yaitu:

Analisis Tingkat Kesukaran Soal

Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkan. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.
Dalam menentukan kriteria soal, apakah soal tersebut termasuk mudah, sedang, atau sukar adalah berdasarkan pertimbangan – pertimbangan tertentu. Pertimbangan tersebut antara lain adalah:
Aspek yang di ukur dalam pernyataan tersebut.
Sifat materi yang di ujikan atau ditanyakan.
Isi bahan yang di tanyakan sesuai dengan bidang keilmuannya, baik luasnya maupun kedalamannya.

Cara melakukan analisis untuk menentukan tingkat kesukaran soal adalah sebagai berikut :

1). Menentukan indeks kesukaran (difficulty index), yaitu bilangan yang menunjukan sukar dan mudahnya sesuatu soal. Dalam dunia evaluasi belajar umumnya dilambangkan dengan huruf P (proporstion).
0,0 1,0
Sukar Mudah

Rumus mencari indeks kesukaran soal :
P= B/Js x 100 %
Dengan:
P=Indeks kesukaran
B= banyaknya siswa yang menjawab soal itu dengan betul
Js= jumlah seluruh siswa peserta tes

2). Menentukan tingkat kesukaran, adalah ukuran yang menunjukan derajat kesulitan soal untuk diselesaikan oleh siswa dan mengetahui soal-soal yang termasuk mudah, sedang dan sukar.

Rumus mencari tingkat kesukaran soal

i).Tk=JB/JJ x 100 %

Dengan: TK= Tingkat kesukaran
JB= Jumlah jawaban yang benar
JJ= Jumlah jawaban keseluruhan

ii).F=(PH+PL)/2
Dengan: F =Tingkat kesukaran
PH = Prosentase pada kelompok tinggi
PL = Prosentase pada kelompok renda

Contoh soal :

kita misalkan murid yang mengikuti tes yang kita berikan adalah sebanyak 50 orang .lembar jawababn murid-murid tersebut kita susun dari skor tertinggi paling atas sampai dengan skor terendah paling bawah.
Kita ambil 27% dari mereka yang mendapatkan skor tertinggi.Dalam hal ini 27% X 50 orang sama dengan 13,5 orang kita bulatkan menjadi 14 orang.begitu pula kita ambil 27% dari mereka yang mendapatkan skor terendah.jumlahnya tentu sama dengan kelompok atas ,yaitu 14 orang juga.
Misalkan data yang diperoleh adalah sebagi berikut :
Untuk item no.1,dari kelompok bawah salah 9 orang dan dari kelompok atas salah 2 orang.
Untuk item no.2,dari kelompok bawah salah 8 orang dan dari kelompok atas salah 85orang.
Untuk item no.3,dari kelompok bawah salah 14 orang dan dari kelompok atas salah 8 orang.
Untuk item no.4,dari kelompok bawah salah 6 orang dan dari kelompok atas tidak ada yang salah.
Untuk item no.5,dari kelompok bawah salah 13 orang dan dari kelompok atas salah 11 orang.
Untuk item no.6,dari kelompok bawah salah 2 orang dan dari kelompok atas salah 3 orang.

Berdasarkan data tersebut ,maka dapat dibuat tabel sebagai berikut :

No.item PL PH PL +PH PL-PH
1 9 2 11 7
2 8 5 13 3
3 14 8 23 6
4 6 0 6 6
5 13 11 24 2
6 2 3 5 -1
DST

Dari tabel tersebut,maka tingkat kesukaran untuk masing-masing item dapat dicari sebagi berikut :
Untuk item no.1.

Tk=JB/JJ x 100 %
= 11 x 100%
28
= 39%
Untuk item no.2
Tk=JB/JJ x 100 %
=13 x 100 % = 46%
28

Untuk item no.3
Tk=JB/JJ x 100 %
=23 x 100 % = 82%
28

Untuk item no.4
Tk=JB/JJ x 100 %
= 6 x 100 % = 21%
28

Untuk item no.5
Tk=JB/JJ x 100 %
= 24 x 100 % = 86%
28

Untuk item no.6
Tk=JB/JJ x 100 %
= 5 x 100 % = 18%
28
Derajat kesukaran yang baik adalah derajat kesukaran yang bergerak 25% sampai 75%.item yang mempunyai derajat kesukaran dibawah 25% berarti bahwa itemtersebut terlalu mudah .sebaliknya item yang mempunyai derajat kesukaran 75% ,berarti bahwa item tersebut terlalu sukar.

Kriteria indeks kesukaran soal adalah sebagai berikut.

Kriteria yang digunakan adalah makin kecil indeks yang diperoleh, makin sulit soal tersebut. Sebaliknya, makin besar indeks yang diperoleh makin mudah soal tersebut.

0,00-0,30 Soal sukar
0,31-0,70 Soal sedang
0,71-0,90 Soal mudah

Analisis Daya Pembeda

Daya pembeda adalah mengkaji soal-soal tes dari segi kesanggupan tes tersebut dalam membedakan siswa yang termasuk ke dalam kategori rendah dan kategori tinggi prestasinya. Tujuan daya pembeda yaitu untuk mengetahui kesanggupan soal dalam membedakan siswa yang tergolong mampu (tinggi prestasinya) dengan siswa yang tergolong kurang atau lemah prestasinya.
Cara melakukan analisis daya pembeda adalah sebagai berikut:

a). Daya pembeda soal ditunjukan indeks diskriminasi (D) yang dihitung dengan menggunakan rumus:
D=PH-PL

Dengan: D = Daya Pembeda
PH= Prosentase pada kelompok tinggi
PL = Prosentase pada kelompok rendah
b). Cara lain menghitung daya pembeda
DP=(PL-pH)/n
Dengan :
DP = Indeks DP atau daya pembeda yang di cari
PH = Prosentase pada kelompok tinggi
PL = Prosentase pada kelompok renda
n=jumlah kelompok atas atau kelompok bawah

Mengambil dari tabel dari soal tingkat kesukaran tadi bisa dilihat juga daya pembeda
No.item PL PH PL +PH PL-PH
1 9 2 11 7
2 8 5 13 3
3 14 8 23 6
4 6 0 6 6
5 13 11 24 2
6 2 3 5 -1
DST

Untuk item no.1
DP=(PL-pH)/n
Dp = 9-2 = 0,50
14
Untuk item no.2
DP=(PL-pH)/n
Dp = 8-5 = 0,21
14
Untuk item no.3
DP=(PL-pH)/n
Dp = 14-8 = 0,43
14
Untuk item no.4
DP=(PL-pH)/n
Dp = 6-0 = 0,43
14
Untuk item no.5
DP=(PL-pH)/n
Dp = 13-11 = 0,14
14
Untuk item no.6
DP=(PL-pH)/n
Dp = 2-3 = -0,07
14

c). Klasifikasi daya pembeda adalah sebagai berikut:
0,00-0,20 Buruk
0,21-0,40 Cukup
0,41-0,70 Baik
0,71-1,00 Baik sekali

Analisis validitas

Suatu alat pengukur dapat dikatakan alat pengukur yang valid apabila alat pengukur tersebut dapat mengukur apa yang hendak diukur secara tepat. Penganalisaan terhadap tes hasil belajar sebagai suatu totalitas dapat dilakukan dengan dua cara.
Pertama, penganalisaan yang dilakukan dengan jalan berpikir secara rasional atau penganalisaan dengan menggunakan logika (logical analysis). Kedua, penganalisaan yang dilakukan dengan mendasarkan diri kepada kenyataan empiris, di mana penganalisaan dilaksanakan dengan menggunakan empirical analysis.
a. Pengujian Validitas Tes Secara Rasional
Tes hasil belajar yang setelah dilakukan penganalisaan secara rasional ternyata memiliki daya ketepatan mengukur, disebut tes hasil belajar yang telah memiliki validitas logika (logical validity). Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang diperoleh dengan berpikir secara logis.
1). Validitas isi (content validity)
Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Validitas isi ini sering juga disebut validitas kurikuler.
Validitas isi adalah validitas yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar peserta didik, isinya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahan pelajaran yang seharusnya diteskan (diujikan). Upaya lain yang dapat ditempuh dalam rangka mengetahui validitas isi dari tes hasil belajar adalah dengan jalan menyelenggarakan diskusi panel. Dalam forum diskusi tersebut, para pakar yang dipandang memiliki keahlian yang ada hubungannya dengan mata pelajaran yang diujikan, diminta pendapat dan rekomendasinya terhadap isi atau materi yang terkandung dalam tes hasil belajar yang bersangkutan. Hasil-hasil diskusi itu selanjutnya dijadikan pedoman atau bahan acuan untuk memperbaiki dan menyempurnakan isi atau materi hasil belajar tersebut. Jadi kegiatan menganalisis validitas isi dapat dilakukan baik sesudah maupun sebelum tes hasil belajar dilaksanakan.
Dalam hal tertentu tes yang telah disusun sesuai dengan kurikulum (materi dan tujuannya) agar memenuhi validitas isi, peneliti atau pemakai tes dapat meminta bantuan ahli bidang studi untuk mene¬laah apakah konsep materi yang diajukan telah memadai atau tidak, sebagai sampel tes. Dengan demikian validitas isi tidak memerlukan uji coba dan analisis statistik atau dinyatakan dalam bentuk angka¬-angka.
Contoh :
Misalnya apabila kita ingin memberikan tes biology kepada anak-anak kelas II, maka item-itemnya harus diambil dari pelajaran kelas II. Kalau terdapat item-item yang diambil dari kelas III maka tes itu tidak valid lagi.

2).Validitas konstruksi (construct validity).
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam tujuan instruksional khusus.
Tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas konstruksi apabila tes hasil belajar tersebut (–ditilik dari segi susunan, kerangka atau rekaannya–) telah dapat dengan secara tepat mencerminkan suatu konstruksi dalam teori psikologis. Tes hasil belajar baru dapat dikatakan telah memiliki validitas susunan apabila butir-butir soal atau item yang membangun tes tersebut benar-benar telah dapat dengan secara tepat mengukur aspek-aspek berpikir (seperti: aspek kognitif, aspek efektif, aspek pdikomotorik dan sebagainya) sebagaimana telah ditentukan dalam tujuan instruksional khusus.
Penganalisaan validitas konstruksi juga dapat dilakukan dengan jalan menyelenggarakan diskusi panel. Pengujian validitas konstruksi tes ini pun dapat dilakukan baik sesudah maupun sebelum tes hasil belajar tersebut dilaksanakan.

Contoh :
Konsep mengenai “hubungan social”, konsep sikap dapat dilihat dari indikatornya secara teoretis (deduksi teori) : dilihat dari pengalaman:
- kesediaan menerima stimulus - (bisa bergaul dengan orang lain)
- kemauan reaksi stimulus - (disenangibanyak temannya)
- menilai stimulus - (menerima pendapat orang lain)
- menyusun/mengorganisasi - (tidak memaksakan pendapat)
- internalisasi nilai - (bisa bekerjasama dgn siapapun)
Apabila hasil tes menunjukkan indicator ang tidak berhubungan secara positif satu sama lain, berarti ukuran tersebut tidak memiliki validitas konstruksi. Maka prlu ditinjau atau diperbaiki kembali.

b. Pengujian Validitas Tes Secara Empirik.
Dimaksud dengan validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat empiric yang bersumber pada atau diperoleh atas dasar pengamatan di lapangan. Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas empirik ataukah belum, dapat dilakukan penelusuran dari dua segi, yaitu dari segi daya ketepatan meramalnya (predictive validity) dan daya ketepatan bandingannya (concurrent validity).

3).Validitas “Ada Sekarang” (Concurrent Validity)
Validitas ini lebih umum dikenal dengan validitas empiris. Dikatakan validitas empiris jika hasilnya sesuai dengan pegalaman. Pengalaman selalu mengenal hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang, concurrent).
Cara yang dipergunakan untuk menilai validitas ini dengan jalan mengkorelasikan hasil-hasil yang dicapai dalam tes dengan hasil-hasil yang dicapai dalam tes yang sejenis yang telah diketahui mempunyai validitas tinggi (misalnya tes standar). Tinggi rendahnya koefisien korelasi yang diperoleh menunjukkan tinggi rendahnya validitas tes yang akan kita nilai kualitasnya.

4).Validitas Prediksi (Predictive Validity)
Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang. Istilah “ramalan” jika dikaitkan dengan validitas tes, maka yang dimaksud dengan validitas ramalan dari suatu tes adalah suatu kondisi yang menunjukan seberapa jauhkah sebuah tes telah dapat dengan secara tepat menunjukan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa mendatang.
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran di perguruan tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian semester 1 dibandingkan dengan dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud tidak memiliki prediksi.
Untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas ramalan ataukah belum, dapat ditempuh dengan cara: mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya dengan kriterium yang ada. Jika diantara kedua variabel tersebut terdapat korelasi positif yang signifikan, maka tes hasil belajar yang sedang diuji validitas ramalannya itu, dapat dinyatakan sebagai tes hasil belajar yang telah memiliki daya ramal yang tepat, artinya: apa yang telah diramalkan, betul-betul telah terjadi secara nyata dalam praktek.
Dalam rangka mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya dengan kriterium yang telah ditentukan itu, cara sederhana yang paling sering digunakan adalah dengan menerapkan Teknik Analisis Korelasional Product Moment dari Karl Pearson.
Cara mengetahui Validitas Alat ukur.
Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh Pearson.

Rumus korelasi product moment ada 2 macam,yaitu :
Korelasi product moment dengan simpangan

Dengan : ┌xy = koefisien korelasi antara variable x dan variable y,dua variable yang dikorelasikan (x=X-x dan y=Y-y)
Σxy = jumlah perkalian x dengan y
x2 = kuadrat dari x.
y2 = kuadrat dari y.

Korelasi product moment dengan kata kasar

Dengan : ┌xy = koefisien korelasi anatara variable x dan variable y,dua variable yang
dikorelasikan.
N= Banyaknya siswa
X= Nilai total
Y= Skor total.
Interprestasi mengenai besarnya koefisien korelasi adalah sebagai berikut:
R INTERPRESTASI
Antara 0,81-1,00 Tinggi
Antara 0,61-0,80 Cukup
Antara 0,41-0,60 Agak rendah
Antara 0,21-0,40 Rendah
Antara 0,00-0,20 Sangat rendah

Contoh soal :
Tabel : Persiapan U/ Mencari Validitas Tes Prestasi B.Inggris
No Nama X Y x y x2 y2 xy
1 Nadia 6,5 6,3 0 -0,1 0,0 0,01 0,0
2 Susi 7 6,8 +0,5 +0,4 0,25 0,16 +0,2
3 Cecep 7,5 7,2 +1,0 +0,8 1,0 0,64 +0,8
4 Erna 7 6,8 +0,5 +0,4 0,25 0,16 +0,2
5 Dian 6 7 -0,5 +0,6 0,25 0,36 -0,3

6 Asmara 6 6,2 -0,5 -0,2 0,25 0,04 +0,1
7 Siswoyo 5,5 5,1 -0,1 -1,3 1,0 1,69 +1,3
8 Jihad 6,5 6 0 -0,4 0,0 0,16 0,0
9 Yanna 7, 6,5 +0,5 +0,1 0,25 0,01 +0,05
10 Lina 6 5,9 -0,5 -0,6 0,25 0,36 +0,3
Jumlah 65,0 63,8 3,5 3,59 2,65

Bila dilihat pada kedua hitungan diatas terdpt perbedaan 0,003 lebih besar pd simpangan ini wajar karna adanya pembulatan .
Koefisien Korelasi adalah sebagai berikut:
Antara 0,800 sampai dengan 1,00 = sangat tinggi
Antara 0,600 sampai dengan 0,800 = tinggi
Antara 0,400 sampai dengan 0,600 = cukup
Antara 0,200 sampai dengan 0,400 =rendah
Antara 0,00 sampai dengan 0,200 = sangat rendah

Validitas Butir Soal Atau Validitas Item.
Validitas di atas adalah validitas soal secara keseluruhan tes. Di samping mencari validitas soal perlu juga mencari validitas butir soal atau validitas item. Sebuah item memiliki validitas yang tinggi jika skor pada item mempunyai kesejajaran dengan skor total. Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk mengetahui validitas item digunakan rumus korelasi.
Untuk soal-soal bentuk objektif skor untuk item biasa diberikan dengan 1 (bagi item yang dijawab benar) dan 0 (bagi item yang dijawab salah). Sedangkan skor total merupakan jumlah dari skor untuk semua item yang membangun soal tersebut. Rumus untuk menghitung validitas item.

Dengan :
Rpbis = koefisien korelasi biserial.
Mp = rerata skor dari subjek yang menjawab betul bagi item yang dicari validitasnya.
Mt = rerata skor total
St = standar deviasi dan skor otal
P = proporsi siswa yang menjawab benar (banyakknya siswa yang benar dibagi jumlah seluruh siswa)
g= proporsi siswa yang menjawab salah (g=1-p)

Sedangkan untuk menghitung validitas item pada soal-soal tes dan soal-soal bentuk uraian di mana skor untuk setiap item diberikan menghendaki gradualisasi penialain, menggunakan rumus korelasi product moment baik dengan simpanagan atau dengan angka kasar antara skor setiap item dengan skor total. Penafsiran koefisien korelasinya dapat melihat ke tabel harga kritik r product moment pearson dengan kriteria jika r yang dihitung lebih besar dari r tabel maka item tersebut valid.

Analisis Reliabilitas.
Suatu tes dapat dikatakan mempunyai kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian realibilitas tes berhubungan dengan masalah ketetapan hasil tes atau seandainya hasilnya berubah-rubah, perubahan yang terjadi dapat dikatakan tidak berarti.
Reliabilitas alat penilaian adalah ketetapan atau keajegan alat dalam menilai apa yang dinilainya.
Beberapa hal yang memepengaruhi hasil tes:
Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-butir soalnya.
Hal yang berhubungan dengan tercoba (testee)
Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa akan mencerminkan keragaman hasil yang menggambarakan besar kecilnya reliabilitas tes.
Hal yang berhubungan dengan penyelenggaraan tes.

Faktor penyelenggaraan tes yang bersifat administrasi sangat menentukan hasil tes.

Kualitas butir-butir soal ditentukan oleh :
Jelas tidaknya rumusan soal.
Baik tidaknya pengarahan soal kepada jawaban sehingga tidak menimbulkan salah jawab.
Petunjuknya jelas sehingga mudah dan cepat dikerjakan.

Cara – cara mencari besarnya reliabilitas yaitu :
Metode Bentuk Parallel (Equivalent).
Tes parallel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan tetapi butir-butir soalya berbeda.
Metode Tes Ulang (Test-Retest Method)
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetesannya memiliki satu segi tetapi dicobakan dua kali.
3.) Metode Belah Dua(Split-Half Method).
Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu kali pada waktu membelah dua dan mengkorelasikan dua belahan baru diketahui reliabiltas separo tes. Syarat menggunakan metode ini adalah bahwa banyaknya butir soal harus genap agar dapat dibelah, item-item yang membangun soal harus homogeny atau dibelah terdapat keseimbangan antara belahan pertama dan belahan kedua. Rumus empiris Spearman-Brown sebagai berikut :
r_(11=) (2 .r 1⁄2 1⁄2)/(( 1+r 1⁄(2 1⁄2)))

dengan keterangan:
r11 : koefisien realiabilitas yang sudah disesuaikan.
r1/21/2 : korelasi antara skor-skor setiap belahan tes.
. Contoh: Koefisien korelasi belah dua adalah 0,60
R11 = =

Sedangkan untuk mengatasi kesulitan bila berhadapan dengan banyaknya butir soal ganjil atau genap, maka digunakan rumus kuder-Richhardson (KR-20) sebagai berikut :
r_11=[n/(n-1)][(S^2- ∑▒pq)/S^2 ]
dengan : r11 = reliabilitas instrument
n= banyakknya butir soal
S=standar deviasi dari tes (akar varians)
P=proporsi subjek yang menjawab item dengan benar
q =proporsi subjek yang menjawab item dengan salah.
Σpq= jumlah hasil perkalian p dan q

Untuk mecari reliabilitas tes bentuk uraian dan bentuk non tes digunakan rumus Alpha sebagai berikut :

Misalnya disusun tes sebanyak 80 soal. Setelah diberikan kepada sejumlah siswa dalam kelas tertentu, lalu dicari nilai rata rata dan simpangan bakunya. Misalnya diperoleh nilai rata rata 60 dan simpangan bakunya 8. Dengan rumus di atas maka:
R11 =
=
=
= 0,77
Uraian ukuran reliabilitas yang telah dijelaskan di atas dapat dipertimbangkan oleh peneliti, cara mana yang paling tepat digunakan ber¬gantung pada peneliti. Pertimbangan tersebut, antara lain sifat va¬riabel yang diukur, jenis alat ukur, jumlah subjek yang diukur, serta hasil hasil pengukuran yang diharapkan sesuai dengan tujuan penelitian.
Misalnya seorang guru hendak melihat reliabilitas tes yang telah dibuatnya. Setelah melakukan dua kali pengukuran didapatkan skor tes sebagai berikut:

Koefisien reliabilitas test di atas dapat dihitung dengan menggunakan formula korelasi produk momen dari Pearson sebagai berikut:

Dengan demikian, korelasi sebesar 0,954 menggambarkan bahwa reliabilitas tes cukup tinggi. Salah satu kelemahan mendasar dari teknik test-retest adalah carry-over effect. Masalah ini disebabkan oleh adanya kemungkinan pada test yang kedua dipengaruhi oleh test pertama. Misalnya, jika peserta tes masih ingat dengan soal-soal dan bahkan jawaban ketika dilakukan test pertama.

CONTOH
PERHITUNGAN RELIABILITAS (METODA BELAH DUA)
Nama Skor Skor
Siswa Ganjil Genap
X Y X2 Y2 X.Y
A 20 25 400 625 500
B 38 40 1444 1600 1520
C 28 26 784 676 728
D 33 32 1089 1024 1056
E 33 43 1089 1849 1419
F 44 45 1936 2025 1980
G 17 16 289 256 272
H 33 32 1089 1024 1056
I 36 35 1296 1225 1260
J 35 32 1225 1024 1120
K 30 26 900 676 780
L 42 38 1764 1444 1596
—————————————————————————————————- Jumlah:
389 390 13305 13448 13287
Setelah dihitung / dijumlahkan diperoleh harga-harga:
N=12, X=389, Y=390,
X2=13305, Y2=13448, XY=13287

Harga-harga tersebut di atas dimasukkan ke dalam rumus Pearson’s Product
Moment sebagai berikut:
N (XY) – (X) (Y)
rxy = –____________________________—
√ [N(X2) - ( X)2] [N(Y2) - ( Y) 2]
Dengan rumus itu diperoleh harga rxy atau rgg = 0,88
2 x 0,88 1,72
Koef. reliabilitas (rtt) = ————- = —— = 0,94
1 + 0,88 1,88

Berarti tes ini tergolong baik sebab reliabilitasnya tinggi.

KESIMPULAN

Analisis butir soal bertujuan untuk memperoleh kualitas soal yang baik sehingga dapat memperoleh gambaran tentang prestasi siswa yang sebenarnya.
Ada beberapa cara melalukan analisis butir soal:
Analisis tingkat kesukaran soal  untuk dapat membedakan soal kategori mudah, sedang dan sukar.
Analisis daya pembeda  mengkaji apakah soal mempunyai kemampuan dalam membedakan siswa termasuk kategori mempunyai kemampuan tinggi atau rendah.
Analisis validitas  mengkaji kesahihan alat ukur (soal) dalam menilai apa yang seharusnya diukur atau mengkaji ketepatan soal sebagai alat ukur.
Analisis reliabilitas  mengkaji keajegan atau ketetapan hasil tes manakala tes tersebut diujikan kepada siswa yang sama lebih dari satu kali.

DAFTAR PUSTAKA

Daryanto, H. 2001. Evaluasi Pendidikan. Cetakan II. Jakarta: Rineka Cipta.
Mahasiswa uhamka angkatan 2001 fkip. 2005. Kumpulan Hasil Diskusi Evaluasi Proses Dan Hasil Belajar. Jakarta: FKIP UHAMKA.
Sudjana, Nana. 1991. Penilaian Hasil Proses Belajar Mengajar. Cetakan III. Bandung: Rosdakarya.
http://gurupembaharu.com/home/Panduan Analisis Butir Soal

http://www.azuarjuliandi.com/openarticles/cronbachalpha(manual).pdf

http://evaluasipendidikan.blogspot.com/2008/04/reliabilitas-pendekatan-tes ulang_10.html

About these ads