Kamis, 05 Februari 2015
Rabu, 04 Februari 2015
Penulisan Butir Soal
I. PENDAHULUAN
A.
Latar
Belakang
Peraturan Menteri Pendidikan Nasional (Permendiknas) Nomor 14 tahun 2005 tentang Organisasi dan Tata Kerja Direktorat
Jenderal Manajemen Pendidikan Dasar dan Menengah Departemen Pendidikan Nasional
menyebutkan bahwa salah satu tugas Direktorat Pembinaan SMA - Subdirektorat
Pembelajaran adalah melakukan penyiapan bahan kebijakan, standar, kriteria, dan
pedoman serta pemberian bimbingan teknis, supervisi, dan evaluasi pelaksanaan
kurikulum. Lebih lanjut dijelaskan dalam Permendiknas Nomor 25 tahun 2006
tentang Rincian Tugas Unit Kerja di Lingkungan Direktorat Jenderal Manajemen
Pendidikan Dasar dan Menengah bahwa rincian tugas Subdirektorat Pembelajaran –
Direktorat Pembinaan Sekolah Menengah Atas antara lain melaksanakan penyiapan
bahan penyusunan pedoman dan prosedur pelaksanaan pembelajaran, termasuk
penyusunan pedoman pelaksanaan kurikulum.
Ditetapkannya Undang-Undang Nomor 20 tahun 2003 tentang Sistem
Pendidikan Nasional dan Peraturan Pemerintah Nomor 19 tahun 2005 tentang
Standar Nasional Pendidikan membawa implikasi terhadap sistem dan
penyelenggaraan pendidikan termasuk pengembangan dan pelaksanaan kurikulum. Kebijakan pemerintah
tersebut mengamanatkan kepada setiap satuan pendidikan dasar dan menengah untuk
mengembangkan Kurikulum Tingkat Satuan Pendidikan (KTSP) yang mengacu pada
Standar Nasional Pendidikan.
Pada kenyataannya dalam
melaksanakan KTSP termasuk sistem penilaiannya, banyak pendidik yang masih
mengalami kesulitan untuk menyusun tes dan mengembangkan butir soal yang valid
dan reliabel. Oleh karena itu, Direktorat Pembinaan SMA membuat berbagai
panduan pelaksanaan KTSP yang salah satu di antaranya adalah panduan penyusunan
butir soal.
B.
Tujuan
Tujuan
penyusunan panduan ini adalah untuk meningkatkan kemampuan profesional guru
khususnya dalam penulisan butir soal. Setelah
mempelajari panduan ini diharapkan para guru dapat menyusun kisi-kisi dengan
benar dan mengemabngkan butir soal yang valid dan reliabel.
C.
Ruang
Lingkup
Ruang lingkup yang dibahas dalam panduan ini meliputi penilaian
berbasis kompetensi, teknik, alat penilaian dan prosedur pengembangan tes,
penyusunan kisi-kisi, dan penyusunan butir soal.
II.
PENILAIAN BERBASIS KOMPETENSI
A. Pengertian
Penilaian berbasis kompetensi merupakan teknik evaluasi yang harus
dilakukan guru dalam pembelajaran di sekolah. Teknik dan pelaksanaannya diatur
di dalam:
·
Undang-Undang Republik Indonesia No. 20 Tahun 2003 tentang Sistem
Pendidikan Nasional
·
Peraturan Pemerintah No. 19 Tahun 2005 tentang Standar Nasional
Pendidikan
·
Peraturan Menteri Pendidikan Nasional No. 22 Tahun 2006 tentang Standar Isi
·
Peraturan Menteri Pendidikan Nasional No. 23 tahun 2006 tentang Standar Kompetensi Lulusan
Standar Kompetensi dan Kompetensi Dasar di dalam Standar Isi menjadi
fokus perhatian utama dalam penilaian.
B. Bentuk
dan Proses Penilaian
Untuk mengetahui tingkat pencapaian kompetensi, guru dapat melakukan
penilaian melalui tes dan non tes. Tes meliputi tes lisan, tertulis (bentuk
uraian, pilihan ganda, jawaban singkat, isian, menjodohkan, benar-salah), dan
tes perbuatan yang meliputi: kinerja (performance), penugasan (projek) dan
hasil karya (produk). Penilaian non-tes contohnya seperti penilaian sikap, minat, motivasi, penilaian diri, portfolio,
life skill. Tes perbuatan dan penilaian non tes dilakukan
melalui pengamatan (observasi).
Langkah-langkah pengembangan tes meliputi (1) menentukan tujuan
penilaian, (2) menentukan kompetensi yang diujikan (3) menentukan materi
penting pendukung kompetensi (urgensi, kontinuitas, relevansi, keterpakaian),
(4) menentukan jenis tes yang tepat (tertulis, lisan, perbuatan), (5) menyusun
kisi-kisi, butir soal, dan pedoman penskoran, (6) melakukan telaah butir soal. Penilaian
non tes
dilakukan melalui pengamatan dengan langkah-langkah (1) menentukan tujuan
penilaian, (2) menentukan kompetensi yang diujikan, (3) menentukan aspek yang
diukur, (4) menyusun tabel pengamatan dan pedoman penskorannya, (5) melakukan
penelaahan.
C. Kriteria Bahan Ulangan/Ujian
Bahan ulangan/ujian yang akan digunakan
hendaknya menenuhi dua kriteria dasar berikut ini.
1. adanya kesesuaian materi yang
diujikan dan target kompetensi yang harus dicapai melalui materi yang diajarkan.
Hal ini dapat memberikan informasi tentang siapa atau peserta didik mana
yang telah mencapai tingkatan pengetahuan tertentu yang disyaratkan sesuai
dengan target kompetensi dalam silabus/kurikulum dan dapat memberikan informasi
mengenai apa dan seberapa banyak materi yang telah dipelajari peserta didik. Berdasarkan
ilmu pengukuran pendidikan, ujian yang bahannya tidak sesuai dengan target
kompetensi yang harus dicapai bukan saja kurang memberikan informasi tentang hasil
belajar seorang peserta didik, melainkan juga tidak menghasilkan umpan balik
bagi penyempurnaan proses belajar-mengajar.
2. bahan ulangan/ujian hendaknya menghasilkan informasi atau data yang
dapat dijadikan landasan bagi pengembangan standar sekolah, standar wilayah,
atau standar nasional melalui penilaian hasil proses belajar-mengajar.
D. Soal yang Bermutu
Bahan ujian atau soal yang bermutu dapat
membantu pendidik meningkatkan pembelajaran
dan memberikan informasi dengan tepat tentang peserta didik mana yang belum
atau sudah mencapai kompetensi. Salah satu ciri soal yang bermutu adalah bahwa
soal itu dapat membedakan setiap kemampuan peserta didik. Semakin tinggi
kemampuan peserta didik dalam memahami materi pembelajaran, semakin tinggi pula
peluang menjawab benar soal atau mencapai kompetensi yang ditetapkan. Makin
rendah kemampuan peserta didik dalam memahami materi pembelajaran, makin kecil
pula peluang menjawab benar soal untuk mengukur pencapaian kompetensi yang ditetapkan.
Syarat soal yang bermutu adalah bahwa soal harus
sahih (valid), dan handal. Sahih maksudnya bahwa setiap alat ukur hanya
mengukur satu dimensi/aspek saja. Mistar hanya mengukur panjang, timbangan
hanya mengukur berat, bahan ujian atau soal PKn hanya mengukur materi
pembelajaran PKn bukan mengukur keterampilan/kemampuan materi yang lain. Handal
maksudnya bahwa setiap alat ukur harus dapat memberikan hasil pengukuran yang
tepat, cermat, dan ajeg. Untuk dapat menghasilkan soal yang sahih dan handal,
penulis soal harus merumuskan kisi-kisi dan menulis soal berdasarkan kaidah
penulisan soal yang baik (kaidah penulisan soal bentuk objektif/pilihan ganda,
uraian, atau praktik).
Linn dan Gronlund (1995: 47) menyatakan bahwa
tes yang baik harus memenuhi tiga karakteristik, yaitu: validitas, reliabilitas,
dan usabilitas. Validitas artinya ketepatan interpretasi hasil prosedur
pengukuran, reliabilitas artinya konsistensi hasil pengukuran, dan usabilitas
artinya praktis prosedurnya. Di samping itu, Cohen dkk. (1992: 28) juga menyatakan
bahwa tes yang baik adalah tes yang valid artinya mengukur apa yang hendak diukur.
Nitko (1996 : 36) menyatakan bahwa validitas berhubungan dengan interpretasi
atau makna dan penggunaan hasil pengukuran peserta didik. Messick (1993: 13)
menjelaskan bahwa validitas tes merupakan suatu integrasi pertimbangan
evaluatif derajat keterangan empiris yang mendasarkan pemikiran teoritis yang
mendukung ketepatan dan kesimpulan berdasarkan pada skor tes. Adapun validitas
dalam model Rasch adalah sesuai atau fit dengan model (Hambleton dan Swaminathan,
1985: 73).
Messick (1993: 16) menyatakan bahwa validitas
secara tradisional terdiri dari: (1) validitas isi, yaitu ketepatan materi yang
diukur dalam tes; (2) validitas criterion-related, yaitu membandingkan tes
dengan satu atau lebih variabel atau kriteria, (3) valitidas prediktif, yaitu
ketepatan hasil pengukuran dengan alat lain yang dilakukan kemudian; (4)
validitas serentak (concurrent), yaitu ketepatan hasil pengukuran dengan
dua alat ukur lainnya yang dilakukan secara serentak; (5) validitas konstruk,
yaitu ketepatan konstruksi teoretis yang mendasari disusunnya tes. Linn dan
Gronlund (1995 : 50) menyatakan hahwa valilitas terdiri dari: (1) konten. (2) test-criterion relationship, (3)
konstruk, dan (4) consequences, yaitu
ketepatan penggunaan hasil pengukuran.
Sedangkan menurut Oosterhof (190 : 23) yang mengutip berdasarkan "Standards for Educational and Psychological
Testing, 1985" yang didukung oleh Ebel dan Frisbie (1991 : 102-109),
serta Popham (1995 : 43) bahwa tipe validitas adalah validitas: (1) content, (2) criterion, dan (3) construction.
Di samping validitas, informasi tentang
reliabilitas tes sangat diperlukan. Nitko (1999 : 62) dan Popham (1995 : 21) menyatakan
bahwa reliabilitas berhubungan dengan konsistensi hasil pengukuran. Pernyataan ini didukung oleh Cohen dkk, yaitu
bahwa reliabilitas merupakan persamaan dependabilitas atau konsistensi (Cohen dkk : 192 : 132) karena tes yang
memiliki konsistensi/reliabilitas tinggi, maka tesnya adalah akurat, reproducible; dan gereralizable terhadap kesempatan testing dan instrumen tes yang
sama. (Ebel dan Frisbie (1991 : 76). Faktor yang mempengaruhi reliabilitas yang
berhubungan dengan tes adalah: (1) banyak butir, (2) homogenitas materi tes, (3)
homogenitas karakteristik butir, dan (4) variabilitas skor. Reliabilitas yang
berhubungan dengan peserta didik dipengaruhi oleh faktor: (1) heterogenitas
kelompok, (2) pengalaman peserta didik mengikuti tes, dan (3) motivasi peserta
didik. Sedangkan faktor yang mempengaruhi reliabilitas yang berhubungan dengan
administrasi adalah batas waktu dan kesempatan menyontek (Ebel dan Frisbie,
1991: 88-93).
Linn dan Gronlund menyatakan bahwa metode
estimasi dapat dilakukan dengan mempergunakan: (1) metode test-retest, yaitu diberikan tes yang sama dua kali pada kelompok
yang sama dengan interval waktu; tujuannya adalah pengukuran stabilitas; (2)
metode equivalent form, yaitu
diberikan dua tes paralel pada kelompok yang sama dan waktu yang sama;
tujuannya adalah pengukuran menjadi ekuivalen; (3) metode test-retest dengan equivalen
form, yaitu diberikan dua tes paralel pada kelompok yang sama dengan
interval waktu; tujuannya adalah pengukuran stabilitas dan ekuivalensi; (4)
metode split-half, yaitu diberikan
tes sekali, kemudian skor pada butir yang ganjil dan genap dkorelasikan dengan
menggunakan rumus Spearman-Brown;
tujuannya adalah pengukuran konsistensi internal; (5) metode Kuder-Richardson dan koefisien Alfa, yaitu diberikan tes
sekali kemudian skor total tes dihitung dengan rumus Kuder-Richardson,
tujuannya adalah pengukuran konsistensi internal; (6) metode inter-rater, yaitu diberikan satu set
jawaban peserta didik untuk diskor/judgement oleh 2 atau lebih rater; tujuannya
adalah pengukuran konsistensi rating. Menurut Popham (1995: 22), reliabilitas
terdiri dari 3 jenis yaitu: (1) stabilitas, yaitu konsistensi hasil di antara
kesempatan testing yang berbeda, (2) format bergantian (alternate form), yaitu konsistensi hasil di antara dua atau lebih
tes yang berbeda, (3) internal konsistensi, yaitu konsistensi melalui suatu
pengukuran fungsi butir instrumen.
Reliabilitas skor tes dalam teori respon
butir adalah penggunaan fungsi informasi tes. Menurut Hambleton dan Swaminathan
(1985: 236), pengukuran fungsi informasi tes lebih akurat bila dibandingkan
dengan penggunaan reliabilitas karena: (1) bentuknya tergantung hanya pada
butir-butir dalam tes, (2) mempunyai estimasi kesalahan pengukuran pada setiap
level abilitas. Pernyataan ini didukung oleh Gustafson (1981 : 41), yaitu bahwa
konsep reliabilitas dalam model Rasch memerankan bagian subordinate sebab model
pengukuran ini diorientasikan pada estimasi kemampuan individu.
Untuk meningkatkan validitas dan reliabilitas
tes perlu dilakukan analisis butir soal. Kegunaan analisis butir soal di
antaranya adalah: (1) dapat membantu para pengguna tes dalam evaluasi atas tes
yang diterbitkan, (2) sangat relevan bagi penyusunan tes informal dan lokal
seperti kuis, ulangan yang disiapkan guru untuk peserta didik di kelas, (3)
mendukung penulisan butir soal yang efektif, (4) secara materi dapat
memperbaiki tes di kelas, (5) meningkatkan validitas soal dan reliabilitas
(Anastasi dan Urbina, 1997: 172).
III. TEKNIK PENILAIAN DAN PROSEDUR PENGEMBANGAN TES
A. Teknik Penilaian
Ada beberapa teknik dan alat penilaian yang
dapat digunakan pendidik sebagai sarana untuk memperoleh informasi tentang
keadaan belajar peserta didik. Penggunaan berbagai teknik dan alat itu harus
disesuaikan dengan tujuan penilaian, waktu yang tersedia, sifat tugas yang dilakukan
peserta didik, dan banyaknya/jumlah materi pembelajaran yang sudah disampaikan.
Teknik penilaian adalah metode
atau cara penilaian yang dapat digunakan guru untuk rnendapatkan informasi.
Teknik penilaian yang memungkinkan dan dapat dengan mudah digunakan oleh guru,
misalnya: (1) tes (tertulis, lisan, perbuatan), (2) observasi atau pengamatan,
(3) wawancara.
1. Teknik penilaian melalui tes
a. Tes tertulis
Tes tertulis adalah tes yang soal-soalnya
harus dijawab peserta didik dengan memberikan jawaban tertulis. Jenis tes
tertulis secara umum dapat dikelompokkan menjadi dua yaitu:
1) tes objektif, misalnya bentuk
pilihan panda, jawaban singkat atau isian, benar salah, dan bentuk
menjodohkan;
2) tes uraian, yang terbagi atas tes
uraian objektif (penskorannya dapat dilakukan secara objektif) dan tes uraian
non-objektif (penskorannya sulit dilakukan secara objektif).
b. Tes lisan
Tes lisan yakni tes yang pelaksanaannya dilakukan dengan mengadakan tanya
jawab secara langsung antara pendidik dan peserta didik. Tes ini memiliki
kelebihan dan kelemahan. Kelebihannya adalah: (1) dapat menilai kemampuan dan
tingkat pengetahuan yang dimiliki peserta didik, sikap, serta kepribadiannya
karena dilakukan secara berhadapan langsung; (2) bagi peserta didik yang kemampuan
berpikirnya relatif lambat sehingga sering mengalami kesukaran dalam memahami
pernyataan soal, tes bentuk ini dapat menolong sebab peserta didik dapat
menanyakan langsung kejelasan pertanyaan yang dimaksud; (3) hasil tes dapat
langsung diketahui peserta didik. Kelemahannya adalah (1) subjektivitas pendidik
sering mencemari hasil tes, (2) waktu pelaksanaan yang diperlukan relatif cukup
lama.
c. Tes perbuatan
Tes perbuatan yakni tes yang penugasannya
disampaikan dalam bentuk lisan atau tertulis dan pelaksanaan tugasnya
dinyatakan dengan perbuatan atau unjuk kerja. Penilaian tes perbuatan dilakukan
sejak peserta didik melakukan persiapan, melaksanakan tugas, sampai dengan
hasil yang dicapainya. Untuk menilai tes perbuatan pada umumnya diperlukan
sebuah format pengamatan, yang bentuknya dibuat sedemikian rupa agar pendidik
dapat menuliskan angka-angka yang diperolehnya pada tempat yang sudah
disediakan. Bentuk formatnya dapat disesuaikan menurut keperluan. Untuk tes
perbuatan yang sifatnya individual, sebaiknya menggunakan format pengamatan
individual. Untuk tes perbuatan yang dilaksanakan secara kelompok digunakan
format tertentu yang sudah disesuaikan untuk keperluan pengamatan kelompok.
2. Teknik penilaian melalui
observasi atau pengamatan
Observasi adalah suatu kegiatan yang dilakukan pendidik untuk mendapatkan
informasi tentang peserta didik dengan cara mengamati tingkah laku dan
kemampuannya selama kegiatan observasi berlangsung. Observasi dapat ditujukan
kepada peserta didik secara perorangan atau kelompok. Dalam kegiatan observasi
perlu disiapkan format pengamatan. Format pengamatan dapat berisi: (1)
perilaku-perilaku atau kemampuan yang akan dinilai, (2) batas waktu pengamatan.
3. Teknik penilaian melalui
wawancara
Teknik wawancara pada satu segi mempunyai
kesamaan arti dengan tes lisan yang telah diuraikan di atas. Teknik wawancara
ini diperlukan pendidik untuk tujuan mengungkapkan atau menanyakan lebih
lanjut hal-hal yang kurang jelas
informasinya. Teknik wawancara ini dapat pula digunakan sebagai alat untuk
menelusuri kesukaran yang dialami peserta didik tanpa ada maksud untuk menilai.
Setiap
teknik penilaian harus dibuatkan instrumen penilaian yang sesuai. Tabel berikut menyajikan teknik penilaian dan bentuk instrumen.
Tabel 1. Teknik Penilaian dan Bentuk
Instrumen
Teknik Penilaian
|
Bentuk Instrumen
|
• Tes tertulis
|
• Tes
pilihan: pilihan ganda, benar-salah, menjodohkan dll.
• Tes
isian: isian singkat dan uraian
|
• Tes lisan
|
• Daftar pertanyaan
|
• Tes praktik (tes kinerja)
|
• Tes identifikasi
• Tes simulasi
• Tes uji petik kinerja
|
• Penugasan individual atau kelompok
|
• Pekerjaan rumah
• Projek
|
• Penilaian portofolio
|
• Lembar penilaian portofolio
|
• Jurnal
|
• Buku cacatan jurnal
|
• Penilaian diri
|
• Kuesioner/lembar penilaian diri
|
• Penilaian antarteman
|
• Lembar penilaian antarteman
|
B. Prosedur Pengembangan Tes
Sebelum menentukan teknik dan alat penilaian, penulis soal perlu menetapkan
terlebih dahulu tujuan penilaian dan kompetensi dasar yang hendak diukur. Adapun proses penentuannya secara lengkap dapat dilihat pada bagan berikut
ini.
Langkah-langkah penting yang dapat dilakukan
sebagai berikut.
1. Menentukan tujuan penilaian. Tujuan penilaian sangat penting karena setiap
tujuan memiliki penekanan yang berbeda-beda. Misalnya untuk tujuan tes prestasi
belajar, diagnostik, atau seleksi. Contoh untuk tujuan prestasi belajar,
lingkup materi/kompetensi yang ditanyakan/diukur disesuaikan seperti untuk
kuis/menanyakan materi yang lalu, pertanyaan lisan
di kelas, ulangan harian, tugas individu/kelompok, ulangan semester, ulangan kenaikan kelas, laporan kerja
praktik/laporan praktikum, ujian praktik.
2. Memperhatikan standar kompetensi (SK) dan kompetensi dasar (KD). Standar
kompetensi merupakan acuan/target utama yang harus dipenuhi atau yang harus
diukur melalui setiap kompetensi dasar yang ada atau melalui gabungan
kompetensi dasar.
3. Menentukan jenis alat ukurnya, yaitu tes atau non-tes atau mempergunakan
keduanya. Untuk penggunaan tes diperlukan penentuan materi penting sebagai
pendukung kompetensi dasar. Syaratnya adalah materi yang diujikan harus mempertimbangkan
urgensi (wajib dikuasai peserta didik), kontinuitas (merupakan materi
lanjutan), relevansi (bermanfaat terhadap mata pelajaran lain), dan
keterpakaian dalam kehidupan sehari-hari tinggi (UKRK). Langkah selanjutnya adalah
menentukan jenis tes dengan menanyakan apakah materi tersebut tepat diujikan
secara tertulis/lisan. Bila jawabannya tepat, maka materi yang bersangkutan
tepat diujikan dengan bentuk soal apa, pilihan ganda atau uraian. Bila
jawabannya tidak tepat, maka jenis tes yang tepat adalah tes perbuatan: kinerja
(performance), penugasan (project), hasil karya (product), atau
lainnya.
4. Menyusun kisi-kisi tes dan menulis butir soal beserta pedoman
penskorannya. Dalam menulis soal, penulis soal harus memperhatikan kaidah
penulisan soal.
C. Penentuan Materi Penting
Langkah awal yang harus dilakukan dalam
menyiapkan bahan ulangan/ujian adalah menentukan kompetensi dan materi yang
akan diujikan. Setelah menentukan kompetensi yang akan diukur, maka langkah
berikutnya adalah menentukan materi yang akan diujikan. Penentuan materi yang akan diujikan sangat penting karena
di dalam satu tes tidak mungkin semua materi yang telah diajarkan dapat
diujikan dalam waktu yang terbatas, misalnya satu atau dua jam. Oleh karena
itu, setiap guru harus menentukan materi mana yang sangat penting dan
penunjang, sehingga dalam waktu yang sangat terbatas, materi yang diujikan hanya
menanyakan materi-materi yang sangat penting saja. Materi yang telah ditentukan
harus dapat diukur sesuai dengan alat ukur yang akan digunakan yaitu tes atau
non-tes.
Penentuan materi penting dilakukan dengan
memperhatikan kriteria:
1. Urgensi, yaitu materi secara
teoritis mutlak harus dikuasai oleh peserta didik,
2. Kontinuitas, yaitu materi
lanjutan yang merupakan pendalaman dari satu atau lebih materi yang sudah
dipelajari sebelumnya,
3. Relevansi, yaitu materi yang
diperlukan untuk mempelajari atau memahami, mata pelajaran lain,
4. Keterpakaian, yaitu rnateri yang
memiliki nilai terapan tinggi dalam kehidupan sehari-hari.
III. PENYUSUNAN KISI-KISI DAN BUTIR SOAL
A. Jenis Perilaku yang Dapat Diukur
Dalam menentukan perilaku yang akan diukur, penulis
soal dapat mengambil atau memperhatikan jenis perilaku yang telah dikembangkan
oleh para ahli pendidikan, di antaranya seperti Benjamin S. Bloom, Quellmalz,
R.J. Mazano dkk, Robert M. Gagne, David Krathwohl, Norman E. Gronlund dan R.W.
de Maclay, Linn dan Gronlund.
1. Ranah kognitif yang dikembangkan
Benjamin S. Bloom adalah: (1) Ingatan di antaranya seperti: menyebutkan,
menentukan, menunjukkan, mengingat kembali, mendefinisikan; (2) Pemahaman di
antaranya seperti: membedakan, mengubah,
memberi contoh, memperkirakan, mengambil kesimpulan; (3) Penerapan di antaranya
seperti: menggunakan, menerapkan; (4) Analisis di antaranya seperti:
membandingkan, mengklasifikasikan, mengkategorikan, menganalisis; (5) Sintesis
antaranya seperti: menghubungkan, mengembangkan, mengorganisasikan, menyusun;
(6) Evaluasi di antaranya seperti: menafsirkan, menilai, memutuskan.
2. Jenis perilaku yang dikembangkan
Quellmalz adalah: (1) ingatan, (2) analisis, (3) perbandingan, (4) penyimpulan,
(5) evaluasi.
3. Jenis perilaku yang dikembangkan
R. J. Mazano dkk. adalah: (1) keterampilan memusat (focusing skills), seperti:
mendefinisikan, merumuskan tujuan, (2) keterampilan mengumpulkan informasi,
seperti: mengamati, merumuskan pertanyaan, (3) keterampilan mengingat, seperti:
merekam, mengingat, (4) keterampilan mengorganisasi, seperti: membandingkan,
mengelompokkan, menata/mengurutkan, menyajikan; (5) keterampilan menganalisis,
seperti mengenali: sifat dari komponen, hubungan dan pola, ide pokok, kesalahan;
(6) keterampilan menghasilkan keterampilan baru, seperti: menyimpulkan,
memprediksi, mengupas atau mengurai; (7) keterampilan memadu (integreting
skills), seperti: meringkas, menyusun kembali; (8) keterampilan menilai,
seperti: menetapkan kriteria, membenarkan pembuktian.
4. Jenis perilaku yang dikembangkan
Robert M. Gagne adalah: (1) kemampuan intelektual: diskriminasi, identifikasi/konsep
yang nyata, klasifikasi, demonstrasi, generalisasi/menghasilkan sesuatu; (2)
strategi kognitif: menghasilkan suatu pemecahan; (3) informasi verbal:
menyatakan sesuatu secara oral; (4) keterampilan motorist
melaksanakan/menjalankan sesuatu; (5) sikap: kemampuan untuk memilih sesuatu.
Domain afektif yang dikembangkan David Krathwohl adalah: (1) menerima, (2)
menjawab, (3) menilai.
6. Domain psikomotor yang
dikembangkan Norman E. Gronlund dan R.W. de Maclay adalah: (1) persepsi, (2)
kesiapan, (3) respon terpimpin, (4) mekanisme; (5) respon yang kompleks, (6)
organisasi, (7) karakterisasi dari nilai.
7. Keterampilan berpikir yang
dikembangkan Linn dan Gronlund adalah seperti berikut.
a. Membandingkan
- Apa persamaan dan perbedaan
antara ... dan...
- Bandingkan dua cara berikut
tentang ....
b. Hubungan
sebab-akibat
- Apa penyebab utama ...
- Apa akibat …
c. Memberi alasan (justifying)
- Manakah pilihan berikut yang kamu
pilih, mengapa?
- Jelaskan mengapa kamu
setuju/tidak setuju dengan pernyataan tentang ....
d. Meringkas
- Tuliskan pernyataan penting yang
termasuk ...
- Ringkaslah dengan tepat isi …
e. Menyimpulkan
- Susunlah beberapa kesimpulan yang
berasal dari data ....
- Tulislah sebuah pernyataan yang
dapat menjelaskan peristiwa berikut ....
f. Berpendapat (inferring)
- Berdasarkan ..., apa yang akan
terjadi bila
- Apa reaksi A terhadap …
g. Mengelompokkan
- Kelompokkan hal berikut berdasarkan
....
- Apakah hal berikut memiliki ...
h. Menciptakan
- Tuliskan beberapa cara sesuai
dengan ide Anda tentang ....
- Lengkapilah cerita ... tentang
apa yang akan terjadi bila ....
i. Menerapkan
- Selesaikan hal berikut dengan
menggunakan kaidah ....
- Tuliskan ... dengan
menggunakan pedoman....
j. Analisis
- Manakah penulisan yang salah
pada paragraf ....
- Daftar dan beri alasan singkat
tentang ciri utama ....
k. Sintesis
- Tuliskan
satu rencana untuk pembuktian ...
- Tuliskan
sebuah laporan ...
l. Evaluasi
- Apakah kelebihan dan kelemahan
....
- Berdasarkan kriteria ...,
tuliskanlah evaluasi tentang...
B. Penentuan Perilaku yang Akan
Diukur
Setelah kegiatan penentuan materi yang akan
ditanyakan selesai dikerjakan, maka kegiatan berikutnya adalah menentukan
secara tepat perilaku yang akan
diukur. Perilaku yang akan diukur, pada Kurikulum Berbasis Kompetensi tergantung pada tuntutan
kompetensi, baik standar kompetensi maupun kompetensi dasarnya. Setiap
kompetensi di dalam kurikulum memiliki tingkat keluasan dan kedalaman kemampuan
yang berbeda. Semakin tinggi kemampuan/perilaku yang diukur sesuai dengan
target kompetensi, maka semakin sulit soal dan semakin sulit pula menyusunnya.
Dalam Standar Isi, perilaku yang akan diukur dapat dilihat pada "perilaku
yang terdapat pada rumusan kompetensi dasar atau pada standar kompetensi".
Bila ingin mengukur perilaku yang lebih tinggi, guru dapat mendaftar terlebih
dahulu semua perilaku yang dapat diukur, mulai dari perilaku yang sangat
sederhana/mudah sampai dengan perilaku yang paling sulit/tinggi, berdasarkan
rumusan kompetensinya (baik standar kompetensi maupun kompetensi dasar). Dari susunan perilaku itu, dipilih satu perilaku yang
tepat diujikan kepada peserta didik, yaitu perilaku yang sesuai dengan kemampuan
peserta didik di kelas.
C. Penentuan
dan Penyebaran Soal
Sebelum menyusun
kisi-kisi dan butir soal perlu ditentukan jumlah soal setiap kompetensi dasar
dan penyebaran soalnya. Untuk lebih jelasnya, perhatikan contoh penilaian akhir
semester berikut ini.
Contoh penyebaran butir soal untuk penilaian akhir
semester ganjil
No
|
Kompetensi
Dasar
|
Materi
|
Jumlah soal tes tulis
|
Jumlah soal
Praktik
|
|
PG
|
Uraian
|
||||
1
|
1.1 ............
|
...........
|
6
|
--
|
--
|
2
|
1.2 ............
|
...........
|
3
|
1
|
--
|
3
|
1.3 ............
|
...........
|
4
|
--
|
1
|
4
|
2.1 ............
|
...........
|
5
|
1
|
--
|
5
|
2.2 ............
|
...........
|
8
|
1
|
--
|
6
|
3.1 ............
|
...........
|
6
|
--
|
1
|
7
|
3.2 ...........
|
...........
|
--
|
2
|
--
|
8
|
3.3 ..........
|
...........
|
8
|
--
|
--
|
Jumlah soal
|
40
|
5
|
2
|
D. Penyusunan Kisi-kisi
Kisi-kisi (test blue-print
atau table of specification)
merupakan deskripsi kompetensi dan materi yang akan diujikan. Tujuan penyusunan
kisi-kisi adalah untuk menentukan ruang lingkup dan sebagai petunjuk dalam
menulis soal. Kisi-kisi dapat berbentuk format atau matriks
seperti contoh berikut ini.
FORMAT KISI-KISI PENULISAN
SOAL
Jenis sekolah : ……………………… Jumlah soal : ………………………
Mata pelajaran : ……………………… Bentuk
soal/tes : ..................
Kurikulum : ……………………… Penyusun : 1. …………………
Alokasi waktu : ……………………… 2. …………………
No.
|
Standar Kompetensi
|
Kompetensi Dasar
|
Kls/
smt
|
Materi
pokok
|
Indikator soal
|
Nomor
soal
|
|
|
|
|
|
|
|
Keterangan:
Isi pada kolom 2, 3. 4, dan 5 adalah harus sesuai dengan pernyataan yang
ada di dalam silabus/kurikulum. Penulis kisi-kisi tidak diperkenankan mengarang sendiri,
kecuali pada kolom 6.
Kisi-kisi yang baik harus memenuhi
persyaratan berikut ini.
1. Kisi-kisi harus dapat mewakili
isi silabus/kurikulum atau materi yang telah diajarkan secara tepat dan proporsional.
2. Komponen-komponennya diuraikan
secara jelas dan mudah dipahami.
3. Materi yang hendak ditanyakan
dapat dibuatkan soalnya.
E. Perumusan Indikator Soal
Indikator dalam kisi-kisi merupakan pedoman dalam merumuskan soal yang
dikehendaki. Kegiatan perumusan indikator soal merupakan bagian dari kegiatan penyusunan
kisi-kisi. Untuk merumuskan indikator dengan tepat, guru harus memperhatikan
materi yang akan diujikan, indikator pembelajaran, kompetensi dasar, dan
standar kompetensi. Indikator yang baik
dirumuskan secara singkat dan jelas. Syarat indikator yang baik:
1. menggunakan kata kerja
operasional (perilaku khusus) yang tepat,
2. menggunakan satu kata kerja
operasional untuk soal objektif, dan satu atau lebih kata kerja operasional
untuk soal uraian/tes perbuatan,
3. dapat dibuatkan soal atau
pengecohnya (untuk soal pilihan ganda).
Penulisan indikator yang lengkap mencakup A =
audience (peserta didik) , B = behaviour (perilaku yang harus
ditampilkan), C = condition (kondisi
yang diberikan), dan D = degree (tingkatan
yang diharapkan). Ada dua model penulisan indikator. Model pertama adalah
menempatkan kondisinya di awal kalimat. Model pertama ini digunakan untuk soal
yang disertai dengan dasar pernyataan (stimulus), misalnya berupa sebuah
kalimat, paragraf, gambar, denah, grafik, kasus, atau lainnya, sedangkan model
yang kedua adalah menempatkan peserta didik dan perilaku yang harus ditampilkan
di awal kalimat. Model yang kedua ini digunakan untuk soal yang tidak disertai
dengan dasar pertanyaan (stimulus).
(1) Contoh model pertama untuk soal
menyimak pada mata pelajaran Bahasa Indonesia.
Indikator: Diperdengarkan
sebuah pernyataan pendek dengan topik "belajar mandiri", peserta
didik dapat menentukan dengan tepat pernyataan yang sama artinya.
Soal : (Soal
dibacakan atau diperdengarkan hanya satu kali, kemudian peserta didik memilih
dengan tepat satu pernyataan yang sama artinya. Soalnya adalah: "Hari
harus masuk kelas pukul 7.00., tetapi dia datang pukul 8.00 pagi hari.")
Lembar tes hanya berisi pilihan seperti berikut:
a. Hari masuk kelas tepat waktu pagi ini.
b. Hari masuk kelas terlambat dua jam pagi ini
c. Hari masuk Kelas terlambat siang hari
ini,
d. Hari masuk Kelas terlambat satu jam hari
ini
Kunci:
d
(2) Contoh model kedua
Indikator: Peserta didik dapat
menentukan dengan tepat penulisan tanda baca pada nilai uang.
Soal : Penulisan nilai uang
yang benar adalah ....
a. Rp 125,-
b. RP
125,00
c. Rp125
d. Rp125.
Kunci: b
|
F. Langkah-langkah
Penyusunan Butir Soal
Agar soal yang disiapkan oleh setiap guru menghasilkan bahan ulangan/ujian
yang sahih dan handal, maka harus dilakukan langkah-langkah berikut, yaitu: (1)
menentukan tujuan tes, (2) menentukan kompetensi yang akan diujikan, (3)
menentukan materi yang diujikan, (4) menetapkan penyebaran butir soal
berdasarkan kompetensi, materi, dan bentuk penilaiannya (tes tertulis: bentuk
pilihan ganda, uraian; dan tes praktik), (5) menyusun kisi-kisinya, (6) menulis
butir soal, (7) memvalidasi butir soal atau menelaah secara kualitatif, (8)
merakit soal menjadi perangkat tes, (9) menyusun pedoman penskorannya (10) uji
coba butir soal, (11) analisis butir soal secara kuantitatif dari data empirik
hasil uji coba, dan (12) perbaikan soal berdasarkan hasil analisis.
G. Penyusunan
Butir Soal Tes Tertulis
Penulisan butir soal tes tertulis
merupakan suatu kegiatan yang sangat penting dalam penyiapan bahan
ulangan/ujian. Setiap butir soal yang ditulis harus berdasarkan rumusan
indikator soal yang sudah disusun dalam kisi-kisi dan berdasarkan kaidah
penulisan soal bentuk obyektif dan kaidah penulisan soal uraian.
Penggunaan bentuk soal yang tepat dalam
tes tertulis, sangat tergantung pada perilaku/kompetensi yang akan diukur. Ada
kompetensi yang lebih tepat diukur/ditanyakan dengan menggunakan tes tertulis
dengan bentuk soal uraian, ada pula kompetensi yang lebih tepat diukur dengan
menggunakan tes tertulis dengan bentuk soal objektif. Bentuk tes tertulis pilihan ganda maupun uraian memiliki kelebihan dan
kelemahan satu sama lain.
Keunggulan soal bentuk pilihan ganda di
antaranya adalah dapat mengukur kemampuan/perilaku secara objektif, sedangkan
untuk soal uraian di antaranya adalah dapat mengukur kemampuan
mengorganisasikan gagasan dan menyatakan jawabannya menurut kata-kata atau kalimat
sendiri. Kelemahan soal bentuk pilihan ganda di antaranya adalah sulit menyusun
pengecohnya, sedangkan untuk soal uraian di antaranya adalah sulit menyusun
pedoman penskorannya.
H. Penulisan Soal Bentuk Uraian
Menulis soal bentuk uraian diperlukan ketepatan dan kelengkapan dalam merumuskannya.
Ketepatan yang dimaksud adalah bahwa materi yang ditanyakan tepat diujikan
dengan bentuk uraian, yaitu menuntut peserta didik untuk mengorganisasikan
gagasan dengan cara mengemukakan atau mengekspresikan gagasan secara tertulis
dengan menggunakan kata-katanya sendiri. Adapun kelengkapan yang dimaksud
adalah kelengkapan perilaku yang diukur yang digunakan untuk menetapkan aspek
yang dinilai dalam pedoman penskorannya. Hal yang paling sulit dalam penulisan
soal bentuk uraian adalah menyusun pedoman penskorannya. Penulis soal harus
dapat merumuskan setepat-tepatnya pedoman penskorannya karena kelemahan bentuk
soal uraian terletak pada tingkat subyektivitas penskorannya.
Berdasarkan metode penskorannya, bentuk uraian
diklasifikasikan menjadi 2, yaitu uraian objektif dan uraian non-objektif.
Bentuk uraian objektif adalah suatu soal atau pertanyaan yang menuntut
sehimpunan jawaban dengan pengertian/konsep tertentu, sehingga penskorannya
dapat dilakukan secara objektif. Artinya perilaku yang diukur dapat diskor secara
dikotomus (benar - salah atau 1 - 0). Bentuk uraian non-objektif adalah suatu
soal yang menuntut sehimpunan jawaban dengan pengertian/konsep menurut pendapat
masing-masing peserta didik, sehingga penskorannya sukar untuk dilakukan secara
objektif. Untuk mengurangi tingkat kesubjektifan dalam pemberian skor ini, maka
dalam menentukan perilaku yang diukur dibuatkan skala. Contoh misalnya perilaku
yang diukur adalah "kesesuaian isi dengan tuntutan pertanyaan", maka
skala yang disusun disesuaikan dengan tingkatan kemampuan peserta didik yang
akan diuji.
Untuk tingkat SMA, misalnya dapat disusun
skala seperti berikut.
Kesesuaiann isi dengan tuntutan pertanyaan 0 - 3
Skor
- Sesuai 3
- Cukup/sedang 2
- Tidak sesuai 1
- Kosong 0
Atau skala seperti berikut:
Kesesuaian isi dengan tuntutan pertanyaan 0 - 5 Skor
Skor
- Sangat Sesuai 5
- Sesuai 4
- Cukup/sedang 3
- Tidak
sesuai 2
- Sangat
tidak sesuai 1
- Kosong 0
Agar soal yang disusun bermutu baik, maka
penulis soal harus memperhatikan kaidah penulisannya. Untuk memudahkan
pengelolaan, perbaikan, dan pengembangan soal, maka soal ditulis di dalam
format kartu soal Setiap satu soal dan pedoman penskorannya ditulis di dalam
satu format. Contoh format soal bentuk uraian dan format penskorannya adalah
seperti berikut ini.
KARTU SOAL
Jenis Sekolah : ……………………............ Penyusun : 1. ……………………
Mata Pelajaran :
……………………........... 2.
……………………
Bahan Kls/Smt :
……………………............ 3.
……………………
Bentuk Soal :
……………………............ Tahun
Ajaran : ……………………….
Aspek yang diukur :
……………………............
|
|||||||||||||
KOMPETENSI DASAR
|
BUKU SUMBER:
|
||||||||||||
RUMUSAN BUTIR SOAL
|
|||||||||||||
MATERI
|
|||||||||||||
NO SOAL:
|
|||||||||||||
|
|||||||||||||
INDIKATOR SOAL
|
|||||||||||||
|
KETERANGAN SOAL
|
||||||||||||
NO
|
DIGUNAKAN UNTUK
|
TANGGAL
|
JUMLAH SISWA
|
TK
|
DP
|
PROPORSI PEMILIH
ASPEK
|
KET.
|
||||||
|
|
|
|
|
|
A
|
B
|
C
|
D
|
E
|
OMT
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
FORMAT PEDOMAN PENSKORAN
NO
SOAL
|
KUNCI/KRITERIA JAWABAN
|
SKOR
|
|
|
|
Bentuk soalnya terdiri dari: (1) dasar pertanyaan/stimulus bila
ada/diperlukan, (2) pertanyaan, dan (3) pedoman penskoran.
Kaidah penulisan soal uraian seperti berikut.
1. Materi
a. Soal harus sesuai dengan
indikator.
b. Setiap
pertanyaan harus diberikan batasan jawaban yang diharapkan.
c. Materi
yang ditanyakan harus sesuai dengan tujuan peugukuran.
d. Materi
yang ditanyakan harus sesuai dengan jenjang jenis sekolah atau tingkat kelas.
2. Konstruksi
a. Menggunakan kata tanya/perintah yang
menuntut jawaban terurai.
b. Ada
petunjuk yang jelas tentang cara mengerjakan soal.
c. Setiap soal harus ada pedoman
penskorannya.
d. Tabel, gambar, grafik, peta, atau
yang sejenisnya disajikan dengan jelas, terbaca, dan berfungsi.
3. Bahasa
a. Rumusan kalimat soal harus
komunikatif.
b. Menggunakan bahasa Indonesia yang
baik dan benar (baku).
c. Tidak menimbulkan penafsiran ganda.
d. Tidak menggunakan bahasa yang
berlaku setempat/tabu.
e. Tidak mengandung kata/ungkapan
yang menyinggung perasaan peserta didik.
H. Penulisan Soal Bentuk Pilihan
Ganda
Menulis soal bentuk pilihan ganda sangat
diperlukan keterampilan dan ketelitian. Hal yang paling sulit dilakukan dalam
menulis soal bentuk pilihan ganda adalah menuliskan pengecohnya. Pengecoh yang
baik adalah pengecoh yang tingkat kerumitan atau tingkat kesederhanaan, serta
panjang-pendeknya relatif sama dengan kunci jawaban. Oleh karena itu, untuk
memudahkan dalam penulisan soal bentuk pilihan ganda, maka dalam penulisannya
perlu mengikuti langkah-langkah berikut, langkah pertama adalah menuliskan
pokok soalnya, langkah kedua menuliskan kunci jawabannya, langkah ketiga
menuliskan pengecohnya.
Untuk memudahkan pengelolaan, perbaikan, dan perkembangan
soal, maka soal ditulis di dalam format kartu soal. Setiap satu soal ditulis di
dalam satu format. Adapun formatnya seperti berikut ini.
KARTU SOAL
Jenis Sekolah : ………………………………. Penyusun : 1.
Mata Pelajaran : ………………………………. 2.
Bahan Kls/Smt : ………………………………. 3.
Bentuk Soal : ……………………………….
Tahun Ajaran : ……………………………….
Aspek yang diukur : ……………………………….
|
||||||||||||||
KOMPETENSI DASAR
|
BUKU SUMBER
|
|||||||||||||
RUMUSAN BUTIR SOAL
|
||||||||||||||
MATERI
|
||||||||||||||
NO
SOAL:
|
|
|||||||||||||
KUNCI :
|
|
|||||||||||||
|
||||||||||||||
INDIKATOR SOAL
|
||||||||||||||
|
KETERANGAN SOAL
|
|||||||||||||
NO
|
DIGUNAKAN UNTUK
|
TANGGAL
|
JUMLAH SISWA
|
TK
|
DP
|
PROPORSI PEMILIH
|
KET.
|
|||||||
|
|
|
|
|
|
A
|
B
|
C
|
D
|
E
|
OMT
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Soal bentuk pilihan ganda merupakan soal yang telah disediakan
pilihan jawabannya. Peserta didik yang mengerjakan soal hanya memilih satu
jawaban yang benar dari pilihan jawaban yang disediakan. Soalnya mencakup: (1)
dasar pertanyaan/stimulus (bila ada), (2) pokok soal (stem), (3) pilihan jawaban
yang terdiri atas: kunci jawaban dan pengecoh.
Perhatikan contoh berikut!
Kaidah penulisan soal pilihan ganda adalah seperti berikut ini.
1. Materi
a. Soal harus sesuai dengan indikator.
Artinya soal harus menanyakan perilaku dan materi yang hendak diukur sesuai
dengan rumusan indikator dalam kisi-kisi.
b. Pengecoh harus bertungsi
c. Setiap soal harus mempunyai satu
jawaban yang benar. Artinya, satu soal hanya mempunyai satu kunci jawaban.
2. Konstruksi
a. Pokok soal harus dirumuskan secara
jelas dan tegas. Artinya, kemampuan/ materi yang hendak diukur/ditanyakan harus
jelas, tidak menimbulkan pengertian atau penafsiran yang berbeda dari yang dimaksudkan
penulis. Setiap butir soal hanya mengandung satu persoalan/gagasan
b. Rumusan pokok soal dan pilihan
jawaban harus merupakan pernyataan yang diperlukan saja. Artinya apabila
terdapat rumusan atau pernyataan yang sebetulnya tidak diperlukan, maka rumusan
atau pernyataan itu dihilangkan saja.
c. Pokok soal jangan memberi petunjuk
ke arah jawaban yang benar. Artinya, pada pokok soal jangan sampai terdapat
kata, kelompok kata, atau ungkapan yang dapat memberikan petunjuk ke arah
jawaban yang benar.
d. Pokok soal jangan mengandung
pernyataan yang bersifat negatif ganda. Artinya, pada pokok soal jangan sampai
terdapat dua kata atau lebih yang mengandung arti negatif. Hal ini untuk
mencegah terjadinya kesalahan penafsiran peserta didik terhadap arti pernyataan
yang dimaksud. Untuk keterampilan bahasa, penggunaan negatif ganda
diperbolehkan bila aspek yang akan diukur justru pengertian tentang negatif
ganda itu sendiri.
e. Pilihan jawaban harus homogen dan
logis ditinjau dari segi materi. Artinya, semua pilihan jawaban harus berasal
dari materi yang sama seperti yang ditanyakan oleh pokok soal, penulisannya harus
setara, dan semua pilihan jawaban harus berfungsi.
f. Panjang rumusan pilihan jawaban
harus relatif sama. Kaidah ini diperlukan karena adanya kecenderungan peserta
didik memilih jawaban yang paling panjang karena seringkali jawaban yang lebih
panjang itu lebih lengkap dan merupakan kunci jawaban.
g. Pilihan jawaban jangan mengandung
pernyataan “Semua pilihan jawaban di atas salah" atau "Semua pilihan
jawaban di atas benar". Artinya dengan adanya pilihan jawaban seperti ini,
maka secara materi pilihan jawaban berkurang satu karena pernyataan itu bukan
merupakan materi yang ditanyakan dan pernyataan itu menjadi tidak homogen.
h. Pilihan jawaban yang berbentuk
angka atau waktu harus disusun berdasarkan urutan besar kecilnya nilai angka atau
kronologis. Artinya pilihan jawaban yang berbentuk angka harus disusun dari
nilai angka paling kecil berurutan sampai nilai angka yang paling besar, dan
sebaliknya. Demikian juga pilihan jawaban yang menunjukkan waktu harus disusun secara
kronologis. Penyusunan secara unit dimaksudkan untuk memudahkan peserta didik
melihat pilihan jawaban.
i. Gambar,
grafik, tabel, diagram, wacana, dan sejenisnya yang terdapat pada soal harus jelas dan berfungsi. Artinya,
apa saja yang menyertai suatu soal yang ditanyakan harus jelas, terbaca, dapat
dimengerti oleh peserta didik. Apabila soal bisa dijawab tanpa melihat gambar,
grafik, tabel atau sejenisnya yang terdapat pada soal, berarti gambar, grafik,
atau tabel itu tidak berfungsi.
j. Rumusan pokok soal tidak
menggunakan ungkapan atau kata yang bermakna tidak pasti seperti: sebaiknya,
umumnya, kadang-kadang.
k. Butir soal jangan bergantung pada
jawaban soal sebelumnya. Ketergantungan pada soal sebelumnya menyebabkan peserta
didik yang tidak dapat menjawab benar soal pertama tidak akan dapat menjawab
benar soal berikutnya.
3. Bahasa/budaya
a. Setiap
soal harus menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia.
Kaidah bahasa Indonesia dalam penulisan soal di antaranya meliputi: a) pemakaian
kalimat: (1) unsur subyek, (2) unsur predikat, (3) anak kalimat; b) pemakaian
kata: (1) pilihan kata, (2) penulisan kata, dan c) pemakaian ejaan: (1)
penulisan huruf, (2) penggunaan tanda baca.
b. Bahasa yang digunakan harus komunikatif,
sehingga pernyataannya mudah dimengerti warga belajar/peserta didik.
c. Pilihan
jawaban jangan yang mengulang kata/frase yang bukan merupakan satu kesatuan
pengertian. Letakkan kata/frase pada pokok soal.
IV. PENULISAN BUTIR SOAL UNTUK TES PERBUATAN
A. Pengertian
Tes perbuatan atau tes praktik merupakan
suatu tes yang penilaiannya didasarkan pada perbuatan/praktik peserta didik.
Sebelum menulis butir soal untuk tes perbuatan, guru dapat mengecek dengan
pertanyaan berikut. Tepatkah kompetensi (yang akan diujikan) diukur dengan tes
tertulis? Jika jawabannya tepat, kompetensi yang bersangkutan tidak tepat
diujikan dengan tes perbuatan/praktik.
Dalam menilai perbuatan/kegiatan/praktik peserta
didik dapat digunakan beberapa jenis penilaian perbuatan di antaranya adalah
penilaian kinerja (performance), penugasan (project), dan hasil
karya (product).
B. Kaidah Penulisan Butir Soal Tes
Perbuatan
Dalam menulis butir soal untuk tes perbuatan,
penulis soal harus mengetahui konsep dasar penilaian perbuatan/praktik. Maksudnya
pernyataan dalam soal harus disusun dengan pernyataan yang betul-betul menilai
perbuatan/praktik, bukan menilai yang lainnya.
Penilaian kinerja merupakan penilaian yang meminta peserta didik untuk
mendemonstrasikan dan mengaplikasikan pengetahuan ke dalam konteks yang sesuai
dengan kriteria yang ditetapkan. Dalam menulis butir soal, perhatikan terlebih
dahulu kompetensi dari materi yang akan ditanyakan.
Penilaian penugasan merupakan penilaian tugas (meliputi:
pengumpulan, pengorganisasian, pengevaluasian, dan penyajian data) yang harus
diselesaikan peserta didik
(individu/kelompok) dalam waktu tertentu. Aspek yang dinilai di antaranya
meliputi kemampuan (1) pengelolaan, (2) relevansi, dan (3) keaslian.
Penilaian hasil karya merupakan penilaian keterampilan peserta didik dalam
membuat suatu produk benda tertentu seperti hasil karya seni, misal lukisan,
gambar, patung, dll. Aspek yang dinilai di antaranya meliputi: (1) tahap
persiapan: pemilihan dan cara penggunaan alat, (2) tahap proses/produksi: prosedur
kerja, dan (3) tahap akhir/hasil: kualitas serta estetika hasil karya. Di
samping itu, guru dapat memberikan penilaian pada pembuatan produk rancang
bangun/perekayasaan teknologi tepat guna misalnya melalui: (1) adopsi, (2)
modifikasi, atau (3) difusi.
Kaidah penulisan soal tes perbuatan adalah
seperti berikut.
1. Materi
a. Soal harus sesuai dengan indikator
(menuntut tes perbuatan: kinerja, hasil karya, atau penugasan).
b. Pertanyaan dan jawaban yang
diharapkan harus sesuai.
c. Materi sesuai dengan kompetensi
(urgensi, relevansi, kontinuitas, keterpakaian sehari-hari tinggi).
d. Isi materi yang ditanyakan sesuai
dengan jenjang jenis sekolah atau tingkat kelas.
2. Konstruksi
a. Menggunakan
kata tanya atau perintah yang menuntut jawaban perbuatan/praktik.
b. Ada
petunjuk yang jelas tentang cara mengerjakan soal.
c. Disusun
pedoman penskorannya.
d. Tabel, gambar, grafik, peta, atau
yang sejenisnya disajikan dengan jelas dan terbaca
3. Bahasa/Budaya
a. Rumusan kalimat soal komunikatif
b. Butir soal menggunakan bahasa
Indonesia yang baku.
c. Tidak menggunakan kata/ungkapan
yang menimbulkan penafsiran ganda atau salah pengertian.
d. Tidak menggunakan bahasa yang
berlaku setempat/tabu.
e. Rumusan soal tidak mengandung kata/ungkapan
yang dapat menyinggung perasaan peserta didik.
C. Penulisan Soal Penilaian Kinerja (Performance
Assessment)
Penilaian kinerja merupakan penilaian yang meminta peserta didik untuk
mendemonstrasikan dan mengaplikasikan pengetahuan ke dalam konteks yang sesuai
dengan kriteria yang ditetapkan. Dalam menulis butir soal, perhatikan terlebih
dahulu kompetensi dari materi yang akan ditanyakan.
D. Penulisan Soal Penilaian Penugasan (Project)
Penilaian penugasan merupakan penilaian tugas (meliputi:
pengumpulan, pengorganisasian, pengevaluasian, dan penyajian data) yang harus
diselesaikan peserta didik
(individu/kelompok) dalam waktu tertentu. Adapun aspek yang dinilai di
antaranya meliputi kemampuan (1) pengelolaan, (2) relevansi, dan (3) keaslian.
E. Penulisan Soal Penilaian Hasil Karya
(Product)
Penilaian hasil karya merupakan penilaian keterampilan peserta didik dalam
membuat suatu produk benda tertentu seperti hasil karya seni, misal lukisan,
gambar, patung, dll. Aspek yang dinilai di antaranya meliputi: (1) tahap
persiapan: pemilihan dan cara penggunaan alat, (2) tahap proses/produksi:
prosedur kerja, dan (3) tahap akhir/hasil: kualitas serta estetika hasil karya.
Di samping itu, guru dapat memberikan penilaian pada pembuatan produk rancang
bangun/perekayasaan teknologi tepat guna misalnya melalui: (1) adopsi, (2)
modifikasi, atau (3) difusi.
VI. PENULISAN BUTIR
SOAL UNTUK INSTRUMEN NON-TES
A. Pengertian
Instrumen non-tes adalah instrumen selain
tes prestasi belajar. Alat penilaian yang dapat digunakan antara lain adalah: lembar
pengamatan/observasi (seperti catatan harian, portofolio, life skill) dan
instrumen tes sikap, minat, dsb.
Pada prinsipnya, prosedur penulisan butir
soal untuk instrumen non-tes adalah sama dengan prosedur penulisan tes pada tes
prestasi belajar, yaitu menyusun kisi-kisi tes, menuliskan butir soal
berdasarkan kisi--kisinya, telaah, validasi butir, uji coba butir, perbaikan
butir berdasarkan hasil uji coba. Namun, dalam proses awalnya, sebelum menyusun
kisi-kisi tes terdapat perbedaan dalam menentukan validitas isi/konstruknya.
Dalam tes prestasi belajar, validitas isi diperoleh melalui kurikulum dan buku
pelajaran, tetapi untuk non-tes validitas isi/konstruknya diperoleh melalui
"teori". Teori adalah pendapat yang dikemukakan sebagai keterangan mengenai
suatu peristiwa atau kejadian, dsb. (Kamus Besar Bahasa Indonesia, 1990 : 932)
B. Pengamatan
Pengamatan merupakan suatu alat penilaian
yang pengisiannya dilakukan oleh guru atas dasar pengamatan terhadap perilaku peserta didik
yang sesuai dengan kompetensi yang hendak diukur. Pengamatan dapat dilakukan dengan menggunakan antara lain
lembar pengamatan, penilaian portofolio dan penilaian kecakapan hidup.
Pelaksanaan pengamatan sikap dapat dilakukan guru pada sebelum mengajar,
saat mengajar, dan sesudah mengajar. Perilaku minimal yang dapat dinilai dengan
pengamatan untuk perilaku/budi pekerti peserta didik, misalnya: ketaatan pada
ajaran agama, toleransi, disiplin, tanggung jawab, kasih sayang, gotong royong,
kesetiakawanan, hormat-menghormati, sopan santun, dan jujur.
Portofolio merupakan deskripsi peta perkembangan kemampuan individu peserta
didik. Jadi portofolio merupakan ”kartu sehat” individu peserta didik. Bila ada
peserta didik yang ”sakit”, tugas guru adalah (1) menentukan penyakitnya apa,
kemudian (2) memberi obat yang tepat agar peserta didik cepat sembuh dari
penyakitnya.
C. Penyusunan
Kisi-kisi Instrumen Non-tes
Dalam
kisi-kisi non-tes biasanya formatnya berisi dimensi, indikator, jumlah butir
soal per indikator, dan nomor butir soal. Formatnya seperti berikut ini.
NO
|
DIMENSI
|
INDIKATOR
|
JUMLAH SOAL PER INDIKATOR
|
NOMOR SOAL
|
|
|
|
|
|
JUMLAH SOAL =
|
|
Untuk mengisi kolom dimensi dan indikator, penulis soal harus mengetahui
terlebih dahulu validitas konstruknya yang disusun/dirumuskan
melalui teori. Cara termudah untuk mendapatkan teori adalah membaca beberapa
buku, hasil penelitian, atau mencari informasi lain yang berhubungan dengan
variabel atau tujuan tes yang dikehendaki. Oleh karena itu, peserta didik atau
responden yang hendak mengerjakan tes ini (instrumen non-tes) tidak perlu mempersiapkan/belajar
materi yang hendak diteskan terlebih dahulu seperti pada tes prestasi belajar.
Setelah teori diperoleh dari berbagai buku, maka langkah selanjutnya adalah
menyimpulkan teori itu dan merumuskan mendefinisikan (yaitu definisi konsep dan
definisi operasional) dengan kata-kata sendiri berdasarkan pendapat para ahli
yang diperoleh dari beberapa buku yang telah dibaca. Definisi tentang teori
yang dirumuskan inilah yang dinamakan konstruk. Berdasarkan konstruk yang telah
dirumuskan itu, langkah selanjutnya adalah menentukan dimensi
(tema-objek/hal-hal pokok yang menjadi
pusat tinjauan teori), indikator (uraian/rincian dimensi yang akan diukur), dan
penulisan butir soal berdasarkan indikatornya. Untuk lebih memudahkan dalam
menyusun kisi-kisi tes, perhatikan alur urutannya seperti pada bagan berikut.
Berdasarkan
bagan di atas, penulis soal dapat dengan mudah mengecek apakah instrumen tesnya
atau butir-butir soal sudah sesuai dengan indikatornya atau belum. Misalnya
soal nomor 1 sampai dengan soal terakhir berasal darimana? Dari indikator.
Indikator dari mana? Dari dimensi. Rumusan dimensi darimana? Dari
konstruk. Rumusan konstruk darimana? Dari teori. Jadi kesimpulannya instrumen
tes yang telah disusun merupakan alat ukur yang (sudah tepat atau belum tepat)
mewakili teori.
D. Kaidah
Penulisan Soal
Dalam
penulisan soal pada instrumen non-tes, penulis butir soal harus memperhatikan
ketentuan/kaidah penulisannya. Kaidahnya adalah seperti berikut ini.
1. Materi
a. Pernyataan
harus sesuai dengan rumusan indikator dalam kisi-kisi.
b. Aspek
yang diukur pada setiap pernyataan sudah sesuai dengan tuntutan dalam kisi-kisi
(misal untuk tes sikap: aspek kognisi, afeksi atau konasinya dan pernyataan
positif atau negatifnya).
2. Konstruksi
a. Pernyataan
dirumuskan dengan singkat (tidak melebihi 20 kata) dan jelas.
b. Kalimatnya
bebas dari pernyataan yang tidak relevan objek yang dipersoalkan atau
kalimatnya merupakan pernyataan yang diperlukan saja.
c. Kalimatnya
bebas dari pernyataan yang bersifat negatif ganda.
d. Kalimatnya
bebas dari pernyataan yang mengacu pada masa lalu.
e. Kalimatnya
bebas dari pernyataan yang faktual atau dapat diinterpretasikan sebagai fakta.
f. Kalimatnya
bebas dari pernyataan yang dapat diinterpretasikan lebih dari satu cara.
g. Kalimatnya
bebas dari pernyataan yang mungkin disetujui atau dikosongkan oleh hampir semua
responden.
h. Setiap
pernyataan hanya berisi satu gagasan secara lengkap.
i. Kalimatnya
bebas dari pernyataan yang tidak pasti seperti semua, selalu, kadang-kadang,
tidak satupun, tidak pernah.
j. Jangan
banyak mempergunakan kata hanya, sekedar, semata-mata. Gunakanlah seperlunya.
3. Bahasa/Budaya
a. Bahasa
soal harus komunikatif dan sesuai dengan jenjang pendidikan peserta didik atau
responden.
b. Soal
harus menggunakan bahasa Indonesia baku.
c. Soal
tidak menggunakan bahasa yang berlaku setempat/tabu.
E. Contoh Penulisan Kisi-kisi Non-Tes
dan Butir soal
Dalam bagian ini disajikan beberapa contoh penulisan kisi-kisi tes dan
penulisan butir soal yang sangat sederhana. Tujuan utamanya adalah agar
contoh-contoh ini mudah dipahami oleh para guru di sekolah. Contoh yang akan
disajikan adalah penulisan kisi-kisi dan butir soal untuk tes skala sikap, tes
minat belajar, tes motivasi berprestasi, dan tes kreativitas. Untuk contoh
instrumen non-tes lainnya, para guru dapat menyusunnya sendiri yang proses
penyusunannya adalah sama dengan contoh yang ada di sini.
1. Tes
Skala Sikap
Berbagai definisi tentang sikap yang
telah dikemukakan oleh para ahli, di antaranya adalah Mueller (1986: 3) yang
menyampaikan 5 definisi dari 5 ahli, adalah seperti berikut ini. (1) Sikap
adalah afeksi untuk atau melawan, penilaian tentang, suka atau tidak suka,
tanggapan positif/negatif terhadap suatu objek psikologis (Thurstone). (2)
Sikap adalah kecenderungan untuk bertindak ke arah atau melawan suatu faktor
lingkungan (Emory Bogardus). (3) Sikap adalah kesiapsiagaan mental atau saraf
(Goldon Allport). (4) Sikap adalah konsistensi dalam tanggapan terhadap
objek-objek sosial (Donald Cambell). (5) Sikap merupakan tanggapan tersembunyi
yang ditimbulkan oleh suatu nilai (Ralp Linton, ahli antropologi kebudayaan).
Berdasarkan beberapa definisi di atas, para ahli menyimpulkan bahwa sikap
memiliki 3 komponen penting, yaitu komponen: (1) kognisi yang berhubungan
dengan kepercayaan, ide, dan konsep; (2) afeksi yang mencakup perasaan
seseorang; dan (3) konasi yang merupakan kecenderungan bertingkah laku atau
yang akan dilakukan. Oleh karena itu, ketiga komponen ini dimasukkan di dalam
format kisi-kisi "sikap belajar peserta didik" seperti contoh
berikut. Adapun definisi operasional sikap belajar adalah kecenderungan
bertindak dalam perubahan tingkah laku melalui latihan dan pengalaman dari
keadaan tidak tahu menjadi tahu yang dapat diukur melalui: toleransi,
kebersamaan dan gotong-royong, rasa kesetiakawanan, dan kejujuran.
NO
|
DIMENSI
|
INDIKATOR
|
NOMOR SOAL YANG MENGUKUR
|
|||||
KOGNISI
|
AFEKSI
|
KONASI
|
||||||
+
|
-
|
+
|
-
|
+
|
-
|
|||
1.
|
Toleransi
|
a. Mau menerima pendapat orang lain atau tidak memaksakan kehendak
pribadi
b. Tidak
mudah tersinggung
|
1
7
|
2
8
|
3
9
|
4
10
|
5
11
|
6
12
|
2.
|
Kebersamaan dan gotong royong
|
a. Dapat bekerja kelompok
b. Rela
berkorban untuk kepentingan umum
|
|
|
|
|
|
|
3.
|
Rasa kesetiakawanan
|
a. Mau
memberi dan meminta maaf
|
|
|
|
|
|
|
4.
|
dst
|
|
|
|
|
|
|
|
Contoh
soalnya sebagai berikut :
NO.
|
PERNYATAAN
|
SS
|
S
|
TS
|
STS
|
1.
2.
3.
4.
5.
6.
7.
|
Mau menerima pendapat orang lain merupakan
ciri bertoleransi.
Untuk mewujudkan cita-cita harus memaksakan kehendak
Saya suka menerima pendapat orang lain
Memilih teman di sekolah, saya utamakan mereka yang pandai saja
Kalau saya boleh memilih, saya akan selalu
mendengarkan usul-usul kedua orang tuaku.
Bekerja sama dengan orang yang berbeda
Suku lebih baik dihindarkan.
……
|
|
|
|
|
Keterangan
: SS = sangat setuju, S = setuju, TS =
tidak setuju, STS = sangat tidak setuju.
2. Tes Minat belajar
Minat adalah kesadaran yang timbul bahwa objek tertentu sangat disenangi
dan melahirkan perhatian yang tinggi bagi individu terhadap objek tersebut
(Crites, 1969 : 29). Di samping itu, minat juga merupakan kemampuan untuk
memberikan stimulus yang mendorong seseorang untuk memperhatikan aktivitas yang dilakukan berdasarkan
pengalaman yang sebenarnya (Crow and Crow , 1984 :248). Berdasarkan kedua
penegertian tersebut, minat merupakan kemampuan seseorang untuk memberikan
perhatian terhadap suatu objek yang disertai dengan rasa senang dan dilakukan
penuh kesadaran.
Peserta didik yang menaruh minat pada suatu mata pelajaran, perhatiannya
akan tinggi dan minatnya berfungsi sebagai pendorong kuat untuk terlibat secara aktif dalam kegiatan
belajar mengajar pada pelajaran tersebut. Oleh karena itu, definisi operasional
minat belajar adalah pilihan kesenangan dalam melakukan kegiatan dan dapat
membangkitkan gairah seseorang untuk memenuhi kesediaannya yang dapat diukur
melalui kesukacitaan, ketertarikan, perhatian dan keterlibatan. Berikut contoh kisi-kisi dan soal minat belajar sastra Indonesia.
NO.
|
DIMENSI
|
INDIKATOR
|
NOMOR SOAL
|
1.
2.
3.
4.
|
Kesukaan
Ketertarikan
Perhatian
Keterlibatan
|
Gairah
Inisiatif
Responsif
Kesegeraan
Konsentrasi
Ketelitian
Kemauan
Keuletan
Kerja Keras
|
8, 13
16, 17
10, 15, 20
2, 6, 9
7, 19
3, 10
4, 5
1, 18
12, 14
|
Keterangan
: Nomor yang bergaris bawah adalah untuk pernyataan positif
Contoh
soalnya seperti berikut :
NO.
|
PERNYATAAN
|
SS
|
S
|
KK
|
J
|
TP
|
1.
2.
7.
16.
20.
|
….
Saya segera
mengerjakan PR sastra sebelum
datang
pekerjaan yang lain.
Saya asyik
dengan pikiran sendiri ketika guru menerangkan sastra di kelas.
Saya suka
membaca buku sastra.
….
|
|
|
|
|
|
Keterangan : SS
= sangat sering, S = sering, KK = kadang-kadang, J = jarang, TP = tidak pernah.
Perhatikan contoh tes minat lainnya berikut ini.
CONTOH TES MINAT PESERTA DIDIK
TERHADAP MATA PELAJARAN
NO.
|
PERNYATAAN
|
SL
|
SR
|
JR
|
TP
|
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
|
Saya Senang
mengikuti pelajaran ini.
Saya rugi bila
tidak mengikuti pelajaran ini.
Saya merasa
pelajaran ini bermanfaat.
Saya berusaha
menyerahkan tugas tepat waktu.
Saya berusaha
memahami pelajaran ini.
Saya bertanya
kepada guru bila ada yang tidak jelas
Saya
mengerjakan soal-soal latihan di rumah.
Saya
mendiskusikan materi pelajaran dengan teman sekelas.
Saya berusaha
memiliki buku pelajaran ini.
Saya berusaha
mencari bahan pelajaran di perpustakaan
|
|
|
|
|
Keterangan : SL = selalu, SR = sering, JR = jarang, TP = tidak pernah.
Keterangan : Dari 4 kategori: skor terendah 10, skor tertinggi 40.
33- 40 Sangat berminat
25- 32 Berminat
17- 24 Kurang berminat
10- 16 Tidak berminat
3. Tes
Motivasi Berprestasi
Definisi Konsep
Motivasi berprestasi adalah
motivasi yang mendorong peserta
didik untuk berbuat lebih baik dari apa yang pernah dibuat atau diraih
sebelumnya maupun yang dibuat atau diraih orang lain.
Definisi Operasional
Motivasi berprestasi adalah motivasi yang mendorong seseorang untuk berbuat
lebih baik dari apa yang pernah dibuat atau diraih sebelumnya maupun yang
dibuat atau diraih orang lain yang dapat diukur melalui: (1) berusaha untuk unggul dalam kelompoknya, (2) menyelesaikan
tugas dengan baik, (3) rasional dalam meraih keberhasilan, (4) menyukai
tantangan, (5) menerima tanggung jawab pribadi untuk sukses, (6) menyukai
situasi pekerjaan dengan tanggung jawab pribadi, umpan balik, dan resiko
tingkat menengah.
CONTOH KISI-KISI PENYUSUNAN INSTRUMEN
VARIABEL MOTIVASI BERPRESTASI
INDIKATOR
|
NOMOR PERNYATAAN
|
JUMLAH
|
|
POSITIF
|
NEGATIF
|
|
|
1. Berusaha unggul
2. Menyelesaikan tugas
dengan baik
3. Rasional dalam meraih keberhasilan
4. Menyukai tantangan
5. Menerima tanggung
jawab
pribadi untuk
sukses
6. Menyukai situasi
pekerjaan dengan
tanggung jawab pribadi, umpan balik, dan
resiko tingkat menengah
|
1,2,3
7,8,9
13,14,15
19,20,21
25,26,27,28
33,34,35,36
|
4,5,6
10,11,12
16,17,18
22,23,24
29,30,31,32
37,38,39,40
|
6
6
6
6
8
8
|
Jumlah Pernyataan
|
20
|
20
|
40
|
CONTOH BUTIR SOAL:
1. Saya bekerja keras agar
prestasi saya lebih baik baripada teman- teman.
a. Selalu b. Sering c. Kadang-kadang d. Jarang
e. Tidak pernah
4. Saya
menghindari upaya mengungguli prestasi teman-teman.
a. Selalu b. Sering c. Kadang-kadang d. Jarang
e. Tidak pernah
9. Saya
berusaha untuk memperbaiki kinerja saya pada masa lalu.
a. Selalu b. Sering c. Kadang-kadang d. Jarang
e. Tidak pernah
12. Saya
mengabaikan tugas-tugas sebelum ada yang mengatur
a. Selalu b. Sering c. Kadang-kadang d. Jarang
e. Tidak pernah
SKOR
JAWABAN
Skor Jawaban
|
a
|
b
|
c
|
d
|
e
|
Pernyataan Positif
|
5
|
4
|
3
|
2
|
1
|
Pernyataan Negatif
|
1
|
2
|
3
|
4
|
5
|
3. Tes Kreativitas
Kreativitas
merupakan proses berpikir yang dapat digunakan untuk memecahkan masalah atau
menjawab pertanyaan secara benar dan bermanfaat (Devito, 1989 : 118). Disamping
itu, kreativitas juga merupakan kemampuan berpikir divergen yang mencerminkan
kelancaran, keluwesan dan orisinal dalam proses berpikir (Good Brophy, 1990 :
619). Ciri-ciri kreativitas berkaitan dengan imaginasi, orisinalitas, berpikir
devergen, penemuan hal-hal yang bersifat baru, intuisi, hal-hal yang menyangkut
perubahan dan eksplorasi (Coben, 1976 : 17). Desain tes kreativitas terdiri
dari dua subtes yaitu dalam bentuk gambar dan verbal yang masing-masing bentuk
memiliki ciri kelancaran (fluency). keluwesan
(flexibility), keaslian (originality), dan elaborasi (elaboration) (Torrance, 1974 : 8).
Berdasarkan
beberapa pendapat para ahli, definisi konsepsual kreativitas adalah kemampuan
berpikir divergen. Adapun definisi operasionalnya adalah kemampuan berpikir
divergen yang memiliki sifat (dapat diukur melalui) kelancaran, keluwesan,
keaslian, elaborasi, dan hasilnya dapat berguna untuk keperluan tertentu. Dari
hasil pendefinisian konstruk ini, kisi-kisinya dapat disusun seperti contoh
berikut ini.
NO.
|
TES
|
INDIKATOR
|
NOMOR SOAL
|
1.
2.
|
VERBAL
Gambar
|
a. Kelancaran
b. Keluwesan
c. Keaslian
d. Keelaborasian
a. Kelancaran
b. Keluwesan
c. Keaslian
d. Keelaborasian
|
1,2,3,4,5,6,7,8,9,10
1,2,3,4,5,6,7,8,9,10
1,2,3,4,5,6,7,8,9,10
1,2,3,4,5,6,7,8,9,10
1,2,3,4,5,6,7,8,9,10
1,2,3,4,5,6,7,8,9,10
1,2,3,4,5,6,7,8,9,10
1,2,3,4,5,6,7,8,9,10
|
Penskoran untuk setiap indikator di atas mempergunakan skala 0-4. Misalnya
untuk indikator “kelancaran”, skor : 4 = sangat lancar, 3 = cukup lancar, 2 =
kurang lancar, 1 = tidak lancar, 0 = tidak menjawab. Untuk indikator
“keluwesan”, skor: 4 = sangat luwes, 3 = cukup luwes, 2 = kurang luwes, 1 =
tidak luwes, 0 = tidak menjawab, demikian pula seterusnya. Adapun contoh butir
soal seperti berikut.
a. Contoh Tes Verbal
§ Misalnya
diberikan tiga gambar ikan dalam akuarium yang masing-masing dibedakan jumlah
ikan dan makanannya. Pertanyaan: pilih salah satu gambar yang anda sukai dan
jelaskan mengapa anda menyukainya! (waktu 3 menit).
§
Buatlah kalimat sebanyak-banyaknya dengan
kata “pintar“! (waktu 3 menit).
§ Tuliskan berbagai cara tikus masuk ke dalam rumah! (waktu 3 menit).
b. Contoh Tes Gambar
§
Disajikan sebuah gambar yang belum selesai.
Pertanyaan:
selesaikan rancangan gambar berikut dan berikan judul sesuai dengan selera
Anda! (waktu 3 menit).
§
Disajikan sebuah sketsa gambar yang belum
selesai.
Pertanyaan
: selesaikan sketsa gambar berikut menurut kesukaan anda dan setelah selesai
berikut judulnya! (waktu 3 menit).
§
Disajikan 6 buah titik A, B, C, D, E, dan F dengan posisi yang
telah ditetapkan.Pertanyaan: Buatlah gambar dari 6 titik ini, kemudian berikan
judulnya!.
§
Disajikan gambar sebuah segitiga dan tiga lingkaran yang letaknya
mengelilingi segitiga. Pertanyaan: Tafsirkan makna gambar berikut!
(waktu 5 menit).
4. Tes
Stres Belajar (menghadapi ujian)
Definisi
konsep stres belajar adalah suatu kondisi kekuatan dan tanggapan sebagai
interaksi dalam diri seseorang akibat dikonfrontasikan dengan suatu peluang,
kendala, atau tuntutan belajar yang dikaitkan dengan apa yang sangat diinginkan
dan hasilnya dipersepsikan sebagai suatu yang tidak pasti atau penting.
Definisi operasional stres belajar adalah suatu kondisi kekuatan dan
tanggapan sebagai interaksi dalam diri seseorang akibat dikonfrontasikan dengan
suatu peluang, kendala, atau tuntutan belajar yang dikaitkan dengan apa yang
sangat diinginkan dan hasilnya dipersepsikan sebagai suatu yang tidak pasti
atau penting yang dapat diukur melalui: (1) tanggapan psikologis seperti
perasaan cemas, khawatir, takut, tidak senang, perasaan terganggu, dan lepas
kendali, (2) tanggapan fisik seperti rasa lelah, jantung berdebar, rasa sakit,
dan tekanan darah terganggu, dan (3) tanggapan perseptual seperti anggapan dan
keyakinan. Berikut contoh kisi-kisi dan soal tes stres belajar.
NO.
|
DIMENSI
|
INDIKATOR
|
NOMOR
SOAL
|
1.
2.
3.
|
Tanggapan
Psikologis terhadap kendala
dan tuntutan)
Tanggapan Fisik
(akibat tuntutan)
Tanggapan Persepsual
(terhadap
pencapaian)
|
a. Perasaan cemas
b. Khawatir
c. Takut
d. Tidak senang
e. Perasaan terganggu
f.
Lepas Kendali
a. Rasa lelah
b. Jantung berdebar
c. Rasa sakit
d. Tekanan
darah terganggu
a. Tanggapan dan keyakinan
|
1,2
3,4,5
6,7,8,9
10,11,12,13,14,15,16,
17,18,19,20,21,22,
23,24,25,26,27,28,29,30
31,32,33,34,
35,36,37,
38,39,40,
41,42,43,
44,45,46,47,48,49,50
|
Keterangan: nomor soal ganjil adalah pernyataan positif, nomor
soal genap adalah pernyataan negatif.
Contoh
soal stres belajar.
NO.
|
PERNYATAAN
|
SS
|
S
|
KK
|
J
|
TP
|
1.
6.
20.
36.
50.
|
Saya cemas terhadap kemampuan saya di sekolah.
Saya takut ranking saya turun.
Saya kehilangan nafsu makan setiap menghadapi tuntutan tugas.
Jantung saya berdebar-debar ketika sedang
menyelesaikan tugas
…..
|
|
|
|
|
|
Keterangan : SS = sangat
sering, S = sering, KK = kadang-kadang,
J
= jarang, TP = tidak pernah.
6. Teknik
Penskoran
Salah satu kegiatan dari penulisan butir soal yaitu teknik penskoran. Ada
cara sederhana untuk menskor hasil jawaban peserta didik dari instrumen
non-tes. Sebagai contoh, tes skala sikap di atas telah dikerjakan oleh salah
satu peserta didik.
Nama peserta didik : Susiana
NO.
|
PERNYATAAN
|
SS
|
S
|
TS
|
STS
|
1.
2.
3.
4.
5.
6.
7.
|
Mau menerima pendapat orang lain merupakan ciri bertoleransi.
Untuk mewujudkan cita-cita harus memaksakan kehendak
Saya suka menerima pendapat orang lain
Memilih teman di sekolah, saya utamakan mereka yang pandai saja
Kalau saya boleh memilih, saya akan selalu
mendengarkan usul-usul kedua orang tuaku.
Bekerja sama dengan orang yang berbeda
suku lebih baik dihindarkan.
……
|
X
X
|
X
|
X
|
X
X
|
Penjelasan:
Dalam kisi-kisi tes, soal nomor 1-6 hanya mewakili indikator “mau menerima
pendapat orang lain” dari dimensi “toleransi” untuk topik “sikap belajar peserta
didik di sekolah”. Sebagai contoh penskorannya adalah seperti berikut ini.
1. Perilaku positif terdapat
pada soal nomor 1, 3, 5 dengan pemberian skor: SS=
4, S= 3, TS= 2, STS= 1.
2. Perilaku negatif terdapat
pada soal nomor 2, 4, 6 dengan pemberian skor: SS=
1, S= 2, TS= 3, STS= 4
3. Skor yang harus diperoleh
dalam perilaku positif minimal 3 x 4 = 12,
Maksimal 3 x 5 = 15, (3
berasal dari 3 butir soal yang positif; 3 adalah skor S; 4 adalah skor SS).
4. Skor yang harus diperoleh
dalam perilaku negatif minimal 3 x 2 = 6,
Maksimal 3 x 1 = 3 (3
berasal dari 3 butir soal yang negatif,
2 adalah skor S; 1 adalah skor SS).
5. Skor
rata-rata: perilaku minimal adalah (12 + 6):2 = 9.
Perilaku maksimal adalah (15 + 3) : 2 = 9.
6.
Jadi skor Susiana di atas adalah seperti berikut ini.
Perilaku positif 5+4+1 = 10, perilaku negatif 4+2+3 = 9.
Skor
akhir Susiana adalah (10+9):2 = 9,5 atau 10.
Skor Susiana 10, sedangkan ukuran perilaku positif minimal 12 dan
maksimalnya adalah 15. Jadi sikap Susiana tentang “toleransi” khususnya mau
menerima pendapat orang lain” dalam topik “sikap belajar peserta didik di
sekolah” masih kurang. Artinya bahwa Susiana mempunyai sikap positif yang tidak
begitu tinggi tentang “mau menerima pendapat orang lain”. Dia perlu pembinaan
dan peningkatan khususnya mengenai perilaku ini.
VII. PENYUSUNAN BUTIR SOAL YANG MENUNTUT
PENALARAN TINGGI
A. Pengertian
Dalam menulis butir soal, penulis soal
memiliki kecenderungan untuk menulis butir-butir soal yang menuntut perilaku
“ingatan”. Di samping mudah penulisan soalnya, materi yang hendak ditanyakan
juga mudah diperoleh dari buku pelajaran. Untuk menuliskan butir soal yang
menuntut penalaran tinggi, penulis soal biasanya merasa agak kesulitan dalam
mengkreasinya. Disamping sulit menentukan perilaku yang diukur atau merumuskan
masalah yang dijadikan dasar pertanyaan, juga uraian materi yang akan
ditanyakan (yang menuntut penalaran tinggi) tidak selalu tersedia di dalam buku
pelajaran. Bagaimana peserta didik bisa maju bila pola berpikirnya hanya
ingatan? Oleh karena itu, ada beberapa cara yang dapat dijadikan pedoman oleh
para penulis soal untuk menulis butir soal yang menuntut penalaran tinggi.
Caranya adalah seperti berikut ini.
1. Materi
yang akan ditanyakan diukur dengan perilaku: pemahaman, penerapan, sintesis,
analisis, atau evaluasi (bukan hanya ingatan). Perilaku ingatan juga
diperlukan, namun kedudukannya adalah sebagai langkah awal sebelum peserta didik
dapat memahami, menerapkan, menyintesiskan, menganalisis, dan mengevaluasi
materi yang diperoleh dari guru. Uraian tentang perilaku ini dapat dilihat pada
perilaku kognitif yang dikembangkan oleh Benjamin S. Bloom pada bab di depan.
2. Setiap
pertanyaan diberikan dasar pertanyaan (stimulus).
3. Mengukur
kemampuan berpikir kritis.
4. Mengukur
keterampilan pemecahan masalah.
5. Penjelasan
nomor 2, 3 dan 4 diuraikan secara rinci di
bawah ini.
B. Dasar Pertanyaan (Stimulus).
Agar butir soal yang ditulis dapat menuntut penalaran tinggi, maka setiap
butir soal selalu diberikan dasar pertanyaan (stimulus) yang berbentuk
sumber/bahan bacaan seperti: teks
bacaan, paragrap, teks drama, penggalan novel/cerita/dongeng, puisi,
kasus, gambar, grafik, foto, rumus, tabel, daftar kata/symbol, contoh, peta,
film, atau suara yang direkam.
C. Mengukur Kemampuan Berpikir kritis
Ada 11 kemampuan berpikir kritis yang dapat
dijadikan dasar dalam menulis butir soal yang menuntut penalaran tinggi.
1. Menfokuskan
pada pertanyaan
Contoh indikator
soal:
Disajikan
sebuah masalah/problem, aturan, kartun, atau eksperimen dan hasilnya, peserta
didik dapat menentukan masalah utama, kriteria yang digunakan untuk mengevaluasi
kualitas, kebenaran argumen atau kesimpulan.
2. Menganalisis
argumen
Contoh indikator
soal:
Disajikan
deskripsi sebuah situasi atau satu/dua argumentasi, peserta didik dapat: (1)
menyimpulkan argumentasi secara cepat, (2) memberikan alasan yang mendukung
argumen yang disajikan, (3) memberikan alasan tidak mendukung argumen yang
disajikan.
3. Mempertimbangkan yang
dapat dipercaya
Contoh indikator soal:
Disajikan sebuah teks
argumentasi, iklan, atau eksperimen dan interpretasinya, peserta didik
menentukan bagian yang dapat dipertimbangan untuk dapat dipercaya (atau tidak
dapat dipercaya), serta memberikan alasannya.
4. Mempertimbangkan laporan
observasi
Contoh
indikator soalnya:
Disajikan
deskripsi konteks, laporan observasi, atau laporan observer/reporter, peserta
didik dapat mempercayai atau tidak terhadap laporan itu dan memberikan
alasannya.
5. Membandingkan kesimpulan
Contoh indikator soal:
Disajikan sebuah
pernyataan yang diasumsikan kepada peserta didik adalah benar dan pilihannya
terdiri dari: (1) satu kesimpulan yang benar dan logis, (2) dua atau lebih
kesimpulan yang benar dan logis, peserta didik dapat membandingkan kesimpulan
yang sesuai dengan pernyataan yang disajikan atau kesimpulan yang harus
diikuti.
6. Menentukan kesimpulan
Contoh indikator soal:
Disajikan sebuah
pernyataan yang diasumsikan kepada peserta didik adalah benar dan satu
kemungkinan kesimpulan, peserta didik dapat menentukan kesimpulan yang ada itu
benar atau tidak, dan memberikan alasannya.
7. Mempertimbangkan kemampuan
induksi
Contoh indikator soal:
Disajikan sebuah pernyataan,
informasi/data, dan beberapa kemungkinan kesimpulan, peserta didik dapat
menentukan sebuah kesimpulan yang tepat dan memberikan alasannya.
8. Menilai
Contoh indikatornya:
Disajikan deskripsi
sebuah situasi, pernyataan masalah, dan kemungkinan penyelesaian masalahnya,
peserta didik dapat menentukan: (1) solusi yang positif dan negatif, (2) solusi
mana yang paling tepat untuk memecahkan masalah yang disajikan, dan dapat
memberikan alasannya.
9. Mendefinisikan Konsep
Contoh indikator
soal:
Disajikan
pernyataan situasi dan argumentasi/naskah, peserta didik dapat mendefinisikan
konsep yang dinyatakan.
10. Mendefinisikan asumsi
Contoh indikator soal
Disajikan sebuah
argumentasi, beberapa pilihan yang implisit di dalam asumsi, peserta didik
dapat menentukan sebuah pilihan yang tepat sesuai dengan asumsi.
11. Mendeskripsikan
Contoh indikator soal:
Disajikan sebuah teks
persuasif, percakapan, iklan, segmen dari video klip, peserta didik dapat
mendeskripsikan pernyataan yang dihilangkan.
D. Mengukur Keterampilan Pemecahan Masalah
Ada 17 keterampilan
pemecahan masalah yang dapat dijadikan dasar dalam menulis butir soal yang
menuntut penalaran tinggi.
1. Mengidentifikasi
masalah
Contoh
indikator soal:
Disajikan deskripsi suatu situasi/masalah, peserta
didik dapat mengidentifikasi masalah yang nyata atau masalah apa yang harus
dipecahkan.
2. Merumuskan
masalah dalam bentuk pertanyaan
Contoh
indikator soal:
Disajikan
sebuah pernyataan yang berisi sebuah masalah, peserta didik dapat merumuskan
masalah dalam bentuk pertanyaan.
3. Memahami
kata dalam konteks
Contoh
indikator soal:
Disajikan
beberapa masalah yang konteks kata atau kelompok katanya digarisbawahi, peserta
didik dapat menjelaskan makna yang berhubungan dengan masalah itu dengan
kata-katanya sendiri.
4. Mengidentifikasi
masalah yang tidak sesuai
Contoh
indikator masalah:
Disajikan
beberapa informasi yang relevan dan tidak relevan terhadap masalah, peserta
didik dapat mengidentifikasi semua informasi yang tidak relevan.
5. Memilih
masalah sendiri
Contoh
indikator soal:
Disajikan
beberapa masalah, peserta didik dapat memberikan alasan satu masalah yang
dipilih sendiri, dan menjelaskan cara penyelesaiannya.
6. Mendeskripsikan
berbagai strategi
Contoh
indikator soal:
Disajikan
sebuah pernyataan masalah, peserta didik dapat memecahkan masalah ke dalam dua
cara atau lebih, kemudian menunjukkan solusinya ke dalam gambar, diagram, atau
grafik.
7. Mengidentifikasi
asumsi
Contoh
indikator soal:
Disajikan
sebuah pernyataan masalah, peserta didik dapat memberikan solusinya berdasarkan
pertimbangan asumsi untuk saat ini dan yang akan datang.
8. Mendeskripsikan
masalah
Contoh
indikator soal:
Disajikan
sebuah pernyataan masalah, peserta didik dapat menggambarkan sebuah diagram
atau gambar yang menunjukkan situasi masalah.
9. Memberi
alasan masalah yang sulit
Contoh
indikator soal:
Disajikan
sebuah masalah yang sukar dipecahkan atau informasi pentingnya dihilangkan,
peserta didik dapat menjelaskan mengapa masalah ini sulit dipecahkan atau
melengkapi informasi pentingnya dihilangkan.
10. Memberi
alasan solusi
Contoh
indikator soal:
Disajikan
sebuah pernyataan masalah dengan dua atau lebih kemungkinan solusinya, peserta
didik dapat memilih satu solusi yang paling tepat dan memberikan alasannya.
11. Memberi
alasan strategi yang digunakan
Contoh
indikator soal:
Disajikan
sebuah pernyataan masalah dengan dua atau lebih strategi untuk menyelesikan
masalah, peserta didik dapat memilih
satu strategi yang tepat untuk menyelesaikan masalah itu dan memberikan
alasannya.
12. Memecahkan
masalah berdasarkan data dan masalah
Contoh
indikator soal:
Disajikan
sebuah cerita, kartun, grafik atau tabel dan sebuah pernyataan masalah, peserta
didik dapat memecahkan masalah dan menjelaskan prosedur yang digunakan untuk
menyelesaikan masalah.
13. Membuat strategi lain
Contoh indikator soal:
Disajikan sebuah
pernyataan masalah dan satu strategi untuk menyelesaikan masalahnya, peserta
didik dapat menyelesaikan masalah itu dengan menggunakan strategi lain.
14. Menggunakan
analogi
Contoh
indikator soal:
Disajikan
sebuah pernyataan masalah dan strategi penyelesaiannya, peserta didik dapat:
(1) mendeskripsikan masalah lain (analog dengan masalah ini) yang dapat
diselesaikan dengan menggunakan strategi itu, (2) memberikan alasannya.
15. Menyelesaikan
secara terencana
Contoh
indikator soal:
Disajikan
sebuah situasi masalah yang kompleks, peserta didik dapat menyelesaikan masalah
secara terencana mulai dari input, proses, output, dan outcomenya.
16. Mengevaluasi
kualitas solusi
Contoh indikator soal:
Disajikan
sebuah pernyataan masalah dan beberapa strategi untuk menyelesaikan masalah,
peserta didik dapat: (1) menjelaskan dengan menerapkan strategi itu, (2)
mengevaluasinya, (3) menentukan strategi mana yang tepat, (4) memberi alasan
mengapa strategi itu paling tepat dibandingkan dengan strategi lainnya.
17. Mengevaluasi
strategi sistematika
Contoh
indikator soal:
Disajikan
sebuah pernyataan masalah, beberapa strategi pemecahan masalah dan prosedur, peserta
didik dapat mengevaluasi strategi pemecahannya berdasarkan prosedur yang
disajikan.
VIII.
PERAKITAN BUTIR SOAL
A. Pengertian
Merakit soal adalah menyusun soal yang siap pakai
menjadi satu perangkat/paket tes atau beberapa paket tes paralel. Dasar acuan
dalam merakit soal adalah tujuan tes dan kisi-kisinya. Untuk memudahkan
pelaksanaannya, guru harus memperhatikan langkah-langkah perakitan soal.
Dalam bab ini juga diuraikan penskoran jawaban soal. Pemeriksaan terhadap jawaban peserta didik dan pemberian angka merupakan
langkah untuk mendapatkan informasi kuantitatif dari masing-masing peserta
didik. Pada prinsipnya, penskoran soal harus diusahakan agar dapat dilakukan
secara objektif. Artinya, apabila penskoran dilakukan oleh dua orang atau lebih
yang sama tingkat kompetensinya, akan menghasilkan skor atau angka yang sama,
atau jika orang yang sama mengulangi proses penskoran akan dihasilkan skor yang
sama.
B. Langkah-langkah Perakitan Soal
Para pendidik dapat merakit soal menjadi suatu paket tes yang tepat, apabila
para pendidik memperhatikan langkah-langkah perakitan soal. Berikut
langkah-langkah perakitan soal.
1.
Mengelompokkan soal-soal yang mengukur
kompetensi dan materi yang sama, kemudian soal-soal itu ditempatkan dalam
urutan yang sama.
2.
Memberi nomor urut soal didasarkan nomor urut
soal dalam kisi-kisi.
3.
Mengecek setiap soal dalam satu paket tes
apakah soal-soalnya sudah bebas dari kaidah “Setiap soal tidak boleh memberi
petunjuk jawaban terhadap soal yang lain”.
4.
Membuat petunjuk umum dan khusus untuk
mengerjakan soal.
5. Membuat
format lembar jawaban.
6. Membuat
lembar kunci jawaban dan petunjuk penilaiannya.
7.
Menentukan/menghitung penyebaran kunci
jawaban (untuk bentuk pilihan ganda), dengan menggunakan rumus berikut.
Jumlah
soal
Penyebaran kunci
jawaban = ¾¾¾¾¾¾¾¾¾¾¾ + 3
Jumlah
pilihan jawaban
|
8. Menentukan soal inti
(anchor items) sebanyak 10 % dari jumlah soal dalam satu paket. Soal inti ini
diperlukan apabila soal yang dirakit terdiri dari beberapa tes paralel. Tujuannya adalah agar antar tes memiliki keterkaitan yang sama. Penempatan
soal inti dalam paket tes diletakkan secara acak.
9. Menentukan
besarnya bobot setiap soal (untuk soal bentuk uraian)
Bobot
soal adalah besarnya angka yang ditetapkan untuk suatu butir soal dalam perbandingan
(ratio) dengan butir soal lainnya dalam satu perangkat tes. Penentuan besar
kecilnya bobot soal didasarkan atas tingkat kedalaman dan keluasan materi yang
ditanyakan atau kompleksitas jawaban yang dituntut oleh suatu soal. Untuk
mempermudah perhitungan/penentuan nilai akhir, jumlah bobot keseluruhan pada
satu perangkat tes uraian ditetapkan 100. Perakit soal harus dapat
mengalokasikan besarnya bobot untuk setiap soal dari bobot yang telah
ditetapkan. Bobot suatu soal yang sudah ditetapkan pada satu perangkat tes
dapat berubah bila soal tersebut dirakit ke dalam perangkat tes yang lain.
10. Menyusun
tabel konversi skor
Tabel konversi sangat membantu para pendidik pada saat menilai lembar
jawaban peserta didik. Terutama bila dalam satu tes terdiri dari dua bentuk
soal, misal bentuk pilihan ganda dan uraian atau tes tertulis dan tes praktik. Skor
dari soal bentuk pilihan ganda tidak dapat langsung digabung dengan skor
uraian. Hal ini karena tingkat keluasan dan kedalaman materi yang ditanyakan
atau penekannya dalam kedua bentuk itu tidak sama. Nilai keduanya dapat
digabung setelah keduanya ditentukan bobotnya. Misalnya, untuk soal bentuk
pilihan ganda (45 soal dengan skor maksimum 45) bobotnya 60 % dan bentuk uraian
(5 soal dengan skor maksimum 20) bobotnya 40 %. Untuk menentukan skor jadinya
adalah skor perolehan peserta didik yang bersangkutan dibagi skor maksimum kali
bobot. Tabel konversi ini merupakan tabel konversi sederhana atau klasik.
Untuk
memudahkan penggunaan tabel konversi, kita ingat proses penyamaan skala atau
konversi alat ukur suhu yang didasarkan pada konversi rumus yang sudah standar,
misal skala pengukuran: Celcius (titik awal 00 titik didih 1000). Reamur (titik
awal 00 titik didih 800),
Fahrenheit (titik awal 320
titik didih 2120 ), Kelvin (titik awal 2370 titik didih 3730). Masing-masing
skala pengukuran ini bukan untuk dibandingkan atau sebagai penentu kelulusan
atau sebagai pengatrol nilai, namun masing-masing memiliki skala
sendiri-sendiri. Keberadaan skala ini tidak bisa dikatakan bahwa orang yang
menggunakan skala pengukuran Celcius dan Reamur akan selalu dirugikan karena
keduanya memiliki nilai 0 sampai dengan 4 (bila acuan kriterianya 4,01),
sedangkan orang yang menggunakan Fahrenheit dan Kelvin selalu diuntungkan karena
titik awalnya 32 dan 237. Demikian pula dengan konversi nilai dalam ulangan
atau ujian. Guru atau panitia ujian mau menggunakan konversi yang mana. Dalam
ilmu pengukuran, konversi dapat disusun
melalui konversi biasa dan konversi yang terkalibrasi dengan model respon
butir. Apabila UN atau US sudah mempergunakan konversi model respon butir,
semua nilai peserta didik harus mengacu pada model konversi ini, tidak
membandingkan dengan konversi
lain/biasa.
Konversi biasa (model pengukuran secara klasik) penggunaannya biasa digunakan
guru di sekolah, yaitu untuk memperoleh nilai murni peserta didik. Bila
menghendaki skor maksimum 10 digunakan rumus (skor perolehan: skor maksimum) x
10 dan bila menggunakan skor maksimum 100 digunakan nilai konversi dengan rumus
(skor perolehan: skor maksimum) x 100 atau bila menggunakan skor maksimum 4 digunakan
nilai konversi dengan rumus (skor perolehan : skor maksimum) x 4. Konversi
seperti ini memiliki dua kelemahan, pertama adalah bahwa setiap butir soal
dihitung memiliki tingkat kesukaran yang sama. Artinya peserta didik manapun
yang menjawab benar 40 dari 50 butir soal dalam satu tes (terserah nomor butir
soal berapa yang benar, apakah nomor 1 benar, nomor 2 salah, nomor 3 benar atau
sebaliknya dan seterusnya, yang penting benar 40 soal) peserta didik yang
bersangkutan akan memperoleh nilai 8 (untuk konversi skor maksimum 10), 80
(untuk konversi skor maksimum 100) 0,2 (untuk konversi skor maksimum 4).
Kelemahan kedua adalah bahwa tingkat kesukaran butir soal tidak ditempatkan/dikalibrasi
pada skala yang sama. Artinya bahwa butir-butir soal tidak disusun berdasarkan
tingkat kesukarannya dan kemampuan peserta didik sehingga model konversi ini
belum bisa menentukan nilai murni peserta didik yang sebenarnya. Seharusnya
hanya peserta didik yang memiliki kemampuan tinggi (misal pada skala kemampuan
1, kemampuan 2, kemampuan 3) yang dapat menjawab benar semua soal dalam tes
pada skala yang bersangkutan atau tingkat kesukaran butir (mudah, sedang,
sukar) sesuai dengan kemampuan peserta didik yang bersangkutan. Apabila sekolah
mempergunakan konversi biasa seperti ini justru akan merugikan peserta didik
yang memiliki kemampuan lebih tinggi.
Konversi yang terkalibrasi adalah konversi nilai yang disusun berdasarkan
kemampuan peserta didik dari tingkat kesukaran butir soal yang terkalibrasi
dengan model Rasch (Item Response Theory).
Untuk memahami model terkalibrasi ini diperlukan pengertian berikut. Setiap
jumlah jawaban yang benar soal, misal 1 sampai dengan 50, masing-masing butir memiliki
tingkat kemampuan (untuk teori klasik tidak ada). Tingkat kemampuan ini
diperoleh dari rumus model Rasch P= (e (F-d)) : (1 + e (F-d): P adalah peluang menjawab benar satu butir soal. E = 2,7183, F = tingkat kemampuan peserta didik, dan d =
tingat kesukaran butir soal. Kemudian nilai abilitas (misal -3,00 sampai
dengan +3,00) ditransformasi ke dalam skala 0-10, 0-100, atau 0-4. Misal untuk
dapat ditransformasi ke dalam skala 0-100 diperlukan rata-rata 50 dan standar
deviasi 5, sehingga untuk membuat tabel konversi mempergunakan rumus Y=50+5X.
Y=nilai peserta didik dan X adalah nilai abilitas. Dengan rumus inilah konversi
terkalibrasi dapat disusun. Jadi dalam konversi yang terkalibrasi skalanya
didasarkan dua hal penting, yaitu
tingkat kesukaran dan tingkat kemampuan peserta didik. Soal ditempatkan pada
tingkat kesukaran dan kemampuan peserta didik yang telah disamakan skalanya.
Bila tes sudah disamakan skalanya, siapapun yang mengambil tes pada paket yang
mudah, sedang, dan sukar, masing-masing tes masih berada pada skala yang sama
dan bisa dibandingkan. Oleh karena itu, tes yang diberikan kepada peserta didik
sudah selayaknya harus sesuai dengan tingkat kemampuan peserta didik. Apabila
kemampuan peserta didik dalam memahami materi yang diajarkan guru itu tinggi
(sudah tercapai target kompetensinya), peluang menjawab benar soal pasti
tinggi. Namun sebaliknya bila kemampuan peserta didik dalam memahami materi
yang diajarkan guru itu rendah (belum tercapai target kompetensinya), peluang
menjawab benar soal pasti rendah. Apakah tesnya berbentuk tes lisan, tertulis
(soalnya berbentuk pilihan ganda, uraian, isian, dll.), atau perbuatan. Model
Rasch merupakan salahsatu model dalam teori respon butir yang menitikberatkan
pada parameter tingkat kesukaran butir soal. Model ini telah digunakan di
berbagai kalangan seperti untuk sertifikasi ujian kedokteran di USA, sejumlah
program penilaian sekolah di USA, program penilaian di Australia, studi
matematik dan science internasional ketiga, National School English Literacy
Survey di Australia, equating tes English di Provinsi Guandong Cina, dan
beberapa tes diagnostic. Model ini banyak digunakan orang sebagai pendekatan
analitik standard untuk kalibrasi instrumen karena modelnya sederhana, elegant, hemat, atau efektif dan
efisien.
Konversi nilai berdasarkan Model Rasch memiliki keunggulan bila
dibandingkan dengan konversi nilai berdasarkan model pengukuran secara klasik.
Keterbatasan model pengukuran secara klasik adalah seperti berikut. (1) Tingkat
kemampuan dalam teori klasik adalah “true score”. Jika tes sulit artinya tingkat
kemampuan peserta didik rendah. Jika tes mudah artinya tingkat kemampuan
peserta didik tinggi. (2) tingkat kesukaran soal didefinisikan sebagai proporsi
peserta didik dalam kelompok yang menjawab benar soal. Mudah/sulitnya butir
soal tergantung pada kemampuan peserta didik yang dites dan keberadaan tes yang
diberikan. (3) Daya pembeda, reliabilitas, dan validitas soal/tes didefinisikan
berdasarkan grup peserta didik. Artinya bahwa konversi nilai berdasarkan teori
tes klasik memiliki kelemahan, yaitu (1) tingkat kesukaran dan daya pembeda
tergantung pada sampel; (2) penggunaan metode dan teknik untuk desain dan
analisis tes dengan memperbandingkan kemampuan peserta didik pada pembagian
kelompok di atas, tengah, bawah. Meningkatnya validitas skor tes diperoleh dari
tingkat kesukaran tes dihubungkan dengan tingkat kemampuan setiap peserta
didik; (3) konsep reliabilitas tes didefinisikan dari istilah tes paralel; (4)
tidak ada dasar teori untuk menentukan bagaimana peserta didik memperoleh tes
yang sesuai dengan kemampuan peserta didik; (5) Standar kesalahan pengukuran
hanya berlaku untuk seluruh peserta didik. Disamping itu, tes klasik telah
gagal memberi kesimpulan yang tepat terhadap beberapa masalah testing seperti:
desain tes (statistik butir klasik tidak memberitahu penyusun tes tentang
lokasi maksimum daya pembeda butir pada skala skor tes), identifikasi item
bias, dan equating skor tes (tidak suksesnya pada item bias dan equating skor
tes karena sulit menentukan kemampuan yang sebenarnya di antara kelompok). Kelebihan model Rasch atau teori respon butir
secara umum adalah bahwa: (1) model ini
tidak berdasarkan grup dependen, (2) skor peserta didik dideskripsikan bukan
tes dependen, (3) model ini menekankan pada tingkat butir soal bukan tes, (4)
model ini tidak memerlukan paralel tes untuk menentukan reliabilitas tes, (5)
model ini merupakan suatu model yang memberikan suatu pengukuran ketepatan
untuk setiap skor tingkat kemampuan. Tujuan utama teori respon butir adalah
memberikan invariant pada statistik soal dan estimasi kemampuan. Oleh karena
itu, kelebihan teori respon butir adalah: (1) responden dapat diskor pada skala
yang sama, (2) skor responden dapat dibandingkan pada dua atau lebih bentuk tes
yang sama, (3) semua bentuk soal memperoleh perlakuan melalui cara yang sama,
(4) tes dapat disusun sesuai keahlian berdasarkan tingkat kemampuan yang akan
dites.
IX.
PROSEDUR PEMERIKSAAN LEMBAR JAWABAN,
PERHITUNGAN
NILAI AKHIR, DAN PENYETARAAN TES
A. Prosedur Pemeriksaan Lembar
Jawaban
Dalam melakukan pemeriksaan lembar jawaban peserta didik sangat ditentukan
pada bentuk soalnya. Untuk pemeriksaan bentuk pilihan ganda, pelaksanaannya
sangat mudah. Lembar jawaban peserta didik
dicocokkan pada lembar kunci jawaban yang sudah disiapkan. Bila jawaban
peserta didik sesuai dengan kunci
jawaban, maka jawabannya diberi skor 1, bila tidak sesuai diberi skor 0.
Setelah selesai menskor seluruh soal, maka baru dihitung berapa jumlah soal
yang benar dan berapa jumlah soal yang tidak benar. Jumlah skor benar itulah
yang merupakan skor perolehan (skor mentah) dari soal bentuk pilihan ganda yang
diperoleh warga belajar/peserta didik yang bersangkutan.
Untuk melakukan pemeriksaan soal-soal bentuk uraian termasuk tes perbuatan,
sangat diperlukan kesabaran dan ketelitian yang handal. Untuk memudahkan pelaksanaannya,
ada beberapa kaidah atau prosedur pemeriksaannya.
1. Gunakanlah
pedoman penskoran yang telah disiapkan sebagai acuan dalam memeriksa jawaban peserta
didik.
2. Bacalah
jawaban peserta didik kemudian bandingkan dengan jawaban ideal seperti yang ada
pada pedoman penskoran.
3. Berikan
skor sesuai dengan tingkat kelengkapan dan kesempurnaan jawaban peserta didik.
4. Periksalah
seluruh lembar jawaban peserta didik pada nomor yang sama, baru dilanjutkan ke
pemeriksaan nomor berikutnya. Hal ini perlu dilakukan guna menjaga konsistensi
dan objektivitas pemberian skor.
5. Hindari
faktor-faktor yang tidak sesuai/relevan dalam pemberian skor seperti bagus tidaknya
tulisan dan bersih tidak kertas jawaban, kecuali kalau memang kedua aspek itu
yang akan diukur, seperti mata pelajaran bahasa.
Setelah selesai memeriksa lembar jawaban peserta didik, langkah berikutnya
adalah memberikan skor pada lembar jawaban itu. Pemberian skor untuk bentuk
soal pilihan ganda sangat mudah dan telah dijelaskan diatas, sedangkan
pemberian skor untuk bentuk soal uraian sangat ditentukan oleh bobot
masing-masing soalnya. Bila setiap butir soal sudah selesai diskor, hitunglah jumlah skor perolehan peserta didik
pada setiap nomor butir soal. Kemudian lakukan perhitungan nilai dengan
menggunakan rumus seperti berikut ini.
Skor perolehan
peserta didik
Nilai Setiap
Soal = ¾¾¾¾¾¾¾¾¾¾¾¾¾ X bobot
Skor
maksimum butir soal ybs
|
Contoh
Soal Uraian
|
Bobot Soal
|
Skor Maksimum
|
Skor perolehan
Raufan
|
Perhitungannya
|
1
2
3
4
5
|
20
10
30
10
30
|
8
5
10
5
10
|
7
4
9
5
7
|
(7:8) x 20 = 17,50
(4:5) x 10 = 8,00
(9:10) x 30 = 27,00
(5:5) x 10 = 10,00
(7:10) x 30 = 21,00
|
Nilai soal uraian
Raufan adalah = 83,50
Untuk memudahkan dalam pelaksanaan penskoran, maka setiap butir soal uraian
dibuatkan perhitungan skornya yang dihitung dari skor maksimumnya.
Contohnya seperti berikut ini.
a. Skor
soal nomor 1 ( contoh: 1:8 x 20 = 2,5; 2:8x20=5; dst. Penjelasan : 8=skor
maksimum soal nomor 1;20=bobot soal nomor 1)
Skor Perolehan
|
Nilai
|
|
Skor Perolehan
|
Nilai
|
|
Skor Perolehan
|
Nilai
|
1
2
|
2,5
5
|
|
4
5
|
10
12,5
|
|
7
8
|
17,5
20
|
3
|
7,5
|
|
6
|
15
|
|
|
|
b. Skor
soal nomor 2 ( Skor maksimum 5; bobot soal 10 )
Skor Perolehan
|
Nilai
|
|
Skor Perolehan
|
Nilai
|
1
2
3
|
2
4
6
|
|
4
5
|
8
10
|
|
|
|
c. Skor Soal No 3 (skor maximum 10, bobot soal 30)
Skor Perolehan
|
Nilai
|
|
Skor Perolehan
|
Nilai
|
|
Skor Perolehan
|
Nilai
|
1
2
3
4
|
3
6
9
12
|
|
6
7
8
9
|
18
21
24
27
|
|
10
|
30
|
|
|
|
|
||||
|
|
|
|
d. Skor
soal no. 4 (Skor Maksimum 5, bobot soal
10)
Skor Perolehan
|
Nilai
|
|
Skor Perolehan
|
Nilai
|
1
2
3
|
2
4
6
|
|
4
5
|
8
10
|
|
|
|
e. Skor
soal no. 5 ( Skor Maksimum 10, bobot soal 30 )
Skor Perolehan
|
Nilai
|
|
Skor Perolehan
|
Nilai
|
|
Skor Perolehan
|
Nilai
|
1
2
3
4
|
3
6
9
12
|
|
6
7
8
9
|
18
21
24
27
|
|
10
|
30
|
|
|
|
|
||||
|
|
|
|
Berdasarkan
perhitungan skor yang telah dibuat, penilaian ke lima butir soal di atas dapat doskor secara
mudah pada setiap peserta didik. Contoh seperti berikut ini
No
|
Nama peserta didik
|
Nomor Soal
|
Nilai
(Jumlah N)
|
|||||||||
1
|
2
|
3
|
4
|
5
|
||||||||
SP
|
N
|
SP
|
N
|
SP
|
N
|
SP
|
N
|
SP
|
N
|
|||
1
2
3
4
5
|
Raufan
dst
|
7
|
7,5
|
4
|
8
|
9
|
27
|
5
|
10
|
7
|
21
|
83,50
|
Keterangan :
SP = Skor Perolehan. N = Nilai
B. Perhitungan
Nilai Akhir
Setiap jenis tes (tertulis, perbuatan, sikap) dalam perhitungan nilai akhir hendaknya berdiri sendiri, jangan
digabung karena setiap jenis tes memiliki karakteristik sendiri-sendiri. Berikut ini diberikan contoh perhitungan nilai akhir untuk tes tertulis.
Contoh Perhitungan Nilai Akhir
1. Tes Tertulis
Bentuk
Soal
|
Jumlah
Soal
|
Bobot
|
Nomor Soal
|
Skor Maksimum
|
Skor
Fauria
|
Perhitungan
|
PG
Isian
|
35
10
|
70 %
|
1-35
1-10
Jumlah=
|
35
10
45
|
30
8
38
|
38:45x10=8,44
|
Uraian
|
5
|
30 %
|
1
2
3
4
5
Jumlah=
|
3
4
9
6
6
28
|
3
2
8
4
5
22
|
22:28x10=7,86
|
Nilai Fauria untuk PG, Isian dan Uraian = ( 70 % x 8,44 ) + ( 30 % x 7,86 )
=
5,91 + 2,36
=
8,27
2. Nilai Tes Praktik
Misal pada tes praktik dengan skor maksimum 23, Fauria dapat menjawab 20
perintah dengan benar. Skor yang diperoleh Fauria adalah 20 . Nilai tes
praktiknya = 20 : 23 x 10= 8,70
X.
PENGEMBANGAN BANK SOAL
A. Pengertian
Bank soal bukan hanya bank pertanyaan, pool soal, kumpulan soal, gudang
soal, atau perpustakaan soal (Millman and Arter, 1984: 315); melainkan bank
yang butir-butir soal terkalibrasi (Wright and Bell, 1984: 331) dan disusun
secara sistematis agar memudahkan penggunaan kembali dan manfaat soalnya. Untuk
itu butir-butir soal di dalam bank soal harus tersedia untuk setiap standar
kompetensi dan kompetensi dasar pada setiap mata pelajaran, tingkat kesukaran
butir soal, dan jenjang pendidikan. Hal ini sangat diperlukan untuk
memiliki suatu tujuan yang jelas sebagai panduan dan pengembangan bank soal.
B. Tujuan Pengembangan
Bank Soal
Secara
implisit, tujuan pengembangan bank soal juga diperlukan untuk penilaian mutu
bank soal itu sendiri. Apakah bank soal dapat berisi butir-butir soal yang
sesuai dengan tujuan yang terkandung di dalamnya atau tidak, karena bank soal
sangat berguna bagi guru, psychometrik, kurikulum, dan peserta didik (Wright
and Bell, 1984: 333-335). Oleh karena itu, tujuan utama bank soal adalah untuk
merakit/mengonstruksi tes dan pengadaan kesesuaian ujian baik untuk tujuan
penilaian ulangan harian maupun untuk tujuan penilaian pada ulangan akhir
semester, sehingga soalnya terjamin (Hambleton and Swaminathan, 1985: 255-256).
C. Prosedur Pengembangan
Bank Soal
Butir-butir
soal yang akan disimpan di dalam bank soal harus diproses melalui prosedur
pengembangan bank soal. Prosedur pengembangan butir soal yang digunakan di dalam
pengembangan bank soal adalah :
(1)
Penyusunan kisi-kisi, (2) Penulisan butir soal, (3) Revisi/validasi butir, (4)
Perakitan tes, (5) Uji coba tes, (6) Memasukkan data, (7) Analisis butir soal
secara klasik dan IRT, (8) Menyeleksi butir untuk bank soal yang terkalibrasi.
Setiap
butir soal dimasukkan berdasarkan : tingkat sekolah, tipe sekolah, jurusan,
standar kompetensi dan kompetensi dasar, tujuan pembelajaran, perilaku yang
diukur/taxonomi, format soal, tingkat kesulitan butir soal, tingkat kemampuan
peserta didik, semester, statistik, tahun.
Dalam mengolah butir-butir soal dalam bank soal diperlukan perangkat lunak
yang tepat. Secara singkat, perangkat lunak yang digunakan memiliki tiga
kelebihan, yaitu : (1) Kemudahan pada penyimpanan dan pencarian kembali, (2) Kesanggupan
untuk memunculkan kembali grafik butir-butir secara tepat, (3) Kelengkapan
susunan data butir soal.
Gagasan lain yang perlu dipertimbangkan pada setiap sekolah adalah adanya
konsep bank tes. Gunanya adalah untuk menyusun beberapa paket paralel tes kecil
berdasarkan unit-unit pembelajaran, seperti ulangan harian, ulangan bersama
setiap selesai mengerjakan kompetensi minimal pada beberapa standar
kompetensi/kompetensi dasar, ulangan tengah semester, atau ulangan akhir
semester.
Para guru dapat memilih tes itu untuk penilaian kelas. Hal ini tidak hanya
dapat menghemat waktu bagi guru, model tes seperti ini dapat diharapkan
memiliki mutu yang lebih baik. Karena kurikulum di Indonesia adalah standar,
maka model seperti ini sangat tepat.
Proses pengembangan bank soal dapat dilihat pada Gambar 1 berikut ini.
Gambar 1 : Pengembangan Bank Soal (Wright
and Bell, 1984: 336)
DAFTAR PUSTAKA
Aiken, Lewis R. (1994). Psychological Testing and Assessment,(Eight
Edition), Boston:
Allyn and Bacon.
Anastasi. Anne and Urbina, Susana. (1997). Psicoholological Testing. (Seventh
Edition). New Jersey:
Prentice-Hall, Inc.
Assessment Systems Corporation. (1984). User's Manual for the MicroCat
Testing System, USA.
Atkinson, John W.
(1978). Personality Motivation and Achievement. Sashington. Hemisphere Publishing
Corporation.
Bejar, Isaac I. (1983). Introduction to Item Response Theory and
Their- Assumptions. Hambleton, Ronald K. (Editor).
Applications of Item Response Theory. Canada:
Educational Research Institute of British
Columbia.
Bruning, James L. and Kintz, B. L. (1987). Computational
Handbook of Statistics. Third Edition. Illinois: Scott, Foresman and Company.
Cohen, Louis. (1976). Educational
Research in Classrooms and Schools: A Manual of Materials and Methods. London: Harper & Row
Publishers.
Cohen, Ronald Jay; Swerdlik, Mark E. and Smith, Douglas K. (1992).
Psychological
Testing and Assessment: An Introduction to Test and Measurement, second edition. California: Mayfield Publishing Company.
Crites, John O. (1969). Vocational Psychology. New York: McGraw Hill
Book Company
Crocker, L. & Algina, J. (1986). Introduction to Classical and
Modern Test, Theory. New York:
Holt, Rinehart and Winston, Inc.
Crow, Lester D. and Crow, Allice. (1984). Educattional Psychology. New York: American Book
Company.
Czikszentmihaly, Mihaly. (1996). Creativity: Flaw and The
Psychology of Discovery and Invention. New York: Harper Collins Publisher.
David and Steinberg, Lynne. (1997). A Response Model for
Multiple-Choice Items dalam
Wim J. van der Linden and Ronald K. Hambleton (Editor). Handbook of Modern Item
Response Theory. New York:
Springer-Verlag.
Devito, Affred. (1990). Creative Wellstrings for Science Teaching.
(Second Edition). USA.
Ebel, Robert L. and Frisbie, David A. (1991). Essentials of Education
Measurement. New Jersey:
Prentice Hall.
Gable. Robert K. (I986). Instrument Development in the Affective
Domain Boston:
Kluwer-Nijhoff Publishing.
Glass, Gene V. and Stanley, Julian C. (1970). Statistical
Methods in Education and Psychology. New Jersey: Prentice Hall, Inc.
Good, Thomas L. and Brophy, Jere E. (1990) Educational Psychology. New York: Longman.
Gonczi, Andrew (Editor). (1992). Developing a Competent Workforce.
Adelaide: National
Centre of Vocational Education Research Ltd.
Hair, J. F.; Anderson, R. E., Tatham, R. L., and Black, W. C.
(1998). Multivariate Data, Analysis. New
Jersey. Prentice-I-lall International, Inc.
Haladyna, Thomas M. (1994). Developing
and Validating Multiple-choice Test Items. New Jersey:
Lawrence
Erlbaum Associates, Publisher.
Hambleton, Ronald K. and Swaminathan, Hariharan. (1985). Item
Response Theory, Principles, and Aplications. Boston:
Kluwer. Nijhoff Publishing.
Hambleton, R.K. ; Swaminathan, H. ; and Rogers, H.J. (1991). Fundamentals
of Item Response Theory. Newbury
Park: Sage Publications.
Hambleton, Ronald K (1993). Principles and Selected
Applications of Item Response Theory. In Linn, Robert L. (Editor). Educational
Measurement. Third Edition. Phoenix: American Council on Education,
Series on Higher Education Oryx Press.
Harman, Harry H. (1970). Modern Factor Analysis
(Third Edition Revised). Chicago: The University of Chicago Press.
Holland. PW & Thaycr. DT (1988). Test Validity. New Jersey: Lawrence
Erlbaum Associates, Publishers.
Izard, John. (1995). Trial Testing and Item Analysis
(Module (A). Australia:
Australian Council Ibr Pdtrcallonal Research, UNESCO.
Joreskog,
Karl and Sorboni, Dag. (1996). PRELIS2: User’s Reference Guide. Chicago: Scientific
Software Internasional, Inc.
Kerlinger,
Fred N (1993). Asas-asas Penelitian Behavioral (Edisi Ketiga), diterjemahkan
Simatupang L. R. Yogyakarta: Gadjah Mada University Press.
Lewy, Arieh (Editor). (1977). International Institute for Educational
Planning: Handbook of Curriculum Evaluation. Paris: UNESCO.
Linn, Robert L. and Gronlund, Norman E. (1995). Measurement
and Assessment in Teaching. (Seventh Edition). Ohio: Prentice-Hall, Inc.
Lord, F.M. (1952). A Theory of Test Scores. USA:
Educational Testing Service.
McDonald,
Roderich P. (1999). Test Theory: A Unified Treatment. New Jersey: Larvrence Erbaum Associates,
Publishers.
Messick, Samuel. (1993). “Validity”, Educational Measurement, Third Edition, ed. Robert L. Linn. New York: American
Council on Education and Macmillan Publishing Company, A Division of Macmillan,
Inc.
Millman, Jason and Arter, Judith A. Issues in Item Banking. In Journal
of Educational Measurement, Volume 21, No. 4, Winter 1984, p. 315.
Millman,
Jason and Greene, Jennifer. (1993).The Spesification and Development of Tests
of Achiievement and Ability in Robert L. Lin (Editor). Educational Measurement,
Third Edition. Phoenix:
American Council on Education, Series on Higher Education Oryx Press.
Mueller, Daniel J. (1986). Measuring
Social Attitudes: A Handbook for Researchers and Practitioners. New York. Teacher College,
Columbia University
Nitko,
Anthony J. (1996). Educational Assessment of Students, Second Edition. Ohio: Merrill an imprint
of Prentice Hall Englewood Cliffs.
Norusis, Marija J. (1993). SPSS for Windows Base System
user's Guide, Release 6.0. Chicago:
Marketing Departernent SPSS Inc.
Nunally,
Jum C. (1978). Psychometric Theory, Second Edition. New Delhi: Tata McGrawHill Publishing
Company Limited.
Oosterhof, Alberth C (1990). Classroom Applications of Educational
Measurement. Ohio Merril
Publishing Company.
Paplia, Diana E. and Olds, Sally-Wendkos. (1985). Psychology. New York Mc.Graw Hill.
Pedhazur,
Elazar J. and Schmekin, Liora Pedhazur. (1991). Measurement, Design, and
Analysis: An Integrated Approach. New Jersey: Lowrence Erlbaum Associates,
Publishers.
Petersen, Nancy S, Kolen, Michael J; and
Hoover H.D( 1993). Scaling, Norming, and Equating. In Educational Measurement ( Third Edition ). Editor Robert L Linn Phoenix: American Council
on Education, Seriess on Higher Education Oryx Press
Petri,
Herbert L. (1981). Motivation Theory and Research. Belmont, California:
Wadsworth, Inc.
Popham, W.James. (1995). Classroom Assesment: What Teachers Need to
Know. Boston:
Allyn and Bacon
Pusat Kurikulum, Balitbang Depdiknas (2002). Kurikulum Berbasis Kompetensi:
Penilaian Berbasis Kelas, Jakarta.
Pusat Penelitian dan Pengembangan Sistem
Pengujian, Balitbang Dikbud
( 1993/1994). Bahan Penataran Pengujian Pendidikan. Jakarta
Pusat Pengembangan dan Pengembangan Bahasa
(1990). Kamus Besar Bahasa Indonesia. Jakarta. Balai Pustaka.
_______________________________ (2003). Penilaian Tingkat Kelas : Pedoman
Bagi Guru SD/MI,SMP/MTs,SMA/MA, dan SMK,Jakarta
Raths,L.E et all(1996). Value
and Teaching: Working with Value in Classroom Columbus:
Charles E. Merill Publishing, Co
Safari.
(2000). Kaidah Bahasa Indonesia dalam Penulisan Soal.
Jakarta: PT
Kartanegara.
Safari. (1995). Pengujian dan Penilaian Bahasa dan Sastra Indonesia, Jakarta: PT. Kartanegara.
Shavelson,
Richard J. (1988). Statistical Reasoning for The Behavioral Sciences. (Second
Edition). Boston:
Allyn and Bacon, Inc.This'en,
Skaggs. G and Lissitz,R.W.(1986). IRT Tes Equating: Relevant issues
and a Review of Recent Research . Review of Educational Research, 56(4),495-529
Skinner, Charles E (1988). Educational Psychology. New Delhi: Prentice Hall
Stufflebean, Daniel L et al (1971). Educational Evaluation and
Decision Making. Illinois F.E. Peacock Publishersm Inc.
Thorndike, Robert M. (1997). Measurement and Evaluation in
Pschology and Education, Sixth Edition. Ohio: Merrill, an imprint of Prentice Hall.
Tinkelman, S.N. (1971). Planning the Objective Test. Educational
Measurement (Second Ed). Washington
D.C: American Council on Education.
Torrance, Paul
(1974). Torrance Test of Creativity Thinking. Bensenville, Scholastic Testing Service, Inc.
Wright, Benjamin D. and Bell,
Susan R. Item Banks : What, Why, How. In Journal of Educational Measurement,
Volume 21, No. 4, Winter 1984; p.331
Wright, Benjamin D. and Stone, Mark H (1979). Best Test Design. Chicago
: MESA Press.
Wright, Benjamin D. and Linacre, John M. (1992). A
User's Guide to BIGSTEPS: Rasch Model Computer Program, Version 2.2. Chicago: MESA
Press. Wright, B.D. and Stone,
Yelon, Stephen L. and Weinstein, Grace W . (1977). A
Teacher’s World; Psychology in The Classroom. Tokyo: Mc-Graw-Hill International Book
Company.