Balok

Volume Balok.

Kubus

Volume Kubus.

Tabung

Volume Tabung.

Kamis, 05 Februari 2015

Kegiatan Tengah Semester

Kegiatan Tengah Semester SMP Negeri 3 Kalikajar Kab. Wonosobo
SPENTIKA di Lapangan Desa Lamuk Kec. Kalikajar Wonosobo 

Soal Matematika

Berapakah sudut terkecil yang dibentuk antara kedua jarum jam pada pukul 04.35 ?

 

Rabu, 04 Februari 2015

Penulisan Butir Soal



I.   PENDAHULUAN


A.           Latar Belakang

Peraturan Menteri Pendidikan Nasional (Permendiknas) Nomor 14 tahun 2005 tentang Organisasi dan Tata Kerja Direktorat Jenderal Manajemen Pendidikan Dasar dan Menengah Departemen Pendidikan Nasional menyebutkan bahwa salah satu tugas Direktorat Pembinaan SMA - Subdirektorat Pembelajaran adalah melakukan penyiapan bahan kebijakan, standar, kriteria, dan pedoman serta pemberian bimbingan teknis, supervisi, dan evaluasi pelaksanaan kurikulum. Lebih lanjut dijelaskan dalam Permendiknas Nomor 25 tahun 2006 tentang Rincian Tugas Unit Kerja di Lingkungan Direktorat Jenderal Manajemen Pendidikan Dasar dan Menengah bahwa rincian tugas Subdirektorat Pembelajaran – Direktorat Pembinaan Sekolah Menengah Atas antara lain melaksanakan penyiapan bahan penyusunan pedoman dan prosedur pelaksanaan pembelajaran, termasuk penyusunan pedoman pelaksanaan kurikulum.

Ditetapkannya Undang-Undang Nomor 20 tahun 2003 tentang Sistem Pendidikan Nasional dan Peraturan Pemerintah Nomor 19 tahun 2005 tentang Standar Nasional Pendidikan membawa implikasi terhadap sistem dan penyelenggaraan pendidikan termasuk pengembangan dan pelaksanaan kurikulum. Kebijakan pemerintah tersebut mengamanatkan kepada setiap satuan pendidikan dasar dan menengah untuk mengembangkan Kurikulum Tingkat Satuan Pendidikan (KTSP) yang mengacu pada Standar Nasional Pendidikan.

Pada kenyataannya dalam melaksanakan KTSP termasuk sistem penilaiannya, banyak pendidik yang masih mengalami kesulitan untuk menyusun tes dan mengembangkan butir soal yang valid dan reliabel. Oleh karena itu, Direktorat Pembinaan SMA membuat berbagai panduan pelaksanaan KTSP yang salah satu di antaranya adalah panduan penyusunan butir soal.      
    

B.           Tujuan

Tujuan penyusunan panduan ini adalah untuk meningkatkan kemampuan profesional guru khususnya dalam penulisan butir soal.  Setelah mempelajari panduan ini diharapkan para guru dapat menyusun kisi-kisi dengan benar dan mengemabngkan butir soal yang valid dan reliabel.


C.           Ruang Lingkup

Ruang lingkup yang dibahas dalam panduan ini meliputi penilaian berbasis kompetensi, teknik, alat penilaian dan prosedur pengembangan tes, penyusunan kisi-kisi, dan penyusunan butir soal.

II. PENILAIAN BERBASIS KOMPETENSI


A.  Pengertian

Penilaian berbasis kompetensi merupakan teknik evaluasi yang harus dilakukan guru dalam pembelajaran di sekolah. Teknik dan pelaksanaannya diatur di dalam:
·         Undang-­Undang Republik Indonesia No. 20 Tahun 2003 tentang Sistem Pendidikan Nasional
·         Peraturan Pemerintah No. 19 Tahun 2005 tentang Standar Nasional Pendidikan
·         Peraturan Menteri Pendidikan Nasional No. 22 Tahun 2006 tentang Standar Isi
·         Peraturan Menteri Pendidikan Nasional No. 23 tahun 2006 tentang Standar Kompetensi Lulusan
·         Peraturan Menteri Pendidikan Nasional No. 20 tahun 2007 tentang Standar Penilaian Pendidikan

Standar Kompetensi dan Kompetensi Dasar di dalam Standar Isi menjadi fokus perhatian utama dalam penilaian.


B.  Bentuk dan Proses Penilaian

Untuk mengetahui tingkat pencapaian kompetensi, guru dapat melakukan penilaian melalui tes dan non tes. Tes meliputi tes lisan, tertulis (bentuk uraian, pilihan ganda, jawaban singkat, isian, menjodohkan, benar-salah), dan tes perbuatan yang meliputi: kinerja (performance), penugasan (projek) dan hasil karya (produk). Penilaian non-tes contohnya seperti penilaian sikap,  minat, motivasi, penilaian diri, portfolio, life skill. Tes perbuatan dan penilaian non tes dilakukan melalui  pengamatan (observasi).

Langkah-langkah pengembangan tes meliputi (1) menentukan tujuan penilaian, (2) menentukan kompetensi yang diujikan (3) menentukan materi penting pendukung kompetensi (urgensi, kontinuitas, relevansi, keterpakaian), (4) menentukan jenis tes yang tepat (tertulis, lisan, perbuatan), (5) menyusun kisi-kisi, butir soal, dan pedoman penskoran, (6) melakukan telaah butir soal. Penilaian non tes dilakukan melalui pengamatan dengan langkah-langkah (1) menentukan tujuan penilaian, (2) menentukan kompetensi yang diujikan, (3) menentukan aspek yang diukur, (4) menyusun tabel pengamatan dan pedoman penskorannya, (5) melakukan penelaahan.


C.  Kriteria Bahan Ulangan/Ujian

     Bahan ulangan/ujian yang akan digunakan hendaknya menenuhi dua kriteria dasar berikut ini.

1.  adanya kesesuaian materi yang diujikan dan target kompetensi yang harus dicapai melalui materi yang diajarkan. Hal ini dapat memberikan informasi tentang siapa atau peserta didik mana yang telah mencapai tingkatan pengetahuan tertentu yang disyaratkan sesuai dengan target kompetensi dalam silabus/kurikulum dan dapat memberikan informasi mengenai apa dan seberapa banyak materi yang telah dipelajari peserta didik. Berdasarkan ilmu pengukuran pendidikan, ujian yang bahannya tidak sesuai dengan target kompetensi yang harus dicapai bukan saja kurang memberikan informasi tentang hasil belajar seorang peserta didik, melainkan juga tidak menghasilkan umpan balik bagi penyempurnaan proses belajar-mengajar.

2. bahan ulangan/ujian hendaknya menghasilkan informasi atau data yang dapat dijadikan landasan bagi pengembangan standar sekolah, standar wilayah, atau standar nasional melalui penilaian hasil proses belajar-mengajar.


D.  Soal yang Bermutu

Bahan ujian atau soal yang bermutu dapat membantu pendidik  meningkatkan pembelajaran dan memberikan informasi dengan tepat tentang peserta didik mana yang belum atau sudah mencapai kompetensi. Salah satu ciri soal yang bermutu adalah bahwa soal itu dapat membedakan setiap kemampuan peserta didik. Semakin tinggi kemampuan peserta didik dalam memahami materi pembelajaran, semakin tinggi pula peluang menjawab benar soal atau mencapai kompetensi yang ditetapkan. Makin rendah kemampuan peserta didik dalam memahami materi pembelajaran, makin kecil pula peluang menjawab benar soal untuk mengukur pencapaian kompetensi yang ditetapkan.

Syarat soal yang bermutu adalah bahwa soal harus sahih (valid), dan handal. Sahih maksudnya bahwa setiap alat ukur hanya mengukur satu dimensi/aspek saja. Mistar hanya mengukur panjang, timbangan hanya mengukur berat, bahan ujian atau soal PKn hanya mengukur materi pembelajaran PKn bukan mengukur keterampilan/kemampuan materi yang lain. Handal maksudnya bahwa setiap alat ukur harus dapat memberikan hasil pengukuran yang tepat, cermat, dan ajeg. Untuk dapat menghasilkan soal yang sahih dan handal, penulis soal harus merumuskan kisi-kisi dan menulis soal berdasarkan kaidah penulisan soal yang baik (kaidah penulisan soal bentuk objektif/pilihan ganda, uraian, atau praktik).

Linn dan Gronlund (1995: 47) menyatakan bahwa tes yang baik harus memenuhi tiga karakteristik, yaitu: validitas, reliabilitas, dan usabilitas. Validitas artinya ketepatan interpretasi hasil prosedur pengukuran, reliabilitas artinya konsistensi hasil pengukuran, dan usabilitas artinya praktis prosedurnya. Di samping itu, Cohen dkk. (1992: 28) juga menyatakan bahwa tes yang baik adalah tes yang valid artinya mengukur apa yang hendak diukur. Nitko (1996 : 36) menyatakan bahwa validitas berhubungan dengan interpretasi atau makna dan penggunaan hasil pengukuran peserta didik. Messick (1993: 13) menjelaskan bahwa validitas tes merupakan suatu integrasi pertimbangan evaluatif derajat keterangan empiris yang mendasarkan pemikiran teoritis yang mendukung ketepatan dan kesimpulan berdasarkan pada skor tes. Adapun validitas dalam model Rasch adalah sesuai atau fit dengan model (Hambleton dan Swaminathan, 1985: 73).

Messick (1993: 16) menyatakan bahwa validitas secara tradisional terdiri dari: (1) validitas isi, yaitu ketepatan materi yang diukur dalam tes; (2) validitas criterion-related, yaitu membandingkan tes dengan satu atau lebih variabel atau kriteria, (3) valitidas prediktif, yaitu ketepatan hasil pengukuran dengan alat lain yang dilakukan kemudian; (4) validitas serentak (concurrent), yaitu ketepatan hasil pengukuran dengan dua alat ukur lainnya yang dilakukan secara serentak; (5) validitas konstruk, yaitu ketepatan konstruksi teoretis yang mendasari disusunnya tes. Linn dan Gronlund (1995 : 50) menyatakan hahwa valilitas terdiri dari: (1) konten. (2) test-criterion relationship, (3) konstruk, dan (4) consequences, yaitu ketepatan penggunaan hasil pengukuran. Sedangkan menurut Oosterhof (190 : 23) yang mengutip berdasarkan "Standards for Educational and Psychological Testing, 1985" yang didukung oleh Ebel dan Frisbie (1991 : 102-109), serta Popham (1995 : 43) bahwa tipe validitas adalah validitas: (1) content, (2) criterion, dan (3) construction.

Di samping validitas, informasi tentang reliabilitas tes sangat diperlukan. Nitko (1999 : 62) dan Popham (1995 : 21) menyatakan bahwa reliabilitas berhubungan dengan konsistensi hasil pengukuran. Pernyataan ini didukung oleh Cohen dkk, yaitu bahwa reliabilitas merupakan persamaan dependabilitas atau konsistensi (Cohen dkk : 192 : 132) karena tes yang memiliki konsistensi/reliabilitas tinggi, maka tesnya adalah akurat, reproducible; dan gereralizable terhadap kesempatan testing dan instrumen tes yang sama. (Ebel dan Frisbie (1991 : 76). Faktor yang mempengaruhi reliabilitas yang berhubungan dengan tes adalah: (1) banyak butir, (2) homogenitas materi tes, (3) homogenitas karakteristik butir, dan (4) variabilitas skor. Reliabilitas yang berhubungan dengan peserta didik dipengaruhi oleh faktor: (1) heterogenitas kelompok, (2) pengalaman peserta didik mengikuti tes, dan (3) motivasi peserta didik. Sedangkan faktor yang mempengaruhi reliabilitas yang berhubungan dengan administrasi adalah batas waktu dan kesempatan menyontek (Ebel dan Frisbie, 1991: 88-93).

Linn dan Gronlund menyatakan bahwa metode estimasi dapat dilakukan dengan mempergunakan: (1) metode test-retest, yaitu diberikan tes yang sama dua kali pada kelompok yang sama dengan interval waktu; tujuannya adalah pengukuran stabilitas; (2) metode equivalent form, yaitu diberikan dua tes paralel pada kelompok yang sama dan waktu yang sama; tujuannya adalah pengukuran menjadi ekuivalen; (3) metode test-retest dengan equivalen form, yaitu diberikan dua tes paralel pada kelompok yang sama dengan interval waktu; tujuannya adalah pengukuran stabilitas dan ekuivalensi; (4) metode split-half, yaitu diberikan tes sekali, kemudian skor pada butir yang ganjil dan genap dkorelasikan dengan menggunakan rumus Spearman-Brown; tujuannya adalah pengukuran konsistensi internal; (5) metode Kuder-Richardson dan koefisien Alfa, yaitu diberikan tes sekali kemudian skor total tes dihitung dengan rumus Kuder-Richardson, tujuannya adalah pengukuran konsistensi internal; (6) metode inter-rater, yaitu diberikan satu set jawaban peserta didik untuk diskor/judgement oleh 2 atau lebih rater; tujuannya adalah pengukuran konsistensi rating. Menurut Popham (1995: 22), reliabilitas terdiri dari 3 jenis yaitu: (1) stabilitas, yaitu konsistensi hasil di antara kesempatan testing yang berbeda, (2) format bergantian (alternate form), yaitu konsistensi hasil di antara dua atau lebih tes yang berbeda, (3) internal konsistensi, yaitu konsistensi melalui suatu pengukuran fungsi butir instrumen.

Reliabilitas skor tes dalam teori respon butir adalah penggunaan fungsi informasi tes. Menurut Hambleton dan Swaminathan (1985: 236), pengukuran fungsi informasi tes lebih akurat bila dibandingkan dengan penggunaan reliabilitas karena: (1) bentuknya tergantung hanya pada butir-butir dalam tes, (2) mempunyai estimasi kesalahan pengukuran pada setiap level abilitas. Pernyataan ini didukung oleh Gustafson (1981 : 41), yaitu bahwa konsep reliabilitas dalam model Rasch memerankan bagian subordinate sebab model pengukuran ini diorientasikan pada estimasi kemampuan individu.

Untuk meningkatkan validitas dan reliabilitas tes perlu dilakukan analisis butir soal. Kegunaan analisis butir soal di antaranya adalah: (1) dapat membantu para pengguna tes dalam evaluasi atas tes yang diterbitkan, (2) sangat relevan bagi penyusunan tes informal dan lokal seperti kuis, ulangan yang disiapkan guru untuk peserta didik di kelas, (3) mendukung penulisan butir soal yang efektif, (4) secara materi dapat memperbaiki tes di kelas, (5) meningkatkan validitas soal dan reliabilitas (Anastasi dan Urbina, 1997: 172).




















III. TEKNIK PENILAIAN DAN PROSEDUR PENGEMBANGAN TES


A. Teknik Penilaian

Ada beberapa teknik dan alat penilaian yang dapat digunakan pendidik sebagai sarana untuk memperoleh informasi tentang keadaan belajar peserta didik. Penggunaan berbagai teknik dan alat itu harus disesuaikan dengan tujuan penilaian, waktu yang tersedia, sifat tugas yang dilakukan peserta didik, dan banyaknya/jumlah materi pembelajaran yang sudah disampaikan.

     Teknik penilaian adalah metode atau cara penilaian yang dapat digunakan guru untuk rnendapatkan informasi. Teknik penilaian yang memungkinkan dan dapat dengan mudah digunakan oleh guru, misalnya: (1) tes (tertulis, lisan, perbuatan), (2) observasi atau pengamatan, (3) wawancara.

1.   Teknik penilaian melalui tes

a.  Tes tertulis
Tes tertulis adalah tes yang soal-soalnya harus dijawab peserta didik dengan memberikan jawaban tertulis. Jenis tes tertulis secara umum dapat dikelompokkan menjadi dua yaitu:
1)   tes objektif, misalnya bentuk pilihan panda, jawaban singkat atau isian, benar ­salah, dan bentuk menjodohkan;
2)   tes uraian, yang terbagi atas tes uraian objektif (penskorannya dapat dilakukan secara objektif) dan tes uraian non-objektif (penskorannya sulit dilakukan secara objektif).

b.  Tes lisan
Tes lisan yakni tes yang pelaksanaannya dilakukan dengan mengadakan tanya jawab secara langsung antara pendidik dan peserta didik. Tes ini memiliki kelebihan dan kelemahan. Kelebihannya adalah: (1) dapat menilai kemampuan dan tingkat pengetahuan yang dimiliki peserta didik, sikap, serta kepribadiannya karena dilakukan secara berhadapan langsung; (2) bagi peserta didik yang kemampuan berpikirnya relatif lambat sehingga sering mengalami kesukaran dalam memahami pernyataan soal, tes bentuk ini dapat menolong sebab peserta didik dapat menanyakan langsung kejelasan pertanyaan yang dimaksud; (3) hasil tes dapat langsung diketahui peserta didik. Kelemahannya adalah (1) subjektivitas pendidik sering mencemari hasil tes, (2) waktu pelaksanaan yang diperlukan relatif cukup lama.

c.  Tes perbuatan
Tes perbuatan yakni tes yang penugasannya disampaikan dalam bentuk lisan atau tertulis dan pelaksanaan tugasnya dinyatakan dengan perbuatan atau unjuk kerja. Penilaian tes perbuatan dilakukan sejak peserta didik melakukan persiapan, melaksanakan tugas, sampai dengan hasil yang dicapainya. Untuk menilai tes perbuatan pada umumnya diperlukan sebuah format pengamatan, yang bentuknya dibuat sedemikian rupa agar pendidik dapat menuliskan angka-angka yang diperolehnya pada tempat yang sudah disediakan. Bentuk formatnya dapat disesuaikan menurut keperluan. Untuk tes perbuatan yang sifatnya individual, sebaiknya menggunakan format pengamatan individual. Untuk tes perbuatan yang dilaksanakan secara kelompok digunakan format tertentu yang sudah disesuaikan untuk keperluan pengamatan kelompok.

2.   Teknik penilaian melalui observasi atau pengamatan

Observasi adalah suatu kegiatan yang dilakukan pendidik untuk mendapatkan informasi tentang peserta didik dengan cara mengamati tingkah laku dan kemampuannya selama kegiatan observasi berlangsung. Observasi dapat ditujukan kepada peserta didik secara perorangan atau kelompok. Dalam kegiatan observasi perlu disiapkan format pengamatan. Format pengamatan dapat berisi: (1) perilaku-perilaku atau kemampuan yang akan dinilai, (2) batas waktu pengamatan.

3.   Teknik penilaian melalui wawancara

Teknik wawancara pada satu segi mempunyai kesamaan arti dengan tes lisan yang telah diuraikan di atas. Teknik wawancara ini diperlukan pendidik untuk tujuan mengungkapkan atau menanyakan lebih lanjut  hal-hal yang kurang jelas informasinya. Teknik wawancara ini dapat pula digunakan sebagai alat untuk menelusuri kesukaran yang dialami peserta didik tanpa ada maksud untuk menilai.

Setiap teknik penilaian harus dibuatkan instrumen penilaian yang sesuai. Tabel berikut menyajikan teknik penilaian dan bentuk instrumen.
Tabel 1. Teknik Penilaian dan Bentuk Instrumen
Teknik Penilaian
Bentuk Instrumen
Tes tertulis

Tes pilihan: pilihan ganda, benar-salah, menjodohkan dll.
• Tes isian: isian singkat dan uraian

Tes lisan

Daftar pertanyaan

Tes praktik (tes kinerja)

Tes identifikasi
Tes simulasi
Tes uji petik kinerja

Penugasan individual atau kelompok

Pekerjaan rumah
• Projek

Penilaian portofolio

Lembar penilaian portofolio

Jurnal

Buku cacatan jurnal

Penilaian diri

Kuesioner/lembar penilaian diri

Penilaian antarteman

Lembar penilaian antarteman

B.  Prosedur Pengembangan Tes

Sebelum menentukan teknik dan alat penilaian, penulis soal perlu menetapkan terlebih dahulu tujuan penilaian dan kompetensi dasar yang hendak diukur. Adapun proses penentuannya secara lengkap dapat dilihat pada bagan berikut ini.




Langkah-langkah penting yang dapat dilakukan sebagai berikut.

1. Menentukan tujuan penilaian. Tujuan penilaian sangat penting karena setiap tujuan memiliki penekanan yang berbeda-beda. Misalnya untuk tujuan tes prestasi belajar, diagnostik, atau seleksi. Contoh untuk tujuan prestasi belajar, lingkup materi/kompetensi yang ditanyakan/diukur disesuaikan seperti untuk kuis/menanyakan materi yang lalu, pertanyaan lisan di kelas, ulangan harian, tugas individu/kelompok, ulangan semester, ulangan kenaikan kelas, laporan kerja praktik/laporan praktikum, ujian praktik.

2. Memperhatikan standar kompetensi (SK) dan kompetensi dasar (KD). Standar kompetensi merupakan acuan/target utama yang harus dipenuhi atau yang harus diukur melalui setiap kompetensi dasar yang ada atau melalui gabungan kompetensi dasar.

3. Menentukan jenis alat ukurnya, yaitu tes atau non-tes atau mempergunakan keduanya. Untuk penggunaan tes diperlukan penentuan materi penting sebagai pendukung kompetensi dasar. Syaratnya adalah materi yang diujikan harus mempertimbangkan urgensi (wajib dikuasai peserta didik), kontinuitas (merupakan materi lanjutan), relevansi (bermanfaat terhadap mata pelajaran lain), dan keterpakaian dalam kehidupan sehari-hari tinggi (UKRK). Langkah selanjutnya adalah menentukan jenis tes dengan menanyakan apakah materi tersebut tepat diujikan secara tertulis/lisan. Bila jawabannya tepat, maka materi yang bersangkutan tepat diujikan dengan bentuk soal apa, pilihan ganda atau uraian. Bila jawabannya tidak tepat, maka jenis tes yang tepat adalah tes perbuatan: kinerja (performance), penugasan (project), hasil karya (product), atau lainnya.

4. Menyusun kisi-kisi tes dan menulis butir soal beserta pedoman penskorannya. Dalam menulis soal, penulis soal harus memperhatikan kaidah penulisan soal.


C.  Penentuan Materi Penting

Langkah awal yang harus dilakukan dalam menyiapkan bahan ulangan/ujian adalah menentukan kompetensi dan materi yang akan diujikan. Setelah menentukan kompetensi yang akan diukur, maka langkah berikutnya adalah menentukan materi yang akan diujikan. Penentuan materi yang akan diujikan sangat penting karena di dalam satu tes tidak mungkin semua materi yang telah diajarkan dapat diujikan dalam waktu yang terbatas, misalnya satu atau dua jam. Oleh karena itu, setiap guru harus menentukan materi mana yang sangat penting dan penunjang, sehingga dalam waktu yang sangat terbatas, materi yang diujikan hanya menanyakan materi-materi yang sangat penting saja. Materi yang telah ditentukan harus dapat diukur sesuai dengan alat ukur yang akan digunakan yaitu tes atau non-tes.

Penentuan materi penting dilakukan dengan memperhatikan kriteria:
1.   Urgensi, yaitu materi secara teoritis mutlak harus dikuasai oleh peserta didik,
2.   Kontinuitas, yaitu materi lanjutan yang merupakan pendalaman dari satu atau lebih materi yang sudah dipelajari sebelumnya,
3.   Relevansi, yaitu materi yang diperlukan untuk mempelajari atau memahami, mata pelajaran lain,
4.   Keterpakaian, yaitu rnateri yang memiliki nilai terapan tinggi dalam kehidupan sehari­-hari.





III.  PENYUSUNAN KISI-KISI DAN BUTIR SOAL



A.  Jenis Perilaku yang Dapat Diukur

Dalam menentukan perilaku yang akan diukur, penulis soal dapat mengambil atau memperhatikan jenis perilaku yang telah dikembangkan oleh para ahli pendidikan, di antaranya seperti Benjamin S. Bloom, Quellmalz, R.J. Mazano dkk, Robert M. Gagne, David Krathwohl, Norman E. Gronlund dan R.W. de Maclay, Linn dan Gronlund.

1.   Ranah kognitif yang dikembangkan Benjamin S. Bloom adalah: (1) Ingatan di antaranya seperti: menyebutkan, menentukan, menunjukkan, mengingat kembali, mendefinisikan; (2) Pemahaman di antaranya seperti:      membedakan, mengubah, memberi contoh, memperkirakan, mengambil kesimpulan; (3) Penerapan di antaranya seperti: menggunakan, menerapkan; (4) Analisis di antaranya seperti: membandingkan, mengklasifikasikan, mengkategorikan, menganalisis; (5) Sintesis antaranya seperti: menghubungkan, mengembangkan, mengorganisasikan, menyusun; (6) Evaluasi di antaranya seperti: menafsirkan, menilai, memutuskan.
2.   Jenis perilaku yang dikembangkan Quellmalz adalah: (1) ingatan, (2) analisis, (3) perbandingan, (4) penyimpulan, (5) evaluasi.
3.   Jenis perilaku yang dikembangkan R. J. Mazano dkk. adalah: (1) keterampilan memusat (focusing skills), seperti: mendefinisikan, merumuskan tujuan, (2) keterampilan mengumpulkan informasi, seperti: mengamati, merumuskan pertanyaan, (3) keterampilan mengingat, seperti: merekam, mengingat, (4) keterampilan mengorganisasi, seperti: membandingkan, mengelompokkan, menata/mengurutkan, menyajikan; (5) keterampilan menganalisis, seperti mengenali: sifat dari komponen, hubungan dan pola, ide pokok, kesalahan; (6) keterampilan menghasilkan keterampilan baru, seperti: menyimpulkan, memprediksi, mengupas atau mengurai; (7) keterampilan memadu (integreting skills), seperti: meringkas, menyusun kembali; (8) keterampilan menilai, seperti: menetapkan kriteria, membenarkan pembuktian.
4.   Jenis perilaku yang dikembangkan Robert M. Gagne adalah: (1) kemampuan intelektual: diskriminasi, identifikasi/konsep yang nyata, klasifikasi, demonstrasi, generalisasi/menghasilkan sesuatu; (2) strategi kognitif: menghasilkan suatu pemecahan; (3) informasi verbal: menyatakan sesuatu secara oral; (4) keterampilan motorist melaksanakan/menjalankan sesuatu; (5) sikap: kemampuan untuk memilih sesuatu. Domain afektif yang dikembangkan David Krathwohl adalah: (1) menerima, (2) menjawab, (3) menilai.
6.   Domain psikomotor yang dikembangkan Norman E. Gronlund dan R.W. de Maclay adalah: (1) persepsi, (2) kesiapan, (3) respon terpimpin, (4) mekanisme; (5) respon yang kompleks, (6) organisasi, (7) karakterisasi dari nilai.
7.   Keterampilan berpikir yang dikembangkan Linn dan Gronlund adalah seperti berikut.
a.  Membandingkan
-    Apa persamaan dan perbedaan antara ... dan...
-    Bandingkan dua cara berikut tentang ....
b.  Hubungan sebab-akibat
-    Apa penyebab utama ...
-    Apa akibat …
c.  Memberi alasan (justifying)
-    Manakah pilihan berikut yang kamu pilih, mengapa?
-    Jelaskan mengapa kamu setuju/tidak setuju dengan pernyataan tentang ....
d.  Meringkas
-    Tuliskan pernyataan penting yang termasuk ...
-    Ringkaslah dengan tepat isi …
e.  Menyimpulkan
-    Susunlah beberapa kesimpulan yang berasal dari data ....
-    Tulislah sebuah pernyataan yang dapat menjelaskan peristiwa berikut ....
f.   Berpendapat (inferring)
-    Berdasarkan ..., apa yang akan terjadi bila
-    Apa reaksi A terhadap …
g.  Mengelompokkan
-    Kelompokkan hal berikut berdasarkan ....
-    Apakah hal berikut memiliki ...
h.  Menciptakan
-    Tuliskan beberapa cara sesuai dengan ide Anda tentang ....
-    Lengkapilah cerita ... tentang apa yang akan terjadi bila ....
i.   Menerapkan
-    Selesaikan hal berikut dengan menggunakan kaidah ....
-    Tuliskan ... dengan menggunakan pedoman....
j.   Analisis
-    Manakah penulisan yang salah pada paragraf ....
-    Daftar dan beri alasan singkat tentang ciri utama ....
k.      Sintesis
-    Tuliskan satu rencana untuk pembuktian ...
-    Tuliskan sebuah laporan ...
l.   Evaluasi
-    Apakah kelebihan dan kelemahan ....
-    Berdasarkan kriteria ..., tuliskanlah evaluasi tentang...

B.  Penentuan Perilaku yang Akan Diukur

Setelah kegiatan penentuan materi yang akan ditanyakan selesai dikerjakan, maka kegiatan berikutnya adalah menentukan secara tepat perilaku yang akan diukur. Perilaku yang akan diukur, pada Kurikulum  Berbasis Kompetensi tergantung pada tuntutan kompetensi, baik standar kompetensi maupun kompetensi dasarnya. Setiap kompetensi di dalam kurikulum memiliki tingkat keluasan dan kedalaman kemampuan yang berbeda. Semakin tinggi kemampuan/perilaku yang diukur sesuai dengan target kompetensi, maka semakin sulit soal dan semakin sulit pula menyusunnya. Dalam Standar Isi, perilaku yang akan diukur dapat dilihat pada "perilaku yang terdapat pada rumusan kompetensi dasar atau pada standar kompetensi". Bila ingin mengukur perilaku yang lebih tinggi, guru dapat mendaftar terlebih dahulu semua perilaku yang dapat diukur, mulai dari perilaku yang sangat sederhana/mudah sampai dengan perilaku yang paling sulit/tinggi, berdasarkan rumusan kompetensinya (baik standar kompetensi maupun kompetensi dasar). Dari susunan perilaku itu, dipilih satu perilaku yang tepat diujikan kepada peserta didik, yaitu perilaku yang sesuai dengan kemampuan peserta didik di kelas.



C.      Penentuan dan Penyebaran Soal

Sebelum menyusun kisi-kisi dan butir soal perlu ditentukan jumlah soal setiap kompetensi dasar dan penyebaran soalnya. Untuk lebih jelasnya, perhatikan contoh penilaian akhir semester berikut ini.

Contoh penyebaran butir soal untuk penilaian akhir semester ganjil


No

Kompetensi
Dasar

Materi
Jumlah soal tes tulis
Jumlah soal
Praktik
PG
Uraian
1
1.1 ............
...........
6
--
--
2
1.2 ............
...........
3
1
--
3
1.3 ............
...........
4
--
1
4
2.1 ............
...........
5
1
--
5
2.2 ............
...........
8
1
--
6
3.1 ............
...........
6
--
1
7
3.2 ...........
...........
--
2
--
8
3.3 ..........
...........
8
--
--
Jumlah soal
40
5
2


D.  Penyusunan Kisi-kisi

Kisi-kisi (test blue-print atau table of specification) merupakan deskripsi kompetensi dan materi yang akan diujikan. Tujuan penyusunan kisi-kisi adalah untuk menentukan ruang lingkup dan sebagai petunjuk dalam menulis soal. Kisi-kisi dapat berbentuk format atau matriks seperti contoh berikut ini.


FORMAT KISI-KISI PENULISAN SOAL

Jenis sekolah     :  ………………………                                      Jumlah soal          :  ………………………
Mata pelajaran  :  ………………………                                      Bentuk soal/tes     :  ..................
Kurikulum         :  ………………………                                      Penyusun              :  1.  …………………
Alokasi waktu    :  ………………………                                                                    2.  …………………
                             
No.
Standar Kompetensi
Kompetensi Dasar
Kls/
smt
Materi
pokok
Indikator soal
Nomor
soal













Keterangan:
Isi pada kolom 2, 3. 4, dan 5 adalah harus sesuai dengan pernyataan yang ada di dalam silabus/kurikulum. Penulis kisi-kisi tidak diperkenankan mengarang sendiri, kecuali pada kolom 6.

Kisi-kisi yang baik harus memenuhi persyaratan berikut ini.
1.   Kisi-kisi harus dapat mewakili isi silabus/kurikulum atau materi yang telah diajarkan secara tepat dan proporsional.
2.   Komponen-komponennya diuraikan secara jelas dan mudah dipahami.
3.   Materi yang hendak ditanyakan dapat dibuatkan soalnya.

E.       Perumusan Indikator Soal

Indikator dalam kisi-kisi merupakan pedoman dalam merumuskan soal yang dikehendaki. Kegiatan perumusan indikator soal merupakan bagian dari kegiatan penyusunan kisi-kisi. Untuk merumuskan indikator dengan tepat, guru harus memperhatikan materi yang akan diujikan, indikator pembelajaran, kompetensi dasar, dan standar kompetensi. Indikator yang baik dirumuskan secara singkat dan jelas. Syarat indikator yang baik:
1.   menggunakan kata kerja operasional (perilaku khusus) yang tepat,
2.   menggunakan satu kata kerja operasional untuk soal objektif, dan satu atau lebih kata kerja operasional untuk soal uraian/tes perbuatan,
3.   dapat dibuatkan soal atau pengecohnya (untuk soal pilihan ganda).

Penulisan indikator yang lengkap mencakup A = audience (peserta didik) , B = behaviour (perilaku yang harus ditampilkan), C = condition (kondisi yang diberikan), dan D = degree (tingkatan yang diharapkan). Ada dua model penulisan indikator. Model pertama adalah menempatkan kondisinya di awal kalimat. Model pertama ini digunakan untuk soal yang disertai dengan dasar pernyataan (stimulus), misalnya berupa sebuah kalimat, paragraf, gambar, denah, grafik, kasus, atau lainnya, sedangkan model yang kedua adalah menempatkan peserta didik dan perilaku yang harus ditampilkan di awal kalimat. Model yang kedua ini digunakan untuk soal yang tidak disertai dengan dasar pertanyaan (stimulus).


(1) Contoh model pertama untuk soal menyimak pada mata pelajaran Bahasa Indonesia.
     Indikator: Diperdengarkan sebuah pernyataan pendek dengan topik "belajar mandiri", peserta didik dapat menentukan dengan tepat pernyataan yang sama artinya.
               Soal  :        (Soal dibacakan atau diperdengarkan hanya satu kali, kemudian peserta didik memilih dengan tepat satu pernyataan yang sama artinya. Soalnya adalah: "Hari harus masuk kelas pukul 7.00., tetapi dia datang pukul 8.00 pagi hari.")
Lembar tes hanya berisi pilihan seperti berikut:
a. Hari masuk kelas tepat waktu pagi ini.
b. Hari masuk kelas terlambat dua jam pagi ini
c. Hari masuk Kelas terlambat siang hari ini,
d. Hari masuk Kelas terlambat satu jam hari ini
                            Kunci: d
(2) Contoh model kedua
     Indikator: Peserta didik dapat menentukan dengan tepat penulisan tanda baca pada nilai uang.
     Soal  :        Penulisan nilai uang yang benar adalah ....
     a. Rp 125,-
     b. RP 125,00
     c. Rp125
     d. Rp125.
                                                    Kunci: b


F. Langkah-langkah Penyusunan Butir Soal

Agar soal yang disiapkan oleh setiap guru menghasilkan bahan ulangan/ujian yang sahih dan handal, maka harus dilakukan langkah-langkah berikut, yaitu: (1) menentukan tujuan tes, (2) menentukan kompetensi yang akan diujikan, (3) menentukan materi yang diujikan, (4) menetapkan penyebaran butir soal berdasarkan kompetensi, materi, dan bentuk penilaiannya (tes tertulis: bentuk pilihan ganda, uraian; dan tes praktik), (5) menyusun kisi-kisinya, (6) menulis butir soal, (7) memvalidasi butir soal atau menelaah secara kualitatif, (8) merakit soal menjadi perangkat tes, (9) menyusun pedoman penskorannya (10) uji coba butir soal, (11) analisis butir soal secara kuantitatif dari data empirik hasil uji coba, dan (12) perbaikan soal berdasarkan hasil analisis.


G.  Penyusunan Butir Soal Tes Tertulis
   
Penulisan butir soal tes tertulis merupakan suatu kegiatan yang sangat penting dalam penyiapan bahan ulangan/ujian. Setiap butir soal yang ditulis harus berdasarkan rumusan indikator soal yang sudah disusun dalam kisi-kisi dan berdasarkan kaidah penulisan soal bentuk obyektif dan kaidah penulisan soal uraian.

Penggunaan bentuk soal yang tepat dalam tes tertulis, sangat tergantung pada perilaku/kompetensi yang akan diukur. Ada kompetensi yang lebih tepat diukur/ditanyakan dengan menggunakan tes tertulis dengan bentuk soal uraian, ada pula kompetensi yang lebih tepat diukur dengan menggunakan tes tertulis dengan bentuk soal objektif. Bentuk tes tertulis pilihan ganda maupun uraian memiliki kelebihan dan kelemahan satu sama lain.

Keunggulan soal bentuk pilihan ganda di antaranya adalah dapat mengukur kemampuan/perilaku secara objektif, sedangkan untuk soal uraian di antaranya adalah dapat mengukur kemampuan mengorganisasikan gagasan dan menyatakan jawabannya menurut kata-kata atau kalimat sendiri. Kelemahan soal bentuk pilihan ganda di antaranya adalah sulit menyusun pengecohnya, sedangkan untuk soal uraian di antaranya adalah sulit menyusun pedoman penskorannya.

 H. Penulisan Soal Bentuk Uraian

Menulis soal bentuk uraian diperlukan ketepatan dan kelengkapan dalam merumuskannya. Ketepatan yang dimaksud adalah bahwa materi yang ditanyakan tepat diujikan dengan bentuk uraian, yaitu menuntut peserta didik untuk mengorganisasikan gagasan dengan cara mengemukakan atau mengekspresikan gagasan secara tertulis dengan menggunakan kata-katanya sendiri. Adapun kelengkapan yang dimaksud adalah kelengkapan perilaku yang diukur yang digunakan untuk menetapkan aspek yang dinilai dalam pedoman penskorannya. Hal yang paling sulit dalam penulisan soal bentuk uraian adalah menyusun pedoman penskorannya. Penulis soal harus dapat merumuskan setepat-tepatnya pedoman penskorannya karena kelemahan bentuk soal uraian terletak pada tingkat subyektivitas penskorannya.

Berdasarkan metode penskorannya, bentuk uraian diklasifikasikan menjadi 2, yaitu uraian objektif dan uraian non-objektif. Bentuk uraian objektif adalah suatu soal atau pertanyaan yang menuntut sehimpunan jawaban dengan pengertian/konsep tertentu, sehingga penskorannya dapat dilakukan secara objektif. Artinya perilaku yang diukur dapat diskor secara dikotomus (benar - salah atau 1 - 0). Bentuk uraian non-objektif adalah suatu soal yang menuntut sehimpunan jawaban dengan pengertian/konsep menurut pendapat masing-masing peserta didik, sehingga penskorannya sukar untuk dilakukan secara objektif. Untuk mengurangi tingkat kesubjektifan dalam pemberian skor ini, maka dalam menentukan perilaku yang diukur dibuatkan skala. Contoh misalnya perilaku yang diukur adalah "kesesuaian isi dengan tuntutan pertanyaan", maka skala yang disusun disesuaikan dengan tingkatan kemampuan peserta didik yang akan diuji.
         
Untuk tingkat SMA, misalnya dapat disusun skala seperti berikut.
Kesesuaiann isi dengan tuntutan pertanyaan      0 - 3
                            Skor
-    Sesuai                3
-    Cukup/sedang    2
-    Tidak sesuai       1
-    Kosong              0

Atau skala seperti berikut:
Kesesuaian isi dengan tuntutan pertanyaan        0 - 5 Skor
                                 Skor
-    Sangat Sesuai          5
-    Sesuai                    4
-    Cukup/sedang         3
-    Tidak sesuai            2
-    Sangat tidak sesuai 1
-    Kosong                   0

Agar soal yang disusun bermutu baik, maka penulis soal harus memperhatikan kaidah penulisannya. Untuk memudahkan pengelolaan, perbaikan, dan pengembangan soal, maka soal ditulis di dalam format kartu soal Setiap satu soal dan pedoman penskorannya ditulis di dalam satu format. Contoh format soal bentuk uraian dan format penskorannya adalah seperti berikut ini.


KARTU SOAL

Jenis Sekolah         :  ……………………............                Penyusun        : 1. ……………………
Mata Pelajaran       : ……………………...........                                         2. ……………………
Bahan Kls/Smt       : ……………………............                                        3. ……………………
Bentuk Soal            : ……………………............                Tahun Ajaran  : ……………………….
Aspek yang diukur  : ……………………............



KOMPETENSI DASAR



BUKU SUMBER:


RUMUSAN BUTIR SOAL

MATERI


NO SOAL:




INDIKATOR SOAL






KETERANGAN SOAL

NO
DIGUNAKAN UNTUK
TANGGAL
JUMLAH SISWA
TK
DP
PROPORSI PEMILIH ASPEK
KET.







A
B
C
D
E
OMT

















FORMAT PEDOMAN PENSKORAN

NO
SOAL
KUNCI/KRITERIA JAWABAN
SKOR







Bentuk soalnya terdiri dari: (1) dasar pertanyaan/stimulus bila ada/diperlukan, (2) pertanyaan, dan (3) pedoman penskoran.

Kaidah penulisan soal uraian seperti berikut­.
1.   Materi
a.  Soal harus sesuai dengan indikator.
b.      Setiap pertanyaan harus diberikan batasan jawaban yang diharapkan.
c.      Materi yang ditanyakan harus sesuai dengan tujuan peugukuran.
d.  Materi yang ditanyakan harus sesuai dengan jenjang jenis sekolah atau tingkat kelas.


2.   Konstruksi
a.      Menggunakan kata tanya/perintah yang menuntut jawaban terurai.
b.      Ada petunjuk yang jelas tentang cara mengerjakan soal.
c.  Setiap soal harus ada pedoman penskorannya.
d.  Tabel, gambar, grafik, peta, atau yang sejenisnya disajikan dengan jelas, terbaca, dan berfungsi.

3.   Bahasa
a.  Rumusan kalimat soal harus komunikatif.
b.  Menggunakan bahasa Indonesia yang baik dan benar (baku).
c.      Tidak menimbulkan penafsiran ganda.
d.  Tidak menggunakan bahasa yang berlaku setempat/tabu.
e.  Tidak mengandung kata/ungkapan yang menyinggung perasaan peserta didik.

H.  Penulisan Soal Bentuk Pilihan Ganda

Menulis soal bentuk pilihan ganda sangat diperlukan keterampilan dan ketelitian. Hal yang paling sulit dilakukan dalam menulis soal bentuk pilihan ganda adalah menuliskan pengecohnya. Pengecoh yang baik adalah pengecoh yang tingkat kerumitan atau tingkat kesederhanaan, serta panjang-pendeknya relatif sama dengan kunci jawaban. Oleh karena itu, untuk memudahkan dalam penulisan soal bentuk pilihan ganda, maka dalam penulisannya perlu mengikuti langkah-langkah berikut, langkah pertama adalah menuliskan pokok soalnya, langkah kedua menuliskan kunci jawabannya, langkah ketiga menuliskan pengecohnya.

Untuk memudahkan pengelolaan, perbaikan, dan perkembangan soal, maka soal ditulis di dalam format kartu soal. Setiap satu soal ditulis di dalam satu format. Adapun formatnya seperti berikut ini.



KARTU SOAL

Jenis Sekolah      : ……………………………….           Penyusun : 1.  
Mata Pelajaran    : ……………………………….                            2.  
Bahan Kls/Smt     : ……………………………….                            3.  
Bentuk Soal         : ……………………………….          
Tahun Ajaran       : ……………………………….
Aspek yang diukur  :                                        ……………………………….



KOMPETENSI DASAR



BUKU SUMBER


RUMUSAN BUTIR SOAL






MATERI

NO SOAL:


KUNCI    :





INDIKATOR SOAL






KETERANGAN SOAL

NO
DIGUNAKAN UNTUK
TANGGAL
JUMLAH SISWA
TK
DP
PROPORSI PEMILIH
KET.







A
B
C
D
E
OMT
































Soal bentuk pilihan ganda merupakan soal yang telah disediakan pilihan jawabannya. Peserta didik yang mengerjakan soal hanya memilih satu jawaban yang benar dari pilihan jawaban yang disediakan. Soalnya mencakup: (1) dasar pertanyaan/stimulus (bila ada), (2) pokok soal (stem), (3) pilihan jawaban yang terdiri atas: kunci jawaban dan pengecoh.

Perhatikan contoh berikut!


Kaidah penulisan soal pilihan ganda adalah seperti berikut ini.

1.   Materi

a.  Soal harus sesuai dengan indikator. Artinya soal harus menanyakan perilaku dan materi yang hendak diukur sesuai dengan rumusan indikator dalam kisi-kisi.
b.  Pengecoh harus bertungsi
c.  Setiap soal harus mempunyai satu jawaban yang benar. Artinya, satu soal hanya mempunyai satu kunci jawaban.

2.  Konstruksi

a.  Pokok soal harus dirumuskan secara jelas dan tegas. Artinya, kemampuan/ materi yang hendak diukur/ditanyakan harus jelas, tidak menimbulkan pengertian atau penafsiran yang berbeda dari yang dimaksudkan penulis. Setiap butir soal hanya mengandung satu persoalan/gagasan
b.  Rumusan pokok soal dan pilihan jawaban harus merupakan pernyataan yang diperlukan saja. Artinya apabila terdapat rumusan atau pernyataan yang sebetulnya tidak diperlukan, maka rumusan atau pernyataan itu dihilangkan saja.
c.  Pokok soal jangan memberi petunjuk ke arah jawaban yang benar. Artinya, pada pokok soal jangan sampai terdapat kata, kelompok kata, atau ungkapan yang dapat memberikan petunjuk ke arah jawaban yang benar.
d.  Pokok soal jangan mengandung pernyataan yang bersifat negatif ganda. Artinya, pada pokok soal jangan sampai terdapat dua kata atau lebih yang mengandung arti negatif. Hal ini untuk mencegah terjadinya kesalahan penafsiran peserta didik terhadap arti pernyataan yang dimaksud. Untuk keterampilan bahasa, penggunaan negatif ganda diperbolehkan bila aspek yang akan diukur justru pengertian tentang negatif ganda itu sendiri.
e.  Pilihan jawaban harus homogen dan logis ditinjau dari segi materi. Artinya, semua pilihan jawaban harus berasal dari materi yang sama seperti yang ditanyakan oleh pokok soal, penulisannya harus setara, dan semua pilihan jawaban harus berfungsi.
f.   Panjang rumusan pilihan jawaban harus relatif sama. Kaidah ini diperlukan karena adanya kecenderungan peserta didik memilih jawaban yang paling panjang karena seringkali jawaban yang lebih panjang itu lebih lengkap dan merupakan kunci jawaban.
g.  Pilihan jawaban jangan mengandung pernyataan “Semua pilihan jawaban di atas salah" atau "Semua pilihan jawaban di atas benar". Artinya dengan adanya pilihan jawaban seperti ini, maka secara materi pilihan jawaban berkurang satu karena pernyataan itu bukan merupakan materi yang ditanyakan dan pernyataan itu menjadi tidak homogen.    
h.  Pilihan jawaban yang berbentuk angka atau waktu harus disusun berdasarkan urutan besar kecilnya nilai angka atau kronologis. Artinya pilihan jawaban yang berbentuk angka harus disusun dari nilai angka paling kecil berurutan sampai nilai angka yang paling besar, dan sebaliknya. Demikian juga pilihan jawaban yang menunjukkan waktu harus disusun secara kronologis. Penyusunan secara unit dimaksudkan untuk memudahkan peserta didik melihat pilihan jawaban.
i.   Gambar, grafik, tabel, diagram, wacana, dan sejenisnya yang terdapat pada soal harus jelas dan berfungsi. Artinya, apa saja yang menyertai suatu soal yang ditanyakan harus jelas, terbaca, dapat dimengerti oleh peserta didik. Apabila soal bisa dijawab tanpa melihat gambar, grafik, tabel atau sejenisnya yang terdapat pada soal, berarti gambar, grafik, atau tabel itu tidak berfungsi.
j.   Rumusan pokok soal tidak menggunakan ungkapan atau kata yang bermakna tidak pasti seperti: sebaiknya, umumnya, kadang-kadang.
k.  Butir soal jangan bergantung pada jawaban soal sebelumnya. Ketergantungan pada soal sebelumnya menyebabkan peserta didik yang tidak dapat menjawab benar soal pertama tidak akan dapat menjawab benar soal berikutnya.

3.  Bahasa/budaya

a. Setiap soal harus menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia. Kaidah bahasa Indonesia dalam penulisan soal di antaranya meliputi: a) pemakaian kalimat: (1) unsur subyek, (2) unsur predikat, (3) anak kalimat; b) pemakaian kata: (1) pilihan kata, (2) penulisan kata, dan c) pemakaian ejaan: (1) penulisan huruf, (2) penggunaan tanda baca.
b. Bahasa yang digunakan harus komunikatif, sehingga pernyataannya mudah dimengerti warga belajar/peserta didik.
c.  Pilihan jawaban jangan yang mengulang kata/frase yang bukan merupakan satu kesatuan pengertian. Letakkan kata/frase pada pokok soal.

IV.  PENULISAN BUTIR SOAL UNTUK TES PERBUATAN

A.  Pengertian

Tes perbuatan atau tes praktik merupakan suatu tes yang penilaiannya didasarkan pada perbuatan/praktik peserta didik. Sebelum menulis butir soal untuk tes perbuatan, guru dapat mengecek dengan pertanyaan berikut. Tepatkah kompetensi (yang akan diujikan) diukur dengan tes tertulis? Jika jawabannya tepat, kompetensi yang bersangkutan tidak tepat diujikan dengan tes perbuatan/praktik.

Dalam menilai perbuatan/kegiatan/praktik peserta didik dapat digunakan beberapa jenis penilaian perbuatan di antaranya adalah penilaian kinerja (performance), penugasan (project), dan hasil karya (product).


B.  Kaidah Penulisan Butir Soal Tes Perbuatan

Dalam menulis butir soal untuk tes perbuatan, penulis soal harus mengetahui konsep dasar penilaian perbuatan/praktik. Maksudnya pernyataan dalam soal harus disusun dengan pernyataan yang betul-betul menilai perbuatan/praktik, bukan menilai yang lainnya.

Penilaian kinerja merupakan penilaian yang meminta peserta didik untuk mendemonstrasikan dan mengaplikasikan pengetahuan ke dalam konteks yang sesuai dengan kriteria yang ditetapkan. Dalam menulis butir soal, perhatikan terlebih dahulu kompetensi dari materi yang akan ditanyakan.

Penilaian penugasan merupakan penilaian tugas (meliputi: pengumpulan, pengorganisasian, pengevaluasian, dan penyajian data) yang harus diselesaikan peserta didik (individu/kelompok) dalam waktu tertentu. Aspek yang dinilai di antaranya meliputi kemampuan (1) pengelolaan, (2) relevansi, dan (3) keaslian.

Penilaian hasil karya merupakan penilaian keterampilan peserta didik dalam membuat suatu produk benda tertentu seperti hasil karya seni, misal lukisan, gambar, patung, dll. Aspek yang dinilai di antaranya meliputi: (1) tahap persiapan: pemilihan dan cara penggunaan alat, (2) tahap proses/produksi: prosedur kerja, dan (3) tahap akhir/hasil: kualitas serta estetika hasil karya. Di samping itu, guru dapat memberikan penilaian pada pembuatan produk rancang bangun/perekayasaan teknologi tepat guna misalnya melalui: (1) adopsi, (2) modifikasi, atau (3) difusi.

Kaidah penulisan soal tes perbuatan adalah seperti berikut.

1.   Materi
a.  Soal harus sesuai dengan indikator (menuntut tes perbuatan: kinerja, hasil karya, atau penugasan).
b.  Pertanyaan dan jawaban yang diharapkan harus sesuai.
c.  Materi sesuai dengan kompetensi (urgensi, relevansi, kontinuitas, keterpakaian sehari-hari tinggi).
d.  Isi materi yang ditanyakan sesuai dengan jenjang jenis sekolah atau tingkat kelas.
2.   Konstruksi
a.  Menggunakan kata tanya atau perintah yang menuntut jawaban perbuatan/praktik.
b.  Ada petunjuk yang jelas tentang cara mengerjakan soal.
c.  Disusun pedoman penskorannya.
d.  Tabel, gambar, grafik, peta, atau yang sejenisnya disajikan dengan jelas dan terbaca­
3.   Bahasa/Budaya
a.  Rumusan kalimat soal komunikatif
b.  Butir soal menggunakan bahasa Indonesia yang baku.
c.  Tidak menggunakan kata/ungkapan yang menimbulkan penafsiran ganda atau salah pengertian.
d.  Tidak menggunakan bahasa yang berlaku setempat/tabu.
e.  Rumusan soal tidak mengandung kata/ungkapan yang dapat menyinggung perasaan peserta didik.


C.  Penulisan Soal Penilaian Kinerja (Performance Assessment)

Penilaian kinerja merupakan penilaian yang meminta peserta didik untuk mendemonstrasikan dan mengaplikasikan pengetahuan ke dalam konteks yang sesuai dengan kriteria yang ditetapkan. Dalam menulis butir soal, perhatikan terlebih dahulu kompetensi dari materi yang akan ditanyakan.

D.  Penulisan Soal Penilaian Penugasan (Project)

Penilaian penugasan merupakan penilaian tugas (meliputi: pengumpulan, pengorganisasian, pengevaluasian, dan penyajian data) yang harus diselesaikan peserta didik (individu/kelompok) dalam waktu tertentu. Adapun aspek yang dinilai di antaranya meliputi kemampuan (1) pengelolaan, (2) relevansi, dan (3) keaslian.

E.  Penulisan Soal Penilaian Hasil Karya (Product)

Penilaian hasil karya merupakan penilaian keterampilan peserta didik dalam membuat suatu produk benda tertentu seperti hasil karya seni, misal lukisan, gambar, patung, dll. Aspek yang dinilai di antaranya meliputi: (1) tahap persiapan: pemilihan dan cara penggunaan alat, (2) tahap proses/produksi: prosedur kerja, dan (3) tahap akhir/hasil: kualitas serta estetika hasil karya. Di samping itu, guru dapat memberikan penilaian pada pembuatan produk rancang bangun/perekayasaan teknologi tepat guna misalnya melalui: (1) adopsi, (2) modifikasi, atau (3) difusi.


VI. PENULISAN  BUTIR  SOAL UNTUK  INSTRUMEN NON-TES


A. Pengertian

Instrumen non-tes adalah instrumen selain tes prestasi belajar. Alat penilaian yang dapat digunakan antara lain adalah: lembar pengamatan/observasi (seperti catatan harian, portofolio, life skill) dan instrumen tes sikap, minat, dsb.

Pada prinsipnya, prosedur penulisan butir soal untuk instrumen non-tes adalah sama dengan prosedur penulisan tes pada tes prestasi belajar, yaitu menyusun kisi-kisi tes, menuliskan butir soal berdasarkan kisi--kisinya, telaah, validasi butir, uji coba butir, perbaikan butir berdasarkan hasil uji coba. Namun, dalam proses awalnya, sebelum menyusun kisi-kisi tes terdapat perbedaan dalam menentukan validitas isi/konstruknya. Dalam tes prestasi belajar, validitas isi diperoleh melalui kurikulum dan buku pelajaran, tetapi untuk non-tes validitas isi/konstruknya diperoleh melalui "teori". Teori adalah pendapat yang dikemukakan sebagai keterangan mengenai suatu peristiwa atau kejadian, dsb. (Kamus Besar Bahasa Indonesia, 1990 : 932)


B.  Pengamatan

Pengamatan merupakan suatu alat penilaian yang pengisiannya dilakukan oleh guru atas dasar pengamatan terhadap perilaku peserta didik yang sesuai dengan kompetensi yang hendak diukur. Pengamatan dapat dilakukan dengan menggunakan antara lain lembar pengamatan, penilaian portofolio dan penilaian kecakapan hidup.

Pelaksanaan pengamatan sikap dapat dilakukan guru pada sebelum mengajar, saat mengajar, dan sesudah mengajar. Perilaku minimal yang dapat dinilai dengan pengamatan untuk perilaku/budi pekerti peserta didik, misalnya: ketaatan pada ajaran agama, toleransi, disiplin, tanggung jawab, kasih sayang, gotong royong, kesetiakawanan, hormat-menghormati, sopan santun, dan jujur.

Portofolio merupakan deskripsi peta perkembangan kemampuan individu peserta didik. Jadi portofolio merupakan ”kartu sehat” individu peserta didik. Bila ada peserta didik yang ”sakit”, tugas guru adalah (1) menentukan penyakitnya apa, kemudian (2) memberi obat yang tepat agar peserta didik cepat sembuh dari penyakitnya.





C.      Penyusunan Kisi-kisi Instrumen Non-tes

     Dalam kisi-kisi non-tes biasanya formatnya berisi dimensi, indikator, jumlah butir soal per indikator, dan nomor butir soal. Formatnya seperti berikut ini.

NO
DIMENSI
INDIKATOR
JUMLAH SOAL PER INDIKATOR
NOMOR SOAL









JUMLAH SOAL =


Untuk mengisi kolom dimensi dan indikator, penulis soal harus mengetahui terlebih dahulu validitas konstruknya yang disusun/dirumuskan melalui teori. Cara termudah untuk mendapatkan teori adalah membaca beberapa buku, hasil penelitian, atau mencari informasi lain yang berhubungan dengan variabel atau tujuan tes yang dikehendaki. Oleh karena itu, peserta didik atau responden yang hendak mengerjakan tes ini (instrumen non-tes) tidak perlu mempersiapkan/belajar materi yang hendak diteskan terlebih dahulu seperti pada tes prestasi belajar.

Setelah teori diperoleh dari berbagai buku, maka langkah selanjutnya adalah menyimpulkan teori itu dan merumuskan mendefinisikan (yaitu definisi konsep dan definisi operasional) dengan kata-kata sendiri berdasarkan pendapat para ahli yang diperoleh dari beberapa buku yang telah dibaca. Definisi tentang teori yang dirumuskan inilah yang dinamakan konstruk. Berdasarkan konstruk yang telah dirumuskan itu, langkah selanjutnya adalah menentukan dimensi (tema-objek/hal-hal pokok yang menjadi pusat tinjauan teori), indikator (uraian/rincian dimensi yang akan diukur), dan penulisan butir soal berdasarkan indikatornya. Untuk lebih memudahkan dalam menyusun kisi-kisi tes, perhatikan alur urutannya seperti pada bagan berikut.


     Berdasarkan bagan di atas, penulis soal dapat dengan mudah mengecek apakah instrumen tesnya atau butir-butir soal sudah sesuai dengan indikatornya atau belum. Misalnya soal nomor 1 sampai dengan soal terakhir berasal darimana? Dari indikator. Indikator dari mana? Dari dimensi. Rumusan dimensi darimana? Dari konstruk. Rumusan konstruk darimana? Dari teori. Jadi kesimpulannya instrumen tes yang telah disusun merupakan alat ukur yang (sudah tepat atau belum tepat) mewakili teori.

D.      Kaidah Penulisan Soal

     Dalam penulisan soal pada instrumen non-tes, penulis butir soal harus memperhatikan ketentuan/kaidah penulisannya. Kaidahnya adalah seperti berikut ini.

1.   Materi
a.  Pernyataan harus sesuai dengan rumusan indikator dalam kisi-kisi.
b.  Aspek yang diukur pada setiap pernyataan sudah sesuai dengan tuntutan dalam kisi-kisi (misal untuk tes sikap: aspek kognisi, afeksi atau konasinya dan pernyataan positif atau negatifnya).

2.   Konstruksi
a.  Pernyataan dirumuskan dengan singkat (tidak melebihi 20 kata) dan jelas.
b.  Kalimatnya bebas dari pernyataan yang tidak relevan objek yang dipersoalkan atau kalimatnya merupakan pernyataan yang diperlukan saja.
c.  Kalimatnya bebas dari pernyataan yang bersifat negatif ganda.
d.  Kalimatnya bebas dari pernyataan yang mengacu pada masa lalu.
e.  Kalimatnya bebas dari pernyataan yang faktual atau dapat diinterpretasikan sebagai fakta.
f.   Kalimatnya bebas dari pernyataan yang dapat diinterpretasikan lebih dari satu cara.
g.  Kalimatnya bebas dari pernyataan yang mungkin disetujui atau dikosongkan oleh hampir semua responden.
h.  Setiap pernyataan hanya berisi satu gagasan secara lengkap.
i.   Kalimatnya bebas dari pernyataan yang tidak pasti seperti semua, selalu, kadang-­kadang, tidak satupun, tidak pernah.
j.   Jangan banyak mempergunakan kata hanya, sekedar, semata-mata. Gunakanlah seperlunya.

3.   Bahasa/Budaya
a.  Bahasa soal harus komunikatif dan sesuai dengan jenjang pendidikan peserta didik atau responden.
b.  Soal harus menggunakan bahasa Indonesia baku.
c.  Soal tidak menggunakan bahasa yang berlaku setempat/tabu.


E.  Contoh Penulisan Kisi-kisi Non-Tes dan Butir soal

Dalam bagian ini disajikan beberapa contoh penulisan kisi-kisi tes dan penulisan butir soal yang sangat sederhana. Tujuan utamanya adalah agar contoh-contoh ini mudah dipahami oleh para guru di sekolah. Contoh yang akan disajikan adalah penulisan kisi-kisi dan butir soal untuk tes skala sikap, tes minat belajar, tes motivasi berprestasi, dan tes kreativitas. Untuk contoh instrumen non-tes lainnya, para guru dapat menyusunnya sendiri yang proses penyusunannya adalah sama dengan contoh yang ada di sini.

1.   Tes Skala Sikap

Berbagai definisi tentang sikap yang telah dikemukakan oleh para ahli, di antaranya adalah Mueller (1986: 3) yang menyampaikan 5 definisi dari 5 ahli, adalah seperti berikut ini. (1) Sikap adalah afeksi untuk atau melawan, penilaian tentang, suka atau tidak suka, tanggapan positif/negatif terhadap suatu objek psikologis (Thurstone). (2) Sikap adalah kecenderungan untuk bertindak ke arah atau melawan suatu faktor lingkungan (Emory Bogardus). (3) Sikap adalah kesiapsiagaan mental atau saraf (Goldon Allport). (4) Sikap adalah konsistensi dalam tanggapan terhadap objek-objek sosial (Donald Cambell). (5) Sikap merupakan tanggapan tersembunyi yang ditimbulkan oleh suatu nilai (Ralp Linton, ahli antropologi kebudayaan).

Berdasarkan beberapa definisi di atas, para ahli menyimpulkan bahwa sikap memiliki 3 komponen penting, yaitu komponen: (1) kognisi yang berhubungan dengan kepercayaan, ide, dan konsep; (2) afeksi yang mencakup perasaan seseorang; dan (3) konasi yang merupakan kecenderungan bertingkah laku atau yang akan dilakukan. Oleh karena itu, ketiga komponen ini dimasukkan di dalam format kisi-kisi "sikap belajar peserta didik" seperti contoh berikut. Adapun definisi operasional sikap belajar adalah kecenderungan bertindak dalam perubahan tingkah laku melalui latihan dan pengalaman dari keadaan tidak tahu menjadi tahu yang dapat diukur melalui: toleransi, kebersamaan dan gotong-royong, rasa kesetiakawanan, dan kejujuran.

NO
DIMENSI
INDIKATOR
NOMOR SOAL YANG MENGUKUR
KOGNISI
AFEKSI
KONASI
+
-
+
-
+
-
1.
Toleransi
a. Mau menerima pendapat orang lain atau tidak memaksakan kehendak pribadi
b. Tidak mudah tersinggung

1



7
2



8
3



9
4



10
5



11
6



12
2.
Kebersamaan dan gotong royong
a. Dapat bekerja kelompok
b. Rela berkorban untuk kepentingan umum







3.
Rasa kesetiakawanan
a. Mau memberi dan meminta maaf







4.
dst









Contoh soalnya sebagai berikut :

NO.
PERNYATAAN
SS
S
TS
STS
1.

2.

3.
4.

5.

6.
7.
Mau menerima pendapat orang lain merupakan
ciri bertoleransi.
Untuk mewujudkan cita-cita harus memaksakan kehendak
Saya suka menerima pendapat orang lain
Memilih teman di sekolah, saya utamakan mereka yang pandai saja
Kalau saya boleh memilih, saya akan selalu
mendengarkan usul-usul kedua orang tuaku.
Bekerja sama dengan orang yang berbeda
Suku lebih baik dihindarkan.
……





Keterangan : SS = sangat setuju, S = setuju, TS = tidak setuju, STS = sangat tidak setuju.

2.  Tes Minat belajar

Minat adalah kesadaran yang timbul bahwa objek tertentu sangat disenangi dan melahirkan perhatian yang tinggi bagi individu terhadap objek tersebut (Crites, 1969 : 29). Di samping itu, minat juga merupakan kemampuan untuk memberikan stimulus yang mendorong seseorang untuk  memperhatikan aktivitas yang dilakukan berdasarkan pengalaman yang sebenarnya (Crow and Crow , 1984 :248). Berdasarkan kedua penegertian tersebut, minat merupakan kemampuan seseorang untuk memberikan perhatian terhadap suatu objek yang disertai dengan rasa senang dan dilakukan penuh kesadaran.

Peserta didik yang menaruh minat pada suatu mata pelajaran, perhatiannya akan tinggi dan minatnya berfungsi sebagai pendorong  kuat untuk terlibat secara aktif dalam kegiatan belajar mengajar pada pelajaran tersebut. Oleh karena itu, definisi operasional minat belajar adalah pilihan kesenangan dalam melakukan kegiatan dan dapat membangkitkan gairah seseorang untuk memenuhi kesediaannya yang dapat diukur melalui kesukacitaan, ketertarikan, perhatian dan keterlibatan. Berikut contoh kisi-kisi dan soal minat belajar  sastra Indonesia.

NO.
DIMENSI
INDIKATOR
NOMOR SOAL
1.

2.

3.

4.



Kesukaan

Ketertarikan

Perhatian

Keterlibatan



Gairah
Inisiatif
Responsif
Kesegeraan
Konsentrasi
Ketelitian
Kemauan
Keuletan
Kerja Keras

8, 13
16, 17
10, 15, 20
2, 6, 9
7, 19
3, 10
4, 5
1, 18
12, 14


Keterangan : Nomor yang bergaris bawah adalah untuk pernyataan positif
Contoh soalnya seperti berikut :
         
NO.
PERNYATAAN
SS
S
KK
J
TP
1.
2.

7.

16.
20.

….
Saya segera mengerjakan PR sastra sebelum
datang pekerjaan yang lain.
Saya asyik dengan pikiran sendiri ketika guru menerangkan sastra di kelas.
Saya suka membaca buku sastra.
….





Keterangan :  SS = sangat sering, S = sering, KK = kadang-kadang,  J = jarang, TP = tidak pernah.

Perhatikan contoh tes minat lainnya berikut ini.
CONTOH TES MINAT PESERTA DIDIK
TERHADAP MATA PELAJARAN
         
NO.
PERNYATAAN
SL
SR
JR
TP
1.
2.
3.
4.

5.
6.

7.

8.

9.
10.
Saya Senang mengikuti pelajaran ini.
Saya rugi bila tidak mengikuti pelajaran ini.
Saya merasa pelajaran ini bermanfaat.
Saya berusaha menyerahkan tugas tepat waktu.
Saya berusaha memahami pelajaran ini.
Saya bertanya kepada guru bila ada yang tidak jelas
Saya mengerjakan soal-soal latihan di rumah.
Saya mendiskusikan materi pelajaran dengan teman sekelas.
Saya berusaha memiliki buku pelajaran ini.
Saya berusaha mencari bahan pelajaran di perpustakaan





Keterangan : SL = selalu, SR = sering, JR = jarang, TP = tidak pernah.
                     
Keterangan : Dari 4 kategori: skor terendah 10, skor tertinggi 40.
33- 40 Sangat berminat
25- 32 Berminat
17- 24 Kurang berminat
10- 16 Tidak berminat
3.   Tes Motivasi Berprestasi

Definisi Konsep
Motivasi berprestasi adalah motivasi yang mendorong peserta didik untuk berbuat lebih baik dari apa yang pernah dibuat atau diraih sebelumnya maupun yang dibuat atau diraih orang lain.

Definisi Operasional
Motivasi berprestasi adalah motivasi yang mendorong seseorang untuk berbuat lebih baik dari apa yang pernah dibuat atau diraih sebelumnya maupun yang dibuat atau diraih orang lain yang dapat diukur melalui: (1) berusaha untuk unggul dalam kelompoknya, (2) menyelesaikan tugas dengan baik, (3) rasional dalam meraih keberhasilan, (4) menyukai tantangan, (5) menerima tanggung jawab pribadi untuk sukses, (6) menyukai situasi pekerjaan dengan tanggung jawab pribadi, umpan balik, dan resiko tingkat menengah.

CONTOH KISI-KISI PENYUSUNAN INSTRUMEN
VARIABEL MOTIVASI BERPRESTASI

INDIKATOR
NOMOR PERNYATAAN
JUMLAH
POSITIF
NEGATIF

1.  Berusaha unggul
2.  Menyelesaikan tugas 
    dengan baik
3. Rasional dalam meraih keberhasilan
4.  Menyukai tantangan
5. Menerima tanggung 
    jawab  pribadi untuk  
    sukses
6. Menyukai situasi
    pekerjaan dengan
    tanggung jawab pribadi, umpan balik, dan resiko tingkat menengah
1,2,3

7,8,9

13,14,15
19,20,21


25,26,27,28





33,34,35,36
4,5,6

10,11,12

16,17,18
22,23,24


29,30,31,32





37,38,39,40
6

6

6
6


8





8
Jumlah  Pernyataan
20
20
40

CONTOH BUTIR SOAL:
1.  Saya bekerja keras agar prestasi saya lebih baik baripada teman- teman.
a. Selalu  b. Sering  c. Kadang-kadang  d. Jarang  e. Tidak pernah
4.  Saya menghindari upaya mengungguli prestasi teman-teman.
a. Selalu  b. Sering  c. Kadang-kadang  d. Jarang  e. Tidak pernah
9.  Saya berusaha untuk memperbaiki kinerja saya pada masa lalu.
a. Selalu  b. Sering  c. Kadang-kadang  d. Jarang  e. Tidak pernah
12. Saya mengabaikan tugas-tugas sebelum ada yang mengatur
a. Selalu  b. Sering  c. Kadang-kadang  d. Jarang  e. Tidak pernah

SKOR JAWABAN

Skor Jawaban
a
b
c
d
e
Pernyataan Positif
5
4
3
2
1
Pernyataan Negatif
1
2
3
4
5

3.   Tes Kreativitas

Kreativitas merupakan proses berpikir yang dapat digunakan untuk memecahkan masalah atau menjawab pertanyaan secara benar dan bermanfaat (Devito, 1989 : 118). Disamping itu, kreativitas juga merupakan kemampuan berpikir divergen yang mencerminkan kelancaran, keluwesan dan orisinal dalam proses berpikir (Good Brophy, 1990 : 619). Ciri-ciri kreativitas berkaitan dengan imaginasi, orisinalitas, berpikir devergen, penemuan hal-hal yang bersifat baru, intuisi, hal-hal yang menyangkut perubahan dan eksplorasi (Coben, 1976 : 17). Desain tes kreativitas terdiri dari dua subtes yaitu dalam bentuk gambar dan verbal yang masing-masing bentuk memiliki ciri kelancaran (fluency). keluwesan (flexibility), keaslian (originality), dan elaborasi (elaboration) (Torrance, 1974 : 8).

Berdasarkan beberapa pendapat para ahli, definisi konsepsual kreativitas adalah kemampuan berpikir divergen. Adapun definisi operasionalnya adalah kemampuan berpikir divergen yang memiliki sifat (dapat diukur melalui) kelancaran, keluwesan, keaslian, elaborasi, dan hasilnya dapat berguna untuk keperluan tertentu. Dari hasil pendefinisian konstruk ini, kisi-kisinya dapat disusun seperti contoh berikut ini.

NO.
TES
INDIKATOR
NOMOR SOAL
1.




2.
VERBAL




Gambar
a.   Kelancaran
b.   Keluwesan
c.    Keaslian
d.   Keelaborasian

a.   Kelancaran
b.   Keluwesan
c.    Keaslian
d.   Keelaborasian

1,2,3,4,5,6,7,8,9,10
1,2,3,4,5,6,7,8,9,10
1,2,3,4,5,6,7,8,9,10
1,2,3,4,5,6,7,8,9,10

1,2,3,4,5,6,7,8,9,10
1,2,3,4,5,6,7,8,9,10
1,2,3,4,5,6,7,8,9,10
1,2,3,4,5,6,7,8,9,10

Penskoran untuk setiap indikator di atas mempergunakan skala 0-4. Misalnya untuk indikator “kelancaran”, skor : 4 = sangat lancar, 3 = cukup lancar, 2 = kurang lancar, 1 = tidak lancar, 0 = tidak menjawab. Untuk indikator “keluwesan”, skor: 4 = sangat luwes, 3 = cukup luwes, 2 = kurang luwes, 1 = tidak luwes, 0 = tidak menjawab, demikian pula seterusnya. Adapun contoh butir soal seperti berikut.


a.      Contoh Tes Verbal
§  Misalnya diberikan tiga gambar ikan dalam akuarium yang masing-masing dibedakan jumlah ikan dan makanannya. Pertanyaan: pilih salah satu gambar yang anda sukai dan jelaskan mengapa anda menyukainya! (waktu 3 menit).
§  Buatlah kalimat sebanyak-banyaknya dengan kata “pintar“!  (waktu 3 menit).
§  Tuliskan berbagai cara tikus masuk ke dalam rumah! (waktu 3 menit).

b.      Contoh Tes Gambar
§   Disajikan sebuah gambar yang belum selesai.
Pertanyaan: selesaikan rancangan gambar berikut dan berikan judul sesuai dengan selera Anda! (waktu 3 menit).
§   Disajikan sebuah sketsa gambar yang belum selesai.
Pertanyaan : selesaikan sketsa gambar berikut menurut kesukaan anda dan setelah selesai berikut judulnya! (waktu 3 menit).
§   Disajikan 6 buah titik A, B, C, D, E, dan F dengan posisi yang telah ditetapkan.Pertanyaan: Buatlah gambar dari 6 titik ini, kemudian berikan judulnya!.
§   Disajikan gambar sebuah segitiga dan tiga lingkaran yang letaknya mengelilingi segitiga. Pertanyaan: Tafsirkan makna gambar berikut! (waktu 5 menit).

4.   Tes Stres Belajar (menghadapi ujian)

Definisi konsep stres belajar adalah suatu kondisi kekuatan dan tanggapan sebagai interaksi dalam diri seseorang akibat dikonfrontasikan dengan suatu peluang, kendala, atau tuntutan belajar yang dikaitkan dengan apa yang sangat diinginkan dan hasilnya dipersepsikan sebagai suatu yang tidak pasti atau penting.

Definisi operasional stres belajar adalah suatu kondisi kekuatan dan tanggapan sebagai interaksi dalam diri seseorang akibat dikonfrontasikan dengan suatu peluang, kendala, atau tuntutan belajar yang dikaitkan dengan apa yang sangat diinginkan dan hasilnya dipersepsikan sebagai suatu yang tidak pasti atau penting yang dapat diukur melalui: (1) tanggapan psikologis seperti perasaan cemas, khawatir, takut, tidak senang, perasaan terganggu, dan lepas kendali, (2) tanggapan fisik seperti rasa lelah, jantung berdebar, rasa sakit, dan tekanan darah terganggu, dan (3) tanggapan perseptual seperti anggapan dan keyakinan. Berikut contoh kisi-kisi dan soal tes stres belajar.







NO.
DIMENSI
INDIKATOR
NOMOR SOAL
1.






2.





3.
Tanggapan
Psikologis terhadap kendala
dan tuntutan)



Tanggapan Fisik
(akibat tuntutan)




Tanggapan Persepsual
(terhadap pencapaian)
a. Perasaan cemas
b. Khawatir
c. Takut
d. Tidak senang
e. Perasaan terganggu
f.  Lepas Kendali

a. Rasa lelah
b. Jantung berdebar
c. Rasa sakit
d. Tekanan darah terganggu

a. Tanggapan dan keyakinan
1,2
3,4,5
6,7,8,9
10,11,12,13,14,15,16,
17,18,19,20,21,22,
23,24,25,26,27,28,29,30

31,32,33,34,
35,36,37,
38,39,40,
41,42,43,


44,45,46,47,48,49,50


Keterangan: nomor soal ganjil adalah pernyataan positif, nomor soal genap adalah pernyataan negatif.

Contoh soal stres belajar.

NO.
PERNYATAAN
SS
S
KK
J
TP
1.

6.
20.

36.

50.
Saya cemas terhadap kemampuan saya di sekolah.
Saya takut ranking saya turun.
Saya kehilangan nafsu makan setiap menghadapi tuntutan tugas.
Jantung saya berdebar-debar ketika sedang menyelesaikan tugas
…..






Keterangan :         SS = sangat sering, S = sering, KK = kadang-kadang,
                            J = jarang, TP = tidak pernah.

6.   Teknik Penskoran

Salah satu kegiatan dari penulisan butir soal yaitu teknik penskoran. Ada cara sederhana untuk menskor hasil jawaban peserta didik dari instrumen non-tes. Sebagai contoh, tes skala sikap di atas telah dikerjakan oleh salah satu peserta didik.

Nama peserta didik :  Susiana
    






NO.
PERNYATAAN
SS
S
TS
STS
1.

2.

3.
4.

5.

6.

7.
Mau menerima pendapat orang lain merupakan ciri bertoleransi.
Untuk mewujudkan cita-cita harus memaksakan kehendak
Saya suka menerima pendapat orang lain
Memilih teman di sekolah, saya utamakan mereka yang pandai saja
Kalau saya boleh memilih, saya akan selalu
mendengarkan usul-usul kedua orang tuaku.
Bekerja sama dengan orang yang berbeda
suku lebih baik dihindarkan.
……
X






X




X








X






X








X


Penjelasan: Dalam kisi-kisi tes, soal nomor 1-6 hanya mewakili indikator “mau menerima pendapat orang lain” dari dimensi “toleransi” untuk topik “sikap belajar peserta didik di sekolah”. Sebagai contoh penskorannya adalah seperti berikut ini.
1. Perilaku positif terdapat pada soal nomor 1, 3, 5 dengan pemberian skor:          SS= 4, S= 3, TS= 2, STS= 1.
2. Perilaku negatif terdapat pada soal nomor 2, 4, 6 dengan pemberian skor:         SS= 1, S= 2, TS= 3, STS= 4
3.  Skor yang harus diperoleh dalam perilaku positif minimal 3 x 4 = 12,
     Maksimal 3 x 5 = 15, (3 berasal dari 3 butir soal yang positif; 3 adalah skor S; 4 adalah skor SS).
4. Skor yang harus diperoleh dalam perilaku negatif minimal 3 x 2 = 6,
     Maksimal 3 x 1 = 3 (3 berasal  dari 3 butir soal yang negatif, 2 adalah skor S; 1 adalah  skor SS).
5.  Skor rata-rata: perilaku minimal adalah (12 + 6):2 = 9.
Perilaku maksimal adalah (15 + 3) : 2 = 9.
6.  Jadi skor Susiana di atas adalah seperti berikut ini.
     Perilaku positif 5+4+1 = 10, perilaku negatif 4+2+3 = 9.
     Skor akhir Susiana adalah (10+9):2 = 9,5 atau 10.

Skor Susiana 10, sedangkan ukuran perilaku positif minimal 12 dan maksimalnya adalah 15. Jadi sikap Susiana tentang “toleransi” khususnya mau menerima pendapat orang lain” dalam topik “sikap belajar peserta didik di sekolah” masih kurang. Artinya bahwa Susiana mempunyai sikap positif yang tidak begitu tinggi tentang “mau menerima pendapat orang lain”. Dia perlu pembinaan dan peningkatan khususnya mengenai perilaku ini.



VII. PENYUSUNAN BUTIR SOAL YANG MENUNTUT
PENALARAN TINGGI


A.  Pengertian
    
Dalam menulis butir soal, penulis soal memiliki kecenderungan untuk menulis butir-butir soal yang menuntut perilaku “ingatan”. Di samping mudah penulisan soalnya, materi yang hendak ditanyakan juga mudah diperoleh dari buku pelajaran. Untuk menuliskan butir soal yang menuntut penalaran tinggi, penulis soal biasanya merasa agak kesulitan dalam mengkreasinya. Disamping sulit menentukan perilaku yang diukur atau merumuskan masalah yang dijadikan dasar pertanyaan, juga uraian materi yang akan ditanyakan (yang menuntut penalaran tinggi) tidak selalu tersedia di dalam buku pelajaran. Bagaimana peserta didik bisa maju bila pola berpikirnya hanya ingatan? Oleh karena itu, ada beberapa cara yang dapat dijadikan pedoman oleh para penulis soal untuk menulis butir soal yang menuntut penalaran tinggi. Caranya adalah seperti berikut ini.

1.   Materi yang akan ditanyakan diukur dengan perilaku: pemahaman, penerapan, sintesis, analisis, atau evaluasi (bukan hanya ingatan). Perilaku ingatan juga diperlukan, namun kedudukannya adalah sebagai langkah awal sebelum peserta didik dapat memahami, menerapkan, menyintesiskan, menganalisis, dan mengevaluasi materi yang diperoleh dari guru. Uraian tentang perilaku ini dapat dilihat pada perilaku kognitif yang dikembangkan oleh Benjamin S. Bloom pada bab di depan.
2.   Setiap pertanyaan diberikan dasar pertanyaan (stimulus).
3.   Mengukur kemampuan berpikir kritis.
4.   Mengukur keterampilan pemecahan masalah.
5.   Penjelasan nomor 2, 3 dan 4 diuraikan secara rinci di  bawah ini.

B.  Dasar Pertanyaan (Stimulus).

Agar butir soal yang ditulis dapat menuntut penalaran tinggi, maka setiap butir soal selalu diberikan dasar pertanyaan (stimulus) yang berbentuk sumber/bahan bacaan seperti: teks  bacaan, paragrap, teks drama, penggalan novel/cerita/dongeng, puisi, kasus, gambar, grafik, foto, rumus, tabel, daftar kata/symbol, contoh, peta, film, atau suara yang direkam.
    
C.  Mengukur Kemampuan Berpikir kritis

Ada 11 kemampuan berpikir kritis yang dapat dijadikan dasar dalam menulis butir soal yang menuntut penalaran tinggi.


1.     Menfokuskan pada pertanyaan
Contoh indikator soal:
Disajikan sebuah masalah/problem, aturan, kartun, atau eksperimen dan hasilnya, peserta didik dapat menentukan masalah utama, kriteria yang digunakan untuk mengevaluasi kualitas, kebenaran argumen atau kesimpulan.

2.     Menganalisis argumen
Contoh indikator soal:
Disajikan deskripsi sebuah situasi atau satu/dua argumentasi, peserta didik dapat: (1) menyimpulkan argumentasi secara cepat, (2) memberikan alasan yang mendukung argumen yang disajikan, (3) memberikan alasan tidak mendukung argumen yang disajikan.

3.   Mempertimbangkan yang dapat dipercaya
     Contoh indikator soal:
     Disajikan sebuah teks argumentasi, iklan, atau eksperimen dan interpretasinya, peserta didik menentukan bagian yang dapat dipertimbangan untuk dapat dipercaya (atau tidak dapat dipercaya), serta memberikan alasannya.

4.   Mempertimbangkan laporan observasi
Contoh indikator  soalnya:
Disajikan deskripsi konteks, laporan observasi, atau laporan observer/reporter, peserta didik dapat mempercayai atau tidak terhadap laporan itu dan memberikan alasannya.

5.   Membandingkan kesimpulan
     Contoh indikator soal:
     Disajikan sebuah pernyataan yang diasumsikan kepada peserta didik adalah benar dan pilihannya terdiri dari: (1) satu kesimpulan yang benar dan logis, (2) dua atau lebih kesimpulan yang benar dan logis, peserta didik dapat membandingkan kesimpulan yang sesuai dengan pernyataan yang disajikan atau kesimpulan yang harus diikuti.

6.   Menentukan kesimpulan
     Contoh indikator soal:
     Disajikan sebuah pernyataan yang diasumsikan kepada peserta didik adalah benar dan satu kemungkinan kesimpulan, peserta didik dapat menentukan kesimpulan yang ada itu benar atau tidak, dan memberikan alasannya.

7.   Mempertimbangkan kemampuan induksi
     Contoh indikator soal:
     Disajikan sebuah pernyataan, informasi/data, dan beberapa kemungkinan kesimpulan, peserta didik dapat menentukan sebuah kesimpulan yang tepat dan memberikan alasannya.




8.   Menilai
     Contoh indikatornya:
     Disajikan deskripsi sebuah situasi, pernyataan masalah, dan kemungkinan penyelesaian masalahnya, peserta didik dapat menentukan: (1) solusi yang positif dan negatif, (2) solusi mana yang paling tepat untuk memecahkan masalah yang disajikan, dan dapat memberikan alasannya.

9.   Mendefinisikan Konsep
Contoh indikator soal:
Disajikan pernyataan situasi dan argumentasi/naskah, peserta didik dapat mendefinisikan konsep yang dinyatakan.

10. Mendefinisikan asumsi
     Contoh indikator soal
     Disajikan sebuah argumentasi, beberapa pilihan yang implisit di dalam asumsi, peserta didik dapat menentukan sebuah pilihan yang tepat sesuai dengan asumsi.

11. Mendeskripsikan
     Contoh indikator soal:
     Disajikan sebuah teks persuasif, percakapan, iklan, segmen dari video klip, peserta didik dapat mendeskripsikan pernyataan yang dihilangkan.

D.  Mengukur Keterampilan Pemecahan Masalah

Ada 17 keterampilan pemecahan masalah yang dapat dijadikan dasar dalam menulis butir soal yang menuntut penalaran tinggi.

1.   Mengidentifikasi masalah
     Contoh indikator soal:
Disajikan deskripsi suatu situasi/masalah, peserta didik dapat mengidentifikasi masalah yang nyata atau masalah apa yang harus dipecahkan.

2.   Merumuskan masalah dalam bentuk pertanyaan
     Contoh indikator soal:
     Disajikan sebuah pernyataan yang berisi sebuah masalah, peserta didik dapat merumuskan masalah dalam bentuk pertanyaan.

3.   Memahami kata dalam konteks
     Contoh indikator soal:
     Disajikan beberapa masalah yang konteks kata atau kelompok katanya digarisbawahi, peserta didik dapat menjelaskan makna yang berhubungan dengan masalah itu dengan kata-katanya sendiri.


4.   Mengidentifikasi masalah yang tidak sesuai
     Contoh indikator masalah:
     Disajikan beberapa informasi yang relevan dan tidak relevan terhadap masalah, peserta didik dapat mengidentifikasi semua informasi yang tidak relevan.

5.   Memilih masalah sendiri
     Contoh indikator soal:
     Disajikan beberapa masalah, peserta didik dapat memberikan alasan satu masalah yang dipilih sendiri, dan menjelaskan cara penyelesaiannya.

6.   Mendeskripsikan berbagai strategi
     Contoh indikator soal:
     Disajikan sebuah pernyataan masalah, peserta didik dapat memecahkan masalah ke dalam dua cara atau lebih, kemudian menunjukkan solusinya ke dalam gambar, diagram, atau grafik.

7.   Mengidentifikasi asumsi
     Contoh indikator soal:
     Disajikan sebuah pernyataan masalah, peserta didik dapat memberikan solusinya berdasarkan pertimbangan asumsi untuk saat ini dan yang akan datang.

8.   Mendeskripsikan masalah
     Contoh indikator soal:
     Disajikan sebuah pernyataan masalah, peserta didik dapat menggambarkan sebuah diagram atau gambar yang menunjukkan situasi masalah.

9.   Memberi alasan masalah yang sulit
     Contoh indikator soal:
     Disajikan sebuah masalah yang sukar dipecahkan atau informasi pentingnya dihilangkan, peserta didik dapat menjelaskan mengapa masalah ini sulit dipecahkan atau melengkapi informasi pentingnya dihilangkan.

10. Memberi alasan solusi
     Contoh indikator soal:
     Disajikan sebuah pernyataan masalah dengan dua atau lebih kemungkinan solusinya, peserta didik dapat memilih satu solusi yang paling tepat dan memberikan alasannya.

11. Memberi alasan strategi yang digunakan
     Contoh indikator soal:
     Disajikan sebuah pernyataan masalah dengan dua atau lebih strategi untuk menyelesikan masalah,  peserta didik dapat memilih satu strategi yang tepat untuk menyelesaikan masalah itu dan memberikan alasannya.



12. Memecahkan masalah berdasarkan data dan masalah
     Contoh indikator soal:
     Disajikan sebuah cerita, kartun, grafik atau tabel dan sebuah pernyataan masalah, peserta didik dapat memecahkan masalah dan menjelaskan prosedur yang digunakan untuk menyelesaikan masalah.

13. Membuat strategi lain
     Contoh indikator soal:
     Disajikan sebuah pernyataan masalah dan satu strategi untuk menyelesaikan masalahnya, peserta didik dapat menyelesaikan masalah itu dengan menggunakan strategi lain.

14. Menggunakan analogi
     Contoh indikator soal:
     Disajikan sebuah pernyataan masalah dan strategi penyelesaiannya, peserta didik dapat: (1) mendeskripsikan masalah lain (analog dengan masalah ini) yang dapat diselesaikan dengan menggunakan strategi itu, (2) memberikan alasannya.

15. Menyelesaikan secara terencana
     Contoh indikator soal:
     Disajikan sebuah situasi masalah yang kompleks, peserta didik dapat menyelesaikan masalah secara terencana mulai dari input, proses, output, dan outcomenya.

16. Mengevaluasi kualitas solusi     
Contoh indikator soal:
     Disajikan sebuah pernyataan masalah dan beberapa strategi untuk menyelesaikan masalah, peserta didik dapat: (1) menjelaskan dengan menerapkan strategi itu, (2) mengevaluasinya, (3) menentukan strategi mana yang tepat, (4) memberi alasan mengapa strategi itu paling tepat dibandingkan dengan strategi lainnya.

17. Mengevaluasi strategi sistematika
     Contoh indikator soal:
     Disajikan sebuah pernyataan masalah, beberapa strategi pemecahan masalah dan prosedur, peserta didik dapat mengevaluasi strategi pemecahannya berdasarkan prosedur yang disajikan.



VIII. PERAKITAN BUTIR SOAL


A.  Pengertian

Merakit soal adalah menyusun soal yang siap pakai menjadi satu perangkat/paket tes atau beberapa paket tes paralel. Dasar acuan dalam merakit soal adalah tujuan tes dan kisi-kisinya. Untuk memudahkan pelaksanaannya, guru harus memperhatikan langkah-langkah perakitan soal.

Dalam bab ini juga diuraikan penskoran jawaban soal. Pemeriksaan terhadap jawaban peserta didik dan pemberian angka merupakan langkah untuk mendapatkan informasi kuantitatif dari masing-masing peserta didik. Pada prinsipnya, penskoran soal harus diusahakan agar dapat dilakukan secara objektif. Artinya, apabila penskoran dilakukan oleh dua orang atau lebih yang sama tingkat kompetensinya, akan menghasilkan skor atau angka yang sama, atau jika orang yang sama mengulangi proses penskoran akan dihasilkan skor yang sama.

B.  Langkah-langkah Perakitan Soal

Para pendidik dapat merakit soal menjadi suatu paket tes yang tepat, apabila para pendidik memperhatikan langkah-langkah perakitan soal. Berikut langkah-langkah perakitan soal.
1.     Mengelompokkan soal-soal yang mengukur kompetensi dan materi yang sama, kemudian soal-soal itu ditempatkan dalam urutan yang sama.
2.     Memberi nomor urut soal didasarkan nomor urut soal dalam kisi-kisi.
3.     Mengecek setiap soal dalam satu paket tes apakah soal-soalnya sudah bebas dari kaidah “Setiap soal tidak boleh memberi petunjuk jawaban terhadap soal yang lain”.
4.     Membuat petunjuk umum dan khusus untuk mengerjakan soal.
5.     Membuat format lembar jawaban.
6.     Membuat lembar kunci jawaban dan petunjuk penilaiannya.
7.     Menentukan/menghitung penyebaran kunci jawaban (untuk bentuk pilihan ganda), dengan menggunakan rumus berikut.


                                                      Jumlah soal
Penyebaran kunci jawaban  =   ¾¾¾¾¾¾¾¾¾¾¾   +  3
                                              Jumlah pilihan jawaban

 
8.   Menentukan soal inti (anchor items) sebanyak 10 % dari jumlah soal dalam satu paket. Soal inti ini diperlukan apabila soal yang dirakit terdiri dari beberapa tes paralel. Tujuannya adalah agar antar tes memiliki keterkaitan yang sama. Penempatan soal inti dalam paket tes diletakkan secara acak.


9.   Menentukan besarnya bobot setiap soal (untuk soal bentuk uraian)
     Bobot soal adalah besarnya angka yang ditetapkan untuk suatu butir soal dalam perbandingan (ratio) dengan butir soal lainnya dalam satu perangkat tes. Penentuan besar kecilnya bobot soal didasarkan atas tingkat kedalaman dan keluasan materi yang ditanyakan atau kompleksitas jawaban yang dituntut oleh suatu soal. Untuk mempermudah perhitungan/penentuan nilai akhir, jumlah bobot keseluruhan pada satu perangkat tes uraian ditetapkan 100. Perakit soal harus dapat mengalokasikan besarnya bobot untuk setiap soal dari bobot yang telah ditetapkan. Bobot suatu soal yang sudah ditetapkan pada satu perangkat tes dapat berubah bila soal tersebut dirakit ke dalam perangkat tes yang lain.

10. Menyusun tabel konversi skor
    
Tabel konversi sangat membantu para pendidik pada saat menilai lembar jawaban peserta didik. Terutama bila dalam satu tes terdiri dari dua bentuk soal, misal bentuk pilihan ganda dan uraian atau tes tertulis dan tes praktik. Skor dari soal bentuk pilihan ganda tidak dapat langsung digabung dengan skor uraian. Hal ini karena tingkat keluasan dan kedalaman materi yang ditanyakan atau penekannya dalam kedua bentuk itu tidak sama. Nilai keduanya dapat digabung setelah keduanya ditentukan bobotnya. Misalnya, untuk soal bentuk pilihan ganda (45 soal dengan skor maksimum 45) bobotnya 60 % dan bentuk uraian (5 soal dengan skor maksimum 20) bobotnya 40 %. Untuk menentukan skor jadinya adalah skor perolehan peserta didik yang bersangkutan dibagi skor maksimum kali bobot. Tabel konversi ini merupakan tabel konversi sederhana atau klasik.

     Untuk memudahkan penggunaan tabel konversi, kita ingat proses penyamaan skala atau konversi alat ukur suhu yang didasarkan pada konversi rumus yang sudah standar, misal skala pengukuran: Celcius (titik awal 00  titik didih 1000). Reamur (titik awal 00  titik didih 800), Fahrenheit (titik awal 320  titik didih 2120 ), Kelvin (titik awal 2370  titik didih 3730). Masing-masing skala pengukuran ini bukan untuk dibandingkan atau sebagai penentu kelulusan atau sebagai pengatrol nilai, namun masing-masing memiliki skala sendiri-sendiri. Keberadaan skala ini tidak bisa dikatakan bahwa orang yang menggunakan skala pengukuran Celcius dan Reamur akan selalu dirugikan karena keduanya memiliki nilai 0 sampai dengan 4 (bila acuan kriterianya 4,01), sedangkan orang yang menggunakan Fahrenheit dan Kelvin selalu diuntungkan karena titik awalnya 32 dan 237. Demikian pula dengan konversi nilai dalam ulangan atau ujian. Guru atau panitia ujian mau menggunakan konversi yang mana. Dalam ilmu pengukuran, konversi  dapat disusun melalui konversi biasa dan konversi yang terkalibrasi dengan model respon butir. Apabila UN atau US sudah mempergunakan konversi model respon butir, semua nilai peserta didik harus mengacu pada model konversi ini, tidak membandingkan dengan konversi  lain/biasa.

Konversi biasa (model pengukuran secara klasik) penggunaannya biasa digunakan guru di sekolah, yaitu untuk memperoleh nilai murni peserta didik. Bila menghendaki skor maksimum 10 digunakan rumus (skor perolehan: skor maksimum) x 10 dan bila menggunakan skor maksimum 100 digunakan nilai konversi dengan rumus (skor perolehan: skor maksimum) x 100 atau bila menggunakan skor maksimum 4 digunakan nilai konversi dengan rumus (skor perolehan : skor maksimum) x 4. Konversi seperti ini memiliki dua kelemahan, pertama adalah bahwa setiap butir soal dihitung memiliki tingkat kesukaran yang sama. Artinya peserta didik manapun yang menjawab benar 40 dari 50 butir soal dalam satu tes (terserah nomor butir soal berapa yang benar, apakah nomor 1 benar, nomor 2 salah, nomor 3 benar atau sebaliknya dan seterusnya, yang penting benar 40 soal) peserta didik yang bersangkutan akan memperoleh nilai 8 (untuk konversi skor maksimum 10), 80 (untuk konversi skor maksimum 100) 0,2 (untuk konversi skor maksimum 4). Kelemahan kedua adalah bahwa tingkat kesukaran butir soal tidak ditempatkan/dikalibrasi pada skala yang sama. Artinya bahwa butir-butir soal tidak disusun berdasarkan tingkat kesukarannya dan kemampuan peserta didik sehingga model konversi ini belum bisa menentukan nilai murni peserta didik yang sebenarnya. Seharusnya hanya peserta didik yang memiliki kemampuan tinggi (misal pada skala kemampuan 1, kemampuan 2, kemampuan 3) yang dapat menjawab benar semua soal dalam tes pada skala yang bersangkutan atau tingkat kesukaran butir (mudah, sedang, sukar) sesuai dengan kemampuan peserta didik yang bersangkutan. Apabila sekolah mempergunakan konversi biasa seperti ini justru akan merugikan peserta didik yang memiliki kemampuan lebih tinggi.

Konversi yang terkalibrasi adalah konversi nilai yang disusun berdasarkan kemampuan peserta didik dari tingkat kesukaran butir soal yang terkalibrasi dengan model Rasch (Item Response Theory). Untuk memahami model terkalibrasi ini diperlukan pengertian berikut. Setiap jumlah jawaban yang benar soal, misal 1 sampai dengan 50, masing-masing butir memiliki tingkat kemampuan (untuk teori klasik tidak ada). Tingkat kemampuan ini diperoleh dari rumus model Rasch P= (e (F-d)) : (1 + e (F-d): P adalah peluang menjawab benar satu butir soal. E = 2,7183, F = tingkat kemampuan peserta didik, dan d =  tingat kesukaran butir soal. Kemudian nilai abilitas (misal -3,00 sampai dengan +3,00) ditransformasi ke dalam skala 0-10, 0-100, atau 0-4. Misal untuk dapat ditransformasi ke dalam skala 0-100 diperlukan rata-rata 50 dan standar deviasi 5, sehingga untuk membuat tabel konversi mempergunakan rumus Y=50+5X. Y=nilai peserta didik dan X adalah nilai abilitas. Dengan rumus inilah konversi terkalibrasi dapat disusun. Jadi dalam konversi yang terkalibrasi skalanya didasarkan  dua hal penting, yaitu tingkat kesukaran dan tingkat kemampuan peserta didik. Soal ditempatkan pada tingkat kesukaran dan kemampuan peserta didik yang telah disamakan skalanya. Bila tes sudah disamakan skalanya, siapapun yang mengambil tes pada paket yang mudah, sedang, dan sukar, masing-masing tes masih berada pada skala yang sama dan bisa dibandingkan. Oleh karena itu, tes yang diberikan kepada peserta didik sudah selayaknya harus sesuai dengan tingkat kemampuan peserta didik. Apabila kemampuan peserta didik dalam memahami materi yang diajarkan guru itu tinggi (sudah tercapai target kompetensinya), peluang menjawab benar soal pasti tinggi. Namun sebaliknya bila kemampuan peserta didik dalam memahami materi yang diajarkan guru itu rendah (belum tercapai target kompetensinya), peluang menjawab benar soal pasti rendah. Apakah tesnya berbentuk tes lisan, tertulis (soalnya berbentuk pilihan ganda, uraian, isian, dll.), atau perbuatan. Model Rasch merupakan salahsatu model dalam teori respon butir yang menitikberatkan pada parameter tingkat kesukaran butir soal. Model ini telah digunakan di berbagai kalangan seperti untuk sertifikasi ujian kedokteran di USA, sejumlah program penilaian sekolah di USA, program penilaian di Australia, studi matematik dan science internasional ketiga, National School English Literacy Survey di Australia, equating tes English di Provinsi Guandong Cina, dan beberapa tes diagnostic. Model ini banyak digunakan orang sebagai pendekatan analitik standard untuk kalibrasi instrumen karena modelnya sederhana, elegant, hemat, atau efektif dan efisien.

Konversi nilai berdasarkan Model Rasch memiliki keunggulan bila dibandingkan dengan konversi nilai berdasarkan model pengukuran secara klasik. Keterbatasan model pengukuran secara klasik adalah seperti berikut. (1) Tingkat kemampuan dalam teori klasik adalah “true score”. Jika tes sulit artinya tingkat kemampuan peserta didik rendah. Jika tes mudah artinya tingkat kemampuan peserta didik tinggi. (2) tingkat kesukaran soal didefinisikan sebagai proporsi peserta didik dalam kelompok yang menjawab benar soal. Mudah/sulitnya butir soal tergantung pada kemampuan peserta didik yang dites dan keberadaan tes yang diberikan. (3) Daya pembeda, reliabilitas, dan validitas soal/tes didefinisikan berdasarkan grup peserta didik. Artinya bahwa konversi nilai berdasarkan teori tes klasik memiliki kelemahan, yaitu (1) tingkat kesukaran dan daya pembeda tergantung pada sampel; (2) penggunaan metode dan teknik untuk desain dan analisis tes dengan memperbandingkan kemampuan peserta didik pada pembagian kelompok di atas, tengah, bawah. Meningkatnya validitas skor tes diperoleh dari tingkat kesukaran tes dihubungkan dengan tingkat kemampuan setiap peserta didik; (3) konsep reliabilitas tes didefinisikan dari istilah tes paralel; (4) tidak ada dasar teori untuk menentukan bagaimana peserta didik memperoleh tes yang sesuai dengan kemampuan peserta didik; (5) Standar kesalahan pengukuran hanya berlaku untuk seluruh peserta didik. Disamping itu, tes klasik telah gagal memberi kesimpulan yang tepat terhadap beberapa masalah testing seperti: desain tes (statistik butir klasik tidak memberitahu penyusun tes tentang lokasi maksimum daya pembeda butir pada skala skor tes), identifikasi item bias, dan equating skor tes (tidak suksesnya pada item bias dan equating skor tes karena sulit menentukan kemampuan yang sebenarnya di antara kelompok).  Kelebihan model Rasch atau teori respon butir secara  umum adalah bahwa: (1) model ini tidak berdasarkan grup dependen, (2) skor peserta didik dideskripsikan bukan tes dependen, (3) model ini menekankan pada tingkat butir soal bukan tes, (4) model ini tidak memerlukan paralel tes untuk menentukan reliabilitas tes, (5) model ini merupakan suatu model yang memberikan suatu pengukuran ketepatan untuk setiap skor tingkat kemampuan. Tujuan utama teori respon butir adalah memberikan invariant pada statistik soal dan estimasi kemampuan. Oleh karena itu, kelebihan teori respon butir adalah: (1) responden dapat diskor pada skala yang sama, (2) skor responden dapat dibandingkan pada dua atau lebih bentuk tes yang sama, (3) semua bentuk soal memperoleh perlakuan melalui cara yang sama, (4) tes dapat disusun sesuai keahlian berdasarkan tingkat kemampuan yang akan dites.







IX. PROSEDUR PEMERIKSAAN LEMBAR JAWABAN,
PERHITUNGAN NILAI AKHIR, DAN PENYETARAAN TES


A.  Prosedur Pemeriksaan Lembar Jawaban

Dalam melakukan pemeriksaan lembar jawaban peserta didik sangat ditentukan pada bentuk soalnya. Untuk pemeriksaan bentuk pilihan ganda, pelaksanaannya sangat mudah. Lembar jawaban peserta didik  dicocokkan pada lembar kunci jawaban yang sudah disiapkan. Bila jawaban peserta didik  sesuai dengan kunci jawaban, maka jawabannya diberi skor 1, bila tidak sesuai diberi skor 0. Setelah selesai menskor seluruh soal, maka baru dihitung berapa jumlah soal yang benar dan berapa jumlah soal yang tidak benar. Jumlah skor benar itulah yang merupakan skor perolehan (skor mentah) dari soal bentuk pilihan ganda yang diperoleh warga belajar/peserta didik yang bersangkutan.

Untuk melakukan pemeriksaan soal-soal bentuk uraian termasuk tes perbuatan, sangat diperlukan kesabaran dan ketelitian yang handal. Untuk memudahkan pelaksanaannya, ada beberapa kaidah atau prosedur pemeriksaannya.

1.   Gunakanlah pedoman penskoran yang telah disiapkan sebagai acuan dalam memeriksa jawaban peserta didik.
2.   Bacalah jawaban peserta didik kemudian bandingkan dengan jawaban ideal seperti yang ada pada pedoman penskoran.
3.   Berikan skor sesuai dengan tingkat kelengkapan dan kesempurnaan jawaban peserta didik.
4.   Periksalah seluruh lembar jawaban peserta didik pada nomor yang sama, baru dilanjutkan ke pemeriksaan nomor berikutnya. Hal ini perlu dilakukan guna menjaga konsistensi dan objektivitas pemberian skor.
5.   Hindari faktor-faktor yang tidak sesuai/relevan dalam pemberian skor seperti bagus tidaknya tulisan dan bersih tidak kertas jawaban, kecuali kalau memang kedua aspek itu yang akan diukur, seperti mata pelajaran bahasa.

Setelah selesai memeriksa lembar jawaban peserta didik, langkah berikutnya adalah memberikan skor pada lembar jawaban itu. Pemberian skor untuk bentuk soal pilihan ganda sangat mudah dan telah dijelaskan diatas, sedangkan pemberian skor untuk bentuk soal uraian sangat ditentukan oleh bobot masing-masing soalnya. Bila setiap butir soal sudah selesai diskor,  hitunglah jumlah skor perolehan peserta didik pada setiap nomor butir soal. Kemudian lakukan perhitungan nilai dengan menggunakan rumus seperti berikut ini.






                             Skor perolehan peserta didik
Nilai Setiap Soal =  ¾¾¾¾¾¾¾¾¾¾¾¾¾   X bobot
                             Skor maksimum butir soal ybs


Contoh

Soal Uraian
Bobot Soal
Skor Maksimum
Skor perolehan
Raufan
Perhitungannya
1
2
3
4
5
20
10
30
10
30
8
5
10
5
10
7
4
9
5
7
(7:8)   x 20 = 17,50
(4:5)   x 10 =  8,00
(9:10) x 30 = 27,00
(5:5)   x 10 = 10,00
(7:10) x 30 = 21,00

Nilai soal uraian Raufan adalah = 83,50

Untuk memudahkan dalam pelaksanaan penskoran, maka setiap butir soal uraian dibuatkan perhitungan skornya yang dihitung dari skor maksimumnya.

Contohnya seperti berikut ini.

a.  Skor soal nomor 1 ( contoh: 1:8 x 20 = 2,5; 2:8x20=5; dst. Penjelasan : 8=skor maksimum soal nomor 1;20=bobot soal nomor 1)

Skor Perolehan
Nilai

Skor Perolehan
Nilai

Skor Perolehan
Nilai
1
2
2,5
5

4
5
  10
 12,5

7
8
17,5
20
3
7,5

6
15




b.  Skor soal nomor 2 ( Skor maksimum 5; bobot soal 10 )

Skor Perolehan
Nilai

Skor Perolehan
Nilai
1
2
3
2
4
6

4
5
8
10




c.   Skor  Soal No 3 (skor maximum 10, bobot soal 30)

Skor Perolehan
Nilai

Skor Perolehan
Nilai

Skor Perolehan
Nilai
1
2
3
4
3
6
9
12

6
7
8
9
18
21
24
27

10
30










d.  Skor soal no. 4  (Skor Maksimum 5, bobot soal 10)

Skor Perolehan
Nilai

Skor Perolehan
Nilai
1
2
3
2
4
6

4
5
8
10




e.  Skor soal no. 5 ( Skor Maksimum 10, bobot soal 30 )

Skor Perolehan
Nilai

Skor Perolehan
Nilai

Skor Perolehan
Nilai
1
2
3
4
3
6
9
12

6
7
8
9
18
21
24
27

10
30









Berdasarkan perhitungan skor yang telah dibuat, penilaian ke lima butir soal di atas dapat doskor secara mudah pada setiap peserta didik. Contoh seperti berikut ini

No
Nama peserta didik
Nomor  Soal
Nilai
(Jumlah N)
1
2
3
4
5
SP
N
SP
N
SP
N
SP
N
SP
N
1
2
3
4
5
Raufan
dst
7
7,5
4
8
9
27
5
10
7
21
83,50

Keterangan : SP  = Skor Perolehan.  N = Nilai

B.  Perhitungan Nilai Akhir

Setiap jenis tes (tertulis, perbuatan, sikap) dalam perhitungan nilai akhir hendaknya berdiri sendiri, jangan digabung karena setiap jenis tes memiliki karakteristik sendiri-sendiri. Berikut ini diberikan contoh perhitungan nilai akhir untuk tes tertulis.
Contoh Perhitungan Nilai Akhir

1.  Tes Tertulis

Bentuk
Soal
Jumlah
Soal
Bobot
Nomor Soal
Skor Maksimum
Skor
Fauria
Perhitungan
PG
Isian

35
10
70 %
1-35
1-10
Jumlah=
35
10
45
30
8
38
38:45x10=8,44
Uraian
5
30 %
1
2
3
4
5
Jumlah=
3
4
9
6
6
28
3
2
8
4
5
22
22:28x10=7,86

Nilai Fauria untuk PG, Isian dan Uraian   = ( 70 % x 8,44 ) + ( 30 % x 7,86 )
                                                    = 5,91 + 2,36
                                                    = 8,27

2.   Nilai Tes Praktik

Misal pada tes praktik dengan skor maksimum 23, Fauria dapat menjawab 20 perintah dengan benar. Skor yang diperoleh Fauria adalah 20 . Nilai tes praktiknya = 20 : 23 x 10= 8,70


X. PENGEMBANGAN BANK SOAL



A.      Pengertian

Bank soal bukan hanya bank pertanyaan, pool soal, kumpulan soal, gudang soal, atau perpustakaan soal (Millman and Arter, 1984: 315); melainkan bank yang butir-butir soal terkalibrasi (Wright and Bell, 1984: 331) dan disusun secara sistematis agar memudahkan penggunaan kembali dan manfaat soalnya. Untuk itu butir-butir soal di dalam bank soal harus tersedia untuk setiap standar kompetensi dan kompetensi dasar pada setiap mata pelajaran, tingkat kesukaran butir soal, dan jenjang pendidikan. Hal ini sangat diperlukan untuk memiliki suatu tujuan yang jelas sebagai panduan dan pengembangan bank soal.


B.      Tujuan Pengembangan Bank Soal

Secara implisit, tujuan pengembangan bank soal juga diperlukan untuk penilaian mutu bank soal itu sendiri. Apakah bank soal dapat berisi butir-butir soal yang sesuai dengan tujuan yang terkandung di dalamnya atau tidak, karena bank soal sangat berguna bagi guru, psychometrik, kurikulum, dan peserta didik (Wright and Bell, 1984: 333-335). Oleh karena itu, tujuan utama bank soal adalah untuk merakit/mengonstruksi tes dan pengadaan kesesuaian ujian baik untuk tujuan penilaian ulangan harian maupun untuk tujuan penilaian pada ulangan akhir semester, sehingga soalnya terjamin (Hambleton and Swaminathan, 1985: 255-256).


C.      Prosedur Pengembangan Bank Soal

Butir-butir soal yang akan disimpan di dalam bank soal harus diproses melalui prosedur pengembangan bank soal. Prosedur pengembangan butir soal yang digunakan di dalam pengembangan bank soal adalah :
(1) Penyusunan kisi-kisi, (2) Penulisan butir soal, (3) Revisi/validasi butir, (4) Perakitan tes, (5) Uji coba tes, (6) Memasukkan data, (7) Analisis butir soal secara klasik dan IRT, (8) Menyeleksi butir untuk bank soal yang terkalibrasi.

Setiap butir soal dimasukkan berdasarkan : tingkat sekolah, tipe sekolah, jurusan, standar kompetensi dan kompetensi dasar, tujuan pembelajaran, perilaku yang diukur/taxonomi, format soal, tingkat kesulitan butir soal, tingkat kemampuan peserta didik, semester, statistik, tahun.

Dalam mengolah butir-butir soal dalam bank soal diperlukan perangkat lunak yang tepat. Secara singkat, perangkat lunak yang digunakan memiliki tiga kelebihan, yaitu : (1) Kemudahan pada penyimpanan dan pencarian kembali, (2) Kesanggupan untuk memunculkan kembali grafik butir-butir secara tepat, (3) Kelengkapan susunan data butir soal.

Gagasan lain yang perlu dipertimbangkan pada setiap sekolah adalah adanya konsep bank tes. Gunanya adalah untuk menyusun beberapa paket paralel tes kecil berdasarkan unit-unit pembelajaran, seperti ulangan harian, ulangan bersama setiap selesai mengerjakan kompetensi minimal pada beberapa standar kompetensi/kompetensi dasar, ulangan tengah semester, atau ulangan akhir semester.

Para guru dapat memilih tes itu untuk penilaian kelas. Hal ini tidak hanya dapat menghemat waktu bagi guru, model tes seperti ini dapat diharapkan memiliki mutu yang lebih baik. Karena kurikulum di Indonesia adalah standar, maka model seperti ini sangat tepat.

Proses pengembangan bank soal dapat dilihat pada Gambar 1 berikut ini.


 
         
         






         






















          Gambar 1 : Pengembangan Bank Soal (Wright and Bell, 1984: 336)

DAFTAR PUSTAKA



Aiken, Lewis R. (1994). Psychological Testing and Assessment,(Eight Edition), Boston: Allyn and Bacon.

Anastasi. Anne and Urbina, Susana. (1997). Psicoholological Testing. (Seventh Edition). New Jersey: Prentice-Hall, Inc.

Assessment Systems Corporation. (1984). User's Manual for the MicroCat Testing System, USA.

Atkinson, John W. (1978). Personality Motivation   and Achievement. Sashington. Hemisphere Publishing Corporation.

Bejar, Isaac I. (1983). Introduction to Item Response Theory and Their- Assumptions. Hambleton, Ronald K. (Editor). Applications of Item Response Theory. Canada: Educational Research Institute of British Columbia.

Bruning, James L. and Kintz, B. L. (1987). Computational Handbook of Statistics. Third Edition. Illinois: Scott, Foresman and Company.

Cohen, Louis. (1976). Educational Research in Classrooms and Schools: A Manual of Materials and Methods. London: Harper & Row Publishers.

Cohen, Ronald Jay; Swerdlik, Mark E. and Smith, Douglas K. (1992). Psychological Testing and Assessment: An Introduction to Test and Measurement, second edition. California: Mayfield Publishing Company.

Crites, John O. (1969). Vocational Psychology. New York: McGraw Hill Book Company

Crocker, L. & Algina, J. (1986). Introduction to Classical and Modern Test, Theory. New York: Holt, Rinehart and Winston, Inc.

Crow, Lester D. and Crow, Allice. (1984). Educattional Psychology. New York: American Book Company.

Czikszentmihaly, Mihaly. (1996). Creativity: Flaw and The Psychology of Discovery and Invention. New York: Harper Collins Publisher.

David and Steinberg, Lynne. (1997). A Response Model for Multiple-Choice Items dalam Wim J. van der Linden and Ronald K. Hambleton (Editor). Handbook of Modern Item Response Theory. New York: Springer-Verlag.

Devito, Affred. (1990). Creative Wellstrings for Science Teaching. (Second Edition). USA.

Ebel, Robert L. and Frisbie, David A. (1991). Essentials of Education Measurement. New Jersey: Prentice Hall.

Gable. Robert K. (I986). Instrument Development in the Affective Domain Boston: Kluwer-Nijhoff Publishing.

Glass, Gene V. and Stanley, Julian C. (1970). Statistical Methods in Education and Psychology. New Jersey: Prentice Hall, Inc.

Good, Thomas L. and Brophy, Jere E. (1990) Educational Psychology. New York: Longman.

Gonczi, Andrew (Editor). (1992). Developing a Competent Workforce. Adelaide: National Centre of Vocational Education Research Ltd.

Hair, J. F.; Anderson, R. E., Tatham, R. L., and Black, W. C. (1998). Multivariate Data, Analysis. New Jersey. Prentice-I-lall International, Inc.

Haladyna, Thomas M. (1994). Developing and Validating Multiple-choice Test Items. New Jersey: Lawrence Erlbaum Associates, Publisher.

Hambleton, Ronald K. and Swaminathan, Hariharan. (1985). Item Response Theory, Principles, and Aplications. Boston: Kluwer. Nijhoff Publishing.

Hambleton, R.K. ; Swaminathan, H. ; and Rogers, H.J. (1991). Fundamentals of Item Response Theory. Newbury Park: Sage Publications.

Hambleton, Ronald K (1993). Principles and Selected Applications of Item Response Theory. In Linn, Robert L. (Editor). Educational Measurement. Third Edition. Phoenix: American Council on Education, Series on Higher Education Oryx Press.

Harman, Harry H. (1970). Modern Factor Analysis (Third Edition Revised). Chicago: The University of Chicago Press.

Holland. PW & Thaycr. DT (1988). Test Validity. New Jersey: Lawrence Erlbaum Associates, Publishers.

Izard, John. (1995). Trial Testing and Item Analysis (Module (A). Australia: Australian Council Ibr Pdtrcallonal Research, UNESCO.

Joreskog, Karl and Sorboni, Dag. (1996). PRELIS2: User’s Reference Guide. Chicago: Scientific Software Internasional, Inc.

Kerlinger, Fred N (1993). Asas-asas Penelitian Behavioral (Edisi Ketiga), diterjemahkan Simatupang L. R. Yogyakarta: Gadjah Mada University Press.

Lewy, Arieh (Editor). (1977). International Institute for Educational Planning: Handbook of Curriculum Evaluation. Paris: UNESCO.

Linn, Robert L. and Gronlund, Norman E. (1995). Measurement and Assessment in Teaching. (Seventh Edition). Ohio: Prentice-Hall, Inc.

Lord, F.M. (1952). A Theory of Test Scores. USA: Educational Testing Service.

McDonald, Roderich P. (1999). Test Theory: A Unified Treatment. New Jersey: Larvrence Erbaum Associates, Publishers.

Messick, Samuel. (1993). “Validity”, Educational Measurement, Third Edition, ed. Robert L. Linn. New York: American Council on Education and Macmillan Publishing Company, A Division of Macmillan, Inc.

Millman, Jason and Arter, Judith A. Issues in Item Banking. In Journal of Educational Measurement, Volume 21, No. 4, Winter 1984, p. 315.

Millman, Jason and Greene, Jennifer. (1993).The Spesification and Development of Tests of Achiievement and Ability in Robert L. Lin (Editor). Educational Measurement, Third Edition. Phoenix: American Council on Education, Series on Higher Education Oryx Press.

Mueller, Daniel J. (1986). Measuring Social Attitudes: A Handbook for Researchers and Practitioners. New York. Teacher College, Columbia University

Nitko, Anthony J. (1996). Educational Assessment of Students, Second Edition. Ohio: Merrill an imprint of Prentice Hall Englewood Cliffs.

Norusis, Marija J. (1993). SPSS for Windows Base System user's Guide, Release 6.0. Chicago: Marketing Departernent SPSS Inc.

Nunally, Jum C. (1978). Psychometric Theory, Second Edition. New Delhi: Tata McGraw­Hill Publishing Company Limited.

Oosterhof, Alberth C (1990). Classroom Applications of Educational Measurement. Ohio Merril Publishing Company.

Paplia, Diana E. and Olds, Sally-Wendkos. (1985). Psychology. New York Mc.Graw Hill.


Pedhazur, Elazar J. and Schmekin, Liora Pedhazur. (1991). Measurement, Design, and Analysis: An Integrated Approach. New Jersey: Lowrence Erlbaum Associates, Publishers.

Petersen, Nancy S, Kolen, Michael J; and Hoover H.D( 1993). Scaling, Norming, and Equating. In Educational Measurement ( Third Edition ). Editor Robert L Linn Phoenix: American Council on Education, Seriess on Higher Education Oryx Press

Petri, Herbert L. (1981). Motivation Theory and Research. Belmont, California: Wadsworth, Inc.

Popham, W.James. (1995). Classroom Assesment: What Teachers Need to Know.  Boston: Allyn and Bacon

Pusat Kurikulum, Balitbang Depdiknas (2002). Kurikulum Berbasis Kompetensi: Penilaian Berbasis Kelas, Jakarta.

Pusat Penelitian dan Pengembangan Sistem Pengujian, Balitbang Dikbud
          ( 1993/1994). Bahan Penataran Pengujian Pendidikan. Jakarta

Pusat Pengembangan dan Pengembangan Bahasa (1990). Kamus Besar Bahasa Indonesia. Jakarta. Balai Pustaka.

_______________________________ (2003). Penilaian Tingkat Kelas : Pedoman Bagi Guru SD/MI,SMP/MTs,SMA/MA, dan SMK,Jakarta

Raths,L.E et all(1996). Value and Teaching: Working with Value in Classroom Columbus: Charles E. Merill Publishing, Co

Safari. (2000). Kaidah Bahasa Indonesia dalam Penulisan Soal. Jakarta: PT Kartanegara.

Safari. (1995). Pengujian dan Penilaian Bahasa dan Sastra Indonesia, Jakarta: PT. Kartanegara.

Shavelson, Richard J. (1988). Statistical Reasoning for The Behavioral Sciences. (Second Edition). Boston: Allyn and Bacon, Inc.This'en,

Skaggs. G and Lissitz,R.W.(1986). IRT Tes Equating: Relevant issues and a Review of Recent Research . Review of Educational Research, 56(4),495-529

Skinner, Charles E (1988). Educational Psychology. New Delhi: Prentice Hall

Stufflebean, Daniel L et al (1971). Educational Evaluation and Decision Making. Illinois F.E. Peacock Publishersm Inc.


Thorndike, Robert M. (1997). Measurement and Evaluation in Pschology and Education, Sixth Edition. Ohio: Merrill, an imprint of Prentice Hall.

Tinkelman, S.N. (1971). Planning the Objective Test. Educational Measurement (Second Ed). Washington D.C: American Council on Education.

Torrance, Paul (1974). Torrance Test of Creativity Thinking. Bensenville, Scholastic Testing Service, Inc.

Wright, Benjamin D. and Bell, Susan R. Item Banks : What, Why, How. In Journal of Educational Measurement, Volume 21, No. 4, Winter 1984; p.331

Wright, Benjamin D. and Stone, Mark H (1979). Best Test Design. Chicago : MESA Press.

Wright, Benjamin D. and Linacre, John M. (1992). A User's Guide to BIGSTEPS: Rasch­ Model Computer Program, Version 2.2. Chicago: MESA Press. Wright, B.D. and Stone,

Yelon, Stephen L. and Weinstein, Grace W . (1977). A Teacher’s World; Psychology in The Classroom. Tokyo: Mc-Graw-Hill International Book Company.