Bagaimana Penyalahgunaan Hasil Penilaian Siswa Dapat Terjadi ?

Gambar Ilustrasi Kertas Ujian Nasional (beritagar.id)

Semakin banyak tujuan dari suatu tes, maka semakin tinggi risiko tes (high stake testing) yang ditanggung oleh pesertanya. Misalnya, tes yang hasilnya digunakan untuk menentukan kelulusan siswa sekaligus untuk menentukan standar pendidikan suatu wilayah. Apabila otoritas Pendidikan setempat berusaha menaikkan skor minimal yang harus dicapai, tentu hal ini menjadi beban yang ditanggung siswa.

Pada kasus lain, hasil tes siswa digunakan untuk mengevaluasi kinerja guru suatu sekolah atau wilayah di Indonesia. Praktik ini terjadi saat hasil ujian nasional digunakan sebagai syarat kelulusan siswa sekaligus representasi mutu pendidikan di sekolah dan wilayah.

Tes yang sudah berisiko tinggi untuk siswa, dapat lebih berat karena hasilnya digunakan pula untuk mengevaluasi kinerja sekolah dan bahkan dianggap menggambarkan mutu pendidikan di suatu daerah. Dapat dibayangkan upaya kolosal yang dilakukan agar hasil tes dapat maksimal, karena selain kepentingan siswa juga dianggap mempertaruhkan gengsi daerah.

Gordon Stobart dalam bukunya Testing Times; The Uses and Abuses of Assessment (2009) menjabarkan penyalahgunaan hasil tes dapat terjadi saat tujuan dari suatu tes ditambahkan, terutama bila tujuannya bersifat manajerial. Tujuan manajerial dari asesmen (yang salah satunya tes) merupakan tujuan yang terkait dengan akuntabilitas baik institusi atau bahkan kinerja kelompok profesi.

Sebagai contoh, saat kebijakan Ujian Nasional dilakukan di Indonesia, awalnya bertujuan untuk mengukur pencapaian individu siswa setelah belajar dalam kurun waktu tertentu. Ini adalah tujuan individu untuk siswa.

Rupanya hasil ujian nasional juga digunakan untuk memantau mutu dan atau efektivitas kinerja otoritas baik sekolah maupun otoritas wilayah. Hal ini masuk dalam kategori tujuan manajerial.

Penambahan tujuan ini menyebabkan munculnya washback effect pada Ujian Nasional. Walhasil mendorong praktik-praktik teaching to the test, mencontek massal, bahkan membocorkan soal.

Stobart menegaskan, hasil tes yang bertujuan individu jika digunakan kepentingan tambahan yang bersifat manajerial, maka tujuan manajerial-lah yang lebih mendominasi. Bahkan Lambert and Lines (2001), mengungkapkan bahwa kenaikan skor tes tidak untuk menunjukkan peningkatan standar mengajar dan hasil belajar, melainkan sekadar kepentingan politis membangun citra yang baik di mata publik.

Penggunaan hasil tes siswa dengan tujuan selain untuk individu siswa, telah menjadi fokus perdebatan ilmiah selama lebih dari dua dasawarsa. Beberapa dampak tes berisiko tinggi (high stake testing) terhadap kurikulum dan pengajaran diulas Assessment Reform Group (2002)  sebagai berikut :

  1. Saat tujuan dari belajar adalah lulus tes berisiko tinggi (high stake), guru cenderung memilih gaya mengajar yang menekankan pada menghafal pengetahuan daripada gaya mengajar yang menguatkan kreativitas siswa.
  2. Tujuan kurikulum tidak maksimal capaiannya terutama untuk pengembangan kreativitas, pribadi, dan sosial,karena ujian eksternal mendorong sekolah fokus hanya pada mata pelajaran yang diujikan.
  3. Praktik ujian di sekolah menciptakan kultur menganggap skor hasil ujian lebih bernilai dibanding bentuk pencapaian lain.
  4. Walaupun tes diklaim mengukur kemampuan berpikir tingkat tinggi, namun guru lebih efektif melatih siswa menjawab soal tes tanpa siswa menunjukkan kemampuan berpikir tingkat tinggi.

Paul Black dan  Dylan William, anggota Assessment Reform Group dalam karya klasik mereka yang menjadi rujukan peneliti asesmen formatif ; Assessment and Classroom Learning (1998); telah melakukan review terhadap 250 penelitian. Simpulannya bahwa peningkatan standar  tidak ditempuh dengan menaikkan skor tes ujian atau bahkan melakukan tes berkali-kali kepada siswa.

Peningkatan standar/mutu yang sebenarnya adalah memperkecil senjangan prestasi antara para siswa yang dianggap memiliki kemampuan rendah  dengan siswa dianggap mempunyai kemampuan baik bahkan tinggi. Caranya dengan mengintegrasikan asesmen dan pembelajaran melalui implementasi teknik-teknik asesmen formatif (assessment for learning) di kelas.

Kajian klasik Paul Black dan Dylan William memberikan pengaruh perubahan-perubahan kebijakan sistem pendidikan di beberapa negara. Hingga tahun 2023 pendapat mereka menjadi dasar refleksi, apakah penilaian terhadap siswa sesungguhnya untuk mengukur kemampuan hidup di zamannya atau untuk tujuan lainnya. Apakah kita mengembangkan tes dan penilaian untuk mengukur apa yang dianggap berharga untuk diukur di dalam konteks kehidupan saat ini dan selanjutnya (Hopfenbeck, 2023).

Implementasi Kurikulum Merdeka dengan ekosistem kebijakan yang mendukung seperti Asesmen Nasional, membawa perubahan positif dalam mengurangi dampak kultur asesmen yang tidak berpihak ke siswa. Regulasi standar penilaian-pun (Permendikbudristek No 21 tahun 2022), menyatakan bahwa penilaian yang dilakukan oleh guru di kelas digunakan untuk memantau, memperbaiki proses pembelajaran, dan mengevaluasi pencapaian tujuan pembelajaran.

Namun, tantangan implementasi kultur asesmen yang lebih berpihak ke siswa dapat dikatakan berat. Hal ini karena kultur asesmen di level wilayah didominasi keyakinan bahwa penilaian yang dilakukan oleh pihak di luar sekolah (misalnya dalam bentuk ujian bersama), memiliki kekuasaan simbolis dibandingkan praktik penilaian yang dilakukan oleh guru di kelas.

Tantangan lainnya berupa keyakinan bahwa ujian bersama akan meningkatkan motivasi siswa untuk belajar. Apa yang dimaksud dengan ‘belajar’ sudah berubah untuk konteks kehidupan di abad 21 dan selanjutnya.

Belajar di dalam konteks ketidakpastian membutuhkan kemampuan penyelesaian masalah, berpikir, dan kreatif (Hopfenbeck, 2018). Motivasi belajar yang ditumbuhkan dari ujian hanya saat menghadapi ujian saja (performance goal) dan bukan motivasi untuk belajar (learning goal) yang dibutuhkan untuk menjadi pembelajar sepanjang hayat (lifelong learner) dalam menghadapi ketidakpastian.

Apakah setelah menamatkan pendidikan (formal), motivasi belajar harus berhenti ? Tulisan ini dimaksudkan sebagai bahan refleksi bersama terhadap praktik penilaian yang terjadi di sekitar kita. Apakah kita menggunakan hasil tes siswa untuk tujuan sebenarnya atau kita berpotensi menyalahgunakan hasil tes tersebut untuk tujuan lainnya ?

 

Penulis :

Marike Nawang Palupi, Widyaprada Balai Penjaminan Mutu Pendidikan DI Yogyakarta

Pernah belajar di Jurusan Curriculum, Pedagogy, Assessment Institute of Education, UCL

Artikel Lain

Evaluasi Diklat Implementasi Kurikulum 2013 bagi Guru Sasaran Jenjang SMP Mata Pelajaran PPKn/IPS

EVALUASI DIKLAT IMPLEMENTASI KURIKULUM 2013 BAGI GURU SASARAN JENJANG SMP MATA PELAJARAN PPKN/IPS LPMP D.I. …

Best Practice: Implementasi Project Based Learning dalam Pembelajaran Abad 21

Best Practice: Implementasi Project Based Learning dalam Pembelajaran Abad 21 pada Mata Pelajaran IPA Kelas …