Sabtu, 26 Februari 2011

Hakikat, Fungsi, dan Tujuan Penilaian dalam Pembelajaran

Oleh :

NURUL ASWAR, S.Pd



A. Hakikat dan Fungsi Penilaian
Penilaian berurusan dengan data kuantitatif dan kualitatif, sedang pengukuran yang hanya bagian penilaian itu selalu berhubungan dengan data kuantitatif. Penilaian memerlukan data kuantitatif dari pengukuran. Sebaliknya, pengukuran juga sangat terikat pada penilaian khusus yang berkaitan dengan masalah tujuan dan kriteria yang dipergunakan.
Penilaian adalah proses memperoleh dan mempergunakan infomasi untuk membuat pertimbangan yang dipergunakan sebagai dasar pengambilan informasi. Dengan demikian, terdapat tiga komponen penting penilaian, yaitu informasi, pertimbangan, dan keputusan.
Informasi memberikan data-data (baik kuantitatif maupun kualita tif) yang berguna untuk pembuatan pertimbangan. Pertimbangan dimungkinkan tepat jika informasi yang diperoleh dan interpretasi terhadapnya juga tepat. Pertimbangan adalah taksiran kondisi yang ada kini dan prediksi keadaan pada masa mendatang. Keputusan yang diambil berdasarkan kedua komponen tersebut adalah pilihan di antara berbagai arah tindakan atau sejumlah alternatif yang ada.
Langkah-langkah penilaian menurut Buchori (1972) adalah per siapan (berisi penetapan tujuan, aspek yang dinilai, metode, penyusunan alat, penetapan kriteria, dan frekuensi penilaian), pengumpulan data, pengolahan data hasil penilaian, penafsiran, dan penggunaan hasil.
Langkah-langkah penilaian menurut Ten Brink (1974) terdiri dari tahap persiapan yang berupa pemerincian pertimbangan dan keputusan yang akan dibuat, informasi yang diperlukan dan pe manfaatan yang ada, penentuan waktu dan cara, dan penyusunan alat, tahap pengumpulan data yang diteruskan analisis terhadapnya, dan tahap penilaian yang berupa pembuatan pertimbangan dan keputusan, dan diteruskan dengan pembuatan laporan hasil penilaian.
Tujuan dan fungsi penilaian antara lain adalah untuk mengeta hui kadar pencapaian tujuan, memberikan sifat objektivitas penga matan tingkah-laku hasil belajar siswa, mengetahui kemampuan siswa dalam hal-hal tertentu, menentukan layak tidaknya seorang siswa dinyatakan naik kelas atau lulus, dan untuk memberikan umpan balik bagi kegiatan belajar mengajar yang dilakukan.
Pengukuran dilakukan hanya dengan mengambil sample tentang suatu hal yang akan diketahui karena tak mungkin mengukur se mua kemampuan siswa, dan siswa sendiri tak mungkin menunjuk kan semua kemampuannya.

B. Tujuan Pembelajaran dan Penilaian
Tujuan memberi arah dan pegangan yang jelas, memaksa kita untuk berpijak pada kenyataan dan berpikir secara konkret. Tu juan bagi guru akan membantu untuk memilih bahan, metode, teknik, dan alat evaluasi, sedang bagi murid, la dapat dimanfaat kan sebagai pengorganisator dan kerangka kerja untuk mem peroleh ilmu.
Tujuan pembelajaran dan keluaran hasil belajar adalah dua hal yang erat berkaitan. Tujuan menyarankan bentuk-bentuk tertentu ke luaran belajar, sebaliknya, tingkah laku keluaran belajar merupa kan realisasi pencapaian tujuan.
Keluaran belajar oleh Gagne dibedakan dalam bentuk keteram pilan intelektual (yang berisi kemampuan membedakan, konsep, aturan, dan aturan tingkat tinggi), strategi kognitif, informasi ver bal, keterampilan motor, dan sikap. Pembagian Bloom yang terkenal dengan sebutan taksonomi Bloom yang terdiri dari aspek kognitif, afektif, dan psikomotor banyak diikuti orang, termasuk kurikulum di Indonesia .
Proses identifikasi tujuan khusus merupakan proses analisis dan identifikasi keluaran belajar. Tujuan khusus (behavioral objec tives) menyaran pada tingkah laku keluaran belajar yang ope rasional, artinya mudah diamati diukur dengan alat penilaian.
Tiap tujuan khusus harus mengandung unsur sasaran, tingkah laku yang diharapkan, kondisi sewaktu dinilai, dan kriteria keberhasil an. Tidak seperti halnya tujuan umum, tujuan khusus mempunyai cakupan bahan yang terbatas.
Penyusunan alat penilaian harus mendasarkan diri pada tujuan agar dapat berfungsi sebagaimana mestinya. Alat penilaian di katakan memenuhi kriteria kelayakan jika dapat mengukur ke luaran belajar yang konsisten dengan tujuan. Tujuan akan menen tukan tingkah laku guru dan murid dan bentuk keluaran belajar yang terukur.
Bahan pembelajaran merupakan pengantara tujuan dan alat penilai an, merupakan sarana tercapainya tujuan dan sumber penyusunan alat penilaian. Karena bahan memegang peranan penting, ia perlu dideskripsikan secara terinci karena hal itu juga dapat dimanfaat kan untuk menguji kesahihan isi alat penilaian itu sendiri.
Pemilihan jenis alat penilaian harus disesuaikan dengan tingkah laku keluaran belajar yang ditunjuk oleh tujuan, baik itu yang berkaitan dengan kemampuan kognitif, tingkah laku efektif, maupun psikomotor. Jenis penilaian mungkin berupa lisan atau ter tulis, observasi, wawancara, perbuatan, dan sebagainya.
Tingkatan penilaian terutama dikaitkan dengan aspek kognitif yang terdiri dari tingkatan pengetahuan (ingatan), pernahaman, penerapan, analisis, sintesis, dan evaluasi. Kegiatan penilaian umumnya hanya ditekankan pada (sampai dengan) tingkatan ingatan dan pernahaman saja. Aktivitas kognitif yang lebih tinggi tingkatannya dan lebih penting dalam kaitannya dengan tujuan pendidikan justru sering tidak nampak dalam penilaian.
Penyusunan alat penilaian seharusnya mencakup keenam tingkat an aspek kognitif itu, tetapi dengan memperhatikan perimbangan bobotnya, yaitu sesuai dengan tingkat perkembangan kognitif siswa. Semakin tinggi tingkat kemampuan kognitif siswa, se makin tinggi pula penilaian daya kognitif yang diberikan.
Tabel spesifikasi atau kisi-kisi berisi perincian pokok bahasan yang diteskan, tingkat kemampuan kognitif yang diukur, perim bangan dan jumlah soal per tingkatan aspek kognitif dan pokok bahasan (per sel), dan persentase atau jumlah soal pertingkatan kognitif, per pokok bahasan, dan seluruh butir soal.
Pengisian jumlah atau bobot tiap sel dengan mempertimbangkan tingkatan aspek kognitif yang diungkap dan keadaan pokok ba hasan. Pertimbangan pertama berkaitan dengan aspek kejiwaan siswa tentang tingkat perkembangan kognitifnya, yaitu yang akan dipakai untuk menentukan bobot per tingkatan aspek kognitif. Pertimbangan kedua mencakup peranan dan cakupan bahan yang dipakai untuk menentukan bobot tiap pokok bahasan.
Tabel spesifikasi berguna untuk memberi rambu-rambu kepada penyusun alat tes agar tidak hanya memfokuskan diri pada satu atau beberapa pokok bahasan dan tingkatan-tingkatan aspek kognitif sederhana saja. Di samping itu, ia juga akan memberi petunjuk sel-sel mana saja yang telah dibuat alat tesnya dan mana yang belum atau masih kurang.

C. Alat Penilaian
Ada dua macama alat penilaian yaitu, teknik tes dan teknik nontes. Baik teknik tes maupun nontes keduanya dapat di manfaatkan secara efektif jika dipergunakan secara tepat, dan itu tergantung dari tujuan penilaian.
Teknik nontes misalnya berupa kegiatan kuesener, wawancara, pengamatan, dan pengukuran kecenderungan tertentu dengan mempergunakan skala. Skala merupakan suatu kesatuan sebagai penanda unit-unit yang bersifat angka yang disusun secara berjen jang, tiap jenjang melambangkan sikap dan keyakinan tertentu.
Teknik wawancara baik secara bebas maupun terpimpin, dalam kaitannya dengan penilaian kebahasaan, dapat dipergunakan juga untuk menilai keterampilan, kelancaran, dan kefasihan berbicara siswa dalam bahasa yang diajarkan.
Kegiatan pengamatan baik yang berstruktur maupun tak berstruk tur dapat dimanfaatkan untuk menilai tingkah laku hasil belajar bahasa siswa yang terlihat dalam kegiatan sehari-hari. Tingkah laku dalam situasi seperti itu bersifat wajar, tidak dibuat-buat, dan lebih mencerminkan keadaan yang sesungguhnya.
Tes adalah seperangkat tugas atau pertanyaan yang dipergunakan untuk mengukur keterampilan, pengetahuan, intelegensi, kemam puan, atau bakat yang dimiliki seseorang atau kelompok. Dan segi jawaban siswa, tes dapat dibedakan ke dalam tes perbuatan dan tes verbal.
Tes buatan guru disusun berdasarkan tujuan-tujuan khusus dan deskripsi bahan yang disusun guru untuk mengukur keberhasilan siswa mencapai tujuan, jadi yang terpenting dapat dipertanggung jawabkan dari jenis kesahihan isi. Tes buatan guru biasanya ting kat ketepercayaannya rendah atau tak diketahui.
Tes standar disusun berdasarkan tujuan-tujuan umum seperti yang terdapat dalam kurikulum. Oleh karena telah mengalami beberapa kali uji coba dan revisi, tes standar dapat dipertanggungjawabkan dari segi kelayakan, kesahihan, ketepercayaan, dan ketertafsiran. Tes standar berguna untuk melengkapi informasi tertentu tingkat hasil belajar siswa, membuat perbandingan prestasi siswa, dan berfungsi diagnostik.
Tes kemampuan awal dapat dibedakan menjadi pretes, yang dimak sudkan untuk mengetahui kemampuan siswa sebelum mengalami proses belajar, tes prasyarat, yang dimaksudkan untuk mengetahui kemampuan tertentu disyaratkan untuk masuk pendidikan ter tentu, dan tes penempatan yang dimaksudkan untuk menempatkan siswa sesuai dengan kemampuannya.
Tes diagnostik dimaksudkan untuk menemukan kelemahan-kele mahan siswa dalam hal tertentu untuk kemudian diremidi. Tes for matif dimaksudkan untuk mengukur kadar keberhasilan siswa mencapai tujuan yaitu berkaitan dengan pokok bahasan yang baru saja diselesaikan dalam proses belajar mengajar. Bagi guru tes formatif dapat untuk menilai efektivitas pengajaran, sedang bagi siswa dapat berfungsi sebagai penguat.
Tes sumatif dimaksudkan untuk mengukur kadar pencapaian siswa terhadap tujuan umum, yang meliputi seluruh bahan yang dipro gramkan pada periode tertentu. Informasi tes sumatif dipergu nakan untuk menentukan prestasi siswa, naik-tidak dan atau lulus tidak-nya seorang siswa, serta untuk membuat laporan kepada pi hak tertentu.
Tes esai merupakan tes proses berpikir yang melibatkan aktivitas kognitif tingkat tinggi, menuntut kemampuan siswa untuk mene rapkan pengetahuan, menganalisis, menghubungkan konsep-kon sep, menilai, dan memecahkan masalah.
Kelemahan pokok tes esai adalah rendahnya kadar kesahihan dan ketepercayaan akibat terbatasnya sampel bahan, jawaban siswa yaitu bervariasi, dan penilaian yang bersifat subjektif. Untuk me ngurangi sifat subjektif dalam penilaian, perlu ditentukan kriteria penilaian yang menyangkut isi, organisasi, proses, kesimpulan dan alasan dengan bobot yang tidak harus sama.
Tes objektif menghendaki hanya satu jawaban yang benar, maka penilaiannya dapat secara objektif, cepat, dan dapat dipercaya. Karena jumlah soal relatif banyak, tes objektif dapat mencakup ba han secara lebih menyeluruh.Tes objektif yang baik tidak mudah disusun, memerlukan waktu lama, dan ada kecenderungan guru hanya terpusat pada pokok ba hasan dan tingkatan aspek kognitif tertentu. Dalam mengerjakan nya, siswa dapat bersifat untung-untungan.
Tes objektif dapat berupa benar-salah, pilihan ganda, melengkapi, dan penjodohan. Tes benar-salah bisa dipakai karena hasil belajar yang berupa penguasaan pengetahuan verbal yang dinyatakan da lam bentuk proposisi dapat dinyatakan secara benar atau salah. Tes pilihan ganda merupakan tes benar-salah dengan pernyataan salah lebih banyak. Tes isian adalah tes pilihan ganda tapi siswa mengisi sendiri pilihan yang benar, sedang penjodohan semua pernyataan yang benar ditunjukan sekaligus.
Tes objektif jenis benar-salah dan pilihan ganda dapat diskor de ngan rumus tanpa tebakan dan tebakan (yaitu memberlakukan se macam denda), sedang jenis isian dan penjodohan umumnya di skor dengan tanpa tebakan.
Tes yang baik adalah yang dapat dipertanggungjawabkan dari segi kelayakan (appropriateness), kesahihan (validity), keteper cayaan (reliability), efektivitas butir soal, dan kepraktisan (prac ticality). Kelayakan tes berkaitan dengan masalah apakah suatu tes dapat mengukur keluaran hasil belajar yang konsisten dengan tujuan; apakah semua tujuan telah mempunyai alat ukur yang sesuai; apakah jumlah butir soal per tujuan telah mencerminkan kadar pentingnya tujuan; dan apakah semua butir soal telah mengacu ke tujuan tertentu?
Butir-butir tes harus mencerminkan bahwa pelajaran yang dia jarkan. Semua bahan yang diajarkan perlu diambil tesnya, dan sebaliknya, tes harus hanya terbatas pada bahan yang diajarkan. Untuk memudahkan pengecekan hal itu, pembuatan soal hendak nya mendasarkan diri pada tabel spesifikasi. Kelayakan tes dalam hal ini, merupakan salah satu jenis kesahihan, kesahihan isi.
Kesahihan tes, tes menunjuk pada pengertian apakah suatu tes dapat mengukur apa yang akan diukur. Tes yang sahih akan da pat membedakan siswa yang memang berkemampuan yang lebih baik daripada yang sebaliknya. Kesahihan tes yang baik akan mengungkap semua tingkatan aspek kognitif, dan tidak hanya terbatas pada beberapa tingkatan kognitif yang sederhana saja.
Kesahihan tes dibedakan berdasarkan analisis rasional, kesahih an isi dan konstruk atau konsep, dan berdasarkan data empirik, kesahihan serentak dan ramalan, serta kesahihan kriteria atau ukuran.
Kesahihan isi menunjuk pada pengertian apakah suatu tes mem punyai kesejajaran dengan tujuan deskripsi bahan yang dia jarkan. Tujuan dan bahan biasanya dikembalikan kepada kuriku lum, maka kesahihan isi disebut juga sebagai kesahihan kuri kuler. Di pihak lain, kesahihan konstruk menunjuk pada penger tian apakah tes yang disusun telah sesuai dengan konstruk ilmu bidang studi yang diteskan.
Kesahihan ukuran mempermasalahkan seberapa jauh siswa yang sudah diajar dalam bidang tertentu mempunyai kemampuan yang tinggi daripada yang belum diajar. Jika subjeknya sama, membandingkan hasil belajar itu dapat mendasarkan diri pada hasil pretes dan postes.
Kesahihan sejalan menunjuk pada pengertian apakah tingkat ke mampuan seseorang pada suatu bidang yang diteskan sesuai de ngan skor bidang-bidang lain yang mempunyai persamaan ka rakteristik. Di pihak lain, kesahihan ramalan mempermasalahkan apakah sebuah tes mempunyai kemampuan untuk meramalkan prestasi yang akan dicapai kemudian. Pengujian terhadap kedua jenis kesahihan ini dilakukan dengan teknik korelasi.
Pengujian kesahihan dalam berbagai jenis di atas merupakan pengujian kesahihan secara keseluruhan. Pengujian tingkat kesa hihan dapat dilakukan secara per butir soal, yaitu dengan meng korelasikan skor-skor tiap butir tes dengan skor keseluruhan. Tes yang kesahihannya tinggi, biasanya tinggi pula kesahihan butir butirnya, walau mungkin terdapat beberapa butir tes yang kurang sahih.
Ketepercayaan tes menunjuk pada pengertian apakah suatu tes dapat mengukur secara konsisten sesuatu yang akan diukur dari waktu ke waktu. Konsisten berarti (i) tes dapat memberikan hasil yang relatif tetap terhadap sesuatu yang diukur, (ii) jawaban siswa terhadap butir-butir tes relatif tetap, (iii) hasil tes diperiksa siapa pun menghasilkan skor yang kurang lebih sama.
Hasil pengukuran tidak hanya mencerminkan berapa banyak siswa berhasil dalam belajar, melainkan juga bagaimana ke akuratan tes itu sendiri. Keakuratan tes akan mempengaruhi skor yang diperoleh siswa, maka skor itu tidak akan secara sempurna mencerminkan kemampuan yang sebenarnya.
Prosedur pengujian ketepercayaan tes adalah dengan melakukan tes ulang uji, teknik belah dua, mempergunakan rumus Kuder Richardson 20 dan 21, koefisien alpha, dan reliabilitas bentuk paralel.
Teknik ulang uji dilakukan dengan memberikan tes dua kali de ngan tes yang sama, dan hasilnya dikorelasikan. Tinggi ren dahnya koefisien korelasi menunjukkan tinggi rendahnya tingkat ketepercayaan tes. Teknik ini mempunyai beberapa kelemahan, misalnya sulit menghilangkan pengaruh jawaban pertama.
Pengujian dengan teknik belah dua dilakukan dengan membagi tes ke dalam tes bernomor ganjil dan genap, yang kemudian keduanya dikorelasikan. Koefisien korelasi yang diperoleh baru menunjukkan reliabilitas separuh tes, maka kemudian diperguna kan rumus Spearman-Brown untuk mencari reliabilitas keselu ruhan tes.
Pengukuran dengan mempergunakan rumus K - R 20 dan 21 dapat mengatasi kelemahan yang ada pada teknik belah dua. Ru mus K - R 20 akan memberikan indeks yang lebih besar daripada K - R 21, tetapi penghitungannya lebih rumit. Penyusunan rumus K - R 21 lebih disarankan karena dapat mengukur secara lebih cermat. Koefisien alpha dipakai untuk menguji reliabilitas tes (angket) yang jawabannya berskala.
Pengujian reliabilitas tes dengan teknik bentuk paralel dilakukan dengan menyediakan dua perangkat tes yang bersifat paralel atau ekuivalen. Setelah kedua perangkat tes itu dicobakan, hasilnya dikorelasikan. Untuk meningkatkan keterpercayaan butir tes, hendaknya dibuat butir-butir tes yang secukupnya. Butir tes yang semakin banyak akan semakin mempertinggi tingkat ketepercayaan tes, walau se telah dalam jumlah tertentu peningkatan itu kecil.
Peningkatan ketepercayaan tes juga dilakukan dengan memilih butir-butir soal yang indeks tingkat kesulitan dan daya bedanya memenuhi persyaratan. Untuk keperluan ini, kita perlu melaku kan analisis butir soal. Bahasa yang dipergunakan dalam tes harus jelas, mudah dipa hami, tidak bersifat ambigu, dan tidak membingungkan, agar ti dak menimbulkan kesalahpahaman.
Kondisi pelaksanaan tes harus dikontrol sebaik-baiknya agar hal itu tidak mempengaruhi penampilan siswa. Dalam memeriksa pekerjaan siswa, kita harus menghindari sifat subjektivitas diri, terutama dalam tes esai. Oleh karena itu, sebelum memeriksa pe kerjaan siswa hendaknya membuat pedoman penilaian.
Analisis butir adalah analisis hubungan antara skor-skor butir soal dengan skor keseluruhan, membandingkan jawaban siswa terhadap suatu butir soal dengan jawaban terhadap keseluruhan tes. Tujuan analisis adalah membuat tiap butir tes konsisten de ngan keseluruhan tes dan menilai efektivitas tes sebagai alat pengukuran.
Analisis butir dilakukan untuk mencari indeks tingkat kesulitan, daya beda, dan efektivitas distraktor. Butir soal yang baik adalah yang tidak terlalu sukar atau terlalu mudah yang indeksnya ber kisar antara 0,15 sampai dengan 0,85, yang mampu membedakan antara siswa kelompok tinggi dan rendah yang indeks daya be¬danya paling tidak sebesar 0,25 serta semua distraktor yang di sediakan dipilih.
Penghitungan indeks tingkat kesulitan dan daya beda dapat di lakukan dengan mempergunakan tabel analisis butir soal. Untuk maksud ini, kita harus mencapai proporsi jawaban betul kelom pok tinggi dan kelompok rendah, baru kemudian mengkonsulta sikannya kepada tabel. Butir soal yang indeks tingkat kesulitan dan daya bedanya tidak memenuhi persyaratan disarankan untuk direvisi.
Distraktor seharusnya dipilih oleh siswa kelompok rendah secara lebih banyak. Jika terjadi sebaliknya, kelompok tinggi yang lebih banyak memilih, atau ada distraktor yang tak dipilih, distraktor yang bersangkutan disarankan untuk direvisi. Tingkat ketepercayaan tes esai dihitung dengan rumus alpha, se dang indeks tingkat kesulitan serta indeks daya bedanya dicari dengan mempergunakan rumus yang berbeda dengan tes objek tif.
Sebuah tes yang baik di samping layak, sahih, dan tepercaya, juga harus memenuhi kriteria kepraktisan. Kriteria kepraktisan dapat dilihat dari segi keekonomisan, kemudahan pelaksanaan, penskoran, dan penafsiran.

Daftar Pustaka
Depdikbud. 1983. Penilaian dalam Pendidikan. Jakarta : Dikti.
Ghofur, Abdul. 2004. Pedoman Umum Pengembangan Penilaian. Jakarta : Puskur.

Naga, Dali S. 1992. Pengantar Teori Skor pada Pengukuran Pendidikan. Jakarta : Gunadarma.

Nurgiantoro, Burhan. 2001. Penilaian dalam Pengajaran Bahasa dan Sastra. Yogyakarta : BPFE.

Purwanto, Ngalim. 2002. Prinsip-Prinsip dan Teknik Evaluasi Pengajaran. Bandung ; Remaja Rosdakarya.

Surapranata, Sumarna. 2004. Panduan Penulisan Tes Tertulis Implementasi Kurikulum 2004.Bandung ; Remaja Rosdakarya.

1 komentar:

  1. mkasi ya artikel nya,.. bisa buat nambah refrensi tugas ni,.. :)

    BalasHapus