Metodologi penelitian

PROSEDUR MENGESTIMASI RELIABILITAS

  1.  Prosedur Administrasi yang Membutuhkan Dua Tes..                                                                                                                                                                               
  • a.      Metode Bentuk Alternatif (Alternate Form)

Anggaplah bahwa semua calon yang masuk ke pekerjaan kesehatan tertentu harus mengikuti ujian negara, yang dikelola dalam kondisi yang terkendali di sebuah situs particiear pada tanggal tertentu. Untuk mengurangi kemungkinan kecurangan, ujian di kursi yang berdekatan mengambil bentuk yang berbeda dari tes yang mencakup konten yang sama. Jelas ujian masing-masing memiliki hak untuk mengharapkan bahwa nilainya tidak akan sangat dipengaruhi oleh bentuk khusus dari tes yang diambil. Dalam hal ini, kesalahan pengukuran yang pengguna tes terutama perhatian adalah yang disebabkan oleh perbedaan dalam isi bentuk tes. Tentu saja kesalahan, administrasi dan penilaian, menebak, dan fluktuasi dalam kinerja peserta ujian sementara juga dapat berkontribusi dalam inkonsistensi nilai. Untuk mengatasi masalah ini, pengembang tes harus memperkirakan koefisien reliabilitas tes kemampuan dengan menggunakan metode bentuk lainnya (alternatif form).

Metode bentuk alternatif membutuhkan membangun dua bentuk serupa tes dan administrasi baik formulir untuk kelompok ujian yang sama. Bentuk harus diberikan dalam jangka waktu yang sangat singkat, sehingga waktu hanya cukup antara pencobaan sehingga peserta ujian tidak akan lelah. Hal ini dianggap diinginkan untuk menyeimbangkan urutan administrasi bentuk sehingga setengah peserta ujian secara acak ditugaskan untuk membentuk 1 diikuti oleh bentuk 2, sedangkan separuh lainnya mengambil formulir 2 diikuti oleh bentuk 1. Koefisien korelasi antara dua set nilai ini kemudian dihitung, biasanya dengan rumus product moment Pearson. Koefisien korelasi ini disebut koefisien kesetaraan. Semakin tinggi koefisien equivalen bahwa kekerasan, pengguna tes lebih percaya diri dapat bahwa nilai dari bentuk-bentuk tes yang berbeda dapat digunakan secara bergantian.

Setiap tes yang memiliki berbagai bentuk harus memiliki beberapa bukti kesetaraan mereka. Biasanya, tes prestasi dan bakat yang dibangun dengan berbagai bentuk sejak beberapa penggunaan klinis, pendidikan, atau penelitian memerlukan ujian untuk memiliki kesempatan untuk merebut kembali pemeriksaan, dan pengguna tes tidak ingin menggunakan item yang sama untuk tes kedua. Meskipun tidak ada, sulit aturan cepat untuk apa yang merupakan nilai minimal yang dapat diterima untuk estimasi reliabilitas bentuk alternatif, banyak prestasi manual standar laporan uji koefisien berkisar di 0,80 dan 0,90 untuk jenis reliabilitas. Selain itu, nilai-nilai berarti, deviasi standar, dan kesalahan standar pengukuran harus dilaporkan untuk setiap form, dan ini harus cukup mirip jika koefisien kesetaraan ditafsirkan sebagai estimasi reliabilitas.

b.      Metode Tes-Ulang (Test-Retest)

Ada banyak situasi pengujian yang satu bentuk dari tes ini adalah cukup tetapi pengguna uji tertarik pada bagaimana secara konsistensi peserta ujian merespon bentuk ini pada waktu yang berbeda. Dalam situasi ini kesalahan pengukuran perhatian utama adalah fluktuasi skor mengamati ujian di sekitar skor murni karena perubahan sementara di bagian ujian itu. Sekali lagi, namun. kesalahan karena administrasi, penilaian, menebak, kesalahan menjawab oleh peserta ujian, dan fluktuasi sementara lainnya dalam perilaku mungkin memiliki dampak pada skor diamati. Untuk memperkirakan dampak dari kesalahan tersebut pada reliabilitas skor tes, tes konstruktor mengelola tes untuk kelompok ujian, menunggu, pembacaan tes yang sama untuk kelompok yang sama, dan kemudian menghitung koefisien korelasi antara dua set nilai. Koefisien korelasi diperoleh dari prosedur tes ulang disebut koefisien stabilitas.

Penafsiran koefisien stabilitas sebagai estimasi reliabilitas menimbulkan beberapa pertanyaan menarik. Ketika koefisien rendah diperoleh, apakah ini menunjukkan bahwa tes tidak dapat diandalkan memberikan langkah-langkah sifat tersebut, atau apakah itu berarti bahwa sifat itu sendiri tidak stabil? Jika pengguna tes percaya bahwa jumlah sifat yang dimiliki peserta ujian harus berubah dari waktu ke waktu, asumsi dasar dari model klasik skor murni telah dilanggar dan koefisien korelasi yang diperoleh bukanlah estimasi yang tepat pada reliabilitas skor tes. Isu kedua adalah apakah perilaku suatu ujian adalah diubah oleh administrasi tes pertama sehingga skor tes kedua akan mencerminkan efek memori, praktek, belajar, kebosanan, sensitisasi, atau konsekuensi lain dari pengukuran pertama. Mengingat isu-isu itu mungkin masuk akal untuk mengasumsikan bahwa koefisien uji-tes ulang merupakan estimasi yang agak tidak akurat dari koefisien reliabilitas teoritis. Namun demikian, informasi tentang stabilitas skor tes sangat penting untuk menguji pengguna tes di banyak situasi pengujian praktis.

c.       Tes Ulang dengan Bentuk Alternatif (Test-Retest dengan Alternate Form)

Koefisien reliabilitas juga dapat diperkirakan dengan menggunakan kombinasi dari tes-tes ulang bentuk dan metode alternatif. Dalam hal ini, prosedur ini untuk mengatur bentuk 1 tes, tunggu, dan kemudian mengatur bentuk 2. Jika memungkinkan, diharapkan bahwa urutan administrasi bentuk dibalik untuk setengah kelompok. Koefisien korelasi antara dua set skor dikenal sebagai koefisien stabilitas dan kesetaraan. Koefisien ini dipengaruhi oleh kesalahan pengukuran karena sampling konten dalam bentuk pembangunan serta perubahan dalam pertunjukan individu ‘dari waktu ke waktu dan hampir semua jenis lain dari kesalahan yang telah dijelaskan sebelumnya. Estimasi reliabilitas tersebut biasanya lebih rendah daripada koefisien kesetaraan atau koefisien stabilitas yang ditentukan untuk tes yang sama pada kelompok ujian yang sama.

2. Membutuhkan Metode Administrasi Tes Tunggal

a.      Metode Split-Half (Formula Spearman Brown untuk belah dua)

Dengan menggunakan metode split-half, pengembang tes mengelola satu bentuk tes untuk kelompok ujian. Pengembang tes membagi item menjadi dua subyek, masing-masing setengah dari panjang tes asli. Jadi, jika tes 20 item yang diberikan, itu akan dibagi menjadi dua yaitu setiap tes 10 item masing-masing. Tujuannya adalah untuk menciptakan dua setengah-tes yang adalah sebagai hampir paralel mungkin. Empat metode populer untuk membagi tes menjadi dua bagian adalah untuk:

a)      Menetapkan semua item yang bernomor ganjil untuk membentuk 1 dan semua item genap untuk membentuk 2

b)      Peringkat urutan item dalam hal tingkat kesulitannya (p-nilai) berdasarkan respon dari peserta ujian; kemudian menetapkan item dengan ganjil peringkat untuk membentuk 1 dan mereka dengan peringkat genap untuk membentuk 2

c)      Menetapkan secara acak item ke dua setengah bentuk tes

d)     Menempatkan item untuk setengah-tes bentuk sehingga bentuk-bentuk yang “sesuai” dalam konten.

Formula Spearman Brown untuk belah dua merupakan sebuah formula komputasi yang sangat populer untuk estimasi reliabilitas tes yang dibelah menjadi dua bagian yang relatif paralel satu dengan yang lain. Formula ini dapat digunakan pada tes yang item-itemnya diberi skor dikotomi maupun non-dikotomi. Umumnya untuk memperoleh dua belahn tes yang relative paralel satu sama lain dalam penggunaan formula Spearman Brown, dilakukan cara pembelahan gasal-genap atau cara matched random subsets dikarenakan dari dua cara itulah diharapkan akan diperoleh belhan-belhan yang paralel seperti yang dikehndaki.

b.      Formula Rulon

Rulon (1939) merumuskan suatu formula untuk mengestimasi reliabilitas belah-dua tanpa perlu berasumsi bahwa kedua belahan mempunyai varians yang sama. Menurut Rulon, perbedaan subjek pada kedua belahan tes akan membentuk distribusi perbedaan skor dengan varians yang besarnya ditentukan oleh varians eror masing-masing belahan. Karena varians eror keseluruhan tes, maka varians eror tes ini dapat diestimasi lewat besarnya varians perbedaan skor diantara kedua belahan. Dengan demikian, dalam melakukan estimasi terhadap reliabilitas tes, varians perbedaan skor inilah yang perlu diperhitungkan sebagai sumber eror.

c.       Koefisien Alpha (α)

Telah dijelaskan dimuka bahwa formula Spearman Brown hanya akan menghasilkan estimasi reliabilitas yang cermat apabila belahan-belahan tes yang diperoleh dapat memenuhi asumsi paralel. Apabila kita tidak yakin bahwa asumsi tersebut tidak terpenuhi, maka koefisien-α (Cronbach, 1951) dapat digunakan. Walaupun dapat digunakan pada tes yang belahannya tidak paralel satu sama lain, akan tetapi apabila kedua belahan tersebut tidak memenuhi asumsi -equivalent, maka koefisien reliabilitas alpha yang diperoleh akan merupakan underestimasi terhadap reliabilitas yang sesungguhnya (artinya, reliabilitas yang sebenarnya mungkin sekali lebih tinggi daripada koefisien yang diperoleh dari hasil perhitungan). Oleh karena itu, bila kita memperoleh hasil perhitungan yang cukup tinggi kita akan tahu bahwa ada kemungkinan reliabilitas yang sesungguhnya lebih tinggi lagi akan tetapi bila koefisien yang diperoleh ternyata rendah, maka kita belum dapat memastikan apakah tes yang bersangkutan memang memiliki reliabilitas rendah ataukah hal tersebut sekedar indikasi tidak terpenuhinya asumsi -equivalent (Allen & Yen, 1979).

d.      Formula Kuder-Richardson

Bila suatu tes berisi item-item yang diberi skor dikotomi sedangkan jumlah itemnya sendiri tidak begitu banyak, kadang-kadang membagi tes menjadi dua bagian tidak dapat menghasilkan bagian yang setara sedangkan membagi tes menjadi lebih dari dua belahan akan mengakibatkan jumlah item dalam setiap belahan terlalu sedkit. Bila dalam belahan hanya berisi sedikit item, komputasi reliabilitasnya tidak dapat menghasilkan estimasi yang cermat. Salah satu cara yang dapat dilakukan adalah membelah tes tersebut menjadi sebanyak jumlah itemnya sehingga setiap belahan berisi hanya satu item saja. Kemudian estimasi reliabilitasnya dilakukan melalui formula alpha yang disesuaikan, yang dikenal dengan nama formula Kuder Richardson-20 atau KR-20 (Kuder-Richardson, 1937) dan dikenal pula dengan nama koefisien α-20 (Cronbach, 1951). Koefisien KR-20 atau koefisien α-20 merupakan rata-rata estimasi reliabilitas dari semua cara belah-dua yang mungkin dilakukan. Koefisien ini juga mencerminkan sejauhmana kesetraan isi item-item dalam tes.

e.       Estimasi reliabilitas dengan analisis varians

Selain melalui pendekatan-pendekatan korelasional, estimasi reliabilitas tes dalam prosedur single-trial administration dapat pula dilakukan melalui teknik analisis varians (anava). Hal ini sangat logis bila diingat bahwa konsepsi reliabilitas sendiri memang merupakan rasio dari berbagai varians distribusi. Salah satu teknik anava yang sangat populer adalah yang dikemukakan oleh Hoyt (1941). Pendekatan Hoyt ini termuat dalam jurnal Psychometrika yang sangat bergengsi dan sejak itu mendapat perhatian yang besra sekali dari para ahli psikometri.

Konsep dalam teknik analisis varians Hoyt adalah memandang distribusi item keseluruhan subjek sebagai data pada suatu desain eksperimen factorial dua-jalan tanpa replikasi, yang dikenal pula sebagai item by subject design. Setiap item dianggap seakan suatu treatment atau perlakuan yang berbeda sehingga setiap kali subjek dihadapkan pada suati item seakan-akan ia berada oada suatu perlakuan yang berbeda. Dalam hal ini banyaknya item merupakan banyaknya perlakuan. Dari pola faktorial ini diperoleh harga mean kuadrat antarsubjek yang sbenarnya merupakan estimasi terhadap varians skor tes, mean kuadratanatitem, dan men kuadrat interaksi itemsubjek yang merupakan estimasi terhadap barians eror.

f.       Metode Berdasarkan Kovarian Item

Kurangnya estimasi unik untuk konsistensi internal dari nilai tes dari sampel tunggal ujian pada satu kesempatan merupakan masalah yang mendapat banyak perhatian dalam literatur psikometri tahun 1930-an dan 1940-an. Kemudian dalam waktu yang relatif singkat tiga prosedur yang diusulkan diatasi masalah ini. Meskipun mereka tampak berbeda dalam bentuk, tiga prosedur yang dijelaskan di sini menghasilkan hasil yang identik. Tiga prosedur secara luas digunakan adalah Kuder Richardson 20, alpha Cronbach, dan analisis varians Hoyt itu. Mereka yang ingin membaca manual tes, tinjauan tes, atau literatur uji pengembangan lainnya harus mengakui kesetaraan metode ini untuk menghindari kebingungan. Kita akan menggunakan koefisien alpha istilah untuk merujuk ke kelas ini prosedur. KOEFISIEN ALPHA. Pada tahun 1951, Cronbach disajikan sebuah sintesis komprehensif dan diskusi dari berbagai metode untuk memperkirakan konsistensi internal dan berhubungan mereka ke rumus umum yang dikenal sebagai alpha Cronbach.

sumber :

Linda C and James A. (1986). Introduction to Classical and Modern Test Theory. United State of America.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s