Senin, 30 April 2012

Uji Peringkat Bertanda Wilcoxon

Uji tanda memanfaatkan hanya tanda-tanda ‘plus’dan ‘minus’ yang diperoleh dari selisih antara nilai pengamatan dan median pembanding, tetapi mengabaikan besarnya selisih-selisih tersebut. Wilcoxon (1945) memperkenalkan satu prosedur nonparametrik untuk menguji median yang memanfaatkan baik arah (tanda ‘plus’dan ‘minus’) maupun besar arah itu. Uji ini dikenal dengan istilah uji peringkat bertanda Wilcoxon (Wilcoxon signed-rank test).
 
Asumsi
a. Contoh acak saling bebas dengan median (M) tidak diketahui
b. Peubah yang diamati kontinu
c. Data diukur setidaknya dalam skala interval (selang)
d. Pengamatan saling bebas
Hipotesis
a. (Dua arah ) : H0 : M = M0 vs. H1 : M ≠ M0
b. (Satu arah) : H0 : M ≤ M0 vs. H1 : M > M0
c. (Satu arah)  : H0 : M ≥ M0 vs. H1 : M < M0
Statistik Uji
Prosedur umum uji peringkat bertanda Wilcoxon adalah sebagai berikut :
1. Hitung selisih nilai data dan median untuk setiap pengamatan, Di = Xi – M0. Jika hasilnya Di = 0, abaikan pengamatan tersebut.
2. Beri peringkat untuk |Di|. Jika ada nilai yang sama (disebut ties) beri peringkat tengah (mid-rank).
3. Pasangkan tanda ‘plus’ dan ‘minus’ pada peringkat sesuai nilai pada langkah pertama.
4. Hitunglah : jumlah peringkat bertanda ‘plus’ (T+), dan jumlah peringkat bertanda ‘minus’ (T-).
Statistik uji yang digunakan untuk masing-masing hipotesis adalah adalah :
a. (Hipotesis a) : T = T’ = min (T-, T+)
b. (Hipotesis b) : T = T
c.  (Hipotesis c) : T = T+
Kaidah Keputusan
a. (Hipotesis a) : Tolak H0 jika T’ ≤ Tn(α/2)
b. (Hipotesis b) : Tolak H0 jika T- ≤ Tn(α)
c. (Hipotesis c) : Tolak H0 jika T+ ≤ Tn(α)
Catatan Untuk contoh berukuran besar dapat didekati dengan sebaran normal baku
menggunakan rumus :










atau jika Ties :










Statistik uji T* akan menyebar normal baku, T* » Normal (0,1)
Contoh :
Seorang dosen beranggapan bahwa median IP mahasiswa suatu kelas pada semester tertentu kurang dari 3.40. Ujilah anggapan dosen tersebut jika IP dari 10 orang mahasiswa yang diambil secara acak dari kelas tersebut adalah seperti yang tersaji dalam tabel berikut :
(Gunakan taraf nyata 5%)

Mahasiswa ke-
1
2
3
4
5
6
7
8
9
10
IP
3.35
3.45
3.30
3.25
3.52
3.38
3.10
3.42
3.42
3.38

Hipotesis yang akan diuji dalam kasus ini adalah H0 : M ≥ 4.40 lawan H1 : M < 4.40. Sesuai dengan hipotesis tersebut, maka statistik uji yang digunakan adalah T+ atau jumlah peringkat selisih bertanda ‘minus’. Tahapan perhitungannya adalah sebagai berikut:






















Berdasarkan tabel di atas, diperoleh statistik uji T = T+ = 18.5. Dari tabel peringkat bertanda Wilcoxon (Tabel A3), kita peroleh T10 (0.05) sekitar 11. Karena T+ lebih besar dari Ttabel, maka hipotesis nol tidak ditolak, atau dengan kata lain pernyataan dosen tersebut belum dapat dibuktikan.




Sumber: Daniel, Wayne W.1990.Applied Nonparametric Statistics.USA:PWS KENT Publishing



ANALISA FAKTOR

Analisis faktor mencoba mengkaji hubungan internal dari sejumlah variabel-variabel. Variabel-variabel yang erat hubungannya akan bergabung membentuk sebuah faktor dimana setiap faktor yang terbentuk menggambarkan ciri dari variabel pembentuknya. Analisa Faktor juga sering disebut sebagai analisa pereduksi variabel. Variabel-variabel yang jumlahnya banyak akan mengelompok menjadi kelompok variabel yang tentunya jumlahnya akan lebih sedikit dari jumlah variabel asalnya. Ada dua tujuan dari analisa faktor, yaitu:
  •   Untuk melihat pola keterkaitan  antar variabel
Tujaun ini mencoba mengintisarikan dari sekelompok variabel untuk mencari ciri-ciri umum dari sekelompok variabel. Dalam riset pemasaran, kegunaan ini banyak digunakan untuk melihat karakteristik customer mengenai sebuah indikator yang diteliti. Contoh ingin mengindentifikasi  motivasi/keinginan seseorang dalam membeli sebuah produk tertentu.
  •        Untuk mereduksi variabel
Mereduksi variabel  berarti memperkecil jumlah variabel dari variabel sebelumnya, artinya hasil dari analisa ini adalah mengkompres variabel yang jumlahnya banyak menjadi variabel baru yang jumlahnya sedikit.  Umumnya tujuan pereduksian data ini hanya sebagai analisa perantara sebelum dilanjutkan keanalisa berikutnya, contohnya cluster, regresi dll.

Contoh Aplikasi :
Kepada 32 orang ditanyakan 6 alasan mereka membeli sebuah produk HP. 6 alasan tersebut adalah:
1.       Harga
2.       Ases internet
3.       Fitur menarik
4.       User Friendly
5.       Warna
6.       Merek

Dengan analisa Faktor ingin diketahui motivasi umum dari 32 orang yang menjadi responden dalam membeli sebuah produk HP
Kesimpulan hasil analisa dapat dilihat dalam tabel berikut :
(Silakan Klik)







Sabtu, 28 April 2012

ANALISA CLUSTER

Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokkan objek-objek/cases berdasarkan karakteristik yang dimilikinya. Analisis cluster mengklasifikasi objek sehingga setiap objek yang memiliki sifat yang mirip (paling dekat  kesamaannya) akan mengelompok kedalam satu cluster (kelompok) yang sama. Cluster-cluster yang terbentuk memiliki homogenitas internal yang tinggi dan heterogenitas eksternal yang tinggi. Pemilihan indikator yang menjadi dasar pengelompokan objek ditentukan oleh peneliti, yang tentunya mempertimbangkan kaedah logis dan keilmuan yang ada. Indikator/set variabel cluster adalah suatu set variabel/indikator yang merpresentasikan karakteristik yang dipakai objek-objek.

Solusi analisis cluster bersifat tidak unik, anggota cluster untuk tiap penyelesaian/solusi tergantung pada beberapa elemen prosedur dan beberapa solusi yang berbeda dapat diperoleh dengan mengubah satu elemen atau lebih. Solusi cluster secara keseluruhan bergantung pada variabel-variaabel yang digunakan sebagai dasar untuk menilai kesamaan. Penambahan atau pengurangan variabel-variabel yang relevan dapat mempengaruhi substansi hasi analisisi cluster.

Data penjualan 157 mobil yang berasal dari berbagai tipe dan merek mobil. Ingin diklasifikasikan 157 mobil yang terjual berdasarkanan Variable Engine Size, Horsepower, Wheelbase, Width, Length, Curb weight, Fuel capacity dan Fuel efficiency
Dengan analisa cluster ingin diketahui :
  1. Jika dikelompokan kedalam dua katagori, bagai mana ciri-ciri mobil yang termasuk katagori I dan juga ciri-ciri mobil yang termasuk katagori II.
  2. Berapa mobil yang masuk kedalam katagori I dan juga mobil yang masuk dalam katagori II.
  3. Dari data, mobil mana saja yang masuk dalam katagori I dan yang masuk dalam katagori II.

Dari hasil analisa terbentuk dua cluster dari data:

(Silakan Klik)

 







Jumat, 27 April 2012

REGRESI LOGISTIK

Suatu metode statistika yang dapat digunakan untuk mengetahui hubungan antara peubah respon dan beberapa peubah penjelas adalah regresi linear. Dalam regresi linear klasik, peubah respon harus bersifat kuantitatif dengan skala pengukuran minimal adalah interval dan peubah penjelas adalah fixed. Peubah respon juga diasumsikan berdistribusi normal dan mempunyai ragam yang homogen.

Bila peubah respon bukan lagi peubah kuantitatif melainkan berupa peubah kategorik yang hanya terdiri dari beberapa nilai maka regresi linear klasik tidak dapat digunakan. Adapun model regresi yang sering digunakan untuk menganalisis peubah respon berskala biner adalah REGRESI LOGISTIK.

Model regresi logistik termasuk dalam model linear terampat (Generalized Linear Models/GLM). GLM merupakan suatu metode yang dapat digunakan untuk memecahkan masalah peubah respon tidak lagi kontinu melainkan kategorik (misalnya biner), dengan menggunakan fungsi penghubung (link function) logit tertentu sehingga diperoleh suatu model yang mampu menganalisa hubungan antara peubah respon kategorik dengan satu atau beberapa peubah penjelas.


Contoh Aplikasi
Ingin diketahui faktor-faktor yang mempengaruhi resiko ibu melahirkan bayi dengan berat kurang normal/ dibawah standar (bblr/berat bayi lahir rendah). Ada 4 faktor yang dicurigai menyebabkan berat bayi lahir rendah, yaitu: 1. Usia Ibu, 2. Berat ibu hamil, 3. Hipirtensi dan 4. Anemia



Angka di kolom sig menunjukan signifikan atau tidak pengaruh sebuah variabel, sebuah variabel berpengaruh terhadap Berat Bayi Lahir Rendah (BBLR) jika nilainya < 0.05. Terlihat bahwa yang berpengaruh signifikan terhadap BBLR adalah Anemia.
Kolom Exp (B) menunjukan nilai Odd Rasio (OR) yang menjelaskan bentuk pengaruh dari variabel Independen terhadap variabel Dependen. Nilai 14.819 menunjukan bahwa ibu yang anemia lebih beresiko 14.819 kali melahirkan anak yang Berat Bayi Lahir Rendah (BBLR) jika dibandingkan dengan ibu yang tidak anamia.


Artikel HATI-HATI DLM ANALISA REGRESI LOGISTIK Klik




Rabu, 25 April 2012

ANALISA KORESPONDENSI

Analisis korespondensi ditemukan dan dikembangkan pertama kali tahun 1960- an oleh Jean-Paul Benzécri dan kawan-kawan di Perancis. Analisis ini merupakan teknik analisa multivariate secara grafik yang digunakan untuk melakukan explorasi data dari sebuah table kontigensi. Dari data yang merupakan table kontigensi kemudian dilakukan proyeksi kedalam grafik berdasarkan data baris dan kolam.

Dari survey umum tentang kebiasaan merokok pada beberapa katagori pegawai.

Data di bawah menunjuk jumlah pegawai yang tergolong dalam katagori perokok tertentu, contohnya SrManager ada 4 orang yang tidak merokok (non), 2 orang yang Light, 3 orang yang Medium dan 2 orang yang tergolong Heavy.


Dengan analisa koresponden ingin dilihat profil merokok setiap katagori pegawai, hasilnya sebagai berikut?


Dari hasil peta analisa korespondensi terlihat bahwa Jr Menager dan Sr Manager tergolong pada katagori Heavy smoking, Untuk Sr Employees tergolong pada None, Scretaries antara None dan Light dan Jr Employees cenderung perokok yang Medium. 








Kamis, 05 April 2012

Uji Mann Whitney



U-Test ini digunakan untuk menguji signifikasni hipotesis komparatif dua sampel independen bila datanya berbentuk ordinal. Test ini merupakan test yang terbaik untuk menguji hipotesis komparatif dua sampel independen bila berbentuk data ordinal. Uji ini juga sering digunakan  untuk menguji hipotesa untuk data yang memiliki skala ukur  interval atau rasio, syaratnya  jika data tersebut tidak memenuhi asumsi KENORMALAN.
Terdapat dua rumus yang digunakan untuk pengujian, yaitu rumus 4.5 dan 4.6, kedua rumus tersebut digunakan dalam perhitungan, karena akan  digunakan untuk mengetahui nilai U mana yang lebih kecil. Nilai U yang lebih kecil tersebut yang digunakan untuk pengujian dan membandingkan dengan U tabel.









  
Contoh :
Dilakukan penelitian untuk mengetahui adakah perbedaan kualitas manajemen antara Bank yang dianggap favorite oleh masyarakat dan Bank yang tidak favorite. Penelitian menggunakan sampel 12 Bank yang dianggap tidak favorite dan 15 Bank yang dianggap favorite. Selanjutnya kedua kelompok Bank tersebut diukur kualitas manajemennya dengan menggunakan sebuah instrumen, yang terdiri dari beberapa butir pertanyaan. Skor penilaian tertinggi 40 dan terendah 0.
Berikut skor untuk penilaian untuk masing-masing Bank:




























 KESIMPULAN
 
Terdapat perbedaan kualitas manajemen yang signifikan antara Bank yang favorite dan tidak favorite. Bank yang favorite kualitas manajemennya sudah lebih baik jika dibandingkan dengan yang tidak favorite


                                 TABEL MANN WHITNEY