Selasa, 02 Februari 2016

REGRESI LOGISTIK UNTUK DATA KESEHATAN : STATA

Contoh Kasus

Ingin diketahui faktor-faktor resiko mana saya yang berpengaruh signifikan terhadap kejadia diabetes. Diambil 60 sampel yang terdiri dari 30 sampel orang terkena diabetes dan 30 lainnya kondisinya sehat. Faktor resiko yang akan diuji pengaruhnya diantaranya gender, usia, hipertensi, indek massa tubuh, dan riwayat diabetes orang tua.  Gender, hipertensi, status gizi dan riwayat diabetes orang tua berbentuk variabel kategori sedangkan usia dan indek massa tubuh berbentuk variabel numerik.  



Sebelum dilakukan analisa untuk mengetahui faktor penyebab resiko Diabetes dengan analisa regresi logistik terlebih dahulu dilakukan explorasi terhadap kejadian diabetes dan faktor resikonya (analisa univariate), kemudian dilakukan analisa bivariate untuk mengetahui pengaruh langsung faktor resiko terhadap kejadian diabetes sekaligus sebagai selekasi variabel mencari kandidat variabel yang akan dianalisa dalam regresi logistik. Secara umum dalam dalam kontek analisa statistik untuk kesehatan, pemilihan variabel kandidat yang akan diikutsertakan dalam analisa multivariate (dalam hal ini regresi logistik) didasarkan pada hasil analisa bivariate yang memiliki nilai p-value < 0.25. 

Explorasi terhadap kejadian diabetes dan faktor resikonya (analisa univariate)

Untuk melakukan explorasi digunakan command/perintah  tab dan sum. Perintah tab digunakan pada variabel kategorik dan perintah sum digunakan pada variabel numerik. Format perintah untuk melakukan explorasi terhadap kejadian diabet dan faktor resikonya: command  variabel

Explorasi data kategorik
Explorasi data kategorik berupa explorasi terhadap frekuensi dan presentasi dari setiap kategori yang terdapat dalam setiap variabel



Explorasi data numerik

Explorasi data numerik merupakan explorasi terhadap nilai rata-rata, stadar deviasi dan nilai minimum dan maksimum dari  dan setiap variabel numerik



Explorasi pengaruh langsung faktor resiko terhadap kejadian diabetes  (analisa bivariate)
Uji pengaruh langsung faktor resiko variabel kategorik terhadap kejdian diabetes

Untuk melihat pengaruh langsung faktor resiko dari sebuah variabel kategorik terhadap kejadian diabets digunakan uji chi-square. Adapun format perintahnya : tab (variabel resiko) (variabel kejadi diabetes), chi row 


Hasil uji pengaruh gender terhadap kejadia diabetes diperoleh nilai p-value 0.2778 yang berarti gender tidak masuk sebagai kandidat variabel yang akan dianalisa dalam model regresi logistik.

Hasil uji pengaruh hipertensi  terhadap kejadia diabetes diperoleh nilai p-value 0.2667 yang berarti hipertensi tidak masuk sebagai kandidat variabel yang akan dianalisa dalam model regresi logistik.

Hasil uji pengaruh status gizi  terhadap kejadia diabetes diperoleh nilai p-value 0.009 yang berarti status gizi  masuk sebagai kandidat variabel yang akan dianalisa dalam model regresi logistik.

Hasil uji pengaruh riwayat diabetes orang tua  terhadap kejadia diabetes diperoleh nilai p-value 0.010 yang berarti riwayat diabetes orang tua  masuk sebagai kandidat variabel yang akan dianalisa dalam model regresi logistik.


Uji pengaruh langsung faktor resiko variabel numerik terhadap kejdian diabetes

Untuk melihat pengaruh langsung faktor resiko dari sebuah variabel numerik terhadap kejadian diabets digunakan uji t-test. Adapun format perintahnya : ttest (variabel resiko), by (variabel kejadi diabetes)

Analisa pengaruh  faktor resiko terhadap kejadian diabetes  dengan regresi logistik (Analisa Multivariate)


Dari hasil analisa bivariate (uji pengaruh langsung) variabel resiko terhadap kejadian diabetes diperoleh beberapa variabel kandidat yang akan dianalisa dengan regresi logistik, diantaranya variabel usia status gizi, indek massa tubuh dan riwayat diabetes orang tua.  Dalam stata ada dua jenis output yang ditampilkan ketika melakukan analisa regresi logistik, yaitu output regresi logistik yang menampilkan nilai koefisien regresinya dan output regresi logistik yang menampilkan nilai odd rasio.

Regresi Logistik Dengan Nilai Koefisien Regresi
Untuk melakukan analisa regresi logistik yang menampilkan nilai koefisien digunakan perintah: Logit (dependent variabel) (independen variabel). Regresi logistik dengan nilai koefisien nantinya dapat digunakan untuk menghitung nilai probabilitas kejadian Y=1.

Dari hasil analisa terlihat bahwa yang signifikan berpengaruh terhadap kejadian diabetes (Y=1) adalah usia dengan p-value= 0.014, status gizi (stgizi) dengan p-value 0.028, dan riwayat diabetes orang tua (org_tua) dengan p-value 0.007. Dengan memperhasikan nilai varian dari sampel, maka faktor resiko yang paling besar pengaruhnya terhadap kejadian diabetes adalah riwayat diabetes orang tua (org_tua)karena memiliki statistik z terbesar yaitu 2.67.
Dengan nilai  Pseudo R2 diperolah 0.2927 yang berarti bahwa pengaruh 5 faktor tesiko yang masuk dalam persamaan regresi logistik terhadap kejadian diabetes sebesar 29.27%.
Dengan menggunakan persamaan

Jika ingin diprediksi nilai probabilitas setiap sampel yang terkumpul kemungkinan terkena diabetes sebagai berikut
Regresi Logistik Dengan Odd Rasio
Untuk melakukan analisa regresi logistik yang menampilkan nilai odd rasio dengan menambahkan option or di akhir perintah, dengan format perintah yang digunakan: Logit (dependent variabel) (independen variabel), or

Perhitungan nilai Odd rasio pada output analisa regresi logistik diperolah dari nilai koefisien dengan menggunakan formula:


Interpretasi dari nilai odd rasio variabel-variabel yang berpengaruh signifikan terhadap kejadian diabetes adalah sebagai berikut. Nilai Odd Rasio dari faktor resiko riwayat diabetes orang tua (org_tua) sebesaryang berarti bahwa yang sampel yang orang tua diabet akan memiliki resiko terkena diabet sebesar 8.39 kali dibandingkan yang orang tuanya tidak terkena diabetes. Untuk faktor resiko usia dengan nilai odd rasiomemiliki makna bahwa semakin bertambah usianya maka semakin besar resiko terkena diabet. Faktor resiko status gizi memiliki nilai odd rasiomemiliki makna bahwa yang status gizinya berlebih memiliki resiko terkena diabet sebesar 4.76 kali dibandingkan yang normal.


Download Data Latihan Klik Disini


KETERANGAN : jika gambar tulisan kurang jelas silahkan di klik saja gambarnya untuk memperbesar . . .!!!











0 komentar:

Posting Komentar

Silahkan cantumkan alamat email atau CP anda jika ingin komentar dan tertarik untuk mengikuti pelatihan statistik, agar secepatnya dapat kami jawab pertanyaan anda. Terima kasih sebelumnya.