Anda di halaman 1dari 4

Memperkenalkan Xi sebagai Koefisien Korelasi yang baru.

Terinpirasi dari tulisan Professor Sourav Chatterjee yang membahas mengenai "A New Coefficient of
Correlation" yang bisa diakses secara bebas di (https://arxiv.org/abs/1909.10140). Terbarukan
karena selama ini kita mengnal tiga ukuran klasik yang paling populer mengenai korelasi,hubungan
atau asosiasi dalam statistik adalah: Koefisien korelasi Pearson, Spearman, dan Kendall. Koefisien ini
sangat baik untuk mendeteksi asosiasi atau hubungan linier atau yang monotonik, dan mereka
memiliki teori asimptotik yang berkembang dengan baik untuk menghitung signifikansinya nilai-p.

Nah bagaimana kalo hubungannya tidak monotonik, apakah kalo nilai korelasinya kecil dan tidak
signifikan menjadi tidak ada hubungan antar variabel?

Saya mensimulasikan pola y = sin(x) yang jelas jelas berhubungan tetapi tidak linier (berupa fungsi
sinus). Data ini kalo dipaksakan pake rumus korelasi pearson = -0.387 dan nilai p yang tidak
signifikan. Jika kita mengambil keputusan ini akan salah besar.

Lalu gimana ngitung korelasi atau hubungan untuk data yang tidak monotonik, tidak linier, artinya
hubungan x dan y bisa berupa hubungan fungsional apapun, baik sinus, cosinus, bahkan yang rumit
sekalipun. Professor Sourav Chatterjee memberikan alternatif dengan menghitung korelasi Xi.
Ini terdengar berguna sangat ! Namun, perhatikan bahwa matriks korelasi yang dibentuk tidak
simetris, dan tidak memiliki konsep "anti-korelasi." Atau nilai korelasinya minus yang artinya
berbanding terbalik. Nilai Xi bisa negatif, tetapi negativitas ini tidak memiliki signifikansi yang berrarti
(selain "mendekati nol", seperti yang akan kita bahas nanti).

Jadi mungkin, daripada memikirkan sebagai "korelasi" yang sudah didominasi dengan paham
linieritas, mungkin nilai Xi akan lebih berguna untuk menganggapnya sebagai ukuran
ketergantungan: khususnya, sejauh mana variabel y bergantung pada variabel x. dan tidak
sebaliknya.

Balik ke simulasi tadi dengan menggunakan library XICOR yang bisa diunduh di sini https://cran.r-
project.org/web/packages/XICOR/index.html akan mendapatkan hasil matrik sebagai berikut :
x y

x 0.98507463 0.9406735
y 0.05130128 0.9850746

Kita lihat hubungannya memang tidak simetris atau asimetris seperti pada matriks korelasi yang
usdah bisa digunakan seperti pearson. Hubungan x terhadap y itu 0.9406 sangat tinggi sedangkan
hubungan sebaliknya y terhadap x hanya 0.051 (sangat kecil dan tidak signifikan).
>xitest(df$x, df$y,p)
"xi = 0.940673516837921 , p = 0"
"REJECT independence of x and y"
> xitest(df$y, df$x,p)
xi = 0.0513012825320633 , p = 0.125676959766959"
"DON'T REJECT independence of x and y"

Untuk menggunakan data nyata kita menggunakan Data kacang polong yang dikumpulkan oleh Sir
Francis Galton, yang dikumpulkan pada tahun 1875, adalah salah satu yang kumpulan data set
paling awal dan paling terkenal dalam sejarah statistik. Data terdiri dari 700 hasil pengamatan
diameter rata-rata kacang polong manis pada tanaman induk dan tanaman anak. Datanya sebagai
berikut 6 terawal dari 700 data secara keseluruhan:
parent child
1 21 14.67
2 21 14.67
3 21 14.67
4 21 14.67
5 21 14.67
6 21 14.67

Jika kita plot dan hitung korelasinya secara korelasi klasik maka didapat :
Ibrah dan hikmah dari percobaan ini, jangan putus asa jika data anda diuji tidak berkorelasi (r=0)
dengan menggunakan cara klasik Spearman, Pearson atau Kendal, jangan jangan data yang anda
miliki tidak bersifat linier, tidak monotonik, bukan artinya mereka tidak berhubungan, berasosiasi
atau bergantung. Tetapi hubungan fungsionalnya memang tidak linier. Sebaliknya kita jangan
memaksakan sesuatu hubungan yang secara fungsional tidak linier dengan rumus korelasi klasik
tentunya akan salah pengambilan kesimpulannya.

Anda mungkin juga menyukai