Titik perkiraan efek untuk setiap percobaan menunjukkan keparahan
depresi yang lebih rendah di antara peserta yang dialokasikan untuk kelompok latihan dibandingkan dengan mereka dialokasikan untuk kontrol non - olahraga (Gambar 2 ) . Empat dari sembilan percobaan perbedaan dalam tingkat keparahan depresi secara statistik signifikan . Dua percobaan dari latihan 3D melaporkan ukuran besarnya efek jauh lebih besar dari uji coba yang tersisa , dan heterogenitas statistik terdeteksi antara efek trial- tingkat ( I 2 = 58 % , w2 = 18,97 , df = 8 , P = 0,02 ) . Kedua percobaan telah dihapus dan tidak memberikan kontribusi untuk analisis selanjutnya . Keputusan untuk tidak menggabungkan uji coba dalam sintesis terpisah didasarkan pada deteksi heterogenitas statistik antara percobaan ( I 2 = 60 % , w2 = 2,48 , df = 1 , P = 0,12 ) dan penilaian dari setiap percobaan sebagai memiliki risiko tinggi bias . Hanya uji coba latihan campuran yang mengkontribusikan data analisis untuk dikumpulkan ( Tabel 2 ). Sintesis data dari tujuh percobaan menghasilkan efek kecil tapi signifikan secara statistik di mana latihan dikaitkan dengan tingkat keparahan depresi yang lebih rendah ( SMD = 70,34 , 95 % CI 70,52-70,17 ) . Tidak ada bukti heterogenitas statistik antara pooled estimates ( I 2 = 0 % ) , dan tidak ada indikasi bias studi kecil ( Egger 70.52 , 95 % CI 73,722,69 , P = 0.72 ) . Kecil , efek yang signifikan secara statistik muncul dari sintesis tiga trials17 , 18,20 di mana kelayakan peserta diperlukan diagnosis saat depresi ( SMD = 70.38 , 95 % CI 70,67-70,10 ) , dan dalam empat trials16 , 19,21,22 menggunakan ambang gejala checklist ( SMD = 70,34 , 95 % CI 70,62-70,06 ) . Untuk sintesis yang terakhir ada beberapa indikasi variasi antara pooled estimates ( I2 = 25 % ) , tapi ini tidak mungkin penting dan tidak melebihi apa yang diharapkan secara kebetulan saja ( w2 = 4,02 , df = 3 , P = 0.26 ) . Kecil , efek yang signifikan secara statistik mendukung latihan diamati pada tiga trials17 , 20,22 dengan risiko rendah bias ( SMD = 70.36 , 95 % CI -0.61 sampai -0.10 ) , empat trials17 , 18,20,21 menggunakan pooled estimates terdeteksi namun tidak melebihi apa yang diharapkan oleh kebetulan saja dalam analisis risiko bias ( I 2 = 25 % , w2 = 3,20 , df = 2 , P = 0,20 ) dan periode follow - up ( I2 = 19 % , w2 = 3,72 , df = 3 , P = 0,29 ) . Tidak ada bukti heterogenitas statistik antara percobaan membandingkan latihan dengan kontrol perawatan biasa aktif ( I 2 = 0 % , w2 = 2,43 , df = 3 , P = 0.49 ) .