Anda di halaman 1dari 23

Regresi linier dengan One predictor Variabel

Analisis regresi adalah metodologi statistik yang memanfaatkan hubungan antara dua atau
variabel yang lebih kuantitatif sehingga variabel respon atau hasil dapat diprediksi dari
yang lain , atau orang lain . Metodologi ini banyak digunakan dalam bisnis , sosial dan
perilaku ilmu , ilmu biologi , dan disiplin ilmu lainnya . Beberapa contoh aplikasi adalah:
1 . Penjualan produk dapat diprediksi dengan memanfaatkan hubungan antara penjualan
dan jumlah pengeluaran iklan .
2 Kinerja karyawan pada pekerjaan dapat diprediksi dengan memanfaatkan hubungan
antara kinerja dan baterai tes bakat .
3 . Ukuran dari kosakata anak dapat diprediksi dengan memanfaatkan hubungan
antara ukuran kosakata dan usia anak dan jumlah pendidikan orang tua .
4 . Lama tinggal di rumah sakit seorang pasien bedah dapat diprediksi dengan
memanfaatkan hubungan antara waktu di rumah sakit dan tingkat keparahan operasi .
Dalam Bagian I kita mengambil analisis regresi ketika variabel prediktor tunggal digunakan
untuk memprediksi respon atau variabel hasil bunga. Dalam Bagian II dan III , kami
mempertimbangkan analisis regresi ketika dua atau lebih variabel yang digunakan untuk
membuat prediksi . dalam hal ini bab , kami mempertimbangkan ide-ide dasar analisis
regresi dan mendiskusikan estimasi parameter model regresi yang mengandung variabel
prediktor tunggal.
1.1 Hubungan antara Variabel
1.2 Konsep hubungan antara dua variabel, seperti antara pendapatan keluarga dan keluarga
pengeluaran untuk perumahan, adalah satu akrab. Kami membedakan antara hubungan
afunctional dan hubungan statistik, dan mempertimbangkan masing-masing di tum.

Hubungan fungsional antara Dua Variabel

Sebuah hubungan fungsional antara dua variabel dinyatakan oleh rumus matematika. Jika X
2 menunjukkan variabel bebas dan Y variabel dependen, hubungan fungsional adalah ... Y =
f (X) Mengingat nilai tertentu dari X, fungsi f menunjukkan nilai yang sesuai Y.
Pertimbangkan hubungan antara penjualan Douar (Y) dari produk yang dijual dengan harga
tetap dan nomor unit yang terjual (X). Jika harga jual adalah $ 2 per unit, relasi dinyatakan
dengan persamaan: Y = 2X
Hubungan fungsional ini ditunjukkan pada Gambar 1.1. Jumlah unit yang terjual dan
penjualan dolar selama tiga periode terakhir (sementara harga satuan tetap konstan pada $ 2)
adalah sebagai berikut:
Jumlah Dollar
Periode Unit Terjual Penjualan
1 75 150 $
2 25 50
3 130 260
Pengamatan ini juga diplot pada Gambar 1.1. Perhatikan bahwa AU Fau langsung pada garis
hubungan fungsional. Ini adalah karakteristik dari hubungan fungsional AU

Hubungan statistik antara Dua Variabel
contoh 1
Sebuah hubungan statistik, tidak seperti hubungan fungsional, bukan yang sempurna. Secara
umum, pengamatan untuk hubungan statistik tidak Fau langsung di-kurva hubungan.
Evaluasi performansi bisnis selama 10 karyawan diperoleh pada pertengahan tahun dan akhir
tahun.
Data ini diplot pada Gambar 1.2a. Evaluasi akhir tahun diambil sebagai dependen atau
variabel respon Y, dan pertengahan tahun evaluasi sebagai independen, jelas, atau prediktor

Variabel X. merencanakan dilakukan seperti sebelumnya . Misalnya , kinerja pertengahan
tahun dan akhir tahun evaluasi untuk karyawan pertama diplot di X = 90 , Y = 94 .
Gambar l.2a jelas menunjukkan bahwa ada hubungan antara pertengahan tahun dan akhir
tahun evaluasi , dalam arti bahwa semakin tinggi evaluasi pertengahan tahun , cenderung
lebih tinggi untuk akhir tahun evaluasi. Namun, hubungan ini tidak sempurna . Ada
hamburan poin , menunjukkan bahwa beberapa variasi dalam evaluasi akhir tahun tidak
dicatat dengan pertengahan tahun penilaian kinerja . Misalnya , dua karyawan memiliki
evaluasi pertengahan tahun X = 80 , namun mereka menerima agak berbeda evaluasi akhir
tahun. Karena hamburan poin dalam hubungan statistik, Gambar 1.2a disebut diagram pencar
atau plot pencar . di statistik terminologi , setiap titik dalam diagram pencar merupakan trial
atau kasus .
Pada Gambar 1.2b , kami telah diplot garis hubungan yang menggambarkan hubungan
statistik antara pertengahan tahun dan akhir tahun evaluasi . Hal ini menunjukkan
kecenderungan umum dimana akhir tahun evaluasi bervariasi dengan tingkat evaluasi kinerja
tengah tahun . Perhatikan bahwa sebagian besar poin tidak jatuh langsung pada garis
hubungan statistik . Ini hamburan poin sekitar garis mewakili variasi dalam evaluasi akhir
tahun yang tidak terkait dengan evaluasi kinerja pertengahan tahun dan yang biasanya
dianggap bersifat acak.
Hubungan statistik dapat sangat berguna , meskipun mereka tidak memiliki ketepatan dari
hubungan fungsional .

Contoh 2
Gambar 1.3 menyajikan data tentang usia dan tingkat steroid dalam plasma selama 27
perempuan sehat antara 8 dan 25 tahun. Data sangat menyarankan bahwa hubungan statistik
adalah lengkung (tidak linier). Kurva hubungan juga telah ditarik pada Gambar 1.3. itu
menyiratkan bahwa, seiring dengan meningkatnya usia, tingkat steroid meningkat sampai
titik tertentu dan kemudian mulai tingkat off. Perhatikan lagi hamburan poin sekitar kurva
hubungan statistik, khas dari semua hubungan statistik.

1.3 Model Regresi dan Penggunaan mereka
Origins sejarah
Analisis regresi pertama kali dikembangkan oleh Sir Francis Galton di bagian akhir
Abad ke-19 . Galton telah mempelajari hubungan antara tinggi orang tua dan anak-anak dan
mencatat bahwa ketinggian anak orang tua keduanya tinggi dan pendek tampaknya "
kembali " atau
" kemunduran " dengan rata-rata kelompok . Ia menganggap kecenderungan ini menjadi
regresi untuk
" biasa-biasa saja . " Galton mengembangkan deskripsi matematis regresi ini kecenderungan
itu,
prekursor model regresi hari ini .
Regresi Istilah berlanjut sampai hari ini untuk menggambarkan hubungan statistik betwe ! N
variabel .
Konsep dasar
contoh
Sebuah model regresi adalah cara formal untuk mengekspresikan dua unsur penting dari
hubungan statistik :
1 . Sebuah kecenderungan variabel respon Y bervariasi dengan prediktor variabel X secara
sistematis
fashion.
2 . Sebuah hamburan poin di sekitar kurva hubungan statistik .
Kedua karakteristik yang diwujudkan dalam model regresi dengan mendalilkan bahwa:
1 . Ada disfiibution probabilitas Y untuk setiap tingkat X.
2 . Cara-cara ini distribusi probabilitas bervariasi dalam beberapa cara sistematis dengan X.
Pertimbangkan lagi contoh evaluasi kinerja FiglU " e 1.2 . Akhir tahun evaluasi Y
diperlakukan dengan model regresi sebagai variabel acak . Untuk setiap tingkat kinerja
pertengahan tahun
evaluasi, ada mendalilkan distribusi probabilitas Y. Gambar 1.4 menunjukkan seperti
distribusi probabilitas untuk X = 90 , yang merupakan evaluasi pertengahan tahun untuk
karyawan pertama .
Sebenarnya evaluasi akhir tahun karyawan ini , Y = 94 , kemudian dipandang sebagai acak
seleksi dari distribusi probabilitas .
Gambar 1.4 juga menunjukkan distribusi probabilitas Y untuk tingkat evaluasi pertengahan
tahun X = 50
dan X = 70 . Perhatikan bahwa sarana distribusi probabilitas memiliki hubungan sistematis
ke level X. Hubungan sistematis disebut fungsi regresi Y berdasarkan X.
Grafik fungsi regresi disebut kurva regresi . Perhatikan bahwa dalam Gambar 1.4
fungsi regresi sedikit lengkung . Ini akan berarti misalnya kita bahwa peningkatan
di diharapkan (mean ) evaluasi akhir tahun dengan peningkatan kinerja pertengahan tahun
evaluasi terhambat pada tingkat yang lebih tinggi kinerja pertengahan tahun.
Model regresi mungkin berbeda dalam bentuk fungsi regresi ( linier , lengkung ) ,
dalam bentuk distribusi probabilitas Y ( simetris , miring ) , dan dengan cara lain .
Apapun variasi , konsep distribusi probabilitas Y untuk setiap X yang diberikan adalah
mitra resmi kepada pencar empiris dalam hubungan statistik. Demikian pula , regresi
kurva , yang menggambarkan hubungan antara sarana distribusi probabilitas
Y dan tingkat X , adalah mitra untuk kecenderungan umum Y bervariasi dengan X
sistematis dalam suatu hubungan statistik.
Model regresi dengan Lebih dari Satu Prediktor Variabel . Model regresi dapat
mengandung lebih dari satu variabel prediktor . Tiga contoh berikut .
1 . Dalam sebuah studi efisiensi 67 kantor cabang dari rantai pembiayaan konsumen ,
respon
variabel adalah biaya operasi langsung untuk tahun yang baru saja berakhir . Ada empat
variabel prediktor :
ukuran rata-rata outstanding pinjaman selama tahun , rata-rata jumlah pinjaman , jumlah
jumlah aplikasi kredit baru diproses , dan indeks gaji kantor .
2 . Dalam studi pembelian traktor , variabel respon adalah Volume ( tenaga kuda ) dari
pembelian traktor di wilayah penjualan perusahaan peralatan pertanian . Ada sembilan
prediktor
variabel , termasuk usia rata-rata traktor di lahan pertanian di wilayah itu , jumlah
peternakan di
wilayah , dan indeks kuantitas produksi tanaman di wilayah itu .
3 . Dalam sebuah penelitian medis anak-anak pendek , variabel respon adalah pertumbuhan
plasma puncak
tingkat hormon . Ada 14 variabel prediktor , termasuk usia , jenis kelamin , tinggi badan,
berat badan ,
dan 10 pengukuran lipatan kulit .
Model fitur diwakili dalam Gambar 1.4 harus diperluas ke dimensi lebih lanjut
ketika ada lebih dari satu variabel prediktor . Dengan dua prediktor variabel Xl dan X2
misalnya, distribusi probabilitas Y untuk setiap ( X " X2 ) kombinasi diasumsikan
oleh model regresi . Hubungan sistematis antara sarana probabilitas ini
distribusi dan variabel prediktor Xl dan X2 kemudian diberikan oleh permukaan regresi .

Konstruksi Model Regresi
Pemilihan Variabel Predictor . Karena kenyataan harus dikurangi dengan proporsi dikelola
setiap kali kita membangun model , hanya sejumlah terbatas dari penjelasan atau prediksi
variabel dapat - atau harus - dimasukkan dalam model regresi untuk setiap situasi yang
menarik .
Oleh karena Masalah sentral dalam banyak studi eksplorasi adalah bahwa memilih , untuk
regresi
Model , satu set variabel prediktor yang "baik" dalam arti tertentu untuk tujuan
analisis. Pertimbangan utama dalam membuat pilihan ini adalah sejauh mana memilih
variabel memberikan kontribusi untuk mengurangi variasi yang tersisa di penyisihan Yafter
dibuat untuk
kontribusi variabel prediktor lain yang sementara dimasukkan dalam
model regresi . Pertimbangan lainnya termasuk pentingnya variabel ks kausal
agen dalam proses di bawah analisis , sejauh mana pengamatan pada variabel dapat
diperoleh lebih akurat, atau cepat , atau ekonomis dari pada variabel bersaing , dan
sejauh mana variabel dapat dikendalikan . Dalam Bab 9 , kita akan membahas prosedur
dan masalah dalam memilih variabel prediktor untuk dimasukkan dalam model regresi .

Bentuk Fungsional Regresi Hubungan . Pemilihan bentuk fungsional dari
hubungan regresi terkait dengan pemilihan variabel prediktor . Kadang-kadang , teori yang
relevan
mungkin menunjukkan bentuk fungsional yang sesuai . Teori belajar , misalnya, mungkin
menunjukkan
bahwa regresi fungsi terkait biaya unit produksi untuk jumlah kali sebelumnya
item telah diproduksi harus memiliki bentuk tertentu dengan sifat asimtotik tertentu.
Lebih sering , bagaimanapun , bentuk fungsional dari relasi regresi tidak dikenal di
maju dan harus diputuskan secara empiris setelah data telah dikumpulkan . linear
atau fungsi regresi kuadrat sering digunakan sebagai memuaskan pertama perkiraan untuk
fungsi regresi alam diketahui . Memang , jenis sederhana fungsi regresi
dapat digunakan bahkan ketika teori memberikan bentuk fungsional yang relevan ,
terutama ketika
bentuk yang dikenal sangat kompleks, namun dapat diperkirakan oleh linear atau kuadrat
fungsi regresi . Gambar l.5a mengilustrasikan kasus di mana fungsi regresi kompleks
mungkin cukup didekati dengan fungsi regresi linier . Gambar l.5b memberikan
contoh di mana dua fungsi regresi linier dapat digunakan " piecewise " untuk perkiraan
fungsi regresi yang kompleks .
Lingkup Model . Dalam merumuskan model regresi , biasanya kita perlu membatasi cakupan
dari model untuk beberapa interval atau wilayah nilai-nilai dari variabel prediktor ( s ) . itu
cakupannya ditentukan baik oleh desain penyelidikan atau dengan kisaran data di tangan .
Sebagai contoh, sebuah perusahaan mempelajari pengaruh harga pada volume penjualan
diselidiki enam harga
tingkatan, mulai dari $ 4,95 sampai $ 6,95. Di sini , ruang lingkup model terbatas pada
tingkat harga
mulai dari mendekati US $ 5 sampai mendekati US $ 7. Bentuk fungsi regresi substansial luar
kisaran ini akan berada dalam keraguan yang serius karena penyelidikan tidak memberikan
bukti untuk
sifat hubungan statistik di bawah $ 4,95 atau di atas $ 6,95.

Penggunaan Analisis Regresi
Analisis regresi menyajikan tiga tujuan utama: ( I) deskripsi , ( 2 ) kontrol, dan ( 3 ) prediksi .
Tujuan ini diilustrasikan oleh tiga contoh dikutip sebelumnya . Pembelian traktor
Studi melayani tujuan deskriptif . Dalam studi cabang biaya operasional kantor , utama
tujuannya adalah kontrol administratif , dengan mengembangkan hubungan statistik yang
dapat digunakan antara biaya
dan variabel prediktor , manajemen bisa menetapkan standar biaya untuk setiap kantor
cabang
dalam rantai perusahaan . Dalam studi medis anak pendek , tujuannya adalah prediksi .
Dokter dapat menggunakan hubungan statistik untuk memprediksi kekurangan hormon
pertumbuhan
pada anak pendek dengan menggunakan pengukuran sederhana dari anak-anak .
Yang beberapa tujuan analisis regresi sering tumpang-tindih dalam praktek . cabang
Misalnya kantor adalah kasus di titik . Pengetahuan tentang hubungan antara biaya
operasional dan
karakteristik kantor cabang tidak hanya memungkinkan manajemen untuk menetapkan
standar biaya untuk
setiap kantor tetapi manajemen juga bisa memprediksi biaya , dan pada akhir tahun fiskal
itu
bisa membandingkan biaya aktual cabang terhadap biaya yang diharapkan .

Regresi dan Kausalitas
Adanya hubungan statistik antara variabel respon Y dan penjelasan atau
variabel prediktor X tidak berarti dengan cara apapun bahwa Y tergantung kausal pada X.
Tidak peduli seberapa
kuat adalah hubungan statistik antara X dan Y , ada pola sebab- akibat adalah selalu
ditunjukkan oleh model regresi . Misalnya , data pada ukuran kosakata ( X ) dan menulis
kecepatan ( Y ) untuk sampel anak-anak berusia 5-10 akan menunjukkan hubungan regresi
positif .
Hubungan ini tidak berarti , bagaimanapun, bahwa peningkatan kosakata menyebabkan
menulis lebih cepat
kecepatan . Di sini , variabel penjelas lainnya, seperti usia anak dan jumlah pendidikan,
mempengaruhi baik kosakata ( X ) dan kecepatan menulis ( Y ) . Anak yang lebih tua memiliki
lebih besar
kosakata dan kecepatan menulis lebih cepat .
Bahkan ketika hubungan statistik yang kuat mencerminkan kondisi kausal , kondisi kausal
dapat bertindak dalam arah yang berlawanan , dari Y ke X. Perhatikan, misalnya , kalibrasi
termometer . Di sini , pembacaan termometer yang diambil pada suhu yang dikenal berbeda
,
dan hubungan regresi dipelajari sehingga akurasi prediksi yang dibuat dengan menggunakan
pembacaan termometer dapat dinilai . Untuk tujuan ini , pembacaan termometer adalah
variabel prediktor X , dan suhu aktual adalah variabel respon Y untuk diprediksi .
Namun, pola kausal sini tidak pergi dari X ke Y , tapi ke arah sebaliknya:
suhu aktual ( Y ) mempengaruhi pembacaan termometer ( X ) .
Contoh-contoh ini menunjukkan perlunya perawatan dalam menarik kesimpulan tentang
penyebab
hubungan dari analisis regresi . Analisis regresi dengan sendirinya tidak memberikan
informasi
tentang pola kausal dan harus dilengkapi dengan analisis tambahan untuk mendapatkan
wawasan
tentang hubungan sebab akibat .

Penggunaan Komputer
Karena analisis regresi sering memerlukan perhitungan panjang dan membosankan ,
komputer
biasanya digunakan untuk melakukan perhitungan yang diperlukan . Hampir setiap paket
statistik untuk
komputer mengandung komponen regresi . Sedangkan paket berbeda dalam banyak detail ,
mereka
Output regresi dasar cenderung sangat mirip .
Mter penjelasan awal perhitungan regresi yang dibutuhkan , kita akan bergantung pada
komputer
perhitungan untuk semua contoh berikutnya . Kami menggambarkan output komputer
dengan menghadirkan keluaran
dan grafis dari BMDP ( Ref. 1,1 ) , MINITAB ( Ref. 1,2 ) , SAS ( Ref. 1,3 ) , SPSS ( Ref. 1,4 ) ,
SYSTAT ( Ref. 1,5 ) , JMP ( Ref. 1,6 ) , S -Plus ( Ref. 1,7 ) , dan MATLAB ( Ref. 1,8 ) ; , .

1.3 Model Regresi Linear Sederhana dengan Distribusi
Ketentuan Unspecified Error
Pernyataan Formal Model
Dalam Bagian I kita mempertimbangkan model regresi dasar di mana hanya ada satu
variabel prediktor
dan fungsi regresi linier . Model ini dapat dinyatakan sebagai berikut :
Y ; = F30 + f31X ; + 10; ( 1.1 )
di mana :
Y , adalah nilai variabel respon dalam sidang engan
F30 dan F31 adalah parameter
X , adalah sebuah konstanta yang dikenal , yaitu nilai dari variabel prediktor dalam sidang
engan
10 , adalah kesalahan istilah acak dengan mean E { Cd = 0 dan varians u 2 { Cd = u 2; 10 , dan
Cj adalah
berkorelasi sehingga kovarians mereka adalah nol (yaitu , u { c; , Cj } = 0 untuk semua i , j; i =
1 = j )
i = _1 , ... , n
Model regresi ( 1.1 ) dikatakan sederhana , linear dalam parameter , dan linier dalam
variabel prediktor . Ini adalah " sederhana " dalam bahwa hanya ada satu variabel prediktor
, " linear dalam
parameter , " karena tidak ada parameter muncul sebagai eksponen atau dikalikan atau
dibagi dengan
parameter lain , dan " linear dalam variabel prediktor , " karena variabel ini hanya muncul
pada kekuatan pertama. Sebuah model yang linear dalam parameter dan dalam variabie
prediktor adalah
disebut juga model ajirst -order .

Fitur penting dari Model
1 . Respon Y , dalam sidang i adalah jumlah dari dua komponen : ( 1 ) istilah konstan
F30 + F31 Xi dan ( 2 ) istilah acak .. c ; . Oleh karena itu , Yi adalah variabel rando ... m .
2 . Karena E { c; } = 0 , maka dari ( A.13c ) dalam Lampiran A bahwa:
E { Y ;} = { E f3o + F31 X , + cd = F30 + fhX ; + E { Cd = F30 + f31X ;
Perhatikan bahwa F30 + f31X , memainkan peran tersebut yang konstan dalam ( A. 13c )

Dengan demikian , respon Vi , ketika tingkat X dalam sidang i adalah Xi , berasal dari
probabilitas
distribusi yang rata-rata adalah :
( 1.2 )
Oleh karena itu kita tahu bahwa fungsi regresi untuk model ( 1.1 ) adalah :
( 1.3 )
karena fungsi regresi berkaitan sarana distribusi probabilitas Y untuk diberikan
X untuk tingkat X.
3 . Tanggapan Yi dalam sidang engan melebihi atau jatuh pendek dari nilai regresi
fungsi dengan kesalahan istilah jumlah Ci .
4 . Istilah kesalahan Ci diasumsikan memiliki varians konstan 0-2 karena Hal berikut bahwa
tanggapan Yi memiliki varian konstan yang sama :
( 1.4 )
karena, dengan menggunakan ( A.I6a ) , kita memiliki:
0-2 { , 80 + , 81 + Xi cd = 0-2 { c; } = 0-2
Dengan demikian , model regresi ( 1.1 ) mengasumsikan bahwa distribusi probabilitas dari Y
memiliki sama
varians 0 - 2 , terlepas dari tingkat prediktor variabel X.
5 . Istilah kesalahan diasumsikan tidak berkorelasi . Karena istilah kesalahan Ci dan Cj adalah
berkorelasi , demikian pula respon Yi dan Yj
6 . Singkatnya , model regresi ( 1.1 ) menunjukkan bahwa tanggapan Yi berasal dari
probabilitas
distribusi yang berarti adalah E { Y ;} = , 80 + , 81Xi dan yang varians adalah 0-2 , yang
sama untuk semua tingkat X. Selanjutnya, setiap dua tanggapan Yi dan Yj tidak berkorelasi .
Seorang konsultan untuk distributor listrik adalah mempelajari hubungan antara nomor
tawaran yang diminta oleh kontraktor konstruksi untuk peralatan pencahayaan dasar
selama seminggu
dan waktu yang diperlukan untuk menyiapkan tawaran . Misalkan model regresi ( 1.1 )
berlaku
dan adalah sebagai berikut :
Yi = 9,5 + + 2.IXi Ci
dimana X adalah jumlah tawaran disiapkan dalam seminggu dan Y adalah jumlah waktu yang
dibutuhkan untuk
menyiapkan tawaran . Gambar 1.6 berisi presentasi dari fungsi regresi :
E { Y } = 9,5 + 2.IX
Misalkan pada minggu engan , Xi = 45 tawaran dipersiapkan dan jumlah sebenarnya jam
yang diperlukan Yi = 108 . Dalam hal ini, nilai error term adalah Ci = 4 , karena kita memiliki
E { Y ;} = 9,5 + 2,1 ( 45 ) = 104
dan
Yi = 108 = 104 + 4
Gambar 1.6 menampilkan distribusi probabilitas dari Y untuk X = 45 dan menunjukkan dari
di mana dalam distribusi ini pengamatan Yi = 108 datang . Perhatikan lagi bahwa istilah
kesalahan Ci
hanyalah penyimpangan Yi dari nilai rata-ratanya E { Y ; } .
Gambar 1.6 juga menunjukkan distribusi probabilitas Y saat X = 25 . Perhatikan bahwa ini
distribusi menunjukkan variabilitas yang sama sebagai distribusi probabilitas ketika X = 45 ,
di
kesesuaian dengan persyaratan model regresi ( 1.1 ) .

Arti Regresi Parameter
contoh
Parameter F30 dan f3 , dalam model regresi ( 1.1 ) disebut koefisien regresi . f3 ,
adalah kemiringan garis regresi . Hal ini menunjukkan perubahan dalam rata-rata probabilitas
distribusi Y per unit kenaikan X. Parameter F30 adalah intercept Y dari regresi
line. Ketika lingkup model termasuk X = 0 , F30 memberikan rata-rata probabilitas
distribusi Y pada X = O. Ketika lingkup model tidak mencakup X = 0 , F30 tidak
tidak memiliki makna tertentu sebagai sebagai ~ jangka parate dalam model regresi .
Gambar 1.7 menunjukkan fungsi regresi :
E { Y } = 9,5 + 2.1x
untuk distributor misalnya listrik . Kemiringan f3 , = 2.1 i- ndicates bahwa persiapan
satu tawaran tambahan dalam seminggu menyebabkan peningkatan rata-rata distribusi
probabilitas
Y dari 2 . Aku jam.
Mencegat F30 = 9,5 menunjukkan nilai dari fungsi regresi di X = O. Namun ,
karena model regresi linier dirumuskan untuk diterapkan ke minggu di mana jumlah
12 Bagian Satu Regresi Linier Sederhana
tawaran disiapkan berkisar 20-80 , F30 tidak memiliki arti intrinsik sendiri
di sini . Jika lingkup dari model itu harus diperluas ke tingkat X mendekati nol , model
dengan
fungsi regresi lengkung dan beberapa nilai F30 berbeda untuk linier
fungsi regresi mungkin juga diperlukan.

Versi Alternatif Model Regresi
Kadang-kadang akan lebih mudah untuk menulis model regresi linier sederhana ( 1.1 ) dalam
sedikit
berbeda , meskipun sama , bentuk. Biarkan Xo berupa sebuah konstanta identik sama dengan
1 . Kemudian, kita
dapat menulis ( 1.1 ) sebagai berikut :
Y ; = f3oXo + f3 , X , + 8i mana Xo == 1 ( 1.5 )
Ini versi dari model asosiasi variabel X dengan masing-masing koefisien regresi .
Sebuah modifikasi alternatif adalah dengan menggunakan untuk variabel prediktor
penyimpangan Xi - X
daripada Xi . Untuk meninggalkan Model ( 1.1 ) tidak berubah , kita perlu menulis :
Ii = F30 + f3 , ( X , - X ) + f3 , X + 8 ;
= ( F3o + f3 , X ) + f3 , ( X , - X ) + 8i
= F3 ~ + F31 ( Xi - X ) + 8 ;
Dengan demikian , ini alternatif model versi adalah :
Yi = f3 ~ + f3 , ( Xi - X ) + 8 ;
di mana :
f3 ~ = F30 + f3 , X
Kami menggunakan model ( 1.1 ) , ( 1,5 ) , dan ( 1,6 ) secara bergantian sebagai mendikte
kenyamanan .

1.4 Data Analisis Regresi
( 1.6 )
( 1.6a )
Biasanya , kita tidak tahu nilai-nilai parameter regresi F30 dan f3 , dalam regresi
Model ( 1.1 ) , dan kita harus memperkirakan mereka dari data yang relevan . Memang ,
seperti yang kita catat sebelumnya , kami
sering tidak memiliki cukup pengetahuan apriori dari variabel prediktor yang sesuai
dan bentuk fungsional hubungan regresi ( misalnya , linear atau lengkung ) , dan kami
perlu bergantung pada analisis data untuk mengembangkan model regresi yang sesuai .
Data untuk analisis regresi dapat diperoleh dari nonexperimental atau eksperimental
studi . Kami menganggap masing-masing di tum .
data observasional
Data pengamatan adalah data yang diperoleh dari studi nonexperimental . Studi tersebut tidak
mengontrol penjelasan atau prediksi variabel ( s ) dari bunga. Misalnya , pejabat perusahaan
ingin mempelajari hubungan antara usia karyawan ( X ) dan jumlah hari sakit
tahun lalu ( Y ) . Data yang diperlukan untuk digunakan dalam analisis regresi diperoleh dari
personil
catatan . Data tersebut merupakan data pengamatan sejak variabel penjelas , usia, tidak
dikontrol .
Analisis regresi sering didasarkan pada data pengamatan , karena seringkali tidak
layak untuk melakukan eksperimen terkontrol . Dalam personil contoh perusahaan hanya
disebutkan , misalnya, tidak akan mungkin untuk mengontrol usia dengan menetapkan usia
untuk orang .

Keterbatasan besar data pengamatan adalah bahwa mereka sering tidak memberikan
informasi yang memadai
tentang hubungan sebab -akibat . Misalnya, hubungan positif antara usia
karyawan dan jumlah hari sakit pada personil contoh perusahaan mungkin tidak
menyiratkan
bahwa jumlah hari sakit adalah akibat langsung dari usia. Mungkin bahwa karyawan muda
perusahaan terutama bekerja di dalam ruangan sementara karyawan yang lebih tua
biasanya bekerja di luar rumah , dan
bahwa lokasi kerja lebih langsung bertanggung jawab untuk jumlah hari sakit dari usia .
Setiap kali analisis regresi dilakukan untuk tujuan deskripsi berdasarkan pengamatan
data, orang harus menyelidiki apakah variabel penjelas selain mereka yang dianggap
dalam model regresi mungkin lebih langsung menjelaskan hubungan sebab -akibat .

data eksperimental
Sering , adalah mungkin untuk melakukan percobaan terkontrol untuk menyediakan data
dari mana
parameter regresi dapat diperkirakan . Perhatikan, misalnya , perusahaan asuransi yang
keinginan untuk mempelajari hubungan antara produktivitas analis dalam pemrosesan ) (
laims dan
Lama pelatihan . Sembilan analis yang akan digunakan dalam penelitian ini . Tiga dari
mereka akan dipilih
secara acak dan dilatih selama dua minggu , tiga selama tiga minggu , dan tiga selama lima
minggu .
Para analis ofthe produktivitas selama 10 minggu berikutnya kemudian akan diamati . Data
sehingga diperoleh akan data eksperimen karena kontrol dilaksanakan atas jelas
variabel , panjang pelatihan .
Ketika kontrol atas variabel penjelas ( s ) dilaksanakan melalui penugasan acak ,
seperti dalam studi contoh produktivitas, data yang dihasilkan eksperimen memberikan
lebih kuat
informasi tentang penyebab - dan-efek hubungan daripada data pengamatan . Alasannya
adalah
yang pengacakan cenderung untuk mengimbangi efek dari setiap variabel lain yang mungkin
mempengaruhi
variabel respon , seperti pengaruh bakat dari karyawan terhadap produktivitas .
Dalam terminologi desain eksperimental , panjang pelatihan ditugaskan seorang analis di
studi contoh produktivitas disebut pengobatan . Para analis untuk dimasukkan dalam
penelitian ini
disebut unit eksperimental . Kontrol atas variabel penjelas ( s ) kemudian terdiri dari
menugaskan pengobatan untuk masing-masing unit eksperimen dengan cara pengacakan .

Rancangan Acak Lengkap
Jenis yang paling dasar dari desain statistik untuk membuat tugas acak perawatan untuk
unit percobaan ( atau sebaliknya ) adalah rancangan acak lengkap . Dengan desain ini,
tugas yang dibuat benar-benar acak . Ini pengacakan lengkap menyatakan bahwa semua
kombinasi unit eksperimental ditugaskan untuk perlakuan yang berbeda sama-sama
mungkin ,
yang berarti bahwa setiap unit percobaan memiliki kesempatan yang sama untuk menerima
siapa pun dari
perawatan .
Sebuah rancangan acak lengkap ini sangat berguna ketika unit eksperimen
cukup homogen . Desain ini VEI ) , fleksibel, mengakomodasi sejumlah perawatan
dan memungkinkan sampel yang berbeda ~ izes untuk perawatan yang berbeda . Kepala
merugikan adalah bahwa ,
ketika unit percobaan yang heterogen , desain ini tidak seefisien beberapa lainnya
desain statistik.

1.5 Ikhtisar Langkah-langkah dalam Analisis Regresi
Model regresi yang dipertimbangkan dalam hal ini dan selanjutnya bab dapat dimanfaatkan
baik
untuk data pengamatan atau data eksperimen dari rancangan acak lengkap .
( Analisis regresi juga dapat memanfaatkan data dari jenis lain desain eksperimental, namun
model regresi yang disajikan di sini akan perlu diubah . ) Apakah data yang
observasional atau eksperimental , adalah penting bahwa kondisi model regresi menjadi
sesuai untuk data di tangan untuk model dapat diterapkan .
Kita mulai diskusi kita analisis regresi dengan mempertimbangkan kesimpulan tentang
regresi
parameter untuk model regresi linier sederhana ( 1.1 ) . Untuk kesempatan langka
mana pengetahuan sebelumnya atau teori saja memungkinkan kita untuk menentukan regresi
yang tepat
Model . kesimpulan berdasarkan pada model regresi adalah langkah pertama dalam analisis
regresi .
Dalam situasi yang biasa , namun, di mana kita tidak memiliki pengetahuan yang memadai
untuk menentukan
model regresi yang tepat di muka, langkah pertama adalah studi eksplorasi dari data ,
seperti yang ditunjukkan dalam diagram alur pada Gambar 1.8 . Atas dasar ini analisis
eksplorasi awal,
satu atau lebih model regresi awal dikembangkan . Model regresi ini
kemudian diperiksa untuk kesesuaian mereka untuk data di tangan dan direvisi , atau model
baru

bagan alir
dikembangkan , sampai penyidik merasa puas dengan kesesuaian regresi tertentu
Model . Hanya kemudian adalah kesimpulan yang dibuat berdasarkan model regresi ini ,
seperti
kesimpulan tentang parameter regresi dari model atau prediksi pengamatan baru .
Kita mulai , untuk alasan pedagogik , dengan kesimpulan berdasarkan model regresi yang
akhirnya dianggap sesuai . Seseorang harus memiliki pemahaman tentang model regresi
dan bagaimana mereka dapat dimanfaatkan sebelum masalah invol ved dalam
pengembangan yang sesuai
model regresi dapat sepenuhnya dijelaskan .

1.6 Estimasi Regresi Fungsi
contoh
The observasional atau eksperimental data yang akan digunakan untuk memperkirakan
parameter
fungsi regresi terdiri dari pengamatan pada penjelasan atau prediksi variabel X dan
pengamatan yang sesuai pada variabel respon Y. Untuk setiap percobaan , ada X
observasi dan pengamatan Y . Kami melambangkan ( X , Y ) pengamatan untuk t \ rst
persidangan sebagai
( X " YI ) , untuk sidang kedua sebagai ( X2 , Y2 ) , dan secara umum untuk percobaan i
sebagai ( Xi , Vi ) , di mana
i = 1 , ... , n .
Dalam sebuah penelitian kecil - skala ketekunan, suatu percobaan memberi tiga mata
pelajaran yang sangat sulit
tugas . Data mengenai usia subjek ( X ) dan jumlah usaha untuk mencapai
tugas sebelum menyerah ( Y ) berikut:
Tunduk i:
Umur Xi :
Jumlah upaya Yi :
1
20
5
2
55
12
3
30
10
Dalam hal notasi yang akan digunakan , ada n = 3 subjek dalam penelitian ini,
pengamatan untuk subyek pertama ( X " YI ) = ( 20 , 5 ) , dan juga untuk yang lain
subyek .

Metode paling - Squares
Untuk menemukan "baik" estimator dari parameter regresi F30 dan F31 , kami
mempekerjakan metode
kuadrat terkecil . Untuk pengamatan ( Xi > Vi ) untuk setiap kasus , metode kuadrat terkecil
menganggap penyimpangan Yi dari nilai yang diharapkan :
( 1.7 )
Secara khusus , metode kuadrat terkecil mengharuskan kita mempertimbangkan jumlah dari
n kuadrat
penyimpangan . Kriteria ini dinotasikan dengan Q :
n
Q ~ : L ( Yi - F30 - f3IXi ) ~ ( 1.8 )
i = 1
Menurut metode kuadrat terkecil , estimator dari F30 dan F31 adalah nilai-nilai
bo dan b " masing-masing, yang meminimalkan kriteria Q untuk pengamatan sampel yang
diberikan
( X " YI ) , ( X2 , Y2 ) , ... , ( X , , , Yn ) .
garis regresi yang terjadi ketika kita menggunakan rata-rata dari respon ( 9,0 ) sebagai
prediktor
dan mengabaikan X :
Y = 9,0 + O ( X )
Perhatikan bahwa garis regresi ini menggunakan perkiraan bo = 9.0 dan bl = 0 , dan
menandakan Y
ordinat dari garis regresi estimasi . Jelas , garis regresi ini tidak baik
cocok, sebagaimana dibuktikan oleh deviasi vertikal besar dua pengamatan Y dari
sesuai koordinat Y dari garis regresi . Penyimpangan untuk subjek pertama , untuk
yang ( X " YI ) = ( 20,5 ) , adalah :
YI - ( bo + Pixi ) = 5 - [ 9.0 + 0 ( 20 ) ] = 5-9,0 = -4
Jumlah kuadrat penyimpangan untuk tiga kasus adalah :
Q = ( 5-9,0 ) 2 + (12 - 9,0) 2 + (10 - 9,0) 2 = 26,0
Gambar 1.9b menunjukkan data yang sama dengan garis regresi :
Y = 2.81 + 0,177 X
Fit dari garis regresi ini jelas jauh lebih baik . Penyimpangan vertikal untuk kasus pertama
sekarang adalah :
YI - ( bo + Pixi ) = 5 - [ 2.81 + 0,177 ( 20 ) ] = 5-6,35 = -1.35
dan kriteria Q jauh berkurang :
Q = ( 5-6,35 ) 2 + ( 12-12,55 ) 2 + ( 10-8,12 ) 2 = 5.7
Dengan demikian , lebih cocok dari garis regresi untuk data sesuai dengan jumlah yang lebih
kecil Q.
Tujuan dari metode kuadrat terkecil adalah untuk menemukan perkiraan bo dan bl untuk F30
dan F31 ,
masing-masing, yang Q adalah minimum . Dalam arti tertentu , yang akan dibahas segera , ini

perkiraan akan memberikan " baik " fit dari fungsi regresi linier . Garis regresi di
Gambar 1.9b adalah, pada kenyataannya, setidaknya garis regresi kuadrat .
Kuadrat Terkecil estimator . Estimator bo dan bl yang memenuhi kriteria kuadrat terkecil
dapat ditemukan dalam dua cara dasar :
1 . Prosedur pencarian numerik dapat digunakan yang mengevaluasi secara sistematis yang
paling
kuadrat kriteria Q untuk perkiraan yang berbeda bo dan bl sampai orang-orang yang
meminimalkan Q
ditemukan . Pendekatan ini diilustrasikan pada Gambar 1.9 untuk studi misalnya ketekunan.
2 . Prosedur analitis sering dapat digunakan untuk menemukan nilai-nilai bo dan bl yang
meminimalkan
Q. pendekatan analitis layak ketika model regresi tidak matematis
kompleks.
Model forregression menggunakan pendekatan analitis , dapat ditunjukkan ( 1.1 ) bahwa
nilai-nilai
bo dan bl yang meminimalkan Q untuk setiap set data tertentu sampel diberikan oleh berikut
. , ~ Persamaan simultan :
2 : Yi = NBO + bl 2 : Xi
2 : Xi Yi = bo 2 : Xi + bl 2 : xi
( 1.9a )
( 1.9b )
Persamaan ( 1.9a ) dan ( 1.9b ) disebut persamaan normal, bo dan bl disebut estimator titik
dari F30 dan F31 , masing-masing.
Persamaan normal ( 1.9 ) dapat diselesaikan secara simultan untuk bo dan bl :
b _ L : ( Xi - X ) ( Yi - Y )
1 - L : ( X ; _ X ) 2 ( l.lOa )
bo = ~ ( 2 : Yi - bl 2 : Xi ) = Y - bl X ( l.lOb )
di mana X dan Y adalah sarana Xi dan Yi pengamatan , masing-masing. komputer
perhitungan umumnya didasarkan pada banyak digit untuk memperoleh nilai yang akurat
untuk bo dan bl
komentar
Persamaan normal ( 1,9 ) dapat diturunkan dengan kalkulus . Untuk pengamatan sampel yang
diberikan ( Xi , Yi ) , yang
kuantitas Q di ( 1,8 ) adalah fungsi dari F30 dan f3 , . Nilai-nilai F30 dan f3 , yang
meminimalkan Q dapat mengikat diturunkan
dengan membedakan ( 1,8 ) sehubungan dengan F30 dan f3 , . Kami memperoleh :
Kami kemudian menetapkan ini derivatif parsial sama dengan nol , menggunakan bo dan bI
untuk menunjukkan nilai-nilai tertentu
F30 dan f3 , yang meminimalkan Q :
-22 : ( Y; - bo - Pixi ) = 0
-22 : Xi ( Yi - bo - b , Xi ) = 0

enyederhanakan , kita memperoleh :
Memperluas , kita memiliki:
"
2 : ( Yi - bo - b , Xi ) = 0
; = 1
2 " : Xi ( Yi - bo - b , Xi ) = 0
; = 1
2 : Y ; - NBO - b , 2 : Xi = 0
2 : X , Y , - bo 2 : X , - b , 2 : X ; = 0
dari mana persamaan normal ( 1,9 ) diperoleh dengan istilah menata ulang .
Sebuah tes dari derivatif parsial kedua akan menunjukkan bahwa minimum diperoleh dengan
kuadrat
estimator bo dan bl
Sifat Kuadrat Terkecil estimator . Teorema penting , yang disebut GaussMarkov
teorema , menyatakan :
Dalam kondisi model regresi ( 1.1 ) , kuadrat terkecil
estimator bo dan bl dalam ( 1.10 ) yang berisi dan memiliki minimal
varians antara semua estimator linier tidak bias.
( 1.11 )
Teorema ini , terbukti dalam bab berikutnya , menyatakan bahwa pertama bo dan bl yang
berisi estimator .
Oleh karena itu :
E { } bo = F30 E { br } = F31
sehingga estimator tidak cenderung melebih-lebihkan atau meremehkan sistematis .
Kedua , negara-negara teorema bahwa estimator bo dan bl lebih tepat (yaitu , mereka
distribusi sampling kurang bervariasi ) daripada estimator lain milik kelas
berisi estimator yang fungsi linear dari pengamatan YI , , Y " . Estimators
bo dan bl adalah fungsi linear seperti Yi Perhatikan, misalnya , bl Kami memiliki dari (
1.1Oa ) :
b _ L : ( Xi - X ) ( Yi - Y )
1 - L : ( Xi _X ) 2
Ini akan ditampilkan dalam Bab 2 bahwa ungkapan ini adalah sama dengan :
di mana :
Karena ki adalah konstanta yang dikenal ( konstanta karena Xi diketahui ) , bl adalah linier
kombinasi dari Yi dan karenanya merupakan estimator linier

Dalam cara yang sama , dapat ditunjukkan bahwa bo adalah estimator linier . Di antara
semua linier
estimator yang berisi kemudian , bo dan bl memiliki variabilitas terkecil dalam sampel
diulang
di mana tingkat X tetap tidak berubah .
The Toluca Perusahaan memproduksi peralatan pendingin serta banyak pengganti
bagian. Di masa lalu , salah satu bagian pengganti telah diproduksi secara berkala dalam
banyak
berbagai ukuran . Ketika program peningkatan biaya dilakukan , pejabat perusahaan
berharap
untuk menentukan ukuran lot optimal untuk memproduksi bagian ini . Produksi Bagian ini
melibatkan
menyiapkan proses produksi (yang harus dilakukan tidak peduli apa ukuran lot ) dan
mesin dan operasi perakitan . Salah satu masukan penting bagi model untuk memastikan
optimal
ukuran lot adalah hubungan antara ukuran lot dan jam kerja yang dibutuhkan untuk
menghasilkan parkir
Untuk menentukan hubungan ini , data pada ukuran lot dan jam kerja selama 25 produksi
baru-baru ini
berjalan dipergunakan . Kondisi produksi yang stabil selama periode enam bulan
yang 25 berjalan dibuat dan diharapkan untuk terus menjadi sama selama
tiga tahun ke depan , periode perencanaan yang biaya perbaikan prograrrr . , sedang
dilakukan .
Tabel 1.1 berisi sebagian dari data pada ukuran lot dan jam kerja dalam kolom 1 dan
2 . Perhatikan bahwa semua ukuran banyak merupakan kelipatan dari 10 , hasil dari
kebijakan perusahaan untuk memfasilitasi
administrasi bagian produksi . Gambar 1.1Oa menunjukkan SYSTAT pencar plot
data. Kami melihat bahwa banyak ukuran berkisar 20-120 unit dan bahwa tidak ada
produksi
berjalan adalah terpencil dalam arti yang baik luar biasa kecil atau besar . The plot pencar
juga
menunjukkan bahwa hubungan antara ukuran lot dan jam kerja cukup linier . Kami juga
melihat bahwa tidak ada pengamatan pada jam kerja yang luar biasa kecil atau besar ,
dengan mengacu pada
hubungan antara ukuran lot dan jam kerja .
Untuk menghitung kuadrat memperkirakan bo dan bl dalam ( 1.10 ) , kita memerlukan
penyimpangan
Xi - X dan Yi - Y. ini diberikan dalam kolom 3 dan 4 dari Tabel 1.1 . Kami juga membutuhkan
istilah cross- produk ( Xi - X ) ( Yi - Y ) dan deviasi kuadrat ( Xi - X ) 2 ; ini
ditunjukkan pada kolom 5 dan 6 . Deviasi kuadrat ( Yi - y ) 2 pada kolom 7 adalah untuk
,,,,,
Kita melihat dari Tabel 1.1 bahwa jumlah dasar yang dibutuhkan untuk menghitung kuadrat
terkecil
perkiraan adalah sebagai berikut:
2 :: (Xi - X) (Yi - Y) = 70.690
'L ") X i - X-) 2 = 19.800
X = 70,0
Y = 312,28
Menggunakan (1.10) kita memperoleh:
L: (Xi - X) (Yi - Y) 70.690
bl = L: (X
i
_ X) 2 = 19,800 = 3,5702
bo = Y - BLX = 312,28-3,5702 (70,0) = 62,37
Dengan demikian, kami memperkirakan bahwa rata-rata jumlah jam kerja meningkat
sebesar 3,57 jam untuk masing-masing
unit tambahan diproduksi dalam banyak. Perkiraan ini berlaku untuk berbagai ukuran
banyak dalam
Data dari mana estimasi berasal, yaitu ukuran banyak mulai dari sekitar 20 sampai
sekitar 120.
Gambar 1.11 berisi sebagian dari output regresi MINITAB untuk Perusahaan Toluca
contoh. Estimasi bo dan bl ditunjukkan dalam kolom berlabel Koefisien, sesuai dengan
Bab 1 Regresi Linear dengan Satu Variabel Predictor 21
garis Konstan dan X, masing-masing. Penambahan informasilpengetahuan ditunjukkan pada
Gambar 1.11
akan dijelaskan nanti.
Titik Estimasi Mean Response
contoh
Estimasi Regresi Fungsi . Mengingat sampel estimator bo dan bl dari parameter
dalam fungsi regresi ( 1.3 ) :
E { Y } = F30 + f3IX
kami memperkirakan fungsi regresi sebagai berikut :
V = bo + BLX ( 1.12 )
dimana V (baca Y topi ) adalah nilai fungsi regresi estimasi pada tingkat X dari
variabel prediktor .
Kami menyebutnya nilai variabel respon respon dan E { Y } yang respttnse berarti . Dengan
demikian ,
respon rata-rata singkatan mean dari distribusi probabilitas dari Y yang sesuai
ke tingkat X dari variabel prediktor . V kemudian adalah estimator titik respon rata-rata
ketika tingkat variabel prediktor adalah X. Hal ini dapat ditunjukkan sebagai perpanjangan
dari GaussMarkov
Teorema ( 1.11 ) bahwa V merupakan penduga yang tidak bias dari E { Y } , dengan varians
minimum
di kelas estimator linier tidak bias.
Untuk kasus-kasus dalam penelitian ini , kami akan memanggil Vi :
i = 1 , . .. , n ( 1.13 )
nilai thejitted untuk kasus engan . Dengan demikian, nilai Vi dipasang adalah yang dapat
dilihat dalam perbedaan dengan
nilai yang diamati Yi
Untuk Perusahaan Toluca contoh, kami menemukan bahwa kuadrat perkiraan regresi
koefisien adalah:
bo = 62,37 bl = 3,5702
Oleh karena itu , fungsi regresi estimasi adalah :
V = 62,37 + 3.5702X
Fungsi ini diperkirakan regresi diplot pada Gambar 1.1Ob . Tampaknya be.a baik
deskripsi hubungan statistik antara ukuran lot dan jam kerja .
Untuk memperkirakan respon rata-rata untuk setiap tingkat X dari variabel prediktor , kita
hanya
gantikan bahwa nilai X dalam fungsi regresi estimasi . Misalkan kita tertarik
dalam jumlah rata-rata jam kerja yang dibutuhkan ketika ukuran lot adalah X = 65; estimasi
titik kita adalah :
saya
~ = 62,37 + 3,5702 ( 65 ) = 294,4
Dengan demikian , kami memperkirakan bahwa rata-rata jumlah jam kerja yang dibutuhkan
untuk produksi berjalan
X = 65 unit adalah 294,4 jam . Kami ! Nterpret ini berarti tlIat jika banyak banyak 65 unit
diproduksi di bawah kondisi 25 berjalan di mana fungsi regresi diperkirakan adalah
berdasarkan , waktu kerja rata-rata untuk banyak ini adalah sekitar 294 jam . Tentu saja,
waktu kerja untuk
orang banyak ukuran 65 kemungkinan jatuh di atas atau di bawah rata-rata respon karena
melekat
variabilitas dalam sistem produksi , yang diwakili oleh kesalahan tenn dalam model.

Anda mungkin juga menyukai