Anda di halaman 1dari 10

Nama : Abdul Wahab A

Mata Kuliah : Statistika Terapan


Jadwal : Selasa (13:00-15:30)
Tugas 1
Populasi, Sampel dan Variabel Penelitian

2.1.1 In each of the following examples identify the population, the sample, and the research variable.
a. To determine the total amount of error in all students’ bills, a large university selects 150
accounts for a special check of accuracy.
b. A wildlife biologist collects information on the sex of the 28 surviving California condors.
c. An organic chemist repeats the synthesis of a certain compound 5 times using the same
procedure and each time determines the percentage of yield.
d. The Census Bureau distributes a special questionnaire to 1 out of every 20 households in the
census and among other questions inquires about the number of rooms in the dwelling.
e. A manufacturer examines the records of each of its employees to determine how long each
one has worked for the company.

Answer

Populasi (keseluruhan kelompok yang ingin diteliti), sampel (kelompok yang dipilih
untuk penelitian), dan variabel penelitian (karakteristik yang diamati atau diukur).

Kasus Populasi Sampel Variabel Penelitian


Semua mahasiswa di
150 akun yang dipilih untuk Jumlah total kesalahan
A universitas besar
pemeriksaan khusus keakuratan dalam tagihan mahasiswa.
tersebut.
28 California condor yang
B California condor Jenis kelamin condor.
masih hidup.
Hasil dari sintesis 5 pengulangan sintesis dengan Persentase hasil dalam
C
senyawa tertentu prosedur yang sama setiap sintesis
Rumah tangga dalam 1 dari setiap 20 rumah tangga Jumlah ruangan dalam
D
sensus. dalam sensus tempat tinggal
Karyawan perusahaan Durasi pekerjaan untuk
E Semua karyawan perusahaan
manufaktur setiap karyawan

2.1.2. Identify 3 different research variables that might be investigated for each of the following
populations.
a. All adults living in Colorado
b. All patients of a certain opthalmologist
c. All farms in Oklahoma
d. All veterans’ hospitals
Answer :

Populasi Variabel 1 Variabel 2 Variabel 3


Semua orang dewasa Pencapaian
Tingkat Penghasilan Akses Kesehatan
yang tinggal di Colorado Pendidikan
Semua pasien dari Kepatuhan Peningkatan
seorang ahli mata Kepuasan Pasien Terhadap Ketajaman
tertentu Pengobatan Penglihatan
Semua peternakan di Pengeluaran Tingkat kesejahtteraan
Pendapatan Peternakan
Oklahoma Peternakan Peternak
Kepuasan Pasien
Semua rumah sakit Waktu tunggu
terhadap Layanan Pengunjung Bulanan
veteran Pasien
Kesehatan

2.1.3. For two years Francis Galton explored unmapped areas of South Africa. Thereafter, he tried to
explore unmapped areas of science. In both Africa and science, however, he made some wrong turns.
One of them was in the sampling procedure he used in his study of the inheritance of genius. To
simplify his study, he evaluated the number and quality of academic, artistic, musical, and other
worthy “abilities” a notable person displayed in his life, and the variable of interest was the man’s
score on the scale Galton used (see Exercise 2.3.5). He would then examine the life of that man’s
father and score his abilities in the same fashion. After gathering data on a number of sonand-father
pairs, he wanted to see if sons with high scores had fathers with high scores.

a. To obtain data, Galton used information from obituaries.


i. What is the target population, the population about which Galton wanted to make inference?
ii. Tell why his data selection process meets the definition of a sample. Since it is a sample, why
is it of questionable use for making reliable inference?
iii. Give some ways in which his process could lead to biased results.
b. How would you have sampled the target population and what variable of interest would you have
used?

Answer :
a i. Target Population: Orang-orang yang diselidiki oleh Galton adalah populasi yang ingin dia
generalisasi. Dalam konteks ini, populasi targetnya adalah orang-orang yang disebutkan dalam
obituaries, terutama mereka yang memiliki skor tinggi pada skala yang dia buat untuk mengukur
"kemampuan" seperti akademis, seni, dan musik.

ii. Reasoning for Sample: Galton menggunakan informasi dari obituaries sebagai sampel. Ini
menjadi sampel karena dia tidak menyelidiki semua orang di populasi target, tetapi hanya orang-
orang yang sudah meninggal dan yang informasinya dapat ditemukan dalam obituaries.
Pemilihan sampel ini tidak acak dan mungkin tidak mewakili seluruh populasi target dengan
benar.

iii. Potential Biases: Proses seleksi data dari obituaries bisa menyebabkan bias karena tidak semua
orang tercatat dalam obituaries, dan kriteria untuk dianggap "berprestasi" atau "berbakat"
mungkin bersifat subyektif. Selain itu, informasi yang tidak terdokumentasi atau kurang
terperinci dapat memengaruhi hasil.
b. Cara Sampling Alternatif dan Variabel yang Digunakan

Saya mungkin akan memilih sampel acak dari populasi target yang lebih besar, mencakup orang-
orang yang hidup dan telah meninggal. Variable yang lebih objektif seperti prestasi akademis yang
terukur, karya seni yang diakui, atau pencapaian musikal dapat digunakan sebagai variabel utama.
Proses pemilihan sampel acak dapat mengurangi bias dan memungkinkan generalisasi yang lebih baik
ke seluruh populasi target.

2.3.1. Which is the highest level of measurement possible for each of the following variables?
a. Daily high temperature for a given year in Chicago
b. Marital status of the applicants for a particular job
c. Class standings at a university (freshman, sophomore, etc.)
d. Colors of roses
e. Weights of all American-made cars
f. Number in attendance per day at a particular high school
g. Birthdays of people in a certain group

Answer :
Tingkat pengukuran adalah cara kita mengukur atau mengkategorikan variabel. Terdapat empat
tingkat pengukuran utama: nominal, ordinal, interval, dan ratio. Berikut adalah tingkat pengukuran
tertinggi untuk setiap variabel:
Tingkat
Variabel Alasan
Pengukuran
Suhu tinggi harian untuk suatu
Interval Tidak memiliki nilai nol mutlak
tahun di Chicago:
Status pernikahan pelamar Tidak ada urutan atau peringkat intrinsik di
Nominal
untuk suatu pekerjaan tertentu antara status pernikahan
Kelas di universitas
Ada urutan yang bermakna, tetapi interval antar
(mahasiswa baru, sophomores, Ordinal
kelas tidak selalu sama
dll.)
Warna mawar Nominal Warna mewakili kategori tanpa urutan intrinsik
Berat semua mobil buatan Berat memiliki titik nol sejati, dan rasio antara
Ratio
Amerika berat memiliki makna
Jumlah kehadiran per hari di
Jumlah kehadiran memiliki titik nol sejati, dan
sebuah sekolah menengah Ratio
rasio antara jumlah kehadiran memiliki makna
tertentu

Meskipun terdapat urutan kronologis, interval


Tanggal lahir orang dalam
Ordinal antara tanggal lahir tidak selalu sama, dan tidak
suatu kelompok
ada titik nol sejati
2.3.2. Which of the following sets of categories are suitable for a nominal scale when classifying
persons? (There must be a unique category for each observation.)
a. Female, only child, under 66 in. tall
b. Only child, has only brothers, has only sisters, has both brothers and sisters
c. Less than three children in a family, more than three children in a family
d. Left handed, right handed
e. Blue eyed, female, blond.
Answer
a. Female, only child, under 66 in. Tall
Tidak cocok karena kategori tersebut tidak bersifat ekslusif artinya antara kategori ada ada
potensi tumpang tindih.
b. Only child, has only brothers, has only sisters, has both brothers and sisters
Cocok karena kategori tersebut bersifat ekslusif artinya tidak ada tumpang tindih antara
kategori.
c. Less than three children in a family, more than three children in a family
Cocok karena kategori tersebut bersifat ekslusif artinya tidak ada tumpang tindih antara
kategori.
d. Left handed, right handed
Cocok karena kategori tersebut bersifat ekslusif artinya tidak ada tumpang tindih antara
kategori.
e. Blue eyed, female, blond.
Tidak cocok karena kategori tersebut tidak bersifat ekslusif artinya antara kategori ada ada
potensi tumpang tindih

2.3.3. Correct each of the unsuitable sets in Exercise 2.3.2


a. Perempuan, anak tunggal, tinggi kurang dari 66 inci.
Untuk menjadikan kumupulan kategori tersebut sehingga dapat diukur menjadi skala nomina maka
kategori tersebut dapat dimodifikasi dengan rincian sebagai berikut :
-Perempuan anak tunggal dengan tinggi kurang dari 66 inci
-Perempuan anak tunggal dengan tinggi lebih dari 66 inci
-Perempuan bukan anak tunggal dengan tinggi kurang dari 66 inci
-Perempuan bukan anak tunggal dengan tinggi lebih dari 66 inci

b. Berambut biru, perempuan, berambut pirang.


Untuk menjadikan kumpulan kategori tersebut sehingga dapat diukur menjadi skala nomina maka
kategori tersebut dapat dimodifikasi dengan rincian sebagai berikut.
-Perempuan bermata biru berambut pirang.
-Perempuan tidak bermata biru berambut pirang
-Perempuan bermata biru tidak berambut pirang
-Perempuan tidak bermata biru tidak berambut pirang
2.3.4. In Exercise 2.2.4:
Table 2.2.4

a. The level of measurement used to record height for this population is the numerical
scale. Is it discrete or continuous?
b. Could a higher level of measurement have been employed to record the data?
c. Could height have been measured more accurately?
Answer
a. data ini bersifat diskrit karena nilainya terbatas dan terpisah satu sama lain. Secara umum,
data tinggi badan yang diukur dalam inci dapat bersifat kontinu jika mencakup rentang nilai
yang lebih luas dan dapat mengambil nilai-nilai dalam rentang yang kontinu. Namun, dalam
kasus spesifik ini, karena hanya terdapat 50 nilai, maka kita memandangnya sebagai data
diskrit.
b. Jika ingin meningkatkan tingkat pengukuran dari data tinggi badan siswa, kita bisa
menggunakan tingkat pengukuran yang lebih tinggi, yaitu rasio dengan lebih presisi dari
satuan inci
c. Bisa dengan menggunakan alat pengukur yang lebih presisi dari pada satuan inci misalnya
satuan milmeter.

2.3.5. Sir Francis Galton believed that manual skills are among the many abilities that are inherited.
Hence, even the young children of skilled laborers should show greater manual dexterity than those of
unskilled laborers. For evidence, suppose he watched 20 children of the age of 3 at play with toys
requiring some manual ability. Ten of the children are children of skilled laborers and the other 10 of
unskilled laborers, but at the time of measurement, he would not know to which group a child
belongs. When making subjective measures, Galton used the scale
Xgfed cbaAB CDEFGX
in which a lower-case x is the lowest possible measurement and an upper-case X the highest. Assume
this is used to measure the abilities of the 20 children and the following data were obtained:

Father Children’s Scores


Skilled e b a B C D F G G X
Unskilled X G f d d c A B E F

a. What is the scale of measurement? Explain.


b. Galton would see evidence that the children of skilled laborers have greater
dexterity. Explain why.
c. How would you summarize the data, graphically or numerically, to support the idea
of greater ability for the group with skilled-laborer fathers?
Answer:

a. Skala pengukuran yang digunakan oleh Galton adalah skala ordinal. Skala xgfedcbaABCDEFGX
adalah skala ordinal di mana setiap huruf mewakili tingkat kemampuan manual yang berbeda.

b. Galton akan melihat bukti yang menunjukkan kemampuan manual yang lebih tinggi pada anak-
anak dari pekerja terampil karena, berdasarkan hipotesisnya bahwa keterampilan tersebut diwarisi,
Ekpektasi Galton menduga bahwa skor anak-anak dari pekerja terampil umumnya lebih tinggi pada
skala ordinal dibandingkan dengan anak-anak dari pekerja tidak terampil. Untuk membuktikan
hipotesisnya, Galton harus menunjukkan data skor yang lebih tinggi untuk anak-anak dari pekerja
terampil dibandingkan dengan anak-anak dari pekerja tidak terampil. Kalau dilihat dari rata-rata skala
ordinal, menunjukkan bahwa hipotesis Galton benar, skor rata-rata anak dari pekerja terampil lebih
tinggi daripada anak pekerja tidak terampil.
c. Untuk mendukung hipotesis kemampuan lebih tinggi untuk kelompok anak dengan ayah pekerja
terampil, Berikut dirangkum ringkasan analisis data tersebut.
-Pemberian bobot nilai
Pemberian bobot nilai untuk setiap skala
Skala x g f e d c b a A B C D E F G X
Bobo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
t

-Selanjutnya akan dihitung rata-rata bobot nilai dari masing-masing kategori


Father Children’s Scores Total Mean
Skilled 4 7 8 10 1 12 14 15 1 16 112 11,2
1 5
Unskille 1 2 3 5 5 6 9 10 1 14 68 6,8
d 3

Mean Score
12
10
8
Mean Score
6
4
2
0
Anak dari Ayah Pekerja
Terampil Anak dari Ayah bukan
pekerja terampil
-

Diagram batang diatas menunjukkan distribusi skor rata-rata untuk kedua kelompok. Representasi
visual ini membandingkan kecenderungan pusat dan sebaran skor antara kedua kelompok.
Kemampuan lebih tinggi untuk kelompok anak dengan ayah pekerja terampi.
2.4.1.

If the table above represents a probability distribution, what is the value of p(8)?
a. Graph the probability distribution.
b. Find P(y≤ 6 ¿ P( y¿ 6), P(y = 6), and p(y≥ 6).
Answer
a. Karena tabel diatas merepresentasikan sebuah distribusi probabilitas maka mesti memenuhi
salah satu kondisi berikut yaitu ∑ p ( y )=1 artinya, jumlah p(y) atas semua nilai y adalah 1.
y
Maka dalam kaidah ini, dapat kita temukan nilai dari p(8) dengan
1= p ( 2 ) + p ( 4 ) + p ( 6 ) + p ( 8 ) + p(10)
1 2 1 1
1= + + + p ( 8 ) +
6 6 6 6
1 2 1 1
p ( 8 )=1− + + +
6 6 6 6
1
p ( 8 )=
6
b. Berikut grafik distribusi probabilitas

Distribusi Probabilitas
0.35
0.3
0.25
0.2 p(y)

0.15
0.1
0.05
0
2 4 6 8 10

c. Untuk P(y≤ 6 ¿ maka P(2)+P(4)+P(6)= 1/6+2/6+1/6= 4/6


Untuk P( y¿ 6) maka P(2)+ P(4)= 1/6+2/6= 3/6
Untuk P(y = 6), maka P(6)= 1/6
Untuk P(y≥ 6). Maka P(6)+P(8)+P(10)= 1/6+1/6+1/6=3/6
2.4.2. If p(y= 1/5) for y = 1, 2, 3, 4, 5:
a. Show that this is a probability distribution.
b. Draw the graph.
c. Find P(y . 3), P( y ¼ 3), P( y 3), and P(y , 3).
Answer
a. Untuk menunjukkan bahwa p(y= 1/5) for y = 1, 2, 3, 4, 5 adalah distribusi probabilitas maka
harus memenuhi dua kondisi yaitu :

Untuk kondisi 1. Terpenuhi, karena untuk setiap nilai dari y, p(y) =1/5, dan 1/5 < 1 .
Untuk kodisi 2 . Terpenuhi karena p(1)+ p(2)+ p(3)+ p(4)+ p(5)= 1 terbukti.
Karena dua kondisi terpenuhi maka p(y= 1/5) for y = 1, 2, 3, 4, 5 merupakan distribusi probabilitas.

2.4.3. Given the continuous probability distribution in Figure 2.6, imagine that the distribution
represents the probability that a certain expert dart thrower will hit a 1-ft target within a certain
distance y from the center 0.
a. What is the total area within the triangle?
b. What is the area of the shaded portion of the distribution?
c. What is the probability that the dart will hit at a point that is from 6 in. to 1 ft from
the center of the target?
d. What is the area of the unshaded portion of the distribution?
e. What is the probability that the dart will hit at a point that is less than 6 in. from the
center of the target?
Answer:
a. Secara sederhana total luar daerah seg itiga yang dimaksud pada gambar 2.6 adalah 1 satuan
yang ditunjukkan melalui panjang interval y yaitu 1 dan panjang interval f(y) yaitu 2 yang
membentuk kurva area segitiga, L= ½ x 1 x 2 = 1 satuan
b. Pada gambar 2.6 menunjukkan daerah segitiga yang diarsir terbentuk oleh kurva dengan
interval y yaitu ½ dan interval f(y) yaitu 1, sehingga luas daerah yan diarsir tersebut sebesar ¼
(1/2 x ½ x 1= ¼)
c. . Berdasarkan grafik distribusi probabilitas segitiga berkelanjutan pada gambar 2.6. Peluang
target terkenai pada jarak kurang dari 6 inci direpresentasikan dalam luas daerah yang tidak
diarsir.Perhitungan luas untuk daerah yang tidak diarsir telah di tunjukkan pada soal 2.4.3. d
yaitu sebesar ¾.
d. Untuk menentukan luas daerah yang tidak diarsir pada segitiga yang terbentuk dari kurva
diatas grafik, dapat dilakukan dengan mengurangkan luas total segitiga diatas grafik dengan
segitiga daerah yang diarsir. Karena luas total segitiga yang merepresentasikan total peluang
permainan yaitu 1 dan luas segitiga yang diarsir adalah ¼ maka luas daerah yang tidak diarsir
adalah 3/4 (1-1/4=3/4)
e. Berdasarkan grafik distribusi probabilitas segitiga berkelanjutan pada gambar 2.6,
merepresetasikan rasio peluang untuk jarak 6 inci ke 1 kaki bersesuaian denb gan luar daerah
yang diarsir pada segitiga pada grafik tersebut. Hal ini karena total luas dari segitiga total
merepresentasikan total peluang dari target permainan. Rasio daerah segitiga yang diarsir
bersesuaian dengan peluang jarak dart melempar mengenai target

2.4.4. An oil company believes that the probability of striking oil on a single random drilling
in a certain field is 1/3. They drill and hit oil on the sixth attempt. Is there any evidence
that the probability of a strike is less than 1/3?
2.5.1. Find the mean and the variance of the probability distributions A to C in Table 2.1
2.5.2. In Mendel’s experiments on pea plants, he found that the trait of being tall is dominant
over being short. His theory indicates that if pure-line tall and pure-line short plants are
cross-pollinated and then the hybrids in the next generation are cross-pollinated, in the
resulting population approximately 3/4 of the plants will appear tall and 1/4 willappear short. If 4
plants are chosen at random from such a population, the best model
for the number of tall plants in 4 is

a. Find the expected value of this probability distribution.


b. Find the variance of the probability distribution.
c. What is the probability that the value of the random variable will be more than 2
d. standard deviations below the expected value?
e. What is the probability that the value of the random variable will be more than 2
f. standard deviations above the expected value?

2.5.3. A gambling game is played in which there is a group of 100 cards with one $25 winning
card, two $10 winning cards, and three $5 winning cards. After paying a certain fee, a
player selects one card at random. If it is one of the winning cards, the player receives
the designated amount. If it is one of the other cards, the player wins nothing. The card
is returned to the deck, the cards shuffled, and they are ready for the next play.
a. Find the probability distribution for y, the number of dollars won (use the rule for
b. equally likely events).
c. If a large number of plays are purchased, what are the expected winnings per play,
d. or in statistical terms, what is the expected value of y?
e. Would it be reasonable to pay $1 to play this game?
f. Find the variance of this probability distribution.
g. What proportion of the time will the winnings be within two standard deviations of
h. the expected value?

2.5.4

a. Find the expected value of y.


b. Find V( y).
c. Compare your answers with those found in Exercise 2.5.1 for Table 2.1, distribution
d. B. Explain why there is a difference in the expected values but the variances are the same

2.5.5.
a. Find E( y).
b. Compare this result with that of Exercise 2.5.4; find a simple general formula for the
expected value of a discrete uniform distribution of successive integers from a to b.

Anda mungkin juga menyukai