2.1.1 In each of the following examples identify the population, the sample, and the research variable.
a. To determine the total amount of error in all students’ bills, a large university selects 150
accounts for a special check of accuracy.
b. A wildlife biologist collects information on the sex of the 28 surviving California condors.
c. An organic chemist repeats the synthesis of a certain compound 5 times using the same
procedure and each time determines the percentage of yield.
d. The Census Bureau distributes a special questionnaire to 1 out of every 20 households in the
census and among other questions inquires about the number of rooms in the dwelling.
e. A manufacturer examines the records of each of its employees to determine how long each
one has worked for the company.
Answer
Populasi (keseluruhan kelompok yang ingin diteliti), sampel (kelompok yang dipilih
untuk penelitian), dan variabel penelitian (karakteristik yang diamati atau diukur).
2.1.2. Identify 3 different research variables that might be investigated for each of the following
populations.
a. All adults living in Colorado
b. All patients of a certain opthalmologist
c. All farms in Oklahoma
d. All veterans’ hospitals
Answer :
2.1.3. For two years Francis Galton explored unmapped areas of South Africa. Thereafter, he tried to
explore unmapped areas of science. In both Africa and science, however, he made some wrong turns.
One of them was in the sampling procedure he used in his study of the inheritance of genius. To
simplify his study, he evaluated the number and quality of academic, artistic, musical, and other
worthy “abilities” a notable person displayed in his life, and the variable of interest was the man’s
score on the scale Galton used (see Exercise 2.3.5). He would then examine the life of that man’s
father and score his abilities in the same fashion. After gathering data on a number of sonand-father
pairs, he wanted to see if sons with high scores had fathers with high scores.
Answer :
a i. Target Population: Orang-orang yang diselidiki oleh Galton adalah populasi yang ingin dia
generalisasi. Dalam konteks ini, populasi targetnya adalah orang-orang yang disebutkan dalam
obituaries, terutama mereka yang memiliki skor tinggi pada skala yang dia buat untuk mengukur
"kemampuan" seperti akademis, seni, dan musik.
ii. Reasoning for Sample: Galton menggunakan informasi dari obituaries sebagai sampel. Ini
menjadi sampel karena dia tidak menyelidiki semua orang di populasi target, tetapi hanya orang-
orang yang sudah meninggal dan yang informasinya dapat ditemukan dalam obituaries.
Pemilihan sampel ini tidak acak dan mungkin tidak mewakili seluruh populasi target dengan
benar.
iii. Potential Biases: Proses seleksi data dari obituaries bisa menyebabkan bias karena tidak semua
orang tercatat dalam obituaries, dan kriteria untuk dianggap "berprestasi" atau "berbakat"
mungkin bersifat subyektif. Selain itu, informasi yang tidak terdokumentasi atau kurang
terperinci dapat memengaruhi hasil.
b. Cara Sampling Alternatif dan Variabel yang Digunakan
Saya mungkin akan memilih sampel acak dari populasi target yang lebih besar, mencakup orang-
orang yang hidup dan telah meninggal. Variable yang lebih objektif seperti prestasi akademis yang
terukur, karya seni yang diakui, atau pencapaian musikal dapat digunakan sebagai variabel utama.
Proses pemilihan sampel acak dapat mengurangi bias dan memungkinkan generalisasi yang lebih baik
ke seluruh populasi target.
2.3.1. Which is the highest level of measurement possible for each of the following variables?
a. Daily high temperature for a given year in Chicago
b. Marital status of the applicants for a particular job
c. Class standings at a university (freshman, sophomore, etc.)
d. Colors of roses
e. Weights of all American-made cars
f. Number in attendance per day at a particular high school
g. Birthdays of people in a certain group
Answer :
Tingkat pengukuran adalah cara kita mengukur atau mengkategorikan variabel. Terdapat empat
tingkat pengukuran utama: nominal, ordinal, interval, dan ratio. Berikut adalah tingkat pengukuran
tertinggi untuk setiap variabel:
Tingkat
Variabel Alasan
Pengukuran
Suhu tinggi harian untuk suatu
Interval Tidak memiliki nilai nol mutlak
tahun di Chicago:
Status pernikahan pelamar Tidak ada urutan atau peringkat intrinsik di
Nominal
untuk suatu pekerjaan tertentu antara status pernikahan
Kelas di universitas
Ada urutan yang bermakna, tetapi interval antar
(mahasiswa baru, sophomores, Ordinal
kelas tidak selalu sama
dll.)
Warna mawar Nominal Warna mewakili kategori tanpa urutan intrinsik
Berat semua mobil buatan Berat memiliki titik nol sejati, dan rasio antara
Ratio
Amerika berat memiliki makna
Jumlah kehadiran per hari di
Jumlah kehadiran memiliki titik nol sejati, dan
sebuah sekolah menengah Ratio
rasio antara jumlah kehadiran memiliki makna
tertentu
a. The level of measurement used to record height for this population is the numerical
scale. Is it discrete or continuous?
b. Could a higher level of measurement have been employed to record the data?
c. Could height have been measured more accurately?
Answer
a. data ini bersifat diskrit karena nilainya terbatas dan terpisah satu sama lain. Secara umum,
data tinggi badan yang diukur dalam inci dapat bersifat kontinu jika mencakup rentang nilai
yang lebih luas dan dapat mengambil nilai-nilai dalam rentang yang kontinu. Namun, dalam
kasus spesifik ini, karena hanya terdapat 50 nilai, maka kita memandangnya sebagai data
diskrit.
b. Jika ingin meningkatkan tingkat pengukuran dari data tinggi badan siswa, kita bisa
menggunakan tingkat pengukuran yang lebih tinggi, yaitu rasio dengan lebih presisi dari
satuan inci
c. Bisa dengan menggunakan alat pengukur yang lebih presisi dari pada satuan inci misalnya
satuan milmeter.
2.3.5. Sir Francis Galton believed that manual skills are among the many abilities that are inherited.
Hence, even the young children of skilled laborers should show greater manual dexterity than those of
unskilled laborers. For evidence, suppose he watched 20 children of the age of 3 at play with toys
requiring some manual ability. Ten of the children are children of skilled laborers and the other 10 of
unskilled laborers, but at the time of measurement, he would not know to which group a child
belongs. When making subjective measures, Galton used the scale
Xgfed cbaAB CDEFGX
in which a lower-case x is the lowest possible measurement and an upper-case X the highest. Assume
this is used to measure the abilities of the 20 children and the following data were obtained:
a. Skala pengukuran yang digunakan oleh Galton adalah skala ordinal. Skala xgfedcbaABCDEFGX
adalah skala ordinal di mana setiap huruf mewakili tingkat kemampuan manual yang berbeda.
b. Galton akan melihat bukti yang menunjukkan kemampuan manual yang lebih tinggi pada anak-
anak dari pekerja terampil karena, berdasarkan hipotesisnya bahwa keterampilan tersebut diwarisi,
Ekpektasi Galton menduga bahwa skor anak-anak dari pekerja terampil umumnya lebih tinggi pada
skala ordinal dibandingkan dengan anak-anak dari pekerja tidak terampil. Untuk membuktikan
hipotesisnya, Galton harus menunjukkan data skor yang lebih tinggi untuk anak-anak dari pekerja
terampil dibandingkan dengan anak-anak dari pekerja tidak terampil. Kalau dilihat dari rata-rata skala
ordinal, menunjukkan bahwa hipotesis Galton benar, skor rata-rata anak dari pekerja terampil lebih
tinggi daripada anak pekerja tidak terampil.
c. Untuk mendukung hipotesis kemampuan lebih tinggi untuk kelompok anak dengan ayah pekerja
terampil, Berikut dirangkum ringkasan analisis data tersebut.
-Pemberian bobot nilai
Pemberian bobot nilai untuk setiap skala
Skala x g f e d c b a A B C D E F G X
Bobo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
t
Mean Score
12
10
8
Mean Score
6
4
2
0
Anak dari Ayah Pekerja
Terampil Anak dari Ayah bukan
pekerja terampil
-
Diagram batang diatas menunjukkan distribusi skor rata-rata untuk kedua kelompok. Representasi
visual ini membandingkan kecenderungan pusat dan sebaran skor antara kedua kelompok.
Kemampuan lebih tinggi untuk kelompok anak dengan ayah pekerja terampi.
2.4.1.
If the table above represents a probability distribution, what is the value of p(8)?
a. Graph the probability distribution.
b. Find P(y≤ 6 ¿ P( y¿ 6), P(y = 6), and p(y≥ 6).
Answer
a. Karena tabel diatas merepresentasikan sebuah distribusi probabilitas maka mesti memenuhi
salah satu kondisi berikut yaitu ∑ p ( y )=1 artinya, jumlah p(y) atas semua nilai y adalah 1.
y
Maka dalam kaidah ini, dapat kita temukan nilai dari p(8) dengan
1= p ( 2 ) + p ( 4 ) + p ( 6 ) + p ( 8 ) + p(10)
1 2 1 1
1= + + + p ( 8 ) +
6 6 6 6
1 2 1 1
p ( 8 )=1− + + +
6 6 6 6
1
p ( 8 )=
6
b. Berikut grafik distribusi probabilitas
Distribusi Probabilitas
0.35
0.3
0.25
0.2 p(y)
0.15
0.1
0.05
0
2 4 6 8 10
Untuk kondisi 1. Terpenuhi, karena untuk setiap nilai dari y, p(y) =1/5, dan 1/5 < 1 .
Untuk kodisi 2 . Terpenuhi karena p(1)+ p(2)+ p(3)+ p(4)+ p(5)= 1 terbukti.
Karena dua kondisi terpenuhi maka p(y= 1/5) for y = 1, 2, 3, 4, 5 merupakan distribusi probabilitas.
2.4.3. Given the continuous probability distribution in Figure 2.6, imagine that the distribution
represents the probability that a certain expert dart thrower will hit a 1-ft target within a certain
distance y from the center 0.
a. What is the total area within the triangle?
b. What is the area of the shaded portion of the distribution?
c. What is the probability that the dart will hit at a point that is from 6 in. to 1 ft from
the center of the target?
d. What is the area of the unshaded portion of the distribution?
e. What is the probability that the dart will hit at a point that is less than 6 in. from the
center of the target?
Answer:
a. Secara sederhana total luar daerah seg itiga yang dimaksud pada gambar 2.6 adalah 1 satuan
yang ditunjukkan melalui panjang interval y yaitu 1 dan panjang interval f(y) yaitu 2 yang
membentuk kurva area segitiga, L= ½ x 1 x 2 = 1 satuan
b. Pada gambar 2.6 menunjukkan daerah segitiga yang diarsir terbentuk oleh kurva dengan
interval y yaitu ½ dan interval f(y) yaitu 1, sehingga luas daerah yan diarsir tersebut sebesar ¼
(1/2 x ½ x 1= ¼)
c. . Berdasarkan grafik distribusi probabilitas segitiga berkelanjutan pada gambar 2.6. Peluang
target terkenai pada jarak kurang dari 6 inci direpresentasikan dalam luas daerah yang tidak
diarsir.Perhitungan luas untuk daerah yang tidak diarsir telah di tunjukkan pada soal 2.4.3. d
yaitu sebesar ¾.
d. Untuk menentukan luas daerah yang tidak diarsir pada segitiga yang terbentuk dari kurva
diatas grafik, dapat dilakukan dengan mengurangkan luas total segitiga diatas grafik dengan
segitiga daerah yang diarsir. Karena luas total segitiga yang merepresentasikan total peluang
permainan yaitu 1 dan luas segitiga yang diarsir adalah ¼ maka luas daerah yang tidak diarsir
adalah 3/4 (1-1/4=3/4)
e. Berdasarkan grafik distribusi probabilitas segitiga berkelanjutan pada gambar 2.6,
merepresetasikan rasio peluang untuk jarak 6 inci ke 1 kaki bersesuaian denb gan luar daerah
yang diarsir pada segitiga pada grafik tersebut. Hal ini karena total luas dari segitiga total
merepresentasikan total peluang dari target permainan. Rasio daerah segitiga yang diarsir
bersesuaian dengan peluang jarak dart melempar mengenai target
2.4.4. An oil company believes that the probability of striking oil on a single random drilling
in a certain field is 1/3. They drill and hit oil on the sixth attempt. Is there any evidence
that the probability of a strike is less than 1/3?
2.5.1. Find the mean and the variance of the probability distributions A to C in Table 2.1
2.5.2. In Mendel’s experiments on pea plants, he found that the trait of being tall is dominant
over being short. His theory indicates that if pure-line tall and pure-line short plants are
cross-pollinated and then the hybrids in the next generation are cross-pollinated, in the
resulting population approximately 3/4 of the plants will appear tall and 1/4 willappear short. If 4
plants are chosen at random from such a population, the best model
for the number of tall plants in 4 is
2.5.3. A gambling game is played in which there is a group of 100 cards with one $25 winning
card, two $10 winning cards, and three $5 winning cards. After paying a certain fee, a
player selects one card at random. If it is one of the winning cards, the player receives
the designated amount. If it is one of the other cards, the player wins nothing. The card
is returned to the deck, the cards shuffled, and they are ready for the next play.
a. Find the probability distribution for y, the number of dollars won (use the rule for
b. equally likely events).
c. If a large number of plays are purchased, what are the expected winnings per play,
d. or in statistical terms, what is the expected value of y?
e. Would it be reasonable to pay $1 to play this game?
f. Find the variance of this probability distribution.
g. What proportion of the time will the winnings be within two standard deviations of
h. the expected value?
2.5.4
2.5.5.
a. Find E( y).
b. Compare this result with that of Exercise 2.5.4; find a simple general formula for the
expected value of a discrete uniform distribution of successive integers from a to b.