Anda di halaman 1dari 7

NAMA

: Nur Arif Bahmid

NIM : H121 12 273


1. Ringkaskan materi bab 2 dan bab 3.

BAB 2 Pengumpulan Data Ilmiah


Populasi, keseluruhan dari objek atau individu dari penelitian.
Setiap member dari populasi memiliki nomor yang terasosiasi
dengan penelitian tersebut, sehingga sering dipertimbangkan
bahwa populasi sebagai satu set angka. Kami ingin mengetahui
tentang distribusi dari nomor-nomor tersebut
Sampel, subset dari populasi.
Parameter, nilai yang saling terkait dan menggunakan sumber
data yang berasal dari populasi dan dapat digunakan unuk menarik
kesimpulan mengenai karakter populasi.
Statistic, karkteristik dari distribusi sampel, seperti mean, median,
modus, standar deviasi, dan jangkauan interquartile dari sampel.
Statistic inferens, pernyataan tentang parameter populasi
berdasarkan pada statistic sampel.
Simple random sampling, setiap item yang belum ditarik memiliki
kesempatan yang sama untuk dipilih untuk dimasukkan kedalam
sampel.
Stratified random sampling, Populasi dipartisi kedalam
subpopulasi yang disebut strata, dan simple random sampel diambil
dari setiap stratum dimana ukuran stratum sampel proporsional
dengan propors stratum dalam populasi. Stratum sampel
digabungkan untuk membentuk sampel dari populasi.
Cluster random sampling, Area dimana populasi area dimana
populasi tinggal didalamnya dan dipartisi kedalam area yang
disebut clusters. Random sampel dari cluster diambil, dan seluruh
anggota dari populasi dalam cluster terpilih termasuk kedalam
sampel.

Metode randomisasi respon, Metode ini memperbolehkan


responden untuk secara acak menentukan apakah ingin menjawab
pertanyaan yang sifatnya sensitive atau pertanyaan bodoh, dimana
keduanya memiliki berbagai jawaban. Dengan demikian, informasi
pribadi dari responden tidak akan terungkap melalui jawaban yang
diberikan, karena interviewer tidak mengetahui pertanyaan yang
mana yang diberikan.
Studi observational. Peneliti mengumpulkan data dari satu set
unit eksperimen yang tidak dipilih secara random, atau tidak
dialokasikan pada sebuah eksperimen atau group kontrol
berdasarkan randomisasi. Mungkin saja akan ada variabel lurking
karena kesalahan dari randomisasi.
Designed experiment. Peneliti mengalokasikan unit eksperimental
untuk kelompok perlakuan dan kelompok kontrol oleh beberapa
bentuk pengacakan.
Completely randomized design. Para peneliti secara acak
memberikan tugas kepada unit-unit kedalam kelompok perlakuan
(nearly) independen.
Randomized block design. Para peneliti mengelompokkan unit
group pertama kedalam blok yang mengandung unit yang sama.
Kemudian unit-unit dalam setiap blok secara acak ditugaskan, antar
sesama grup. Randomisasi dalam blok yang terpisah dilakukan
secara independen satu sama lain.

BAB 3 Menampilkan Dan Menyimpulkan Data


Data harus selalu dilihat dalam beberapa cara sebagai langkah
pertama dalam setiap analisis statistikal. Biasanya tampilan grafikal
yang baiksudah cukup untuk menujukkan apa yang sedang terjadi
sehingga tidak lagi diperlukan analisis secara lebih mendalam.
Beberapa cara dasar dalam menganalisis data adalah :
- Order statistik. Data disusun dari mulai urutan yang terkecil
hingga yang paling besar.

y [ 1 ] , , y [ n]

- Median. Nilai yang memiliki 50% nilai diatas observasi da 50% data
observasi dibawahnya.
y

[ ]
n+1
2

Ini merupakan nilai tengah dari susunan statistik ketika n is odd.


Ketika n genap maka mediannya adalah rata-rata dari dua urutan
data statistik yang berdekatan.
y

n+1
2

1
1
= y n + y n
] 2 [ 2 ] 2 [ 2 +1]

Median juga biasa diketahui sebagai

Q2 .

- Quartile bawah. 25% nilai dari observasi dibawahnya dan 75%


nilai dari observasi diatasnya. Quartil bawah biasa juga diketahui
Q1 .

sebagai
Q 1= y

[ ]
n +1
4

n+1
4

Jika

tidak integer maka kita mencarinya dengan membagi

rata-rata nilai dar data urutan statistik yang terdekat.


- Quartil atas. 75% nilai dari observasi dibawahnya dan 25%nilai
dari observasi diatasnya. Biasa juga diketahui sebagai
Q3=x

Jika

3 ( n +1)
4

Q3 .

3 ( n+ 1 )
4

tidak integer, maka quartile dicari dengan cara

membagi rata-rata dari dua urutan data statistik terdekat.


Ketika kita membandingkan sampel grafik, sangat penting bahwa
sampel berada dalam skala yang sama. kita harus mampu untuk
mendapatkan perbandingan visual yang benar tanpa membaca
angka pada axis. Beberapa dasar display data grafikal adalah :
- Stem-and-leaf diagram. Grafik yang cepat dan mudah dalam
memperbolehkan kita untuk mengestrak informasi dari sampel.
Vertical stem digambarkan dengan angka-angka sampai pada digit
stem bersamaan dengan skala linear. Setiap angka direresentasikan
dengan menggunakan digit setelahnya sebagai sebuah unit yang
sesuai pada tempat yang tepat bersamaan dengan stem. Unit yang

ditinggalakn harus diurutka menajuh dari stem. Sangat mudah


untuk menemukan kuartil dengan menghitung sesuai dengan
grapik. Perbandingan selesai dengan back-to-bak stem-and-leaf
diagrams.
- Boxplot. Grapfik dengan axis linear dimana pusat box mengandung
50% penelitian, dan pengocok keluar dari setiap akhir dari kota
hingga ke penelitian terndah dan tertinggi. Trdapat sebuah garis
sepanjang box pada median. Sehinnga itu merupakan reprsentasi
visual dari dari lima buah angka

y [ 1 ] , Q 1 , Q 2 ,Q 3 , y [ n ]

yang

memberikan kesimpulan yang singkat dari distribusi data.


Perbandingan selesai hanya dengan stacked boxplot.
- Histogram. Grafik dimana batasan garis dari grup diletakkan pada
skala linear horizontal axis. Setiap grup direpresentasikan dengan
bar secara vertical dimana area dari bar sesuai dengan frekuensi
dalam grup.
- Cummulative frequency polygon (ogive). Grafik dimana
batasan garis dari grup diletakkan pada skala linear horizontal axis.
Pointnya adalah (batasan terendah adalah grup terendah, 0) dan
points (batasan grup teratas, frekuensi kumulatif) disatukan dan
tergabung dalam satu garis lurus. Median dan kuartil dapat
ditemukan dengan sangat mudah melalui grafik tersebut.
Hal ini juga berguna untuk menyimpulkan set data dengan
menggunakan beberapa kesimpulan statistik numerik. Hal
terpenting dari kesimpulan statistik dari variabel adalah mengukur
lokasi dimana terindikasi bahwa terdapat nilai-nilai kebohongan
bersamaan dengan nomor axis. Beberapa kemungkinan pengukuran
dari lokasi adalah :
- Mean. Rata-rata dari angka. Sangat mudah untuk dogunakan,
memiliki matematikal propertis, dan kombinasi yang baik. Mean
merupakan jangkauan pengukuran terluas dari lokasi. Mean sensitif
terhadap outliers, sehingga mean tidak terlalu baik untuk distribusi
data yang terlalu berat.

- Median. Statistik urutan tengah, atau rata-rata dari dua urutan


angka yang mendekati nilai tengah. median sulit ditemukan karena
ini membuthkan pen-sortiran data. Tidak dipengaruhi dari luar.
Median tidak memiliki propertis matematika yang baik ataupun
pengkombinasian yang baik dari mean. Oleh karena demikian,
median tidak begitu sering digunakan jika dibandingkan dengan
mean. Biasanya median digunakan dengan distribusi yang memiliki
banyak penghitungan dimana hal tersebut prefered terhadap mean.
- Trimmed mean. Ini merupakan gabungan antara mean dan
median. Mengabaikan k terbesar dan k terkecil urutan statistik dan
mengambil rata-rata untuk sisanya.
Hal kedua dari rangkuman penting statistik adalah pengukuran dari
penyebaran, dimana memperlihatkan bagaimana persebaran dari
angka-angka. Beberapa pengukuran yang umumnya digunakan
untuk emngukur persebarana adalah :
- Range. Ini merupakan urutan terbesar data statistik dikurangi
urutan terkecil data statistik. Sangat jelas terlihat sensitifitasnya
terhadap pengaruh luar.
- IQR. Ini merupakan hasil pengurangan dari quartil atas dikurangi
quartil bawah. Ini untuk mengukur penyebaran dari 50% hasil
penelitian.tidak sensitif terhadap outliners.
- Varians. Rata-rata dari squared deviation dari mean. Sangat kuat
dipengaruhi oleh outliners. Varians memiliki properties matematika
yang baik, dan terkombinasi dengan baik, akan tetapi tidak secara
langsung terbadningkan dengan mean.
- Standar deviasi. Akar dari varians. Standar deviase lebih rendah
sensitifitasnya terhadap outliners dibandingkan dengan varians dan
secara langsung dibandningkan dnegan mean hal ini disebabkan
karena merkea berada dalam unit yang sama.
Display grafik untuk hubungan antara dua atau lebih variabel.
- Scatterplot. Untuk melihat pola
- Scatterplot matrix. Panah untuk keseluruhan scatterplot untuk
semua pasangan variabel.

Korelasi merupakan pengukuran angka dari kekuatan hubungan


linear antara dua variabel. Sudah terstandarisasi untuk selalu
berada diantara -1 and +1. Jika point tidak pas berada pada garis
dengan negative slope, maka korelasinya adalah -1, dan jika pas
berada pada garsi positif slope maka koelasinya +1. Korelasi dari 0
bukan berarti tidak ada hubungan, hanya menandakan bahwa tidak
ada hubungan linear.

2. Berikan penjelasan tentang mengapa Pendekatan Bayesian perlu


dipelajari? Untuk apa?
Jawaban :
Pendekatan statistika Bayesian memandang parameter sebagai
variabel random yang memiliki distribusi, disebut distribusi prior. Dari
distribusi prior selanjutnya dapat ditentukan distribusi posterior
sehingga diperoleh estimator Bayesian yang merupakan mean atau
modus dari distribusi posterior.
3. Apa itu parameter? Apa parameter distribusi normal?
Jawaban :
Parameter adalah nilai yang saling terkait dan menggunakan sumber
data yang berasal dari populasi dan dapat digunakan unuk menarik
kesimpulan mengenai karakter populasi. Contoh : - mean, standar
deviasi, proporsi dan koefisien korelasi.
Suatu data membentuk distribusi normal jika jumlah data di atas dan
di bawah mean adalah sama. Distribusi normal berupa kurva
berbentuk lonceng setangkup yang melebar tak berhingga pada kedua
arah positif dan negatifnya.
Distribusi normal dipengaruhi oleh dua parameter, yaitu mean dan
standar deviasi. Mean menentukan lokasi pusat statistik dan standar
deviasi menentukan lebar dari kurva normal. Rumus umum distribusi
normal :

e(x ) /( 2 )
f ( x )=
2
dengan

= mean dan

= standar deviasi

Anda mungkin juga menyukai