PENDAHULUAN
Statistika banyak diterapkan dalam berbagai disiplin ilmu, baik ilmu-ilmu
alam (misalnya astronomi dan biologi maupun ilmu-ilmu sosial (termasuk
sosiologi dan psikologi), maupun di bidang bisnis, ekonomi, dan industri). Pada
kesempatan ini penulis merangkum tentang penerapan distribusi normal,
Distribusi poisson, dan distribusi burr dari beberapa jurnal.
Statistika adalah ilmu yang mempelajari bagaimana merencanakan,
mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data.
Singkatnya, statistika adalah ilmu yang berkenaan dengan data. Atau statistika
adalah ilmu yang berusaha untuk mencoba mengolah data untuk mendapatkan
manfaat berupa keputusan dalam kehidupan. Istilah ‘statistika’ (bahasa Inggris:
statistics) berbeda dengan ‘statistik’ (statistic). Statistika merupakan ilmu yang
berkenaan dengan data, sedang statistik adalah data, informasi, atau hasil
penerapan algoritma statistika pada suatu data.
STUDI PUSTAKA
Definisi Distribusi Normal
Distribusi normal, disebut pula distribusi Gauss, adalah distribusi
probabilitas yang paling banyak digunakan dalam berbagai
analisis statistika. Distribusi normal baku adalah distribusi normal yang
memiliki rata-rata nol dan simpangan baku satu. Distribusi ini juga dijuluki kurva
lonceng (bell curve) karena grafik fungsi kepekatan probabilitasnya mirip dengan
bentuk lonceng. Distribusi normal memodelkan fenomena kuantitatif pada ilmu
alam maupun ilmu sosial. Beragam skor pengujian psikologi dan
fenomena fisika seperti jumlah fotondapat dihitung melalui pendekatan dengan
mengikuti distribusi normal. Distribusi normal banyak digunakan dalam berbagai
bidang statistika, misalnya distribusi sampling rata-rata akan mendekati normal,
meski distribusi populasi yang diambil tidak berdistribusi normal. Distribusi
normal juga banyak digunakan dalam berbagai distribusi dalam statistika, dan
kebanyakan pengujian hipotesis mengasumsikan normalitas suatu data.
DefinisiDistribusi Binomial
Rangkuman Jurnal Analisis Dan Simulasi Sistem Antrian Bus Rapid Transit
(BRT) Trans-Jakarta Pada Halte Transit BNN.
Jurnal ini berisi tentang Penelitian mengenai Sistem Antrian Bus Rapid
Transit (BRT) trans-jakarta pada halte transit BNN, Antrian bus Trans-Jakarta
menurut peneliti sangat cocok dilakukan analisis karena terjadinya fenomena
antrian yang terjadi di Halte BNN dapat mengganggu aktifitas pengguna jasa yang
menggunakan bus Trans-Jakarta. Tujuan dari penelitian ini adalah untuk
menentukan gambaran penggunaan model antrian yang tepat dalam sistem antrian
bus Trans-Jakarta di Halte BNN dan mengetahui ukuran kinerja sistem antrian
dalam bus Trans-Jakarta di Halte Trans-Jakarta. Untuk mencapai tujuan tersebut
peneliti melakukan pengamatan terhadap antrian yang terjadi pada bus Trans-
Jakarta. Penelitian dilakukan pada jam sibuk (07.00 – 08.00) dan (17.00 – 19.00)
dengan alasan bahwa bis Trans-Jakarta yang beroperasi lebih banyak dan sering
terjadi antrian panjang. Data yang digunakan dalam penelitian ini adalah data
primer yang diperoleh dari pengamatan langsung di Halte BNN selama 2 minggu
berturut-turut. Selain itu untuk mendukung hasil penelitian diperlukan juga data
sekunder yang diperoleh dari BRT maupun Pemerintah Daerah DKI Jakarta.
Tahapan dalam melakukan metode analisis data pada penelitian ini dilaksanakan
dengan langkah-langkah pada Metode Antrian Kondisi Real dan Metode Antrian
Kondisi Simulasi.
Pengujian distribusi pola kedatangan dan pelayanan dilakukan untuk menentukan
model antrian yang sesuai dengan keadaan yang terjadi di lapangan berdasarkan
data yang telah dikumpulkan.
Asumsi sebaran distribusi pada Halte BNN adalah tingkat kedatangan
merupakan distribusi poisson dan tingkat pelayanan merupakan distribusi
eksponensial, untuk mengetahui apakah asumsi tersebut benar atau tidak, maka
dilakukan pengujian distribusi terhadap data yang telah didapatkan dari observasi
di halte BNN.
Pengujian kesesuaian distribusi dapat dilakukan dengan menggunakan salah satu
program pengujian distribusi yaitu Easyfit 5.5. Easy Fit dapat menentukan
apakah distribusi sesuai atau tidak dengan memasukkan data tingkat kedatangan
dan tingkat pelayanan ke dalam program
Rangkuman Jurnal
Impact of road-surface condition on rural highway safety: A multivariate
random parameters negative binomial approach
Rangkuman Jurnal
Fosgerau’s travel time reliability ratio and the Burr distribution
Pada jurnal ini menjelaskan tentang bagaimana analisis statistic tentang
waktu perjalanan lebih tepat menggunakan dsitribusi Burr.
Ringkasan penelitian ini yaitu sebagai berikut: Penelitian internasional
baru-baru ini telah melihat pengembangan metode untuk memasukkan keandalan
waktu perjalanan sebagai faktor terpisah dalam analisis ekonomi proyek
transportasi, termasuk penilaian variabilitas waktu perjalanan. Metode penilaian
Fosgerau mencakup pertimbangan keandalan waktu perjalanan dalam analisis
biaya-manfaat dengan menambahkan variasi waktu perjalanan ke serangkaian
biaya perjalanan umum. Hal ini membutuhkan:
(1) Unit pengukuran yang didefinisikan untuk variabilitas waktu
perjalanan
(2) Perkiraan kuantitas variabilitas waktu perjalanan, dan
(3) Identifikasi biaya untuk wisatawan per unit variabilitas waktu
perjalanan.
Unit pengukuran yang dipilih adalah standar deviasi dari distribusi waktu
perjalanan, dan nilai unit pengukuran ini dapat ditentukan relatif terhadap nilai
rata-rata waktu perjalanan dengan rasio keandalan yang bergantung pada
parameter preferensi pengguna (terkait dengan penghindaran risiko) dan bentuk
ekor bagian atas dari fungsi distribusi kumulatif (cdf) dari distribusi waktu
perjalanan. Bentuk ini diwakili oleh integral yang pasti dari invers dari cdf.
Mendefinisikan bentuk cdf dan fungsi inversinya difasilitasi jika distribusi dapat
didefinisikan oleh fungsi aljabar eksplisit. Distribusi Burr (tipe XII) adalah satu
distribusi dengan fitur ini, dan telah digunakan untuk berhasil mewakili data
waktu tempuh yang teramati. Makalah ini menjelaskan distribusi Burr,
menunjukkan bahwa dapat memberikan representasi yang baik dari data waktu
tempuh yang diamati, dan menjelaskan bagaimana hal itu dapat digunakan untuk
mengembangkan ekspresi yang tepat untuk rasio keandalan dan dengan demikian
dapat membantu penggunaan metode untuk penilaian keandalan waktu perjalanan.
Beberapa distribusi statistik telah diusulkan untuk merepresentasikan data
waktu tempuh yang teramati.Asimetri distribusi berarti distribusi normal
(Gaussian) tidak mungkin cocok dengan data yang diamati. Distribusi alternatif
umum yang mengakomodasi beberapa condong positif, seperti distribusi log-
normal, telah diusulkan sebagai langkah pertama yang masuk akal (misalnya Pu
2011). Penelitian awal penulis pada topik ini (Richardson dan Taylor 1978; Taylor
1982) menunjukkan bahwa distribusi log-normal dapat sesuai dengan beberapa set
data yang tersedia, tetapi ada kekurangan data distribusi waktu perjalanan individu
di abad ke-20. abad dan ukuran sampel dari set data yang tersedia relatif kecil
karena kesulitan historis dalam mengumpulkan waktu perjalanan individu.
Penelitian yang lebih baru menunjukkan bahwa distribusi log-normal umumnya
kurang cocok untuk distribusi waktu perjalanan (misalnya lihat Fosgerau dan
Karlstrom (2010) dan Kim dan Mahmainani (2015)). Teknologi pengumpulan
data modern memungkinkan pengumpulan kumpulan data substansial pada
variabilitas waktu perjalanan (misalnya Van Lint dan Van Zuylen (2005),
Fosgerau dan Fukuda (2012), Susilawati dkk., (2013), Kim dan Mahmassani 2015
dan Delhomme et al., (2015)), yang telah menunjukkan dengan jelas kemiringan
berat bagian atas yang kuat dan berat dalam distribusi variabilitas waktu
perjalanan. Hal ini menyebabkan pertimbangan distribusi lain, seperti:
• Distribusi stabil (Fosgerau dan Fukuda, 2012), yang menyediakan metode yang
kuat untuk mewakili variasi dalam waktu perjalanan tetapi dalam istilah praktis
menderita ketidakmampuan untuk menulis persamaan formulir tertutup untuk
distribusi, bahkan untuk pdf-nya. Ketidakmampuan ini adalah kerugian
substansial dalam lingkungan kebijakan di mana tingkat transparansi yang tinggi
dalam analisis dan penalaran sekarang dituntut
• Distribusi gamma dan senyawa-gamma. Kim dan Mahmassani (2015)
mendemonstrasikan bagaimana menggunakan distribusi senyawa-gamma untuk
secara bersamaan mewakili variasi dalam waktu perjalanan sehari-hari untuk
wisatawan individu dan antara kendaraan yang melakukan perjalanan di jalan
pada saat yang sama, dan
• The Burr type XII distribusi, yang telah terbukti mewakili variasi yang diamati
dalam waktu perjalanan sehari-hari dengan potensi untuk menghubungkan ini
dengan variabel keadaan lalu lintas (Susilawati et al., 2013). Satu masalah dengan
aplikasi dari beberapa distribusi statistik ini dalam penilaian keandalan waktu
perjalanan menggunakan metode Fosgerau adalah bahwa mereka mungkin tidak
memiliki hasil analitik untuk fungsi distribusi kumulatif mereka (cdf) F (x) atau
untuk inverse cdf F −1 (P). Ini adalah kasus untuk distribusi stabil dan distribusi
gamma, sehingga dapat mempersulit perhitungan nilai persentil dan definisi
eksplisit dari cdf terbalik dengan distribusi tersebut. Satu distribusi yang memiliki
bentuk aljabar yang tepat untuk cdf dan inverse cdf adalah distribusi tipe XII Burr
(Burr 1942), selanjutnya digambarkan sebagai distribusi Burr. Distribusi ini telah
menemukan penggunaan yang luas di banyak bidang teknis di mana distribusi
data miring umumnya diamati, seperti ilmu pengetahuan aktuaria dan rekayasa
keandalan. Belakangan ini distribusi ini juga telah digunakan dalam studi
variabilitas waktu perjalanan, mis. Susilawati et al., (2013), di mana ia
ditunjukkan untuk menyesuaikan beberapa set data variabilitas waktu perjalanan.
Rangkuman Jurnal
Strategies to Improve the Efficiency of a Multimodal Interdependent
Transportation System in Disasters
Rangkuman Jurnal
Estimating Travel Time Distribution Under Different Traffic Conditions
Rangkuman Jurnal
Modelling travel time reliability with the Burr distribution
Jurnal ini menunjukkan distribusi Burr sebagai model statistik yang berguna untuk
mewakili keandalan waktu perjalanan melalui studi tentangvariabilitas sehari-hari
dalam waktu perjalanan pada perjalanan di daerah perkotaan. Distribusi ini
memiliki bentuk dan kemampuan yang fleksibel.Hasil ini menyediakan sarana
untuk mempelajari keandalan waktu perjalanan secara lebih rinci, dan sejalan
dengan penelitian terbaru tentang indeks perjalanankeandalan waktu. Distribusi
Burr dapat diolah secara aljabar, yang berarti bahwa nilai persentil dapat dihitung
secara langsung.Dengan cara ini berbagai metrik keandalan waktu perjalanan,
seperti FHWA Buffer Index dan parameter kemiringan Delft dapatdihitung dari
parameter Burr yang dipasang. Ini membuka jalan untuk memasukkan keandalan
sebagai pertimbangan dalam ekonomianalisis, menggunakan metrik yang dapat
lebih mencerminkan sifat variabilitas waktu perjalanan. Contoh studi kasus,
menggambarkan metode komputasi yang diusulkan untuk metrik keandalan waktu
tempuh.
Comtoh Pengaplikasian Distribusi Burr.
ALTTRDAT berisi variasi hari-ke-hari dalam waktu perjalanan di beberapa rute
melalui Adelaidedaerah metropolitan. Pengumpulan data waktu perjalanan
dimulai pada tahun 2007 di rute pertama, Glen OsmondRute jalan. Rute lain telah
ditambahkan secara progresif sejak saat itu dan sekarang adaenam rute terpisah.
Data dikumpulkan menggunakan data GPS, menyediakan sumber yang kaya dari
data waktu perjalanan untuk setiap rute dan untuk bagian yang didefinisikan
(tautan) di dalamnya. Pengamatan selama beberapa hari, minggu, dan
bulanmemungkinkan pengembangan distribusi waktu perjalanan memanjang yang
mencerminkan variasi hari-demi-hari dalam perjalanan yang dialami oleh
komuter, dan dengan demikian memberikan pengalaman dan persepsi mereka
tentang rute. The GlenRute Osmond Road ditunjukkan dengan warna merah pada
Gambar 1. Ini dibagi menjadi tujuh tautan, dan Tautan 3 dan 5 ditampilkan
padapeta.
Rute Glen Osmond Road adalah 5.920 km panjang. 2.204 km pertama (dari awal,
di ujung selatan, keJalan Fullarton - lihat Gambar 1) adalah jalan arteri satu jalur
empat lajur melewati sebagian besar jalan(pemukiman dengan kepadatan rendah).
Bagian dari Fullarton Road ke Greenhill Road (Link 3 pada Gambar 1) jugajalan
arteri satu jalur empat lajur, tetapi melalui area komersial / ritel campuran. Tautan
ini adalah 1.064 kmpanjang. Jalan Greenhill ke Teras Selatan (0,776 km) adalah
jalan arteri yang terbagi empat jalur melalui taman-taman. A 60Batas kecepatan
km / jam berlaku untuk semua bagian rute sebelumnya ini, dan pembatasan
clearway berlaku di pagi haripuncak (waktu hari untuk waktu perjalanan berjalan)
sehingga parkir di pinggir jalan dilarang pada waktu itu. Sisa darirute terletak di
distrik pusat bisnis Adelaide (CBD) dan batas kecepatan 50 km / jam berlaku di
sana. Tautan 5 (lihatGambar 1) berada di sepanjang Hutt Street, sebuah jalan kafe
/ restoran yang populer, yang merupakan empat jalur lalu lintas yang dibagi
dengan sudutparkir di setiap sisi. Bagian rute ini sepanjang 0,791 km. Sisa 1.085
km dari rute terus berlanjutCBD di jalan raya jalur satu lajur tunggal atau jalan
raya jalur empat lajur (keduanya dengan terpisahjalur parkir). Ada 17 set sinyal
lalu lintas di sepanjang rute, dan semua tautan kecuali yang terakhir berakhir pada
sinyal lalu lintas. Tautan terakhir berakhir di pintu masuk parkir mobil. Distribusi
Burr telah dipasangkan ke data untuk rute lengkap, dan ke tautan individu di rute
tersebut,menggunakan kemungkinan maksimum untuk memperkirakan parameter
distribusi. Tabel 2 menunjukkan estimasi parameter danhasil uji goodness of fit
untuk rute dan untuk Link 3 dan 5. Beberapa metrik waktu perjalanan - Buffer
Time Indexdan Delft metrics - dihitung menggunakan estimasi parameter Burr
kemudian ditunjukkan pada Tabel 3.Nilai λmelebihi satu menunjukkan condong
ke kanan (bagian atas) dari distribusi, dan nilaisemakin tinggi, semakin besar
kemiringan. λ Menunjukkan penyebaran data tentang median, dan nilai 0,6908
menunjukkanbahwa besarnya kisaran tengah 80 persen dari data adalah sekitar 69
persen dari nilai median.
Contoh khas dari distribusi pas, Gambar 3 menunjukkan histogram yang diamati
dan Burr pdf untuk Link 5. karakteristik ekor panjang dalam data yang diamati,
mencerminkan kecondongan yang melekat dalam data, terlihat jelas. Jurnal ini
telah menyarankan distribusi statistik baru, distribusi Burr, sebagai model statistik
yang berguna untukmewakili keandalan waktu perjalanan melalui studi
variabilitas sehari-hari dalamwaktu perjalanan pada perjalanan di perkotaan
daerah.Distribusi ini memiliki bentuk yang fleksibel dan kemampuan untuk
menggambarkan ekor bagian atas yang sangat panjang terlihat pada distribusi
distribusi variasi waktu perjalanan. Ini adalah hasil yang bermanfaat karena itu
menyediakan sarana untuk mempelajari keandalan waktu perjalanan secara lebih
rinci, dan sejalan dengan penelitian terbaru tentang yang sesuai
indeks untuk mengukur reliabilitas.
Keuntungan lebih lanjut dari distribusi Burr adalah traktilitas aljabar, yang
berartinilai persentil dapat dihitung secara langsung. Dengan cara ini berbagai
metrikkeandalan waktu perjalanan, seperti FHWABuffer Index dan parameter
kemiringan Delft dapat dihitung secara langsung dalam hal parameter Burr yang
dipasang.
Metrik ini semuanya berdasarkan nilai persentil untuk distribusi waktu
perjalanan.Ini membuka jalanMenujudimasukkannya keandalan sebagai
pertimbangan dalam analisis ekonomi, menggunakan metrik yang dapat lebih
mencerminkan sifatvariabilitas waktu perjalanan. Contoh studi kasus,
menggunakan data dunia nyata, digunakan untuk menggambarkan usulan tersebut
metode komputasi untuk metrik keandalan waktu perjalanan.
Rangkuman Jurnal
Binomial and multinomial regression models for predicting thetactical
choices of bicyclists at signalised intersections
Pada jurnal ini Model regresi binomial dan multinomial diestimasi dan
dievaluasi menggunakan paket perangkat lunak statistik R (The R)Foundation,
2016). Fungsi eliminasi fitur rekursif (RFE) dari paket pelatihan klasifikasi dan
regresicaret (Kuhn, 2016) digunakan untuk mengidentifikasi set prediktor yang
paling kuat dari 37 variabel menggunakan gabungan mundurseleksi dan k-fold
cross validation. Model yang dikurangi disajikan dalam makalah ini karena detail
yang ditawarkan dianggapcukup untuk aplikasi dalam simulasi lalu lintas
mikroskopis.
Pengendara sepeda adalah pengguna jalan yang sangat fleksibel yang
menggunakan berbagai perilaku taktis untuk mengoptimalkankenyamanan,
keterusterangan dan efisiensi waktu saat melintasi persimpangan sinyal.Pilihan
taktis yang dihadapi oleh pengendara sepeda di persimpangan yang ditandai
termasuk apakah akan menggunakanjalur sepeda, jalan raya atau trotoar, untuk
berhenti atau melanggar sinyal lalu lintas merah, untuk berkendara bersamaatau
terhadap arah perjalanan wajib dan metode pelaksanaan belokan kiri. Ituhasil dari
pilihan ini memiliki dampak langsung pada keselamatan lalu lintas dan efisiensi di
persimpangan.
Dalam tulisan ini, terungkap data pilihan dari 4710 bicyclists di empat
persimpangan diMunich, Jerman digunakan untuk mengestimasi model regresi
logistik binomial dan multinomialuntuk memprediksi hasil pilihan taktis. Set
prediktor optimal dipilih dari utamadan efek interaksi dua arah dari 43 variabel
independen yang menggambarkan situasi,perilaku strategis dan pilihan taktis
sebelumnya dari pengendara sepeda menggunakan eliminasi fitur rekursif.Model
yang disederhanakan diperkirakan menggunakan variabel yang signifikan secara
statistik dari yang optimalset prediktor. Kekuatan prediksi dari model regresi yang
dihasilkan dinilai menggunakank-fold cross validation. Model untuk memprediksi
respons terhadap sinyal merah dan jenis kirigiliran menunjukkan kekuatan
prediktif yang tinggi sementara prediksi pemilihan infrastrukturdan arah
perjalanan terbukti sulit.
Data pilihan dari bicyclists di empat persimpangan penelitian di Munich,
Jerman digunakan untuk mengembangkan logistic model regresi. Munich adalah
kota dengan 1,3 juta penduduk di mana sekitar 14% perjalanan dilakukan dengan
sepeda.Jaringan sepeda, yang terdiri dari jalur sepeda, di jalan dan jalur sepeda
terpisah dan jalan-jalan sepedalebih dari 1200 km (München, 2010).
Persimpangan dipilih dengan berbagai jenis infrastruktur sepeda (on-roadjalur
sepeda, jalur sepeda yang terpisah dan tidak ada infrastruktur sepeda khusus),
volume sepeda dan lalu lintas kendaraan bermotordan geometri jalan. Segmen dua
jam dari data video yang direkam selama jam sibuk pagi di setiap persimpangan
adalahdipilih untuk analisis perilaku terperinci. Data yang menjelaskan perilaku
taktis para pengendara sepeda dan situasi dipersimpangan diekstraksi secara
manual. Akhirnya, informasi waktu dari sinyal yang digerakkan oleh lalu lintas
dipasok olehKota Munich dan terkait dengan data yang diamati menggunakan
stempel waktu yang dikoreksi.
Sebanyak 37 variabel independen yang menggambarkan pilihan taktis strategis
dan sebelumnya dari pengendara sepeda serta situasionalnyafaktor digunakan
sebagai prediktor dalam model regresi logistik. Representasi visual dari variabel
independen yang dipilihdan variabel dependen (pilihan taktis) ditunjukkan pada
Gambar. 1.Variasi yang cukup dalam variabel independen dijamin melalui
pemilihan persimpangan penelitian denganpendekatan yang berbeda satu sama
lain dalam hal arus lalu lintas dan geometri. Variabel yang menggambarkan
keberadaan jalan lainpengguna serta keadaan kontrol sinyal pada saat seorang
pengendara sepeda tiba memberikan variasi lebih lanjut antar kasus. Sebuah
daftardari variabel independen kategoris dengan frekuensi yang diamati
ditunjukkan pada Tabel 1. Variabel independen berkelanjutandengan statistik
deskriptif diberikan pada Tabel 2.Sebuah model regresi logistik untuk masing-
masing pilihan taktis ditentukan dan dikalibrasi menggunakan eliminasi fitur
rekursif,yang menggabungkan k-fold cross validation dan predictor selection
berdasarkan kemungkinan log dari model. Efek utama daninteraksi dua arah
antara variabel situasional yang tercantum dalam Tabel 1 dan 2 digunakan sebagai
set awal variabel penjelas.Langkah-langkah berikut ini diambil untuk
mengidentifikasi set variabel penjelas yang optimal untuk masing-masing model
pilihan taktisdan memperkirakan parameter b yang sesuai.