Jurnal Pemrosesan Paralel Pada Nvidia Cuda
Jurnal Pemrosesan Paralel Pada Nvidia Cuda
Muhammad Aminuddin
NIM: 12022025
Teknik Elektro - Universitas Suryadarma
Jl. Protokol Halim Perdanakusuma, Jakarta Timur 13660
Email: kodewap@gmail.com
Abstrak
Nvidia CUDA adalah salah satu teknologi pemrosesan paralel yang menggabungkan
Central Processing Unit (CPU) dan Graphics Processing Unit (GPU) untuk meningkatkan
kinerja pemrosesan data secara paralel. Di Indonesia pemanfaatan Nvidia CUDA untuk
pemrosesan paralel belum dikenal secara luas. Oleh karena itu, pada skripsi ini dibuat
modul pedoman pembelajaran dan modul pedoman praktikum untuk matakuliah
pemrosesan paralel.
Modul pedoman pembelajaran terdiri dari 7 topik pedoman dan modul praktikum terdiri
dari 8 topik pedoman. Pedoman pembelajaran dan pedoman praktikum telah melalui
pengujian terhadap 43 mahasiswa yang mengambil matakuliah dasar pemrograman,
pengujian yang dilakukan melalui pengisian kuesioner. Setelah dilakukan pengisian
kuesioner, tahap selanjutnya melakukan analisis data melalui uji hipotesis.
Uji validalitas dan uji reliabilitas belum dapat dilaksanakan. Hasil dari uji hipotesis adalah
responden tidak puas dengan pedoman pembelajaran tetapi puas dengan pedoman
praktikum. Selain itu juga dilakukan pengujian dalam bentuk praktikum terhadap
mahasiswa dengan prasyarat matakuliah pemrosesan paralel. Hasil dari pengujian
praktikum adalah 5 dari 6 topik praktikum yang diujikan telah melampaui standar
penilaian, sedangkan 1 topik praktikum masih membutuhkan perbaikan. Selain itu tidak
ada perbedaan nilai yang signifikan antara mahasiswa yang mempunyai ipk kurang dari 3
dengan mahasiswa yang mempunyai ipk lebih dari sama dengan 3.
1
I. PENDAHULUAN (CUDA) yang berbasis General
1.1 Latar belakang Purpose Graphics Processing
Seiring dengan kemajuan Unit (GPGPU). Arsitektur Nvidia
teknologi, pemanfaatan komputer CUDA dapat meningkatkan
menjadi sangat luas dan meliputi kinerja pemrosesan data di dalam
segala aspek. Komputer menjadi komputer dengan cara
alat bantu manusia untuk menggabungkan kekuatan
menyelesaikan berbagai bentuk pemrosesan CPU dan GPU untuk
permasalahan dari permasalahan meningkatkan kinerja
yang sederhana sampai dengan pemrosesan data.
permasalahan yang kompleks. GPU pada Nvidia CUDA
Semakin majunya kekuatan mempunyai puluhan hingga
pemrosesan komputer, menjadi ratusan core, sehingga dapat
alasan mengapa permasalahan melakukan pemrosesan data
yang kompleks bisa diselesaikan secara bersama-sama dalam satu
dalam waktu yang singkat. waktu. Gambar 1.1 merupakan
CPU merupakan unit gambar banyaknya core di dalam
pemrosesan utama di dalam GPU pada Nvidia CUDA.
sebuah komputer. Perkembangan Gambar 1.1. Core GPU
CPU dalam 30 tahun terakhir
telah meningkat pesat dari clock
speeds 1 MHz pada awal tahun
1980 hingga mencapai clock
speeds 4 GHz pada saat ini.
Walaupun clock speeds CPU
meningkat, tetapi masalah boros
daya dan panas yang dihasilkan
CPU akibat tingginya clock
speeds menyebabkan clock Dengan banyaknya core di
speeds sulit untuk ditingkatkan dalam sebuah GPU maka
lagi, sehingga merupakan kemampuan Floating-point
masalah besar yang harus Operations per Second GPU jauh
dihadapi tiap pabrikan CPU di atas CPU yang hanya
untuk meningkatkan kinerja mempunyai beberapa unit core.
CPU. Saat ini kemampuan Floating-
Pada tahun 2006 Nvidia point Operations per Second
mengenalkan teknologi GPU telah mencapai lebih dari
pemrosesan paralel yang cepat, 1,5 TFLOPS jauh di atas CPU
murah dan efisien yaitu Compute yang baru mencapai angka 100
Unified Device Architecture GFLOPS. Gambar 1.2 adalah
2
gambar grafik perbandingan 1.3 Spesifikasi
CPU dengan GPU untuk
kemampuan Floating-point Berdasarkan surat keputusan
Operations per Second. nomor: 21/I.3/FTEK/VI/2012
dan surat keputusan nomor:
Gambar 1.2. Floating-Point 02/Kep/D/FTEK/III/2013
Operations per second CPU dan perincian tugas yang dikerjakan
GPU adalah sebagai berikut:
3
4. Nvidia CUDA Memory dengan menggunakan
5. Nvidia CUDA API patokan yang telah telah
6. Nvidia CUDA Library ditentukan.
7. Nvidia CUDA 7. Keluaran berupa : pedoman,
Optimization slide dan rekomendasi
8. Tugas Rancang prasyarat.
8. Metode pengujian yang
2. Format untuk pedoman digunakan adalah uji Chi-
pembelajaran adalah sebagai Square, uji t dan uji z
berikut: sedangkan skala pengujian
1. Judul yang digunakan adalah skala
2. Tujuan likert.
3. Dasar Teori
4. Summary II. DASAR TEORI
5. Latihan Soal 2.1 Sejarah Nvidia CUDA
6. Daftar Pustaka
2006-Nvidia mengenalkan
Format untuk pedoman teknologi pemrosesan paralel
praktikum adalah sebagai berbasis General Purpose
berikut: Graphics Processing Unit
1. Judul (GPGPU) yaitu Compute Unified
2. Tujuan Device Architecture (CUDA).
3. Dasar Teori Nvidia bertujuan membuat
4. Contoh Program Graphics Processing unit (GPU)
5. Soal Praktikum tidak hanya digunakan untuk
6. Set Dosen mengolah aplikasi grafis tetapi
7. Daftar Pustaka juga dapat digunakan untuk
memproses aplikasi non-grafis.
3. Pembuatan program Nvidia GPU pada mulanya hanya
CUDA menggunakan Visual digunakan untuk rendering grafis
Studio 2008 dan Visual 2D maupun 3D, namun sekarang
Studio 2010. telah banyak aplikasi yang
4. Pengujian untuk mahasiswa memanfaatkan kinerja dari GPU
berjumlah 6 orang dengan untuk aplikasi perhitungan
prasyarat matakuliah matematika seperti MATLAB.
pemrosesan paralel. Pada awal perkembangan
5. Penilaian kemampuan komputer, CPU masih
mahasiswa rata-rata 70. memegang peranan penting
6. Standar penilaian dalam pemrosesan grafis namun
kemampuan mahasiswa setelah perkembangan grafis
yang makin meluas, kinerja CPU
4
menjadi menurun karena harus dihubungkan oleh Northbridge
melakukan rendering grafis. Pada pada motherboard yang
awal tahun 1980an dibuatlah berfungsi menjembatani CPU,
hardware khusus untuk mengolah DRAM, Southbridge dan PCI-
grafis yang terdiri dari Geometry Express.
unit, Rasterization unit dan
Fragment unit yang kemudian Nvidia CUDA terdiri dari
dinamakan GPU. beberapa komponen yaitu :
1. G80/G92
2. GT 200
3. Fermi
4. Kepler
5
arsitektur mempunyai jumlah transcendental seperti
SP/CUDA cores yang berbeda- sin,cos dan bilangan
beda. Gambar 2.2 adalah contoh kuadrat.
gambar SM pada arsitektur 2 Warp scheduler untuk
Fermi. penjadwalan 32 thread yang
Gambar 2.2 SM pada bekerja secara paralel.
arsitektur Fermi 64 KB Shared memory dan
L1 cache.
Register serbaguna dengan
ukuran 32.768 x 32 bit.
6
CUDA dengan CPU. CPU mempunyai akses memory yang
tercepat buatan Intel pada tahun cepat karena pada dasarnya GPU
2011 yaitu Intel sandy Bridge memang diperuntukkan untuk
kemampuannya berbeda jauh rendering grafis yang
dengan GPU NVIDIA GTX 680 membutuhkan memory
yang juga keluar pada tahun yang bandwidth yang tinggi untuk
sama. mengurangi bottleneck. Dengan
perkembangan game 3D yang
Memory Bandwidth juga semakin lama membutuhkan
mempengaruhi perbedaan GPU yang semakin cepat,
kemampuan CPU dengan GPU pabrikan chip GPU pun saling
Nvidia CUDA. Gambar 2.4 berlomba-lomba membuat GPU
menunjukkan perbandingan yang mempunyai kemampuan
memory bandwidth antara GPU tinggi tetapi dapat dijual dengan
Nvidia CUDA dengan CPU. harga yang murah. Hal ini
Gambar 2.5. Perbandingan Memory menyebabkan hampir setiap
Bandwidth CPU dengan GPU tahun 2 pabrikan besar pembuat
chip GPU yaitu ATI dan Nvidia
mengeluarkan GPU baru dengan
arsitektur yang semakin baik
dalam segi performa dan semakin
hemat daya listrik.
7
Penjelasannya adalah sebagai Langkah skala likert
berikut: 1. Menentukan dan
memahami apa yang
1. Alur kerja yang pertama yaitu akan diukur.
CPU akan menyalin semua 2. Menyusun
data yang dibutuhkan GPU perancangan.
untuk eksekusi dari main
memory ke GPU memory
III. PERANCANGAN
onboard.
3.1 Pedoman Pembelajaran
2. Setelah semua data yang
Nvidia CUDA
dibutuhkan GPU untuk
Gambar 3.1 Diagram alir
proses eksekusi disalin. CPU
pedoman pembelajaran
akan mengerjakan kode
sequential dan kemudian
akan memberikan instruksi
yang akan dikerjakan oleh
GPU.
3. GPU akan mengeksekusi
secara paralel.
4. Hasil dari pemrosesan paralel
akan disalin ke main
memory.
2.4 Statistika
2.4.1 Skala Likert
Skala likert adalah skala
psikometrik yang sering
digunakan untuk kuesioner di
dalam riset berupa survei.
Disediakan lima pilihan skala
dengan format sebagai
berikut:
1. Sangat tidak setuju
2. Tidak setuju
3. Tidak pasti
4. Setuju
5. Sangat setuju
8
3.2 Pedoman Praktikum memberikan masukan
Nvidia CUDA untuk memperbaiki
Gambar 3.2 Diagram alir pedoman.
Pedoman praktikum 3.3.2 Pengujian oleh
mahasiswa
a) Pengisian kuesioner
Mahasiswa akan mengisi
kuesioner tentang kualitas
pedoman, dari hasil
pengisian kuesioner akan
dilakukan uji hipotesis.
Pada akhir uji hipotesis
akan disimpulkan hasil
pengujian pedoman.
b) Penilaian
Mahasiswa akan
mengerjakan soal-soal
praktikum yang terdapat
pada pedoman. Dari hasil
penilaian dilakukan:
Perhitungan nilai
rata-rata.
Pedoman
dinyatakan dapat
membantu
mahasiswa
memahami materi
apabila rata-rata
penilaian di atas 70.
Perhitungan
perbedaan nilai
kelompok.
3.3 Rancangan Pengujian Pedoman
dinyatakan baik
Pengujian yang dilakukan
apabila tidak ada
melalui tahapan sebagai berikut:
perbedaan yang
3.3.1 Pengujian oleh dosen signifikan antara
Dosen akan mengoreksi kelompok yang
kekurangan di dalam terdiri dari
pedoman dan akan mahasiswa yang
9
memiliki ipk lebih pemrosesan paralel. Skala yang
dari sama dengan 3 digunakan dalam pembuatan
dengan kelompok kuesioner adalah skala likert,
yang terdiri dari skala likert terdiri dari lima
mahasiswa yang pilihan yaitu sangat setuju,
memiliki ipk kurang setuju, tidak pasti, tidak setuju
dari 3. dan sangat tidak setuju,
pernyataan tersebut diberi skor 5,
4, 3, 2 dan 1. Tetapi pada skripsi
IV. PENGUJIAN PEDOMAN ini hanya akan diberikan 4
pilihan yaitu sangat setuju,
4.1 Pengujian oleh Dosen setuju, tidak setuju dan sangat
Setiap pedoman yang telah tidak setuju, pilihan tidak pasti
selesai dikerjakan, pedoman akan dihilangkan sehingga pernyataan
diperiksa oleh dosen diberi skor 4, 3, 2 dan 1.
pembimbing. Dosen pembimbing Kuesioner untuk pedoman
akan memberi masukan dan pembelajaran dan pedoman
memeriksa kekurangan yang praktikum masing-masing diberi
terdapat pada pedoman, masukan pernyataan sejumlah 10
yang diterima yaitu: pernyataan.
1. Penambahan flowchart
pada pedoman praktikum. 10 Pernyataan kuisioner
2. Penambahan penjelasan pedoman belajar adalah sebagai
pada contoh program. berikut :
3. Perbaikan contoh 1. Judul topik pedoman
program. pembelajaran sesuai
dengan tujuan dan materi
4.2 Pengujian oleh Mahasiswa pedoman pembelajaran.
Pengujian oleh mahasiswa 2. Materi dalam pedoman
dilakukan dengan 2 cara yaitu pembelajaran sesuai
melalui kuesioner dan penilaian dengan tujuan pedoman
pedoman praktikum. Mahasiswa pembelajaran
yang mengisi kuesioner adalah 3. Contoh-contoh program
mahasiswa yang mengambil dalam pedoman dapat
kelas dasar pemrograman membantu memahami
sedangkan mahasiswa yang materi.
mengikuti pengujian penilaian 4. Kesesuaian contoh-
pedoman praktikum adalah contoh program dengan
mahasiswa yang telah materi.
mengambil matakuliah
10
5. Kesesuaian ringkasan 5. Contoh-contoh program
dengan dengan materi. dapat membantu
6. Ringkasan dapat memahami dasar teori.
membantu mahasiswa 6. Contoh-contoh program
memahami materi. dapat membantu
7. Kesesuaian soal-soal membuat aplikasi.
latihan dengan materi. 7. Kesesuaian soal
8. Soal-soal latihan dapat praktikum dengan dasar
menguji pemahaman teori.
mahasiswa tentang 8. Kesesuaian soal
materi. praktikum dengan contoh
9. Pedoman pembelajaran program.
dapat diajarkan sesuai 9. Soal praktikum dapat
dengan alokasi jam selesai dikerjakan sesuai
kuliah. dengan alokasi jam
10. Format pedoman praktikum.
pembelajaran keseluruhan 10. Format pedoman
dapat membantu praktikum keseluruhan
mahasiswa memahami dapat membantu
materi. mahasiswa memahami
materi.
11
apabila mengisi pembelajaran dan
kuesioner dengan skor responden puas terhadap
lebih dari sama dengan pedoman praktikum.
3. 3. Pengujian 6 topik
3. Responden dapat pedoman praktikum
dikatakan tidak puas melampaui standar rata-
dengan kualitas rata 70 untuk 5 topik
pedoman apabila praktikum, sedangkan 1
mengisi kuesioner topik masih
dengan skor kurang dari membutuhkan perbaikan
3. untuk melampaui standar
4. Menentukan = 0.05 rata-rata.
5. Menentukan derajat
bebas (db) = (k-1)(b-1) 5.2 Saran Pengembangan
=(5-1)(4-1) = 12 Beberapa saran yang penulis
6. Menentukan nilai dari dapat berikan untuk
tabel x2 pengembangan skripsi ini adalah
Tabel x2 = x2(, db) sebagai berikut:
maka didapat 21.02. 1. Meningkatkan jumlah
peserta untuk pengujian
V. KESIMPULAN DAN SARAN agar mendapatkan hasil
uji beda yang valid.
5.1 Kesimpulan 2. Menambah fasilitas VGA
Berdasarkan perancangan, Nvidia CUDA di BB-5
realisasi dan pengujian skripsi agar praktikum dapat
didapat beberapa kesimpulan berjalan dengan lancar
yaitu: dan jumlah peserta
1. Pemrosesan paralel dapat praktikum dapat
dilakukan pada Nvidia ditambah.
CUDA dan pemrosesan 3. Membuat aplikasi CUDA
paralel pada Nvidia dengan menggabungkan
CUDA dapat beberapa unit PC (Cluster
meningkatkan kinerja CUDA) dapat dilakukan
CPU dalam pemrosesan untuk pengembangan
data. aplikasi Nvidia CUDA.
2. Hasil uji hipotesis untuk 4. Apabila ingin melakukan
pedoman pembelajaran uji validalitas dan uji
dan pedoman praktikum reabilitas sebaiknya
yaitu responden tidak dengan cara
puas terhadap pedoman membandingkan dua
12
kelompok mahasiswa erm=None pada 10 April
yang diberi perlakuan 2012.
berbeda. [5] Kirk David B., Hwu
Wen-mei W.,
Programming Massively
DAFTAR PUSTAKA Parallel Processors, MK,
[1] Benchmark reviews, 2010.
Nvidia GF 100 GPU [6] Mardalis, Metode
Fermi Architecture, Penelitian Suatu
diakses dalam Pendekatan Proposal,
http://benchmarkreviews. PT. Bumi Aksara,
com/index.php?option=co Jakarta, 2008.
m_content&task=view&i [7] Nvidia, NVIDIA CUDA
d=518&Itemid=72&limit Architecture Introduction
=1&limitstart=2 pada 22 & Overview, Nvidia,
Agustus 2012. 2009.
[2] Farber, Rob, CUDA [8] Nvidia, NVIDIA CUDA
Application Design And C Programming Guide
Development, MK, version 4, Nvidia, 2011.
2011. [9] Nvidia, NVIDIA
[3] Guru 3D, Geforce GTX CUDA C Programming
680 review, diakses Guide version 4.2,
dalam Nvidia, 2012.
http://www.guru3d.com/a [10] Nvidia, NVIDIA
rticles_pages/geforce_gtx Fermi Compute
_680_review,3.html pada Architecture, Nvidia.
22 Agustus 2012. [11] Nvidia, Tokyo
[4] Harvard, Harvard Institute of Technology
recognized by NVIDIA Selected as Japans First
as a CUDA Center of CUDA Center of
Excellence, dikases Excellence, diakses
dalam dalam
http://www.seas.harvard.e http://www.nvidia.com/o
du/news- bject/io_1270716327243
events/newsarchive/2009/ pada 10 April 2012.
harvard-recognized-by- [12] Sanders J., Kandrot
nvidia-as-a-cuda-center- E., CUDA By
of- Example, Addison-
excellencenvidia/?searcht Wesley, 2010.
13
[13] Susanto, Stephanus
H., Sistem Operasi
Android pada Kuliah
Mobile Programming,
FTEK-UKSW, Salatiga,
2011. (Laporan Tugas
Akhir untuk meraih gelar
sarjana di FTEK-UKSW).
[14] Toms hardware,
Nvidia Powering
Worlds Most Poweful
Supercomputer, diakses
dalam
http://www.tomshardware
.com/news/Tesla-Titan-
Cray-XK6-
Supercomputer-Steve-
Scott,13669 pada 10
April 2012.
[15] Wikipedia, CUDA,
diakses dalam
http://en.wikipedia.org/wi
ki/CUDA pada 8 Februari
2012.
[16] Wikipedia,
GDDR5, diakses dalam
http://en.wikipedia.org/wi
ki/GDDR5 pada 1 Mei
2012.
[17] Wikipedia, Graphics
processing unit, diakses
dalam
http://en.wikipedia.org/wi
ki/Graphics_processing_u
nit pada 1 Mei 2012.
14