Kelompok 12 - Model Gambling Dengan Kebijakan Optimal Myopic

Model Gambling
dan Pemrograman Dinamik dengan Kebijakan Optimal Myopic

(Studi Kasus: Investasi pada Perusahaan)
Arrizal Fitrah Febryan, Tommy Haryanto, Sevila Yuan Verliana

1,2,3)
Jurusan Matematika, Fakultas MIPA, Universitas
Jl. Raya Bandung Sumedang KM 21 Jatinangor Sumedang 45363
Email: arrizalfitrahf@gmail.com, tommy17002@mail.unpad.ac.id, sevilayuanverliana@gmail.com
ABSTRAK
Paper ini akan membahas suatu penerapan model gambling matematika dengan kebijakan optimal myopic.
Model gambling pada umumnya dapat ditemukan pada berbagai sektor dalam kehidupan sehari hari untuk bertaruh
dalam spekulasi, diantaranya pada masalah keuntungan penanaman saham pada suatu perusahaan. Penyelesaian
model gambling melibatkan masalah multistage, sehingga dapat diselesaikan dengan pemrograman dinamik. Agar
mendapatkan hasil yang optimal, diperlukan suatu penentu kebijakan yang tepat yaitu kebijakan optimal myopic
yang dikenalkan oleh Kelly (1956). Dengan menggunakan asumsi fungsi logaritma, diperoleh model umum fungsi
pemrograman dinamik yaitu :
V n ( x n )= max E wn V n−1 ( x n +un xn w n )

0 ≤u n ≤ 1
V n ( x n )= max [ p V n−1 ( xn +u n x n ) +q V n −1 ( x n−un x n ) ] .

0 ≤un ≤ 1
Kata Kunci : Model gambling, kebijakan optimal myopic, pemrograman dinamik, investasi, multistage
ABSTRACT
This papper will discuss an application of mathematical gambling models with optimal myopic policies. Gambling models can
be found in various sectors in daily life to bet on speculation, among them on the issue of the profit of planting shares in a
company. The completion of the model gambling involves multistage issues, so it can be solved by dynamic programming. In
order to obtain optimal results, a right determinant policy is required, the optimal myopic policy which is introduced by Kelly
(1956). Using the assumption of logarithmic functions, the common model of dynamic programming functions is obtained:

0 ≤u n ≤ 1
V n ( x n )= max [ p V n−1 ( xn +u n x n ) +q V n −1 ( x n−un x n ) ] .
0 ≤un ≤ 1
Keywords : gambling model, Myopic Optimal Policy, multi-stage, myopic, dynamic programming.
PENDAHULUAN
Dalam sebuah paper yang berjudul " A New Interpretation of Information Rate ”Kelly [Kel56] dianggap
sebagai petaruh yang tidak bermoral yang menerima informasi sebelumnya mengenai hasil acara olahraga melalui
saluran komunikasi yang bising (misalnya, sambungan telepon) sebelum hasilnya menjadi pengetahuan
umum.Setelah menerima kata "menang" atau "kalah" yang ia bisa dengar di kondisi sulitnya komunikasi saat itu,
petaruhi akan menempatkan taruhannya (jumlah yang tidak non-negatif sampai kekayaan sekarang) pada
kemungkinan asli.Dengan p sebagai kemungkinan benar dan q = 1 - p sebagai kemungkinan salah, Kelly
menunjukkan menggunakan teknik kalkulus bahwa jika p < q, taruhan optimal si petaruh u (yaitu, sebagian kecil
dari modal bertaruh sekali) adalah u = p - q.Jika p <= q, maka u = 0. Kelly juga menunjukkan bahwa pertumbuhan
modal maksimum terjadi pada tingkat yang sama dengan kapasitas saluran yang dimisalkan sebagai Gmax = log2 2
+ p log2 p + q log2 q.(Menariknya, ini adalah hasil yang sama yang diperoleh oleh Shannon [Sha48] dari
pertimbangan pengkodean informasi.)
Karya Kelly menarik perhatian sejumlah besar peneliti termasuk para ekonom, misalnya, Arrow [Arr71], psikolo
interesting g, misalnya, Edwards [Edw62] dan matematikawan Terapan seperti Bellman dan Kalaba [BK57a],
[BK57b], [Bel61] yang diperluas dan mentafsirkan kembali hasil Kelly.Secara khusus, Bellman dan kal-ABA
kembali memecahkan masalah yang sama setelah merumuskan sebagai program yang dinamis dengan fungsi utilitas
logaritmik untuk terminal kekayaan petaruh.Mereka mengasumsikan bahwa petaruh diperbolehkan bermain
sebanyak n (taruhan) dan pada setiap permainan bertaruhnya, ia bisa bertaruh berapapun jumlahnya asalkan
nonnegative sampai kekayaan sekarang.
METODOLOGI PENELITIAN
Penelitian yang akan dilakukan kepada model gambling adalah menggunakan studi literatur. Studi literatur yang
diambil adalah mengenai Pernyataan Kelly (1956) yang menyatakan bahwa pada permainan seorang gambler dapat
bertaruh dengan jumlah non negatif untuk keberuntungan waktu sekarang, maka menang atau kalah akan dinyatakan
dengan jumlah probabilitas masing-masing p dan q, dimana q = 1 - p. Munculnya n taruhan dan tujuannya adalah
memaksimalkan nilai harapan logaritma dan keberuntungan terakhir. Ketika tidak ada taruhan tersisa, maka fungsi
utilitas gambler kekayaannya adalan V 0 ( x 0 )=ln(x 0). Ketika n taruhan bersisa, kita dapat menganggap un sebagai
fraksi dari kekayaan saat ini untuk bertaruh dengan 0 ≤ un ≤ 1. Kemudian langkah persamaan asumsi dengan bentuk
x n−1=f n ( x n ,u n , wn )=x n+ un x n w n , n=1... N dimana variabel acak wn mengambil nilai 1 atau -1 dengan
peluang p dan q. Dengan demikian persamaan fungsional DP ditulis sebagai :

0 ≤u n ≤ 1
V n ( x n )= max [ p V n−1 ( xn +u n x n ) +q V n −1 ( x n−un x n ) ]
0 ≤un ≤ 1
dengan syarat batas V 0 ( x 0 )=ln ⁡(x 0)

Sekarang kita deskripsikan solusi permasalahan pemrograman dinamik milik Kelly menggunakan Maple.
1
Pertama, ditunjukkan bahwa p≤ adalah nilai optimal untuk tidak bertaruh (u=0) dan ( x n)=ln ( x n ). Dimulai
2
dengan n=1, dapat dilihat bahwa fungsi c1 merupakan monoton turun di u, maka keputusan optimal untuk bertaruh
adalah 0. (sebetulnya, ketika p=½, pengaturan u=2 p−1 membuat c1 konstan. keputusan optimal masih
berlaku). Dengan ( x 1)=0, kita dapat V 1 ( x 1)=log( x 1). Untuk nilai lain dari n > 1, solusinya yang sama dapat
1
ditunjukkan menjadi pembuktiaan yang berlaku ketika ≤ , µ ( X )=0 dan V n ( X n)=log( X n).
2 n n
Dengan menggunakan maple.
CONTOH KASUS DAN PEMBAHASAN
Kasus I
Pak Haryanto menanamkan modalnya di suatu perusahaan. Sejumlah uang yang disimpan dapat
menghasilkan untung atau membuat kerugian sejumlah uang yang disimpan tersebut. Pak Haryanto yakin akan
7
memiliki kesempatan menang sebesar dari modal yang ia tanamkan. Bagaimana strategi yang digunakan Pak
10
Haryanto agar mendapatkan keuntungan dari modal yang ditanamkan tersebut jika ia menanamkan modalnya
sebanyak 10 kali dengan modal awal $ 50?
Jawab :
Perumusan : Perumusan pemrograman dinamik untuk masalah tersebut adalah
Tahap n = pertaruhan ke-n (n = 1,2,3,..10)

x n= jumlah uang yang tersedia pada tahap n, x 3= 50
State un = tingkat taruhan pada tahap n
V n ( x n ) = maksimum perolehan uang dari sejumlah x n yang ditaruhkan saat tersisa n taruhan
7
p = peluang taruhan berhasil (menang) =
10
7 3
q = peluang taruhan gagal = 1− =
10 10
Asumsi. Perolehan uang akhir dari sejumlah uang yang ditaruhkan mengikuti fungsi logaritma natutal :
V 0 ( x 0 )=ln ⁡( x 0)
Definisi state ini dipilih karena dapat menyediakan informasi mengenai situasi sekarang yang diperlukan untuk
membuat keputusan optimal tentang banyaknya uang yang harus dipertaruhkan kedepannya.
Oleh karena tujuannya ialah memaksimalkan probabilitas pak Haryanto tersebut akan menang dalam taruhannya.
Fungsi tujuan yang harus dimaksimalkan pada setiap tahap adalah probalitias penyelesaian permainan tersebut
dengan sekurang-kurangnya $50.
V 0 ( x 0 )=ln ⁡( x 0) (1)
V n ( x n )= max [ p V n−1 ( xn +u n x n ) +q V n −1 ( x n−un x n ) ] (2)

0 ≤un ≤ 1
dengan syarat batas V 0 ( x 0 )=ln ⁡( x 0)

Gambar.1 Penggambaran masalah dalam kasus Multi-stage
Penyelesaian matematis.
Selanjutnya masalah ditinjau dengan pemrograman dinamik tahap mundur (backward) 3 tahap :
i. Tahap 3
Pada tahap 3 terdapat 1 permainan tersisa ( n=1 ), dengan fungsi tujuan
7 3
V 1 ( x1 ) = max [ V 0 ( x1 +u1 x 1) + V 0 ( x 1−u1 x 1) ] (3)
0 ≤u n ≤1 10 10
Perhatikan bahwa dari (1)
V 0 ( x 0 )=ln ⁡( x 0)
Maka 7 3
V 1 ( x1 ) = max [ ln ( x 1+ u1 x 1 ) + ln ( x 1−u1 x1 ) ] (4)
0 ≤u ≤1 10
n
10
Turunkan terhadap u untuk memperoleh nilai optimal untuku
d V 1 ( x1 ) 7 x1 3 x1
= −
du 10 ( x 1+ u1 x 1) 10 ( x ¿ ¿ 1−u 1 x 1)¿
(5)
2
u1 =
5
ii. Tahap 2
Pada tahap 2 terdapat 2 permainan tersisa ( n=2 ), dengan fungsi tujuan
7 3
V 2 ( x2 ) = max [ V ( x +u x ) + V ( x −u x ) ] (6)
0 ≤un ≤1 10 1 2 2 2 10 1 2 2 2
V 0 ( x 0 )=ln ⁡(x 0)
Maka V 2 ( x2 ) = max ¿ (7)

0 ≤u n ≤1
Turunkan terhadap u untuk memperoleh nilai optimal untuku

d V 2 ( x2 ) 7 x2 3 x2
= −
du 10 ( x 2+u 2 x 2) 10 ( x ¿ ¿ 2−u 2 x 2)¿
2
u2 = (8)
5
iii. Tahap 1
Pada tahap 1 terdapat 3 permainan tersisa (n=3 ¿ ,dengan fungsi tujuan
7 3
V 3 ( x 3) = max [ V 2 ( x3 +u 3 x 3 ) + V 2 ( x3 −u3 x 3 ) ] (9)
0 ≤un ≤ 1 10 10

V 0 ( x 0 )=ln ⁡(x 0)
Maka 7 7 3 ln ⁡(3) 3
V 3 ( x 3) = max [ ln ( 7 )−2 ln ( 5 ) + ln ( u3 x3 + x 3 ) + + ln ⁡( −u3 x 3 + x 3)] (10)
0 ≤u ≤ 1 5
n
10 5 10
Turunkan terhadap u untuk memperoleh nilai optimal untuk

d 3 ( x3 ) 7 x3 3 x3
= −
du 10 (x 3 +u3 x3 ) 10 ( x ¿ ¿3−u3 x 3)¿
2 (11)
u3 =
5
2
Substitusi u= , dan x 3=¿50
5
21 ln ⁡(7) 9 ln ⁡( 3)
V 3 ( 10 )= −3 ln ( 5 ) +ln ( 50 ) +
10 10
V 3 ( 5 0 )=4.158871642≈ 4.16
Kesimpulan. Pak Haryanto tersebut dapat memperoleh keuntungan sebesar $4.16 dengan memasang taruhan u =
2/5 bagian dari uang pada setiap pertaruhan.
Komputasi Maple. Dengan aplikasi Maple, akan ditunjukkan masalah gambling dan kebijakan optimal myopic.
SIMPULAN
Model gambling dapat diselesaikan dengan solusi melalui pemrograman dinamik menggunakan maple seperti
pernyataan Kelly. Pada suatu permainan seorang gambler dapat bertaruh untuk mendapatkan keberuntungan.
Menang atau kalah dinyatakan dengan jumlah probabilitas p dan q, dimana p peluang menang dan q dinyatakan 1-p.
Ketika tidak ada taruhan tersisa, maka fungsi utilitas gambler kekayaannya adalan V 0 ( X ¿¿ 0)=ln( X 0) ¿. Ketika
n taruhan bersisa, kita dapat menganggapun sebagai fraksi dari kekayaan saat ini. Kemudian langkahnya yaitu
pertama, ditunjukkan bahwa p ≤ ½ adalah nilai optimal untuk tidak bertaruh (u=0) dan V n ( X n)=ln( X n).
Dimulai dengan n=1, dilihat bahwa fungsi c 1 monoton turun di u, maka keputusan optimal untuk bertaruh adalah
0.
DAFTAR PUSTAKA
Parlar, Mahmut. 2000. Dynamic Programming (Chapter 6 in Interactive Operations Research with Maple Methods
and Models).
Hung Jane, Betting with the Kelly Criterion, 2010
UCAPAN TERIMAKASIH
Penulis mengucapkan terimakasih kepada pihak-pihak yang telah membantu menyelesaikan papper ini, kepada :
1. Ibu Dr. Diah Chaerani, M.Si sebagai dosen mata kuliah Pemrograman Dinamik yang telah membimbing
kami dalam menyelesaikan paper ini.
2. Teman teman kelas pemrograman dinamik 2017 atas semangat dan kebersamaannya
3. Semua pihak yang telah membantu kami, sehingga paper ini dapat terselesaikan dengan baik.
Semoga paper ini dapat bermanfaat, baik untuk kami sebagai penulis, ataupun untuk pembacanya.

Kelompok 12 - Model Gambling Dengan Kebijakan Optimal Myopic

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Kelompok 12 - Model Gambling Dengan Kebijakan Optimal Myopic

Diunggah oleh

Hak Cipta:

Format Tersedia

Model Gambling

dan Pemrograman Dinamik dengan Kebijakan Optimal Myopic

Arrizal Fitrah Febryan, Tommy Haryanto, Sevila Yuan Verliana

V n ( x n )= max E wn V n−1 ( x n +un xn w n )

V n ( x n )= max [ p V n−1 ( xn +u n x n ) +q V n −1 ( x n−un x n ) ] .

V n ( x n )= max E wn V n−1 ( x n +un xn w n )

V n ( x n )= max E wn V n−1 ( x n +un xn w n )

dengan syarat batas V 0 ( x 0 )=ln ⁡(x 0)

Perumusan : Perumusan pemrograman dinamik untuk masalah tersebut adalah

Tahap n = pertaruhan ke-n (n = 1,2,3,..10)

V n ( x n )= max [ p V n−1 ( xn +u n x n ) +q V n −1 ( x n−un x n ) ] (2)

dengan syarat batas V 0 ( x 0 )=ln ⁡( x 0)

Maka V 2 ( x2 ) = max ¿ (7)

Turunkan terhadap u untuk memperoleh nilai optimal untuku

Perhatikan bahwa dari (1)

Turunkan terhadap u untuk memperoleh nilai optimal untuk

Anda mungkin juga menyukai