Teori Bahasa
Bahasa adalah kumpulan kalimat. Kalimat adalah rangkaian kata. Kata adalah komponen
terkecil kalimat yang tidak bisa dipisahkan lagi.
Dalam bahasa pemrograman, kalimat dikenal sebagai ekspresi, dan kata sebagai token.
Kata terdiri atas beberapa karakter. Kelompok karakter yang membentuk sebuah token
dinamakam lexeme untuk token tersebut. Setiap token yang dihasilkan, disimpan dalam
tabel simbol.
Derivasi adalah sebuah proses dimana suatu himpunan produksi akan diturunkan / dipilah-
pilah dengan melakukan sedertan produksi sehingga membentuk untai terminal.
Pengertian dasar
Grammar G didefinisikan sebagai pasangan 4 tupel : V N, VT, S, dan Q, dan dituliskan sebagai
G(VN, VT, S, Q), dimana :
VT : himpunan simbol-simbol terminal (atau himpunan token -token, atau alfabet)
VN : himpunan simbol-simbol non terminal
SV : simbol awal (atau simbol start)
Q : himpunan produksi
Aturan produksi dinyatakan sebagai , artinya menurunkan
Berdasarkan komposisi bentuk ruas kiri dan ruas kanan produksinya ( ), Noam Chomsky
mengklasifikasikan 4 tipe grammar :
Unrestricted
Cotext Sensitive
Kontext free
regular
Aturan-aturan produksi dapat dinyatakan dalam bentuk BNF ( Backus Naur Form )
Notasi BNF :
E ::= <T> | <T> + <E> | <T> - <E>, T ::= a
Diagram sintaks merupakan alat bantu dalam pembentukan parser / analisis sintaks. Notasi
yang terdapat dalam diagram sintaks :
• Empat persegi panjang melambangkan simbol variabel / non terminal.
• Bulatan melambangkan simbol terminal