Előadás
Az előadás tartalma
Informatikai alapismeretek
Adatszerkezetek
Adatmodellezés alapjai
Az ER-modell fogalmai
A relációs modell
Normálformák, normalizálás
Kapcsolatok
Fogalmi megfeleltetések
8
A GAZDASÁGI RENDSZER ÉS AZ
ADATBÁZISRENDSZER VISZONYA
GAZDASÁGI
RENDSZER
E
R
Ő T
E
F
O
Fő működési R
R folyamat M
É
R
Á K
S INFORMÁCIÓ INFORMÁCIÓ E
O K
K ADATRÖGZÍTÉS
MEGJELENÍTÉS
ADATBÁZIS
RENDSZER
TÁROLÁS
ADATBÁZIS
TRANSZFORMÁCIÓ
ADATBÁZIS
ADAT-
KEZELŐ
FELDOLGOZÁS RENDSZER
9
Fogalmak
Rendszer: egymással kölcsönhatásban álló
elemek (objektumok) együttese, amely a
környezet számára egységes egészként jelenik
meg.
Adat: formalizált,
INFORMÁCIÓ értelmezés
rögzített ismeret
Hogyan keletkezik az
információ? Mi az?adat?
hírfolyamat
Információ
Információ: értelmezett, hasznosítható, új
ismeret, amely felhasználáskor bizonytalanságot
(ismeret hiányt) szűntet meg.
Forrás (elsődleges) információ: közvetlenül a
rendszerből, a működési folyamatból
érzékeléssel (méréssel, megszámlálással, … )
szerzett ismeret.
Származtatott (másodlagos) információ:
feldolgozott adatokból, azok értelmezésével
keletkező új ismeret
13
INPUT OUTPUT
HARDWARE
ADAT
ADAT
PROGRAM
SOFTWARE
14
Adat, hír
Formalizált, általában rögzített
ismeret, olyan jelkonfiguráció
(jelsorozat), amely valamilyen
ismeretet hordoz.
Hír: közlésre, továbbításra szánt, mozgásban
lévő ismeret
15
Az adat három aspektusa
• Forma (szintaxis): jelkonfiguráció
(jelsorozat) jellemzői:
• jelek intervalluma
• hossz
• típus
• struktúra (belső szerkezet)
• Tezaurusz: megadja a jelsorozat
jelentését az adott környezetben
• Tartalom (szemantika): az az
ismeret, amelyet az adott jelsorozat
hordoz
16
Elemi adatok
Az adat értelmezhető (észlelhető, érzékelhető, felfogható
és megérthető) ismeret.
Formalizált, általában rögzített ismeret, olyan
jelkonfiguráció (jelsorozat), amely valamilyen ismeretet
hordoz
Az ismeret mindig jelentéssel bír
Bevitt, tárolt és feldolgozandó szimbólumok és jelek
összessége, melyek kimenetként hasznos ismeretet
adnak
Olyan információ, amely átvitelre és feldolgozásra
alkalmas bináris, digitális formában jelenik meg
Információ
Értelmezett nyers adat
A megismerője számára szükséges
Mindig valamilyen kontextusban jelenik meg és
mindig releváns
Az információ
növeli a megértést
csökkenti a bizonytalanságot
Adatjellemzők
Szintaktika - a jelek, jelcsoportok általános
elrendezése
Formai követelmények, jelkonfiguráció
(jelsorozat)
Jellemzői: jelek intervalluma, hossz, típus,
struktúra (belső szerkezet, az adatok egymás
közötti viszonya)
Szemantika - jeleknek, jelcsoportoknak a közlendő
tartalomhoz való viszonya, jelentés az adott
környezetben
Pragmatika - a közölt ismeret gyakorlati
használhatósága, az ismeret
Adattípusok
Felhasznált jelek típusa szerint
Numerikus (személyi szám)
Alfabetikus (név)
Alfanumerikus (rendszám)
Az adatfeldolgozási folyamatra gyakorolt hatásuk szerint
mennyiségi
azonosító vagy leíró
Ábrázolhatóság és rögzíthetőség szerint
digitális
analóg
Adattípusok
Milyen formában illeszkednek az adatfeldolgozás során
formázott adatok (könyvviteli adatok)
formázatlan (szövegek, döntési adatok)
A feldolgozási folyamatban elfoglalt helyük szerint
bemeneti (rögzített)
kimeneti (eredmény)
A feldolgozási folyamatbeli szerepük szerint
törzsadatok
készletadatok
mozgásadatok
Adattípusok
A felhasználói programok által értelmezett típusok
numerikus (szám formátum)
egész
bájt ( 1 bájt)
egész ( 2 bájt)
valós szám
egyszeres ( 4 bájt)
dupla ( 8 bájt)
Adattípusok
A felhasználói programok által értelmezett
típusok
szöveg, karakter
dátum
pénznem
feljegyzés
számláló
OLE objektum
Hiperhivatkozás
Igen/nem
Adatelemek
Karakter
A karakter egy logikai egység, ami a nyelv egy
alapelemét jelképezi.
Írásjel - a karakter megjelenési formája
Betűkészlet
Minden nyelv ábrázolásához véges számú
karakter (és ehhez tartozó írásjel) szükséges. Ez
a sorba rendezett, véges számú írásjel alkot egy
betűkészletet, egy adott fontot
(font=betűkészlet).
Az adatszerkezet két nézete
Fizikai adatszerkezet: az adatok a
számítógéphez kapcsolt adathordozón
tárolódnak
29
30
Adatmodellezés
Az ISMERETEK rendszerszemléletű közelítése
Emberek
Anyagok, alkatrészek
Munka
Termékek
Szervezetek, cégek
Események
Adatmodellezés
Az előzőekben a jellemzők sorával megadott
minden materiális, fogalmi objektum
ENTITÁS
a továbbiakban
(ADAT)EGYED
Adatmodell fogalma, típusai
A modell általános meghatározása
A modellezés szükségessége
Adatmodell mint a rendszer absztrakciója
Adatmodell típusok
Hierarchikus
Hálós (ETK)
Kétszintű
Codasyl (DBTG)
Relációs
Objektum-relációs
Objektum orientált
Heurisztikus
33
AZ ADATBÁZIS
SZERVEZÉS FÁZISAI
Fogalmi ( koncepcionális)
modell A valós világ objektumai és
összefüggései (rendszer)
Valósághű
leképzés
NÉV
Kiss Jóska
ALAPT ŐKE
100 000 Ft
BET ÉT
1996.01.20
100
80
60
Logikai modell
Nagy Benő 50 000 Ft 1995.09.12 40
Konzisztens
szerkezet
Fizikai modell
ADATBÁZIS
Elhelyezés Megvalósítás
Hozzáférés
34
Adatmodell
Adatmodell: a valóságos rendszer egy sajátos
visszatükröződése a rendszer informatikai struktúrája,
amely az adatokban tárgyiasul. Az adatok és
összefüggéseik tanulmányozására, az adatbázis
megvalósítására szolgál.
Adatmodell szintek:
Fogalmi (koncepcionális)
Logikai (konzisztens elvi konstrukció)
Fizikai (megvalósítható adatbázis)
35
Adatmodellezés módszerei
36
Szintetikus modellezési módszer
Összeállító módszer
Egy tulajdonságsorból a belső függések alapján a
relációk (egyedek) összeállítása
A tulajdonságok nagy száma miatt kis
rendszereknél vagy részmodelleknél alkalmazható
Olyan esetben előnyös az alkalmazása, amikor a
rendszer ismeretlen, nincs még kialakult modell és
az egyedek intuitív módon nehezen ismerhetők fel
37
Analitikus modellezési módszer
Elemző módszer
Nagy rendszereknél vagy régi rendszerek tovább
fejlesztésénél alkalmazható
Fázisai:
Felmérjük a rendszer egyedeit
Hozzárendeljük a tulajdonságokat
Elemezzük a belső függéseket
Meghatározzuk a kapcsolatokat
Kialakítjuk az idegen kulcsokat
38
Modell, objektum
Modell: olyan konstrukció, amely egy objektumnak
a modell alkotás céljából lényeges jellemzőit tükrözi
Konstrukció: ember által megalkotott mechanikai
(pl. jármű), grafikus (folyamatábra, hálóterv),
matematikai (pl. egyenlet), verbális (szöveges),
táblázatos (pl. mátrix, döntési fa) vagy egyéb
szerkezet
Objektum: egy rendszer szerkezetét, működését
meghatározó elem, amely lehet tárgy, személy,
esemény, fogalom vagy bármilyen létező (valós vagy
logikai) dolog 40
Modellalkotás
A modell alkotás célja: általában vizsgálat, elemzés, tervezés, az
adott rendszer vagy objektum megismerése vagy beavatkozás a
rendszer működésébe
Modellalkotás szükségessége:
A modellezendő rendszer túl nagy vagy túl kicsi
(világegyetem, atom)
A valóságban lezajló változások túl gyorsak vagy túl lassúak
(robbanás, evolúció) vagy a vizsgálat közben a rendszer
megváltoztatja a struktúráját (társadalmi rendszerek)
A vizsgálandó rendszer struktúrája nagyon bonyolult
A valóság közvetlen tanulmányozása túl költséges
A valóság tanulmányozása megváltoztatja a folyamatok
működését, a rendszer struktúráját, vagy a rendszer
tönkremeneteléhez vezethet
41
2 690315 4567
üzletkötő
1 521107 5469
Szép Ilona
őrmester
96 000Ft
Szabó XXIII József
42 000Ft
titkárnő
kereskedelmi igazgató
Bak Anita
Tört Elek
86 000Ft
185 000Ft
42
A gazdasági rendszerek objektumai,
melyeket adatokkal jellemezhetünk
43
Egyed, tulajdonság, kapcsolat
jellemzői
Egyed jellemzői:
Típus
Előfordulás
• Tulajdonság jellemzői:
Típus
Előfordulás
• Kapcsolat jellemzői:
Típus
Előfordulás
44
A tulajdonság egyeden belüli szerepe
Azonosító
Leíró (nem azonosító)
Kapcsoló tulajdonság
Kulcs adat
Megjelölő adat
45
Tulajdonságok
Azokat a tételeket, amelyeknek az értéke az
egyed előfordulásra nézve nem egyedi, leíró
szerepű tulajdonságoknak hívjuk.
üzletkötő
1 521107 5469
őrmester Szép Ilona
42 000Ft
Egyed típus
2 590315 4567
185 000Ft
48
Az egyedek közül melyek tartoznak egy típusba?
Típus
Személyi szám Gyártási szám
Név
Beosztás
beosztás
Ügyfél Eladási ár
Bér azonosító Teljesítmény
Felvett
összeg
Személyi szám Név
Bizonylatszám
Pénztár
Beosztás
Bér Mozgásnem Munkaszám
Mozgás
dátuma
2 690315 4567
DOLGOZÓ NEVE
1 521107 5469
Szabó XXIII József üzletkötő
őrmester Szép Ilona
Bak Anita 96 000Ft
Tört Elek
42 000Ft
2 590315 4567
titkárnő
86 000Ft
1 680115 1234 kereskedelmi igazgató
185 000Ft
50
Üzem Központ Bp.. XIX. Fő u. 2.
32
22
Piripócs Ó u. 7.
Kapcsolat előfordulás
Kapcsolat típus
22
Szép Ilona
32 22
1 521107 5469
22
őrmester
Szabó XXIII József Bak Anita
22 Tört Elek
42 000Ft
51
52
Az egyeden végezhető
műveletek (funkciók) leírása
az egyed keletkezésétől
(létrehozásától)
megszűnéséig (törléséig).
53
Az adatbáziskezelő rendszer
és a végfelhasználó közötti
„párbeszéd” (valamint ennek
módszerei, tartalmi és
formai kellékei)
54
Számítógépen tárolt, egymással
bonyolult összefüggésben álló
adatok rendszere, összetett
logikai adatszerkezet fizikai
leképzése, amely tartalmazza az
adat- és szerkezetleírást
valamint az adatkezelő
eljárásokat is.
55
Adatbázis
Adatbázis: Általában számítógépben,
számítógépes adathordozón tároljuk
Szőke Barna
törzsszám név
Szabó Éva 258 Kiss Pál
423 Nagy Olga
Pór Bea 356 Pór Bea
567 Kiss Pál
Nagy Olga
599 Szabó Éva
789 Szőke Barna
Kiss Pál
423
456
567
599
789
258
d1
d1: törzsszám*
d3 d2: név
d3: nyelvtudás 60
Adat tartományok (domain)
Descartes szorzatának a
valóságos objektumokat
leképező részhalmaza.
61
A konkrét reláció táblázatos formában írható le. A
továbbiakban:
RELÁCIÓ = TÁBLÁZAT
Általános szabályok:
R a reláció neve egyedi
A reláció foka (n) a reláción belül
nincs azonos nevű oszlop
A reláció mérete (k)
d1 d2 d3 ---- di ---- dn
e11 e12 e13 e1i e1n
oszlop sorrend
e21 e22 e23 tetszőleges
e31 sorok felcserélhetők
e41 nincs két teljesen azonos
sor
minden relációnak van (a
ek1 ekn
sort) azonosító (egyszerű
vagy összetett) tartománya
62
Reláció azonosítója
A reláció azonosítója: a reláció olyan
tulajdonsága vagy tulajdonságok
összessége, melynek bármely előfordulása
egy és csakis egy sorra jellemző
Azonosító lehet:
Egyszerű
Összetett
63
R < d1, d2, … di … dn >
ahol di Di(t,f)
65
DOLGOZÓ < törzsszám, személyi_igazolvány_száma,
jogosítvány_száma, dolgozó_név, besorolási_bér, ...>
67
egyedi
erősen jellemző
stabil
konzisztens struktúra
fix hosszúság
rövid (a jelsorozat kevés jelből áll: pl. törzs-
szám)
a benne szereplő jelek intervalluma szűk
(kevés féle jelet tartalmaz: pl. csak
számok)
68
Az azonosító ezek alapján
Alternatív azonosító (azonosító jelölt):
az a tartomány(ok) a reláción belül, amely rendelkezik az
azonosító kritériumaival.
tsz szig jogsi dn bér
258 AU-IV 456872 A 5236 8942 Kiss Pál 65 000 Ft
423 FS-III. 789258 Nagy Olga 86 000 Ft
456 AU-II 1586821 Pór Bea 92 000 Ft
567 FS-I. 654321 B 4567 0123 Kiss Pál 86 000 Ft
599 B 4586 5284 A 6549 8765 Szabó Éva 145 000 Ft
789 FC-VI. 456123 Szőke Barna 58 000 Ft
71
Kulcs - típusok
Elsődleges (egyedi) kulcs: az adatbázis tábla
azonosító tulajdonsága, az a mező vagy mezősor, amely
nem lehet üres és amelyben bármely érték egy és csakis
egy sorban fordulhat elő (ugyanaz az érték többször
nem szerepelhet a táblában)
Kapcsoló (idegen kulcs): egy másik relációban kulcs
Csoportosító ismérv (csoport kulcs): amely szerint a
reláció pontjai konzisztens részhalmazokba sorolhatók,
a táblázat olyan oszlopa, melynek azonos értékei szerint
a tábla sorai csoportosíthatók, a csoportképzés
előfeltétele: a tábla rendezése a csoportképző
kulcs(ok)ra 72
73
Belső függés
Belső függés: a reláció tartományai (oszlopai)
közötti viszony, a tartományok értékhalmazainak
összerendelhetősége
Alapesetei:
Funkcionális függés
Kölcsönös függés
Fordított függés
Funkcionális függetlenség
74
Ha egy vizsgált da tartomány bármely értékéhez a df
tartomány csak egy értéke rendelhető hozzá
(másképpen ta meghatározza tf-et): df da
da df
törzs-szám dolgozó_neve
258 Kiss Pál
423 Nagy Olga
456 Pór Bea ? Kiss Pál
567 Kiss Pál
599 Szabó Éva
789 Szőke Barna
75
Ha da meghatározza dj-t és dj is egyértelműen
meghatározza da-t (azaz a ta tartomány és a tj
tartomány értékei kölcsönösen összerendelhetők):
da dj
da dj
törzs-szám szem élyi_ig_szám
258 AU-IV 456872
423 FS-III. 789258
456 AU-II 1586821
567 FS-I. 654321
599 B 4586 5284
789 FC-VI. 456123
76
Ha da nem határozza meg a dr-t de dr meghatározza da-
t (azaz tr tartomány bármely értékéhez rendelhető
hozzá ta csak egy értéke): dr da
da dr
törzs-szám gyerm ek_TAJ
258 123 789 456
134 256 987
423
456 369 258 147
Egyedi,
567
nem lehet
599 321 654 741
azonos!
258 963 147
291 847 352
789 281 739 753
77
Ha da nem határozza meg dn tartományt (ta értékeihez
nem rendelhető a tn tartomány csak egy értéke) és dn
sem határozza meg da-t: dn da
da dn
törzs-szám nyelv_kódja
258
423 AN
NE
FR
456 AN
NE AN
567 AN
FR
599 AN
NE
789 NE
FR
78
Jelöljük ki az azonosítót (amely a reláció egy vagy
több tartományát meghatározza)
DOL< tsz,szig,dT,jogsi,dn,nem,len,bér,cím,szek,szen,gT,gn,nk,nm,nd>
Mi okoz
Az, hogy egyes tartományok értékeiből egy
problémát? sorhoz többet kell rendelni, emiatt a reláció
nem képezhető le két dimenziós táblázattá!
80
Ha egy reláció nem minden tartománya
függ funkcionálisan vagy kölcsönösen az
azonosítótól, akkor a reláció határozatlan,
és 0-ik normál formában van (0NF)
81
Határozott reláció
Határozott reláció: az a reláció, melynek minden
tulajdonsága funkcionálisan vagy kölcsönösen függ az
azonosítótól
83
A reláció néhány művelete
1. Kivetítés (projection): a relációból egy
(általában azonosító) tartomány és az ettől függő
tartományok kiemelése egy új relációba
R<ta, tf1, …, tfi, tj, …, tn>Rp<ta, tf1, …, tfi> marad:
R<ta, tj,…, tn>
2. Összekapcsolás (join): két reláció egyesítése a
közös tartomány értékei alapján
R1<tk, t11, t12,…,t1i>; és R2<tk, t21, …,t2k>
Rj<tk, t11, …,t1i;t21, …,t2k> és Rjf=R1f+R2f
84
A reláció néhány művelete
3. Kiválasztás (selection): egy reláció
sorainak kiemelése megadott ismérvek
alapján
Rk R; Rkf=Rf ahol Rf: R
fokszáma
85
Normalizálás R0:
A könnyebb • tsz
kezelhetőség szig
érdekében írjuk át az jogsi
eredeti relációt egy dn
oszlopba!
szek
szen
gT
Emeljük ki az gn
azonosítótól függő
tartományokat egy nk
másik relációba! nm
nd 86
Kivetítés (projection)
R:
1
• tsz
R0: szig
• tsz jogsi
szig dn R3
jogsi tsz
szek
dn • gT
szen gn
szek R 2:
szen tsz
gT
gn R4
gt tsz
nk
nk
nm gn nm
nd nk nd
nm
nd
87
Határozott reláció
Ha egy reláció minden tartománya függ az
azonosítótól, akkor a reláció határozott, és legalább
első normálformában van
89
Részleges függés
R5
1NF nk
R4 nm
• tsz
• nk
R4
nm tsz
nd nk
nd
90
Tranzitív függés
Tranzitív függés van egy relációban, ha
határozott, minden tartománya függ az
azonosító egészétől, de van olyan leíró
tartománya, amely a reláció egy vagy több
tartományát meghatározza.
91
Tranzitív függés
2 NF R6
R1 • tsz
• tsz szig
szig jogsi
jogsi dn
dn szek
szek R7
szen szek
szen
92
„Jól meghatározott” reláció
Jól meghatározott a 3 NF
reláció, ha minden R5
tartománya csak az • tsz
azonosítótól függ! szig
jogsi
Ebben az esetben a dn
reláció 3. normál szek
formában van!
93
Logikai redundancia
Logikailag redundáns az a tartomány, amely két vagy
több relációt jellemez.
Gyenge logikai redundancia: ha a logikailag
redundáns tartomány legalább az egyik relációban
azonosító.
Erős logikai redundancia: ha a logikailag redundáns
tartomány egyik relációban sem azonosító.
Az erős logikai redundancia magában hordozza az
inkonzisztencia veszélyét!
94
Redundancia
Redundancia: az adatok ismétlődése, általában
felesleges tárolása
Inkonzisztencia: az adatok
ellentmondásossága. Egy azonosító
tulajdonságtól funkcionálisan függő
tulajdonságban előfordulás szinten a
függőségből fakadó egyenlőség megsértése
95
Kapcsoló tartomány
A gyenge logikai redundancia a kapcsolat
hordozója. Ezért a logikailag gyengén
redundáns tartományt kapcsoló
tartománynak, (kapcsoló tulajdonság), az
adatbázisban kapcsoló mezőnek
nevezzük.
96
Kapcsoló tartomány
R5
• tsz
szig
jogsi
dn
szek R7
szek
szen
97
Kapcsolati fok
Kapcsolati fok: két reláció soraiból az egymáshoz
rendelhető sorok számosságát definiálja
A kapcsolati fok kifejezi, hogy az egyik reláció
bármelyik sora kölcsönösen a másik reláció hány
sorához kapcsolódhat.
A kapcsolati fok tehát a következő lehet:
99
m:n fokú kapcsolat
Nincs közös tartomány, a kapcsolat
csak a kapcsoló reláción keresztül
valósítható meg