Anda di halaman 1dari 98

7.

Előadás
Az előadás tartalma
 Informatikai alapismeretek
 Adatszerkezetek
 Adatmodellezés alapjai
 Az ER-modell fogalmai
 A relációs modell
 Normálformák, normalizálás
 Kapcsolatok
 Fogalmi megfeleltetések
8
A GAZDASÁGI RENDSZER ÉS AZ
ADATBÁZISRENDSZER VISZONYA
GAZDASÁGI
RENDSZER
E
R
Ő T
E
F
O
Fő működési R
R folyamat M
É
R
Á K
S INFORMÁCIÓ INFORMÁCIÓ E
O K
K ADATRÖGZÍTÉS
MEGJELENÍTÉS
ADATBÁZIS
RENDSZER
TÁROLÁS

ADATBÁZIS

TRANSZFORMÁCIÓ
ADATBÁZIS
ADAT-
KEZELŐ
FELDOLGOZÁS RENDSZER

9
Fogalmak
Rendszer: egymással kölcsönhatásban álló
elemek (objektumok) együttese, amely a
környezet számára egységes egészként jelenik
meg.

Működési folyamat: a rendszer


állapotváltozásainak sorozata, a rendszer
erőforrásainak transzformációja, átalakítása.
10
Fogalmak
Erőforrás: a rendszer működéséhez, (működtetéséhez)
szükséges objektumok, tényezők. Erőforrás kategóriák
gazdasági rendszerekben:
 Materiális jellegű
 Anyagok
 Eszközök
 Energia
 Emberi
 Financiális (pénzeszközök)
 Információ (tudás, ismeretek)
11
Mire van tehát szüksége a gazdasági rendszernek a
működési folyamat fenntartásához?
Erőforrásokra és ezek között
ÚJ, HASZNOSÍTHATÓ ISMERETEKRE, amely nem más mint az

Adat: formalizált,
INFORMÁCIÓ értelmezés
rögzített ismeret
Hogyan keletkezik az
információ? Mi az?adat?

A rendszerből közvetlenül, érzékeléssel


feldolgozott adatokból ADAT

hírfolyamat
Információ
 Információ: értelmezett, hasznosítható, új
ismeret, amely felhasználáskor bizonytalanságot
(ismeret hiányt) szűntet meg.
 Forrás (elsődleges) információ: közvetlenül a
rendszerből, a működési folyamatból
érzékeléssel (méréssel, megszámlálással, … )
szerzett ismeret.
 Származtatott (másodlagos) információ:
feldolgozott adatokból, azok értelmezésével
keletkező új ismeret
13
INPUT OUTPUT

HARDWARE
ADAT
ADAT

PROGRAM

SOFTWARE

14
Adat, hír
Formalizált, általában rögzített
ismeret, olyan jelkonfiguráció
(jelsorozat), amely valamilyen
ismeretet hordoz.
Hír: közlésre, továbbításra szánt, mozgásban
lévő ismeret

15
Az adat három aspektusa
• Forma (szintaxis): jelkonfiguráció
(jelsorozat) jellemzői:
• jelek intervalluma
• hossz
• típus
• struktúra (belső szerkezet)
• Tezaurusz: megadja a jelsorozat
jelentését az adott környezetben
• Tartalom (szemantika): az az
ismeret, amelyet az adott jelsorozat
hordoz
16
Elemi adatok
 Az adat értelmezhető (észlelhető, érzékelhető, felfogható
és megérthető) ismeret.
 Formalizált, általában rögzített ismeret, olyan
jelkonfiguráció (jelsorozat), amely valamilyen ismeretet
hordoz
 Az ismeret mindig jelentéssel bír
 Bevitt, tárolt és feldolgozandó szimbólumok és jelek
összessége, melyek kimenetként hasznos ismeretet
adnak
 Olyan információ, amely átvitelre és feldolgozásra
alkalmas bináris, digitális formában jelenik meg
Információ
 Értelmezett nyers adat
 A megismerője számára szükséges
 Mindig valamilyen kontextusban jelenik meg és
mindig releváns
 Az információ
 növeli a megértést
 csökkenti a bizonytalanságot
Adatjellemzők
 Szintaktika - a jelek, jelcsoportok általános
elrendezése
 Formai követelmények, jelkonfiguráció
(jelsorozat)
 Jellemzői: jelek intervalluma, hossz, típus,
struktúra (belső szerkezet, az adatok egymás
közötti viszonya)
 Szemantika - jeleknek, jelcsoportoknak a közlendő
tartalomhoz való viszonya, jelentés az adott
környezetben
 Pragmatika - a közölt ismeret gyakorlati
használhatósága, az ismeret
Adattípusok
 Felhasznált jelek típusa szerint
 Numerikus (személyi szám)
 Alfabetikus (név)
 Alfanumerikus (rendszám)
 Az adatfeldolgozási folyamatra gyakorolt hatásuk szerint
 mennyiségi
 azonosító vagy leíró
 Ábrázolhatóság és rögzíthetőség szerint
 digitális
 analóg
Adattípusok
 Milyen formában illeszkednek az adatfeldolgozás során
 formázott adatok (könyvviteli adatok)
 formázatlan (szövegek, döntési adatok)
 A feldolgozási folyamatban elfoglalt helyük szerint
 bemeneti (rögzített)
 kimeneti (eredmény)
 A feldolgozási folyamatbeli szerepük szerint
 törzsadatok
 készletadatok
 mozgásadatok
Adattípusok
 A felhasználói programok által értelmezett típusok
 numerikus (szám formátum)
 egész
 bájt ( 1 bájt)

 egész ( 2 bájt)

 hosszú egész ( 4 bájt)

 valós szám
 egyszeres ( 4 bájt)

 dupla ( 8 bájt)
Adattípusok
 A felhasználói programok által értelmezett
típusok
 szöveg, karakter
 dátum
 pénznem
 feljegyzés
 számláló
 OLE objektum
 Hiperhivatkozás
 Igen/nem
Adatelemek
 Karakter
 A karakter egy logikai egység, ami a nyelv egy
alapelemét jelképezi.
 Írásjel - a karakter megjelenési formája
 Betűkészlet
 Minden nyelv ábrázolásához véges számú
karakter (és ehhez tartozó írásjel) szükséges. Ez
a sorba rendezett, véges számú írásjel alkot egy
betűkészletet, egy adott fontot
(font=betűkészlet).
Az adatszerkezet két nézete
 Fizikai adatszerkezet: az adatok a
számítógéphez kapcsolt adathordozón
tárolódnak

 Logikai adatszerkezetek: a környező


valós világ információit megpróbáljuk
interpretálni
25
Fizikai szerkezetek
Adatstruktúrák
 Adatmező – elemi, összetett adat vagy adatcsoport. Adat,
adattömb
 Adattömb - azonos típusú ( numerikus) adathalmaz ( pl. mátrix,
vektor, stb.)
 Fizikai rekord – előre definiált felépítésű, különböző
jelentéstartalmú adatmezők adathalmaz (pl. egy egyed összes
tulajdonsága egy adatbázis táblázatban). Adatlista, Rekord,
Rekordlista
 Adatállomány – egy adott időpillanatban létrehozott vagy
módosított, logikailag összetartozó információk önálló névvel
rendelkező, rendezett adathalmaz. Adatfájl
Állományszervezés
 Soros szervezésű – az elemek a keletkezés
sorrendjében helyezkednek el és csak így is lehet
őket elérni
 Direkt szervezésű – a logikai és a fizikai cím
között kölcsönösen egyértelmű megfeleltetés van,
így bármely elem közvetlenül elérhető
 Indexelt szekvenciális szervezésű – az
adatmezőket mutatók, ún. indextábla
segítségével azonosítjuk
 Véletlen és Rendezett soros szervezés
27
Fájlszervezésen alapuló tervezés

 Adatfájlok szerkezete, adathierarchia


 Fájlok csoportosítása funkciók szerint
 Fájl-orientált rendszerek jellemzői
 Anomáliák
 Adatduplikálás, adat redundancia
 Adat-program függőség
 Többszörös adatmódosítás, inkonzisztencia
 Adatintegráció problémái
 Karbantartási problémák 28
Rendszerszemléletű adatkezelés

 Az adatok, az adatszerkezet és leírása, valamint a


kezelő eljárások egy egységet alkotnak
 A tervezési fázisok elkülönülnek és jól definiáltak
 Az adat-program függetlenség nagyfokú
rugalmasságot biztosít
 Csökken a redundancia, a konzisztencia kézben
tartható
 Kialakítható az adatbázis kezelő rendszer DBMS
 Szabványosítható

29
30
Adatmodellezés
Az ISMERETEK rendszerszemléletű közelítése
 Emberek
 Anyagok, alkatrészek
 Munka
 Termékek
 Szervezetek, cégek
 Események
Adatmodellezés
 Az előzőekben a jellemzők sorával megadott
minden materiális, fogalmi objektum
ENTITÁS

a továbbiakban

(ADAT)EGYED
Adatmodell fogalma, típusai
 A modell általános meghatározása
 A modellezés szükségessége
 Adatmodell mint a rendszer absztrakciója
 Adatmodell típusok
 Hierarchikus
 Hálós (ETK)
 Kétszintű
 Codasyl (DBTG)
 Relációs
 Objektum-relációs
 Objektum orientált
 Heurisztikus
33
AZ ADATBÁZIS
SZERVEZÉS FÁZISAI

Fogalmi ( koncepcionális)
modell A valós világ objektumai és
összefüggései (rendszer)
Valósághű
leképzés
NÉV
Kiss Jóska
ALAPT ŐKE
100 000 Ft
BET ÉT
1996.01.20
100

80

60
Logikai modell
Nagy Benő 50 000 Ft 1995.09.12 40

Joó Géza 120 000 Ft 1995.11.10 20

Schumák Huba 300 000 Ft 1996.08.02 0


1. n.év 2. n.év 3. n.év 4. n.év
Őssze se n 570 000 Ft

Konzisztens
szerkezet
Fizikai modell

ADATBÁZIS

Elhelyezés Megvalósítás
Hozzáférés
34
Adatmodell
 Adatmodell: a valóságos rendszer egy sajátos
visszatükröződése a rendszer informatikai struktúrája,
amely az adatokban tárgyiasul. Az adatok és
összefüggéseik tanulmányozására, az adatbázis
megvalósítására szolgál.
 Adatmodell szintek:
 Fogalmi (koncepcionális)
 Logikai (konzisztens elvi konstrukció)
 Fizikai (megvalósítható adatbázis)

35
Adatmodellezés módszerei

Analitikus modellezési módszer

Szintetikus modellezési módszer

36
Szintetikus modellezési módszer
 Összeállító módszer
 Egy tulajdonságsorból a belső függések alapján a
relációk (egyedek) összeállítása
 A tulajdonságok nagy száma miatt kis
rendszereknél vagy részmodelleknél alkalmazható
 Olyan esetben előnyös az alkalmazása, amikor a
rendszer ismeretlen, nincs még kialakult modell és
az egyedek intuitív módon nehezen ismerhetők fel

37
Analitikus modellezési módszer
 Elemző módszer
 Nagy rendszereknél vagy régi rendszerek tovább
fejlesztésénél alkalmazható
 Fázisai:
 Felmérjük a rendszer egyedeit
 Hozzárendeljük a tulajdonságokat
 Elemezzük a belső függéseket
 Meghatározzuk a kapcsolatokat
 Kialakítjuk az idegen kulcsokat
38
Modell, objektum
 Modell: olyan konstrukció, amely egy objektumnak
a modell alkotás céljából lényeges jellemzőit tükrözi
 Konstrukció: ember által megalkotott mechanikai
(pl. jármű), grafikus (folyamatábra, hálóterv),
matematikai (pl. egyenlet), verbális (szöveges),
táblázatos (pl. mátrix, döntési fa) vagy egyéb
szerkezet
 Objektum: egy rendszer szerkezetét, működését
meghatározó elem, amely lehet tárgy, személy,
esemény, fogalom vagy bármilyen létező (valós vagy
logikai) dolog 40
Modellalkotás
 A modell alkotás célja: általában vizsgálat, elemzés, tervezés, az
adott rendszer vagy objektum megismerése vagy beavatkozás a
rendszer működésébe
 Modellalkotás szükségessége:
 A modellezendő rendszer túl nagy vagy túl kicsi
(világegyetem, atom)
 A valóságban lezajló változások túl gyorsak vagy túl lassúak
(robbanás, evolúció) vagy a vizsgálat közben a rendszer
megváltoztatja a struktúráját (társadalmi rendszerek)
 A vizsgálandó rendszer struktúrája nagyon bonyolult
 A valóság közvetlen tanulmányozása túl költséges
 A valóság tanulmányozása megváltoztatja a folyamatok
működését, a rendszer struktúráját, vagy a rendszer
tönkremeneteléhez vezethet
41
2 690315 4567

üzletkötő
1 521107 5469
Szép Ilona
őrmester

96 000Ft
Szabó XXIII József

42 000Ft

1 680115 1234 2 590315 4567

titkárnő
kereskedelmi igazgató
Bak Anita
Tört Elek

86 000Ft
185 000Ft

42
A gazdasági rendszerek objektumai,
melyeket adatokkal jellemezhetünk

A gazdasági rendszerek működését


meghatározó, befolyásoló anyagi és szellemi
tényezők (dolgok, emberek, események,
jelenségek stb.)

Az egyedeket jellemző elemi adat, mely


egy konkrét egyedet a többitől
megkülönböztet, vagy azonos
kategóriába sorol

Az egyedekben leképzett objektumok


viszonyát tükröző, lényegi és tartós
összefüggés az adatok között

43
Egyed, tulajdonság, kapcsolat
jellemzői
 Egyed jellemzői:
 Típus
 Előfordulás
• Tulajdonság jellemzői:
 Típus
 Előfordulás
• Kapcsolat jellemzői:
 Típus
 Előfordulás
44
A tulajdonság egyeden belüli szerepe
Azonosító
Leíró (nem azonosító)
 Kapcsoló tulajdonság
 Kulcs adat
 Megjelölő adat

45
Tulajdonságok
 Azokat a tételeket, amelyeknek az értéke az
egyed előfordulásra nézve nem egyedi, leíró
szerepű tulajdonságoknak hívjuk.

 Az olyan tulajdonságot, amely az egyik


egyedben azonosító, a másikban leíró
feladatot tölt be, az utóbbi egyedben kapcsoló
szerepű tulajdonságnak hívjuk.
Az előzőekben a jellemzők
sorával megadott minden
materiális, fogalmi objektum
ENTITÁS,
a továbbiakban
(ADAT)EGYED
47
2 690315 4567
DOLGOZÓ

üzletkötő
1 521107 5469
őrmester Szép Ilona

Szabó XXIII József 96 000Ft

42 000Ft
Egyed típus

2 590315 4567

Egyed előfordulás titkárnő


1 680115 1234
kereskedelmi igazgató Bak Anita

Tört Elek 86 000Ft

185 000Ft

48
Az egyedek közül melyek tartoznak egy típusba?
Típus
Személyi szám Gyártási szám

Név

Beosztás
beosztás
Ügyfél Eladási ár
Bér azonosító Teljesítmény
Felvett
összeg
Személyi szám Név
Bizonylatszám
Pénztár
Beosztás
Bér Mozgásnem Munkaszám

Mozgás
dátuma

Minőségi kód Teljesített


mennyiség
Cikkszám
Nyilvántartási ár
Ráfordított
Megnevezés idő

Amelyek azonos tulajdonság típusokkal jellemezhetők.


Az egyed tehát entitás  tulajdonság sor 49
Tulajdonság elő- Tulajdonság
fordulás (érték) típus

2 690315 4567
DOLGOZÓ NEVE
1 521107 5469
Szabó XXIII József üzletkötő
őrmester Szép Ilona
Bak Anita 96 000Ft
Tört Elek
42 000Ft

2 590315 4567

titkárnő

86 000Ft
1 680115 1234 kereskedelmi igazgató

185 000Ft

50
Üzem Központ Bp.. XIX. Fő u. 2.
32
22
Piripócs Ó u. 7.
Kapcsolat előfordulás
Kapcsolat típus
22
Szép Ilona

32 22
1 521107 5469
22

őrmester
Szabó XXIII József Bak Anita

22 Tört Elek
42 000Ft

51
52
Az egyeden végezhető
műveletek (funkciók) leírása
az egyed keletkezésétől
(létrehozásától)
megszűnéséig (törléséig).

53
Az adatbáziskezelő rendszer
és a végfelhasználó közötti
„párbeszéd” (valamint ennek
módszerei, tartalmi és
formai kellékei)

54
Számítógépen tárolt, egymással
bonyolult összefüggésben álló
adatok rendszere, összetett
logikai adatszerkezet fizikai
leképzése, amely tartalmazza az
adat- és szerkezetleírást
valamint az adatkezelő
eljárásokat is.
55
Adatbázis
 Adatbázis: Általában számítógépben,
számítógépes adathordozón tároljuk

 Adatbáziskezelő rendszer (ABKR):


programok, eljárások összessége, amely
az adatbázis adataival végezhető összes
alapvető művelet végrehajtására szolgál
56
ABKR elvárásai
 Új adatbázis létrehozása (logikai struktúrája
adatdefiníciós nyelven adható meg, DDL)
 Adatok lekérdezése, módosítása(lekérdező- és
adatmanipulációs nyelven, DML)
 Támogassa nagy adattömegek hatékony, hosszú időn
keresztül való tárolását, garantálja az adatok
biztonságát meghibásodás és illetéktelen hozzáférés
ellen
 Tegye lehetővé a tárolt adathalmazhoz való párhuzamos
hozzáférést
57
Relációs adatmodell
 Reláció: érték tartományok (domain)
Descartes-i szorzatának a valóságot leképező
részhalmaza. A reláció minden pontja egy adat
n-el írható le, táblázatos formában adhatjuk
meg
 Relációs adatmodell: a matematikai reláció
elméleten alapuló modell, melyben az adatok
ábrázolása a matematikai reláció elméletén,
gyakorlatilag táblázatos formában történik
59
d2 Descartes szorzat RELÁCIÓ

Szőke Barna
törzsszám név
Szabó Éva 258 Kiss Pál
423 Nagy Olga
Pór Bea 356 Pór Bea
567 Kiss Pál
Nagy Olga
599 Szabó Éva
789 Szőke Barna
Kiss Pál
423

456

567

599

789
258

d1

d1: törzsszám*
d3 d2: név
d3: nyelvtudás 60
Adat tartományok (domain)
Descartes szorzatának a
valóságos objektumokat
leképező részhalmaza.
61
A konkrét reláció táblázatos formában írható le. A
továbbiakban:
RELÁCIÓ = TÁBLÁZAT
Általános szabályok:
R a reláció neve egyedi
A reláció foka (n) a reláción belül
nincs azonos nevű oszlop
A reláció mérete (k)

d1 d2 d3 ---- di ---- dn
e11 e12 e13 e1i e1n
oszlop sorrend
e21 e22 e23 tetszőleges
e31 sorok felcserélhetők
e41 nincs két teljesen azonos
sor
minden relációnak van (a
ek1 ekn
sort) azonosító (egyszerű
vagy összetett) tartománya
62
Reláció azonosítója
 A reláció azonosítója: a reláció olyan
tulajdonsága vagy tulajdonságok
összessége, melynek bármely előfordulása
egy és csakis egy sorra jellemző
 Azonosító lehet:
 Egyszerű
 Összetett
63
R < d1, d2, … di … dn >
ahol di Di(t,f)

Példaként vizsgáljuk meg egy cég személyi nyilvántartását!

Személyi Jogosítvány- Leánykori Szervezeti Gyermek Nyelv


igazolványszám szám név egység-kód TAJ megnevezés

DOL< tsz,szig,dT,jogsi,dn,nem,len,bér,cím,szek,szen,gT,gn,nk,nm,nd >


Törzsszám Név Besorolási Szervezet Nyelv
bér neve kódja
TAJ
Állandó Gyermek Nyelvvizsga
lakáscím neve dátuma

Az áttekinthetőség érdekében szűkítsük a relációt és nézzük


meg konkrét adatokkal!
64
tsz szig jogsi dn szek szen gT gn nk nm nd
258 AU-IV 456872 A 5236 8942 Kiss Pál 22 üzem 123 789 456 Kiss Pál
134 256 987 Kiss Béla
423 FS-III. 789258 Nagy Olga 22 üzem AN angol 1984.06.02
NE német 1990.03.29
FR francia 1995.11.13
456 AU-II 1586821 Pór Bea 11 iroda 369 258 147 Kiss Béla AN angol 1992.11.02
NE német 1986.02.04
567 FS-I. 654321 B 4567 0123 Kiss Pál 22 üzem AN angol 1981.05.06
FR francia 1998.11.15
599 B 4586 5284 A 6549 8765 Szabó Éva 11 üzem 321 654 741 Kő Adél
258 963 147 Kő Jakab
291 847 352 Kő Elek
AN angol 1998.10.03
NE német 1992.04.06
789 FC-VI. 456123 Szőke Barna 11 iroda 281 739 753 Szőke Pál NE német 1975.02.16
FR francia 1994.04.08

65
DOLGOZÓ < törzsszám, személyi_igazolvány_száma,
jogosítvány_száma, dolgozó_név, besorolási_bér, ...>

tsz szig jogsi dn bér


258 AU-IV 456872 A 5236 8942 Kiss Pál 65 000 Ft
423 FS-III. 789258 Nagy Olga 86 000 Ft
456 AU-II 1586821 Pór Bea 92 000 Ft
567 FS-I. 654321 B 4567 0123 Kiss Pál 86 000 Ft
599 B 4586 5284 A 6549 8765 Szabó Éva 145 000 Ft
789 FC-VI. 456123 Szőke Barna 58 000 Ft

A tartomány jellemző ereje: a relációnak az a


tartománya, amely minden sorban rendelkezik
értékkel erősen jellemző,
amely nem minden sorban vesz fel értéket
gyengén jellemző.
66
Azonosító: az(ok) a tartomány(ok) a reláción belül,
melynek bármely értéke egy és csakis egy sort jellemez.

Leíró: azok a tartományok a reláción belül, melynek egy


értéke több sorra is jellemző lehet.

tsz szig ? jogsi dn bér


258 AU-IV 456872 A 5236 8942 Kiss Pál 65 000 Ft
423 FS-III. 789258 Nagy Olga 86 000 Ft
456 AU-II 1586821 Pór Bea 92 000 Ft
567 FS-I. 654321 B 4567 0123 Kiss Pál 86 000 Ft
599 B 4586 5284 A 6549 8765 Szabó Éva 145 000 Ft
789 FC-VI. 456123 Szőke Barna 58 000 Ft

67
 egyedi
 erősen jellemző
 stabil
 konzisztens struktúra
 fix hosszúság
 rövid (a jelsorozat kevés jelből áll: pl. törzs-
szám)
 a benne szereplő jelek intervalluma szűk
(kevés féle jelet tartalmaz: pl. csak
számok)

68
Az azonosító ezek alapján
Alternatív azonosító (azonosító jelölt):
az a tartomány(ok) a reláción belül, amely rendelkezik az
azonosító kritériumaival.
tsz szig jogsi dn bér
258 AU-IV 456872 A 5236 8942 Kiss Pál 65 000 Ft
423 FS-III. 789258 Nagy Olga 86 000 Ft
456 AU-II 1586821 Pór Bea 92 000 Ft
567 FS-I. 654321 B 4567 0123 Kiss Pál 86 000 Ft
599 B 4586 5284 A 6549 8765 Szabó Éva 145 000 Ft
789 FC-VI. 456123 Szőke Barna 58 000 Ft

Belső azonosító: kódolása csak a rendszeren belül ismert


Külső azonosító: kódolása a rendszeren kívül történik
69
Az egyed jellemzésében és kezelésében
kitüntetett szerepet játszó
tulajdonságot kulcsnak nevezzük.
Egy egyedet többféleképpen
jellemezhetünk és kezelhetünk, ezért
egy egyednek több kulcsa is lehet,
melyeket kategóriákba sorolhatunk. Ezt
kulcs-típusnak nevezzük.
A továbbiakban a kulcs tehát
gyűjtőfogalom, a kulcs tehát csak
típusnevével együtt értelmezhető!
70
 Azonosító (egyedi, elsődleges
[primary])
 Kapcsoló (idegen [foreign])
 Rendezési
 Csoportosító
 Szelekciós (szűrő)

71
Kulcs - típusok
 Elsődleges (egyedi) kulcs: az adatbázis tábla
azonosító tulajdonsága, az a mező vagy mezősor, amely
nem lehet üres és amelyben bármely érték egy és csakis
egy sorban fordulhat elő (ugyanaz az érték többször
nem szerepelhet a táblában)
 Kapcsoló (idegen kulcs): egy másik relációban kulcs
 Csoportosító ismérv (csoport kulcs): amely szerint a
reláció pontjai konzisztens részhalmazokba sorolhatók,
a táblázat olyan oszlopa, melynek azonos értékei szerint
a tábla sorai csoportosíthatók, a csoportképzés
előfeltétele: a tábla rendezése a csoportképző
kulcs(ok)ra 72
73
Belső függés
 Belső függés: a reláció tartományai (oszlopai)
közötti viszony, a tartományok értékhalmazainak
összerendelhetősége
 Alapesetei:
 Funkcionális függés
 Kölcsönös függés
 Fordított függés
 Funkcionális függetlenség
74
Ha egy vizsgált da tartomány bármely értékéhez a df
tartomány csak egy értéke rendelhető hozzá
(másképpen ta meghatározza tf-et): df  da
da df
törzs-szám dolgozó_neve
258 Kiss Pál
423 Nagy Olga
456 Pór Bea ? Kiss Pál
567 Kiss Pál
599 Szabó Éva
789 Szőke Barna

75
Ha da meghatározza dj-t és dj is egyértelműen
meghatározza da-t (azaz a ta tartomány és a tj
tartomány értékei kölcsönösen összerendelhetők):
da dj
da dj
törzs-szám szem élyi_ig_szám
258 AU-IV 456872
423 FS-III. 789258
456 AU-II 1586821
567 FS-I. 654321
599 B 4586 5284
789 FC-VI. 456123

76
Ha da nem határozza meg a dr-t de dr meghatározza da-
t (azaz tr tartomány bármely értékéhez rendelhető
hozzá ta csak egy értéke): dr  da
da dr
törzs-szám gyerm ek_TAJ
258 123 789 456
134 256 987
423
456 369 258 147
Egyedi,
567
nem lehet
599 321 654 741
azonos!
258 963 147
291 847 352
789 281 739 753

77
Ha da nem határozza meg dn tartományt (ta értékeihez
nem rendelhető a tn tartomány csak egy értéke) és dn
sem határozza meg da-t: dn da
da dn
törzs-szám nyelv_kódja
258
423 AN
NE
FR
456 AN
NE AN
567 AN
FR
599 AN
NE
789 NE
FR

78
Jelöljük ki az azonosítót (amely a reláció egy vagy
több tartományát meghatározza)
DOL< tsz,szig,dT,jogsi,dn,nem,len,bér,cím,szek,szen,gT,gn,nk,nm,nd>

Az áttekinthetőség kedvéért némileg szűkítsük a relációt:


DOL< tsz, szig, jogsi, dn, szek, szen, gT, gn, nk, nm, nd>

Vizsgáljuk meg a relációt konkrét adatokkal!


79
tsz szig jogsi dn szek szen gT gn nk nm nd
258 AU-IV 456872 A 5236 8942 Kiss Pál 22 üzem 123 789 456 Kiss Pál
134 256 987 Kiss Béla
423 FS-III. 789258 Nagy Olga 22 üzem AN angol 1984.06.02
NE német 1990.03.29
FR francia 1995.11.13
456 AU-II 1586821 Pór Bea 11 iroda 369 258 147 Kiss Béla AN angol 1992.11.02
NE német 1986.02.04
567 FS-I. 654321 B 4567 0123 Kiss Pál 22 üzem AN angol 1981.05.06
FR francia 1998.11.15
599 B 4586 5284 A 6549 8765 Szabó Éva 11 üzem 321 654 741 Kő Adél
258 963 147 Kő Jakab
291 847 352 Kő Elek
AN angol 1998.10.03
NE német 1992.04.06
789 FC-VI. 456123 Szőke Barna 11 iroda 281 739 753 Szőke Pál NE német 1975.02.16
FR francia 1994.04.08

Mi okoz
Az, hogy egyes tartományok értékeiből egy
problémát? sorhoz többet kell rendelni, emiatt a reláció
nem képezhető le két dimenziós táblázattá!
80
Ha egy reláció nem minden tartománya
függ funkcionálisan vagy kölcsönösen az
azonosítótól, akkor a reláció határozatlan,
és 0-ik normál formában van (0NF)

Hogyan oldható fel a probléma?!

81
Határozott reláció
 Határozott reláció: az a reláció, melynek minden
tulajdonsága funkcionálisan vagy kölcsönösen függ az
azonosítótól

 Jól meghatározott reláció: az a reláció, melynek


minden tulajdonsága csak az azonosítótól függ

 Normalizálás: az a műveletsorozat, melynek során a


határozatlan reláció(k)ból jól meghatározott relációkhoz
jutunk
82
A relációból kiemeljük az azonosítót és a
tőle függő tartományokat új relációba.
A többi tartomány az „azonosítóval” új
relációt alkot. Ennek a relációnak
- mivel a régi azonosító nem határoz meg
egyetlen tartományt sem - új (általában
összetett) azonosítót kell kijelölni!

83
A reláció néhány művelete
1. Kivetítés (projection): a relációból egy
(általában azonosító) tartomány és az ettől függő
tartományok kiemelése egy új relációba
R<ta, tf1, …, tfi, tj, …, tn>Rp<ta, tf1, …, tfi> marad:
R<ta, tj,…, tn>
2. Összekapcsolás (join): két reláció egyesítése a
közös tartomány értékei alapján
R1<tk, t11, t12,…,t1i>; és R2<tk, t21, …,t2k> 
Rj<tk, t11, …,t1i;t21, …,t2k> és Rjf=R1f+R2f
84
A reláció néhány művelete
3. Kiválasztás (selection): egy reláció
sorainak kiemelése megadott ismérvek
alapján
Rk  R; Rkf=Rf ahol Rf: R
fokszáma

85
Normalizálás R0:
 A könnyebb • tsz
kezelhetőség szig
érdekében írjuk át az jogsi
eredeti relációt egy dn
oszlopba!
szek
szen
gT
 Emeljük ki az gn
azonosítótól függő
tartományokat egy nk
másik relációba! nm
nd 86
Kivetítés (projection)
R:
1
• tsz
R0: szig
• tsz jogsi
szig dn R3
jogsi tsz
szek
dn • gT
szen gn
szek R 2:
szen tsz
gT
gn R4
gt tsz
nk
nk
nm gn nm
nd nk nd
nm
nd
87
Határozott reláció
 Ha egy reláció minden tartománya függ az
azonosítótól, akkor a reláció határozott, és legalább
első normálformában van

 Függ: funkcionálisan vagy kölcsönösen

 Azonosítótól: a reláció egy tartománya (egyszerű


azonosító) vagy több tartomány (összetett
azonosító), amely rendelkezik az azonosító
kritériumaival
88
Részleges függés
 Részleges függés van egy relációban, ha
határozott, minden tartománya függ egy
összetett azonosítótól, de van az azonosítónak
olyan része, amely a reláció egy vagy több
tartományát meghatározza.

 A reláció 1. normál formában van!

89
Részleges függés
R5
1NF  nk
R4 nm
• tsz
• nk
R4
nm  tsz
nd  nk
nd
90
Tranzitív függés
 Tranzitív függés van egy relációban, ha
határozott, minden tartománya függ az
azonosító egészétől, de van olyan leíró
tartománya, amely a reláció egy vagy több
tartományát meghatározza.

 A reláció 2. normál formában van!

91
Tranzitív függés
2 NF R6
R1 • tsz
• tsz szig
szig jogsi
jogsi dn
dn szek
szek R7
szen  szek
szen
92
„Jól meghatározott” reláció
 Jól meghatározott a 3 NF
reláció, ha minden R5
tartománya csak az • tsz
azonosítótól függ! szig
jogsi
 Ebben az esetben a dn
reláció 3. normál szek
formában van!

93
Logikai redundancia
 Logikailag redundáns az a tartomány, amely két vagy
több relációt jellemez.
 Gyenge logikai redundancia: ha a logikailag
redundáns tartomány legalább az egyik relációban
azonosító.
 Erős logikai redundancia: ha a logikailag redundáns
tartomány egyik relációban sem azonosító.
 Az erős logikai redundancia magában hordozza az
inkonzisztencia veszélyét!
94
Redundancia
 Redundancia: az adatok ismétlődése, általában
felesleges tárolása
 Inkonzisztencia: az adatok
ellentmondásossága. Egy azonosító
tulajdonságtól funkcionálisan függő
tulajdonságban előfordulás szinten a
függőségből fakadó egyenlőség megsértése

95
Kapcsoló tartomány
 A gyenge logikai redundancia a kapcsolat
hordozója. Ezért a logikailag gyengén
redundáns tartományt kapcsoló
tartománynak, (kapcsoló tulajdonság), az
adatbázisban kapcsoló mezőnek
nevezzük.

96
Kapcsoló tartomány
R5
• tsz
szig
jogsi
dn
szek R7
 szek
szen

97
Kapcsolati fok
 Kapcsolati fok: két reláció soraiból az egymáshoz
rendelhető sorok számosságát definiálja
 A kapcsolati fok kifejezi, hogy az egyik reláció
bármelyik sora kölcsönösen a másik reláció hány
sorához kapcsolódhat.
 A kapcsolati fok tehát a következő lehet:

 Egy az egyhez (1:1)


 Egy a többhöz (1:n)
 Több a többhöz (m:n) 98
1:n fokú kapcsolat
 Ahol a kapcsoló azonosító, ott bármely
értéknek csak egy előfordulása lehet, tehát
az a reláció owner (tulajdonos, gazda)
 Ahol nem azonosító, leíró ott a kapcsoló
bármely értéke többször is előfordulhat,
tehát member (tag)

99
m:n fokú kapcsolat
Nincs közös tartomány, a kapcsolat
csak a kapcsoló reláción keresztül
valósítható meg

3NF-ban nem fordulhat elő, csak a


koncepcionális modell szintjén létezhet
100
A kapcsolat jellege (opcionalitás)
 Két egyed előfordulásainak kapcsolhatóságát fejezi ki.
 A két reláció sorainak kapcsolatokban való részvételét
írja elő.
 Lehet:
 Kötelező (a két egyed minden előfordulása részt vesz
a kapcsolatban)
 Félig kötelező (az owner oldalon lehetnek olyan
előfordulások, melyek nem vesznek részt a
kapcsolatban)
 Opcionális (a kapcsolat mindkét oldalán lehetnek
olyan előfordulások,melyek nem vesznek részt a
101
kapcsolatban)
Normálformák
 Az egyedhalmaz tulajdonságaiban  Egy reláció akkor és csak akkor van
több érték szerepel, ismétlődő második normál formában,
ismeretet tartalmaz.  ha első normálformában van,
 A táblázat nem normalizált, 0NF  és minden elsődleges kulcs
alakú. részét nem képező tulajdonsága
 A táblázat nem reláció. funkcionálisan teljesen függ a
 Egy táblázat (reláció) akkor van táblázat elsődleges kulcsától.
első normál formában, ha  Egy reláció akkor és csak akkor van
soraiban minden harmadik normálformában, ha
tulajdonságérték atomi, azaz
további adatértékekre nem  második normálformában van,
bontható.  és az elsődleges kulcs részét
nem képező tulajdonságai
között nem áll fenn olyan
funkcionális függőség,
amelyben a meghatározó
tulajdonság nem elsődleges
kulcs.
Összefoglalva - normálformák
 0NF: a csoportadatokat (csoportokat) tartalmazó
adattáblákat (relációkat) nem normalizált
adattábláknak, relációknak nevezzük. Ha
ismétlődő egyedek is szerepelnek az
adattáblában, akkor is „nem normalizált
relációról” beszélünk.
 1NF: megszűntetjük az adatcsoportokat
 2NF: legalább 1NF és nincs részleges függés
 3NF:legalább 2NF és nincs tranzitív függés
103
104

Anda mungkin juga menyukai