Anda di halaman 1dari 17

9.

AUDITUL DATELOR
Datele care se stocheaz n mod sistematic n fiiere sau sunt gestionate prin sisteme de gestiune a bazelor de date, sunt supuse auditului ca orice alt component a sistemului informatic. Auditul datelor este un proces complex ntruct vizeaz acele componente ale sistemului informatic care au ca obiectiv crearea i actualizarea fiierelor sau bazelor de date. Auditul acestor componente permite obinere unei imagini complete n legtur cu capacitatea software de a contribui la realizarea unui nivel ct mai ridicat al calitii datelor. Se consider caracteristicile de calitate CQD1, CQD2, CQD3, ..., CQDNCD ale datelor i modulele MOD1, MOD2, ..., MODNMD program i variabilele care sunt manipulate n sistemul informatic. Orice variabil este iniializat prin: - atribuirea unei constante; de exemplu, se definesc variabilele: int a; float b; ch c; i se iniializeaz n secvena: a = 7; b = -25.81; c = w ; atribuirea unui rezultat dup evaluarea unei expresii; de exemplu n secvena:

int a= b, b = 5, c -------------------------------------------c = a+ b*5; variabilei c i se atribuie valoarea 33 dup evaluarea expresiei;

suprapunerea zonelor de memorie cu ajutorul operaiei union; de exemplu n secvena: int a, b, c; union {a,c}; b = 5; a = b;

rezult c variabilele a i c vor ocupa aceeai zon de memorie; indirect se obine iniializarea variabilei c, iniializat de variabila a; - copierea variabilelor de tip articol tratate ca iruri de caractere; - transfer cu conversie din buffere prin apariii de citire a fiierelor; - transmiterea prin valoare a parametrilor cu condiia ca ntre lista de parametri reali i lista de parametri formali s existe o perfect concordan. Exist numeroase cauze generatoare de erori atunci cnd este vorba de iniializarea variabilelor. n cazul n care modulele au un grad ridicat de specializare se produce localizarea distinct a iniializrii variabilelor prin citire din fiiere, indiferent care este tipul de fiier. Se consider criteriile de validare CV1, CV2, CV3, ..., CDNCV. Se construiete un tablou standard de referire a criteriilor de valoare pentru tipurile fundamentale TFD1, TFD2, ..., TFDNTF de date, tabelul 9.15. Criteriile standard de validare pentru tipurile fundamentale de date
Tabelul 9.15 Tipul fundamental Criterii de validare CV1 CV2 ... CVi ... CVNCV TFD1 TFD2 ... TFDj ... TFDNFT

xxij

Variabila xxij are valoarea 1 dac criteriul de validare CVi este asociat tipului fundamental de date TFj. De exemplu, dac se definesc criteriile: CV1 data conine simbolurilor 0, 1, 2, 3, 4, 5, 6, 7, 8, 9; CV2 - data aparine intervalului [Linf , Lsup]; CV3 data este unul dintre irurile {a1 , a2, , ak }

CV4 data este mai mare ca zero; CV5 data este diferit de zero; CV6 data este mai mic dect zero; CV7 suma cifrelor care alctuiesc data aparine unei mulimi {c1 , c2, , cL }. Lista criteriilor de validare este o list standard. Designerii o cunosc tot att de bine cum o cunosc i auditorii. Auditorii analizeaz care dintre criteriile de validare au fost selectate pentru a asigura testele de filtrare care asigur corectitudinea datelor. Datele trebuie s fie complete. Dac exist o colectivitate CVI pentru care se realizeaz nregistrarea datelor, avnd NeCVI componente, problema completitudinii are o dubl abordare. Prima abordare se refer la iniializarea tuturor cmpurilor care descriu un element din colectivitate. A doua abordare se refer la numrul componentelor pentru care au fost introduse date. Dac numrul componentelor pentru care au fost introduse date este XeCVI, trebuie ca NeCVI = XeCVI. n cazul n care NeCVI > XeCVI nseamn c au fost introduse date numai pentru anumite elemente din colectivitate, restul rmnnd n afar. Dac NeCVI < XeCVI, exist urmtoarele surse ale diferenelor: - numrul elementelor colectivitii NeCVI a fost incorect nregistrat i numrul corect al datelor este XeCVI; - unele nregistrri au fost realizate de mai multe ori, fiind vorba de nregistrri simple; - au fost introduse date referitoare la elemente ale altor colectiviti. Auditorii trebuie s stabileasc despre care dintre situaii este vorba. Exist situaii n care programele genereaz numere de identificare a evenimentelor i acestea devin i chei de regsire. Sunt create condiii de a introduce datele despre un element din colectivitate de nenumrate ori cu asocierea unei alte chei de regsire. Este important ca auditorii s dispun de software care analizeaz coninutul datelor stocate pentru a identifica: - articolele duble introduse; - concordanele dintre evenimentele generate efectiv la un post de operare date i evenimentele planificate. Analiza datelor este una dintre cele mai dificile etape ale procesului de auditare ntruct datele influeneaz direct, fr condiii, calitatea

rezultatelor finale care se obin de ctre un sistem informatic. Din acest considerente, se prezint, n continuare, aspecte privind particulariti, catacteristici, metrici i indicatori de calitate ai datelor. Se consider n colectiviti CVI1 , CVI2 , ..., CVIn fiecare din ele fiind format din NeCVI1, NeCVI2, ..., NeCVIn elemente. Fiecare colectivitate CVIi, i = 1, 2, ..., n include elemente de acelai tip care sunt i . descrise folosind caracteristicile de difereniere Cdif 1i , Cdif 2i , ..., Cdif m

MCdif1, MCdif2, ..., MCdifn reprezint numrul caracteristicilor de difereniere a elementelor din cadrul colectivitilor , respectiv CVI1 , CVI2, ...,respectiv CVIn. Pentru nregistrarea datelor fiecrui element aij din colectivitatea CVIi, care este dispus pe poziia j n irul de elemente, se definesc proceduri care vizeaz: - realizarea msurtorilor pentru acele caracteristici de difereniere ale cror niveluri sunt de natur cantitativ; - constatarea unor atribute pentru a defini acele caracteristici crora li se asociaz niveluri de ordin cantitativ; - punerea n coresponden cu elemente ale unei mulimi finite, atunci cnd, dup efectuarea evalurilor se produce o agregare a mai multor criterii. Aceste proceduri trebuie astfel definite nct s asigure reproductibilitatea colectrii datelor privind elementele oricrei colectiviti. Pentru constituirea colectivitii CVIi i pentru definirea mulimii i caracteristicilor de difereniere Cdif 1i , Cdif 2i , ..., Cdif m se iau n considerare criterii de apartenen i criterii de difereniere care au la baz obiectivul urmrit n colectarea i n prelucrarea datelor. Realitatea economico social ofer o mare varietate de aspecte i interpretri, ceea ce impune definirea cu maxim precizie a obiectivului pe care un produs software, o aplicaie informatic, sau un sistem informatic trebuie s-l aib atunci cnd ncepe derularea codului de dezvoltare. ntr-un fel, este constituit mulimea caracteristicilor de difereniere a elementelor colectivitii cnd prelucrarea datelor are ca obiectiv o optimizare din punct de vedere structural sau de performan i cu totul altele sunt caracteristicile selectate atunci cnd obiectivul prelucrrii vizeaz exclusiv latura financiar contabil a dinamicii acelorai elemente.

Pentru un obiectiv stabilit, O, se construiete un plan care vizeaz datele problemei de rezolvat incluznd etapele: Etl precizarea colectivitilor prin enumerarea lor, CVI1 , CVI2, ...; din aceast enumerare rezult numrul de colectiviti NCVI; 1 - construirea listelor de caracteristici < Cdif 11 , Cdif 21 ,..., Cdif ml >,
< C
2 1

2 2

,...

2 ml

>

n , ..., < Cdif1n , Cdif 2n ,..., Cdif mn >;

- enumerarea procedurilor utilizate pentru nregistrarea datelor. Experiena designerilor de date este important n a realiza o proiectare corect, complet i consistent. Dac obiectivul O este stabilirea impozitului pe imobile, n faza de analiz sunt luate n considerare dou colectiviti (n = 2): CVI1 colectivitatea persoanelor i CVI2 colectivitatea imobilelor. Pentru colectivitatea CVI1 se definesc caracteristicile de difereniere: 1 Cdif1 - cod numeric personal; Cdif12 - nume i prenume; Cdif13 - ir de caractere pentru localizarea n spaiu; Cdif14 - venituri; Cdif15 - ir de identificare pli electronice. Pentru colectivitatea CVI2se definesc caracteristicile de identificare: 1 Cdif 2 - codul numeric personal al proprietarului; Cdif 22 - suprafaa construit; Cdif 23 - suprafaa locuibil; Cdif 24 - an de construire; Cdif 25 - clasa de confort; Cdif 26 - clasa de reziden; Cdif 27 - valoarea de pia. Dup construirea celor dou liste de caracteristici rezult MCdif1 = 5 i MCdif2 = 7. Este deosebit de important stabilirea dimensiunilor celor dou colectiviti.

n cazul n care stabilirea cu exactitate este dificil de realizat se propun estimri acoperitoare care permit: - efectuarea de calcule privind necesarul de memorie extern pentru stocarea datelor; - stabilirea modalitilor de nregistrare simultan a datelor din colectiviti; - precizarea tehnologiei de asigurare i control a calitii procesului de nregistrare i a calitii seturilor de date rezultate; - estimarea costurilor pe care le implic att constituirea seturilor de date asociate colectivitilor, ct, mai ales, reluarea procesului de nregistrare dac nu s-a obinut nivelul de calitate impus odat cu definirea obiectivului O. Pentru exemplul considerat, NCVI1 = 1000 i NCVI2 = 400. nregistrarea datelor trebuie efectuat pe formulare astfel proiectate, nct caracteristicile colectivitilor s fie prezentate cu maxim claritate prin: - gruparea tuturor caracteristicilor de difereniere ale unei colectiviti ntr-un singur formular; rezult c pentru r colectiviti distincte vor circula r formulare diferite, r seturi de proceduri pentru nregistrarea caracteristicilor specifice; - regruparea pe un formular a caracteristicilor mai multor colectiviti, mai ales atunci cnd datele de identificare a elementelor corespondente sunt comune; manipularea unui numr mai restrns de documente comparativ cu numrul caracteristicilor este nsoit de reducerea efortului de nregistrare i de cretere a gradului de concentratrare asupra calitii procesului de nregistrare date. Descrierea procedurilor de nregistrare are n vedere totalitatea situaiilor de pe teren, astfel nct completarea documentelor s fie integral i reluarea nregistrrilor prin sondaj s conduc la rezultate identice, dnd caracter de reproductibilitate procesului de constituire a seturilor de date asociate caracteristicilor. Un set de date asociat unei colectiviti CVIi se prezint sub forma unui tablou Ti cu TCOLi coloane corespunztor caracteristicilor de i i TLINi linii corespunztor elementelor difereniere Cdif1i , Cdif 2i , ..., Cdif mi ai1, ai2, ..., aiNi care intr n alctuirea colectivitii CVIi. Diferenierea elementelor unei colectiviti se obine prin nregistrarea nivelurilor msurate, constatate sau deduse la faa locului pentru fiecare elemente n parte.

La constituirea listei elementelor de difereniere pentru o colectivitate CVIi se precizeaz natura fiecrei caracteristici Cdif ji : - element de codificare pentru care se descrie mecanismul de generare i mecanismul de verificare a corectitudinii structurii obinute; - valoare numeric msurat, indicnd instrumentul cu care se asigur o msurtoare corect; - setul complet de atribute din care se extrage unul singur n mod neambiguu; - algoritmul de evaluare a nsuirilor, de cuantificare i de punere n coresponden cu un element dintr-o mulime dat. Setul de date sub forma tabloului cu TLINi linii i TCOLi coloane asociate colectivitii CVIi, pentru a face obiectul unei prelucrri care s satisfac obiectivul O trebuie s fie de un nivel calitativ deosebit de ridicat. Pentru a stabili care este nivelul calitativ al setului de date se enumer atributele, caracteristicile de calitate i metricile de calitate a datelor. Ortogonalitatea datelor este o caracteristic de calitate deosebit de important care arat msura n care un element aij din colectivitate difer de un alt element aik sau msura n care elementul aij difer de toate celelalte elemente care alctuiesc colectivitatea CVIi. Datele despre elementul aij se afl pe linia j a tabloului Tj corespunztor setului de date nregistrate. Datele nscrise pe linie fie c sunt valori msurate, fie c sunt atribuite, fie c sunt niveluri puse n coresponden cu valori agregate ntr-un proces de evaluare, sunt considerate cuvinte i sunt tratate ca iruri de caractere indiferent de mecanismul de generare. Pe linia j a tabloului Ti se afl Ncuvi cuvinte, alctuind irul de cuvinte Scuv ij , iar pe linia k a tabloului se afl irul de
i . cuvinte Scuvk

Se definete funcia Lg () pe mulimea cuvintelor vocabularului cu care este construit tabloul Ti cu valori n mulimea {1, 2, ..., Ncuvi } prin relaia:
H (aij , aik ) =
i Lg Scuv ij Scuvk

Lg

( (Scuv

i j

Scuv

i k

) )

Dac elementele aij i aik sunt total diferite H(aij, aik)= 0, iar dac elementele sunt identice H(aij, aik)=1.

Ortogonalitatea global a elementului aij este definit ca medie aritmetic a ortogonalitilor elementului respectiv n raport cu celelalte i este dat de relaia:

HG (aij ) =

H (a
k =1 k j

Ni

ij

, aik )

Ni 1

Pentru prelucrri statistice este rezonabil ca datele s aib un grad de asemnare sporit, ceea ce se traduce printr-o ortogonalitate global redus. Pentru aplicaiile economice diferite trebuie s corespund iruri de cuvinte diferite, iar ortogonalitatea trebuie s se apropie de valoarea maxim 1. Consistena datelor vizeaz nregistrrile care privesc un element din colectivitate. Proprietile elementelor se reflect i la nivelul nregistrrilor. Lipsa de consisten se manifest cnd fie prin msurtori, fie printr-un alt procedeu este trecut n dreptul coloanei COLij de descriere a caracteristicii un nivel n contradicie cu proprietile specifice elementului. De exemplu, pentru elementul aij care reprezint un material j aflat ntr-un depozit exist pe o coloan descris cantitatea existent n stoc, iar pe alt coloan cantitatea livrat, referirile fcndu-se la acelai moment de timp. Datele i pierd consistena atunci cnd cantitatea livrat este mai mare dect cantitatea existent n stoc. n acelai fel se pierde consistena datelor atunci cnd calificarea unei persoane este cu mult mai mare dect vrsta nscris pentru respectiva persoan. Omogenitatea datelor pentru aceeai caracteristic de difereniere vizeaz tipul datei, modul de efectuare a msurtorilor i modul de nregistrare. Se stabilete un domeniu de definiie pentru fiecare caracteristic n parte, se stabilete unitatea de msur a caracteristicilor de difereniere. Se urmrete ca prin aplicarea aceleiai proceduri de msurare, nregistrrile s reflecte situaia de la faa locului. De exemplu, pentru caracteristica greutatea unei persoane se stabilesc condiiile n care se efectueaz msurtorile, ce instrumente sunt folosite, procedurile pe care le urmeaz persoanele pentru ca rezultatele obinute s dea cu o exactitate ct mai mare greutatea corporal. Se stabilete dac msurtoarea se face cu rotunjire numai n plus sau numai n minus.

Completitudinea datelor vizeaz reiterarea setului de NrPRODi proceduri pentru cele MCdifi caracteristici de difereniere, pentru fiecare din cele Ni elemente ale colectivitii. Completitudinea datelor conduce la obinerea unui tablou care are toate irurile de pe linii sau de pe coloane nregistrate n concordan cu domeniile fiecrei caracteristici de difereniere. n cazul n care numrul de iruri NrSi nscrise n tablou este definit prin NSi < MCdifi NrPRODi rezult c setul de date pentru descrierea colectivitii Ai este incomplet. Analize statistice se realizeaz i pe seturi de date incomplete dac acestea nu i-au pierdut reprezentativitatea. n alte aplicaii economice, toate prelucrrile presupun seturi de date complete NSi = MCdifi NrPRODi. Accesibilitatea datelor presupune ca datele s fie disponibile uor, repede, iar algoritmii de cutare i regsire s se ncheie cu succes folosind criterii dintre cele mai variate, inclusiv definiri incomplete de chei de cutare. Acurateea vizeaz exactitatea, nivelul acceptabil al erorilor coninute, ncadrate n limite stabilite. Procedurile de nregistrare i dispozitivele de msurare sunt verificate, iar personalul este instruit s efectueze msurtorile i nregistrrile conform cerinelor impuse. Credibilitatea are la baz acceptarea nregistrrilor ca reprezentnd un rezultat real al nregistrrilor. Se consider c ori de cte ori se reia procesul de msurare-constatare folosind proceduri echivalente, nregistrrile sunt aceleai. Interpretabilitatea datelor presupune definirea unui alfabet, a unor reguli de producie pentru construirea de iruri consecutive de simboluri, iar punerea n coresponden a cuvintelor cu fapte, evenimente, obiecte din lumea real aparin unui limbaj unanim acceptat i cunoscut. Obiectivitatea vizeaz imparialitatea, lipsa de prejudeci, neprtinirea n a efectua msurtori, n a prelua rezultatul obinut de la dispozitivele de msurare i din aplicarea procedurilor de efectuare a msurtorilor. Existena unor principii etice, a unor argumente tiinifice determin eliminarea elementelor care genereaz subiectivism n constituirea seturilor de date i, mai ales, n prelucrare pentru obinerea de rezultate agregate, reprezentative. Oportunitatea vizeaz neafectarea de uzura moral a datelor n raport cu un criteriu, cu un moment de timp, cu un nivel de cuprindere, toate

stabilite de la nceput, definitivndu-se, n acest fel, un context i un nivel de exigen sub care nu se coboar. Relevana este stabilit n raport cu cerine ale utilizatorilor i vizeaz corespondena dintre rezultatele agregate i trendul de dezvoltare a colectivitii de la care provine setul de date. Alte caracteristici de calitate sunt dependente de reputaia sursei, claritatea corespondenei dintre cuvintele unui vocabular i mulimea de elemente desemnate din lumea real. Profitabilitatea datelor vizeaz valoarea adugat care se obine i care justific efortul de definire de proceduri, de achiziionare instrumente, de angajare a personalului pentru a construi seturi de date organizate n tablourile T1, T2, ..., Tn i pentru a dezvolta software care s le prelucreze. Pe baza rezultatelor astfel obinute sunt fundamentate decizii care se deosebesc de deciziile luate empiric prin multiple avantaje. Optimizarea deciziilor d msura profitabilitii. Atributele calitii sunt deosebit de numeroase, ele fiind incluse n tabelul 9.16 [IVAN99a]. Atribute ale calitii datelor
acceptabilitate acuratee alterabilitate auditabilitate bine documentate capacitate de descrcare certificare compactivitate competitivitate compresabilitate conexiuni logice consisten coninut cost acuratee credibilitate customizabilitate detaliere surse dispersie eficacitate extendabilitate fr greeli accesibilitate adaptabilitate amplitudine auto-corectabilitate bine prezentate capacitate de identificare erori claritate compatibilitate completitudine comprihensivitate confidenialitate context corectitudine cost colectare criticabilitate definire exact dimensiune disponibilitate ergonomie extensibilitate fr pierderi de informaii Tabelul 9.16 actualitate agregabilitate aspect estetic autoritate cantitate capacitate de ncrcare claritate surse compatibilitatea cu date istorice comportament concizie conformitate continuitate cost creativitate curente detaliere adecvat dinamism domeniu expansibilitate fr erori fiabilitate

finalitate format imparialitate integrabilitate interesante manevrabilitate minimalitate nivel de abstractizare noutate optimalitate partiionabilitate pertinente precise rspunde cerinelor regsire relevan responsabilitate rigiditate secrete sincronizare stocare translatare uurin acces uurin corelaii uurin interogare uurin modificare validitate varietate vitez

flexibilitate generalitate importan integritate interpretare semantic msurabilitate modularitate nivel de standardizare obiectivitate organizare pedigree portabile prietenoase raionalitate regularitate format reproductibilitate rezisten robustee securitate specificitate suprancrcare transportabilitate uurin actualizare uurin folosire uurin interschimb uurin regsire valoare vrst volatilitate

form prezentare ierarhizare independen de timp interactivitate localizare mediu neambiguitate normalizare oportunitate origine personalizate posibilitate de urmrire profunzime redundan reiterare reputaie rezoluie grafic scop semnificaie stabilitate surse unicitate uurin comparaii uurin nelegere uurin ntreinere utilizabilitate variabilitate verificabilitate volum adecvat

Dintre aceste atribute se extrag unele care sunt considerate de baz, se stabilesc interdependene i rezult prioriti care trebuie urmrite cnd se planific nivelurile de calitate a datelor. Seturile de date difer unele de altele prin caracteristici de ordin cantitativ i prin caracteristici de ordin calitativ, ambele trebuind s fie puse n coresponden cu valori numerice care s conduc la efectuarea de comparaii. Punerea n coresponden se realizeaz prin utilizarea metricilor. Dimensiunea colectivitii CVIi este dat de numrul componentelor NCVIi care o alctuiesc. Dinamica proceselor economico-sociale impune o abordare mai larg a conceptului de dimensiune. Astfel, sunt analizate modalitile de constituire a colectivitii CVIi i se stabilete NCVIMAXi: numrul maxim de componente pe care le-a avut mulimea CVIi ntr-un interval de timp [t0, t1], NCVIMINi numrul minim de elemente, referitoare

la acelai interval i NCVIMEDi numrul mediu de elemante. Aceste mrimi creeaz o imagine referitoare la nivelul pe care l va avea NCVIi ntr-un interval viitor [t1, t2]. Lungime listei caracteristicilor de calitate CQi asociat colectivitii CVIi este invariabil pe intervale lungi de timp. Setul de date asociat colectivitii este caracterizat prin volumul V(STi). Setul de date este privit ca un text format din cuvinte. Numrul de cuvinte depinde de numrul de coloane i de numrul de linii ale tabloului Ti asociat colectivitii CVIi. V(STi) = NLINi NCOLi, i = 1, 2, ..., n n cazul n care setul de date este incomplet, lipsind datele unor coloane ntregi n numr de COLi, sau numr de linii complete LINi, rezult c volumul incomplet de date este dat de relaia: VI(STi) = (LINNi - LINi) (NCOLi - COLi ) Se definete relaia: V(STi) > VI(STi) n cazul n care lipsa de date este accidental, numrul de date lips pe linii sau coloane este LCi, volumul afectat de aceste absene este dat de relaia: VA(STi) = NLINi NCOLi - LCi Indiferent de modul n care se constituie seturile de date, este necesar ca diferenele dintre volumul de date complet i volumul incomplet, D1, respectiv D2, s traverseze evoluii astfel nct ntr-un numr finit de pai s devin zero. Datele absente trebuie s fie completate nainte de a ncepe prelucrarea setului de date. D1i = V (STi ) VI (STi )

i D2 = V (STi ) VA(STi )

Gradul de acoperire a setulul de date Ga este dat de relaia:


Ga = V (STi ), VA(STi )} min{ V (STi ), VA(STi )} max{

i are valori cuprinse n intervalul [0;1]. La construirea unei metrici pentru calitatea datelor sunt luate n considerare ipotezele privind: - caracterul normat al indicatorilor, toate definiiile trebuind s conduc la obinerea unor valori calculate, cuprinse n intervalul [0;1]; - senzitivitatea indicatorilor, n sensul c la variaii mici ale variabilelor exogene, indicatorul calculat s aib variaii mici, iar la variaii mari ale variabilelor exogene, indicatorul s aib, de asemenea, variaii mari; - indicatorul s nu fie compensatoriu, astfel nct pentru diferite valori ale variabilelor exogene s se obin valori diferite ale indicatorului; dac indicatorul este compensatoriu, la valori diferite ale variabilelor exogene se obin aceleai valori ale indicatorului; - indicatorul nu trebuie s fie catastrofic, adic trebuie s fie construit n aa fel nct s nu existe niveluri ale variabilelor exogene care pentru variaii foarte mici s genereze variaii foarte mari ale indicatorului; - toi indicatorii se calculeaz folosind datele din tabloul Ti construit pentru colectivitatea CVIi, i = 1, 2, ..., n; - folosind datele indicatorilor asociai caracteristicilor de calitate CQ1, CQ2, ..., CQMi, respectiv IQ1, IQ2, ..., IQMi i coeficienii de importan p1, p2, ..., pMi, se obine indicatorul global al calitii pentru colectivitatea dat de relaia: G = (IQ j ) , i = 1, 2, ..., n
i q Mi j =1 pj

Complexitatea datelor care privesc o colectivitate Ai este dat de: - operanzii care particip n elaborarea prelucrrilor; - operatorii utilizai.

Dac se consider datele din tabelul 9.17, pentru calculul valorii Via a produsului PRODi se folosete relaia , i = 1, 2, ..., r.
Date privind producia i preurile
Produs PRODi PROD2
-

Cantitate Q1 Q2
-

Tabelul 9.17 Pre PR1 PR2


-

PRODr

Qr

PRr

Complexitatea operanzilor i a operatorilor rezult din secvena de program asociat prelucrrii: (1) ( 2) 2 3 (4) 4 5 (5) for (i = 0; i < n; i ++) 1 (3 ) (8) ( 10)11 V[j] = Q[i]*PR[i]; 6 7 (7) 8 9 (9)10 C = 11log211 + 10log210 Diversitatea DIVi relativ a datelor colectivitii Ai este dat de relaia: K DIVi = , Mi unde K reprezint numrul tipurilor de date diferite: Se consider urmtoarele tipuri de date: - coduri date ca iruri de caractere; - indicatori exprimai ca numere ntregi; - indicatori exprimai ca iruri de litere; - indicatori exprimai prin numere virgul mobil; - indicatori exprimai prin cuvinte dintr-o mulime cunoscut.

ntr-un tabel n care sunt consemnate pe coloane cantitile livrate ntr-o lun, iar pe linii sunt date produse, tabelul va conine 31 de coloane pentru cantiti, toate date ca numere ntregi, trei coloane pentru denumirea produsului, codul produsului i pentru unitatea de msur, diversitatea tipurilor de date este:

DIV =

4 34

Mi = 34, tabelul avnd 31 coloane pentru cantiti i 3 coloane pentru identificare produs. K = 4, corespunztor tipului de date pentru cod produs, denumire produs, unitate de msur i cantiti; codurile sunt structuri de simboluri care ajut la identificarea produsului; denumirea produsului este un ir de litere; unitatea de msur este un cuvnt din mulimea {l, kg, t, m, m2, m3}. Gradul de omogenitate GOij a datelor din setul asociat colectivitii Ai, aparinnd caracteristicii de difereniere C ij , se obine prin relaia:

GOij =

a
k =1

Ni

i kj

i i min a kj max aij k k

{ }
i kj

{ }

a
k =1

Ni

Dac se consider caracteristica de difereniere C ij , definit de un domeniu definit prin nivelurile A ij ; B j i cu A ij < B ij , avnd nregistrate
i i valorile a1i j , a 2 j , ..., a Nij , gradul de omogenitate se obine prin relaia:

GO =
i j

i i max a kj min a kj k k

{ }

{ }

B j Aj

Obiectivul auditului datelor este de a stabili msura n care datele de intrare ale unui produs software ndeplinesc cerinele de calitate pentru a fi prelucrate.

Programul de audit date este o construcie complex care presupune sarcini precise i care se finalizeaz cu un raport de audit. Auditul datelor presupune: - analiza procedurilor utilizate la nregistrarea datelor i validarea acestor proceduri; - stabilirea dac dispozitivele utilizate pentru efectuarea de msurtori sunt calibrate i ndeplinesc cerinele impuse de standardele cu care se lucreaz; - stabilirea claselor de erori i, n interiorul clasei, a erorilor specifice. La nregistrarea datelor se nregistreaz erori privind: - stabilirea erorilor legate de codurile de identificare a elementelor colectivitii prin neincluderea unui cod, prin interschimbul a dou coduri; - nivelurile unor caracteristici care sunt n afara domeniilor, ceea ce nseamn afectarea grosolan a msurtorilor; repetarea nivelurilor nregistrate pentru un element al mulimii la alte elemente nvecinate; - nregistrarea nivelului caracteristicii C ij n dreptul caracteristicii nvecinate C ij 1 sau C ij +1 ; i fie nregistrarea nivelului caracteristicii C ij a elementului a k
i corespunztor elementului a k 1 , fie corespunztor elementului

i ak +1 ; interpretarea greit a simbolurilor din alfabetul n care este scris irul la intersecia coloanei COL j cu linia LIN k ;

transformarea irului de la intersecia coloanei COL j i a liniei LIN k prin inserarea unui simbol, prin eliminarea unui simbol sau prin nlocuirea unui simbol cu altul; irul transformat rmne n domeniul stabilit pentru caracteristica C ij ;

transformarea irului de la intersecia liniei LIN k i a coloanei COL j , astfel nct s aparin unei alte clase sau unui alt domeniu;

modificarea dimensiunilor tabloului Ti prin inserarea de noi caracteristici, prin eliminarea de caracteristici de difereniere sau prin modificarea numrului de componente N o ale colectivitii Ai .

Auditul datelor are menirea de a stabili: - conformitatea caracteristicilor de calitate ale setului de date STi colectate, prin msurtori sau constatri la nivelul elementelor mulimii Ai , n raport cu cerinele beneficiarului, specificate concret prin referirea la standarde, norme i prin documentaii special ntocmite; - eficacitatea msurilor care asigur caliti referitoare la datele colectate; - identificarea msurilor de asigurare a calitii datelor. Auditul datelor include elemente practice. Se stabilesc regulile cu care se calculeaz volumul datelor care este verificat pentru a stabili latura cantitativ global a datelor. Latura cantitativ, volumul de date, se stabilete difereniat, dup importana dat documentelor.

Anda mungkin juga menyukai