Anda di halaman 1dari 9

DATA MINING

Integrantes:
Paola Montesinos
Carolina Alvarado
Carlos Garces
Pablo Araneda.

Caso Medicamento Paciente
El problema que se plantea es sobre las ventas de medicamentos tomando diferentes criterios
para poder resolver con exactitud que laboratorios con mayor frecuencia en los distintos grupos
definidos, como:
Grupo de edad
Sexo
Requiere o no receta
Laboratorio de marca o genrico
Marca de laboratorio.

Para lograr tal resultado acudimos a la herramienta de minera de datos de nombre weka, despus
de aplicados los pasos sugeridos, obtenemos los resultados con distintos tipos de visualizacin.



















El archivo de
@relation Farmacia

@attribute Grupo {Infante, Adulto}
@attribute Sexo {M, F}
@attribute Receta {SI, NO}
@attribute Generico {SI, NO}
@attribute Laboratorio {Chile, Roche, Andromaco, Glaxo, Recalcine}

@data
Infante, M, SI, SI, Roche
Adulto, F, NO, SI, Andromaco
Adulto, F, SI, SI, Roche
Infante, M, NO, NO, Roche
Infante, M, SI, NO, Andromaco
Adulto, F, NO, SI, Roche
Infante, M, SI, NO, Roche
Infante, M, SI, NO, Chile
Infante, F, NO, SI, Roche
Adulto, M, SI, NO, Roche
Infante, M, SI, SI, Glaxo
Adulto, F, NO, NO, Andromaco
Infante, M, SI, SI, Roche
Infante, F, NO, SI, Roche
Adulto, M, NO, NO, Glaxo
Infante, M, NO, NO, Glaxo
Adulto, M, NO, SI, Recalcine
Adulto, F, NO, NO, Glaxo
Infante, M, NO, NO, Glaxo
Adulto, M, NO, SI, Recalcine
Infante, F, NO, NO, Chile
Adulto, M, NO, NO, Chile
Infante, F, NO, NO, Recalcine
Adulto, M, NO, NO, Recalcine
Infante, F, NO, NO, Glaxo




















=== Run information ===

Scheme: weka.classifiers.trees.J48 -C 0.25 -M 2
Relation: Farmacia
Instances: 25
Attributes: 5
Grupo
Sexo
Receta
Generico
Laboratorio
Test mode: evaluate on training data
=== Classifier model (full training set) ===
J48 pruned tree
------------------
Generico = SI
| Grupo = Infante: Roche (5.0/1.0)
| Grupo = Adulto
| | Sexo = M: Recalcine (2.0)
| | Sexo = F: Roche (3.0/1.0)
Generico = NO
| Receta = SI: Roche (4.0/2.0)
| Receta = NO: Glaxo (11.0/6.0)


Number of Leaves : 5
Size of the tree : 9
Time taken to build model: 0.01 seconds

=== Evaluation on training set ===
=== Summary ===
Correctly Classified Instances 15 60 %
Incorrectly Classified Instances 10 40 %
Kappa statistic 0.4357
Mean absolute error 0.212
Root mean squared error 0.3256
Relative absolute error 69.2588 %
Root relative squared error 83.5378 %
Coverage of cases (0.95 level) 100 %
Mean rel. region size (0.95 level) 68 %
Total Number of Instances 25

=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure ROC Area Class
0 0 0 0 0 0.75 Chile
0.889 0.25 0.667 0.889 0.762 0.861 Roche
0 0 0 0 0 0.78 Andromaco
0.833 0.316 0.455 0.833 0.588 0.798 Glaxo
0.5 0 1 0.5 0.667 0.893 Recalcine
Weighted Avg. 0.6 0.166 0.509 0.6 0.522 0.828

=== Confusion Matrix ===
a b c d e <-- classified as
0 1 0 2 0 | a = Chile
0 8 0 1 0 | b = Roche
0 2 0 1 0 | c = Andromaco
0 1 0 5 0 | d = Glaxo
0 0 0 2 2 | e = Recalcine



















CONCLUSION

El presente trabajo muestra la clasificacin de ciertos datos elegidos para visualizar de mejor
manera la compra de medicamentos en tipos, marcas en dos segmentos de poblacin puntuales
como son adultos e infantes.
Este tipo herramientas software y los informes que arrojan sirve para tomar mejores decisiones a
nivel estratgico sobre la gestin, optimizacin de recursos y mejora continua sin limitantes de
giro de la empresa.

Anda mungkin juga menyukai