Anda di halaman 1dari 26

Teora de la Informacin

Fundamentos tericos de la Criptografa


Los pilares sobre los que descansa toda la teora asociada a los criptosistemas son bsicamente tres: La teora de la informacin Estudio de la cantidad de informacin contenida en los mensajes y claves, as como su entropa. La teora de los nmeros Estudio de las matemticas discretas y cuerpos finitos que permiten las operaciones de cifrado y descifrado. La teora de la complejidad de los algoritmos Estudio de la clasificacin de los problemas como computacionalmente tratables o intratables.
Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin

Informacin
Definicin de informacin:
Es el conjunto de datos o mensajes inteligibles creados con un lenguaje de representacin y que debemos proteger ante las amenazas del entorno, durante su transmisin o almacenamiento, usando tcnicas criptogrficas entre otras herramientas.

Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin

Comunicacin

Transmisor Medio de Transmisin M

Receptor M MT

Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin
Criptosistema
Transmisor M Receptor Medio de Transmisin C C MT R

T
Cifrador

Mensaje cifrado

Descifrador

Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin Informacin


Definicin de informacin:
La teora de la informacin mide la cantidad de informacin que contiene un mensaje a travs del nmero medio de bits necesario para codificar todos los posibles mensajes con un codificador ptimo.

Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin
Representacin de la informacin
Puede ser numrica, alfabtica, simblica, por lenguaje.
Ejemplo: 15/01/05 15-01-05 15-1-05 15/01/2005 01/15/05 01-15-05 1-15-05 01-15-2005 ... - Todos son el da 15 de enero del ao 2005. Vitaminas: B12, C, ... Grupo sanguneo: A2 Veamos la informacin Rh+ ... que contiene el mensaje Elementos: Fe, Si, Hg Hace calor all? ... Compuestos qumicos: H2O, CO2 ... Ms comn Lenguaje con cdigo: Hace calor all?

Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin
La informacin que tiene un mensaje
Veremos qu informacin nos entrega un mensaje dependiendo del contexto en que nos encontremos. Esto puede analizarse: a) En funcin de la extensin del mensaje recibido. b) En funcin de la utilidad del mensaje recibido. c) En funcin de la sorpresa del mensaje recibido. d) Dependiendo del entorno de esa sorpresa. e) En funcin de la probabilidad de recibir un mensaje.

http://es.wikipedia.org/wiki/Claude_E._Shannon
Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin
Cantidad de informacin (caso 1)
En funcin de la extensin del mensaje
Ante una pregunta cualquiera, una respuesta concreta y extensa nos entregar mayor informacin sobre el tema en particular, y diremos que estamos ante una mayor cantidad de informacin.

Pregunta: Hace calor all?

(una playa en particular)

Respuesta 1: S, hace mucho calor. Respuesta 2: Cuando no sopla el viento, el calor all es inaguantable pues supera los 42 grados a la sombra.
Dnde hay una mayor cantidad de informacin?
Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin
Cantidad de informacin (caso 2)
En funcin de la utilidad del mensaje
Ante una pregunta cualquiera, una respuesta ms til y clara nos dejar con la sensacin de haber recibido una mayor cantidad de informacin.

Pregunta: Hace calor all?

(una playa en particular)

Respuesta 1: S, sobre 30 grados. Respuesta 2: Si no hay viento del sur y el mar est en calma, es normal que la temperatura suba bastante.
Dnde hay una mayor cantidad de informacin?

Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin
Cantidad de informacin (caso 3)
En funcin de la sorpresa del mensaje
Ante una pregunta cualquiera, una respuesta ms inesperada y sorprendente, nos dar la sensacin de contener una mayor cantidad de informacin.

Pregunta: Hace calor all?

(ahora Finlandia en otoo)

Respuesta 1: S, muchsimo. Es insoportable. Respuesta 1: S, muchsimo. Es insoportable. Respuesta 2: En esta poca del ao, la temperatura es ms suave y el tiempo muy agradable.
Dnde hay una mayor cantidad de informacin?

Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin
Cantidad de informacin (caso 4)
Dependencia del entorno (sorpresa)
Ante una pregunta cualquiera, una respuesta inesperada y sorprendente en el entorno, nos dar la sensacin de contener una mayor cantidad de informacin.

Pregunta: Hace calor all?


(ahora las mismas respuestas hablan de la temperatura en un horno)

Respuesta 1: S, muchsimo. Es insoportable. Respuesta En esta poca del ao, la temperatura es ms Respuesta 2:2: En esta poca del ao, la temperatura es ms suave y el tiempo muy agradable. ?
Dnde hay una mayor cantidad de informacin?
Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin
Cantidad de informacin (caso 5)
En funcin de la probabilidad de recibir un mensaje
Este enfoque probabilstico es el que nos interesar en cuanto a la definicin de Cantidad de Informacin.

Dnde le da alegra a su cuerpo Macarena?


Respuesta 1: En un pas de Europa. Respuesta 2: En una ciudad de Espaa. Respuesta 3: En los nmeros 1 y 3 de la calle Sierpes en Respuesta 3: En los nmeros 1 y 3 de la calle Sierpes en Sevilla, Espaa... LaSevilla, Espaa.excelente bombonera! Campana, una
Dnde hay una mayor cantidad de informacin?
Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin
Incertidumbre e informacin
Ante varios mensajes posibles, en principio todos equiprobables, aquel que tenga una menor probabilidad de aparicin ser el que contenga una mayor cantidad de informacin. En el ejemplo anterior: Al ser ms extenso el nmero de calles y sus nmeros en una ciudad que el nmero de ciudades en Espaa, y esto ltimo mayor que los pases en Europa, la ltima respuesta tendr una mayor incertidumbre. Si suponemos todos los estados equiprobables, entonces la cantidad de informacin de la respuesta tercera ser mayor que las dems.

Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin
Concepto de variable aleatoria
Sea X una variable aleatoria con n estados posibles con X = xi una ocurrencia isima:
X = {x1, x2, x3, ..., xn-1, xn} p1 = p(x1), p2 = p(x2), ..., pn = p(xn) Como: 0 pi 1 para i = 1, 2, ..., n Entonces: n pi = 1
i=1
Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin
Definicin de cantidad de informacin
Definiremos ci a la cantidad de informacin del estado i, como el logaritmo en base dos de la probabilidad de que ocurra el estado isimo.
ci = - log2 (pi )
- Logaritmo: p(xi) = 1 no hay incertidumbre: ci = 0 p(xi) = 0 mxima incertidumbre: ci - Signo: p(xi) 1 log p(xi) ser negativo - Base 2: Un fenmeno binario dos estados (bit)
Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin
Grado de indeterminacin
ci =
Grado de indeterminacin previo Grado de indeterminacin posterior

En una bolsa hay dos papeles con crculos, dos con cuadrados y dos con tringulos: negros o blancos. Sacamos a ciegas tres papeles cualesquiera... Sea sta ser la combinacin elegida... Combinacin 1 Combinacin 5

Si hay equiprobabilidad entonces p(xi) = 1/8

Combinacin 2 Combinacin 3 Combinacin 4

Combinacin 6 Combinacin 7 Combinacin 8

Qu cantidad de informacin tiene cada uno de los estados?


Curso de Seguridad Informtica y Criptografa JRA

Teora de la Informacin

La incertidumbre del ejemplo del mago


Combinacin 1 Combinacin 2 Combinacin 3 Combinacin 4 Combinacin 5 Combinacin 6 Combinacin 7 Combinacin 8

Como p(xi) = 1/8 entonces Veamos esto ahora Incertidumbre inicial Ii = 8 matemticamente ... Daremos algunas pistas : Las figuras no son del mismo color: Ii baja de 8 a 6 al descartarse las combinaciones 1 y 8. El crculo es blanco: Ii baja de 6 a 3 (descartamos 5, 6 y 7). Hay dos figuras blancas: Ii baja de 3 a 2 (descartamos 4). El cuadrado es negro: Ii baja de 2 a 1 (descartamos 2.)

Se acaba la incertidumbre pues la solucin es la combinacin 3.


Jorge Rami Aguirre
Madrid (Espaa) 2006

Teora de la Informacin Solucin matemtica al ejemplo del mago


Las figuras no son del mismo color. Ii baja de 8 a 6:
ci1 = log (8/6) = log 8 - log 6

El crculo es blanco. Ii baja de 6 a 3:


ci2 = log (6/3) = log 6 - log 3

Hay dos figuras blancas. Ii baja de 3 a 2:


ci3 = log (3/2) = log 3 - log 2

El cuadrado es negro. Ii baja de 2 a 1:


ci4 = log (2/1) = log 2 - log 1

Todas las magnitudes se pueden sumar como escalares:

ci = ci1 + ci2 + ci3 + ci4 = log 8 - log 1 = log 8


Jorge Rami Aguirre
Madrid (Espaa) 2006

Teora de la Informacin Base del logaritmo


Sean Ii la indeterminacin inicial If la indeterminacin final

ci = log (Ii / If) = log Ii - log If


La cantidad de informacin tiene como unidad de medida la de un fenmeno de slo dos estados, un fenmeno binario. Luego:

ci = logb (2/1) = logb 2 - logb 1


Si logb 2 debe ser igual a 1 entonces la base b = 2. Precisamente a esta unidad se le llama bit (binary digit) Ejemplo anterior: ci = log2 8 = 3. Es decir, pasamos de la incertidumbre total a la certeza con slo 3 preguntas.
Jorge Rami Aguirre

Madrid (Espaa) 2006

Teora de la Informacin Con slo tres preguntas inteligentes...


Combinacin 1 Combinacin 2 Combinacin 3 Combinacin 4 Combinacin 5 Combinacin 6 Combinacin 7 Combinacin 8

Con slo tres preguntas ms o menos inteligentes podemos pasar de la incertidumbre total a la certeza: Pregunta 1: Est entre la opcin 1 y la 4? S Pregunta 2: Est entre la opcin 1 y la 2? No Pregunta 3: Es la opcin 4? No
Se acaba la indeterminacin!

Jorge Rami Aguirre

Madrid (Espaa) 2006

Teora de la Informacin Entropa de los mensajes


Si un fenmeno tiene un grado de indeterminacin k y sus estados son equiprobables, la probabilidad p de que se d uno de esos estados ser 1/k. Luego: ci = log2 (k/1) = log2 [1/(1/k)] = - log2 p Si ahora cada uno de estos estados tiene una probabilidad distinta pi, la entropa H ser igual a la suma ponderada de la cantidad de informacin: H = - p1 log2 p1 - p2 log2 p2 - ... - pk log2 pk
H = - pi log2 pi
i=1 k

Nota: aunque la ecuacin parece bastante lgica, no es inmediata.


http://en.wikipedia.org/wiki/Information_entropy

Jorge Rami Aguirre

Madrid (Espaa) 2006

Teora de la Informacin

Definicin de entropa
La entropa de un mensaje X, que se representa por H(X), es el valor medio ponderado de la cantidad de informacin de los diversos estados del mensaje.
H(X) = - p(xi) log2 p(xi)
i=1 k

Esto lo veremos ms adelante...

Es una medida de la incertidumbre media acerca de una variable aleatoria y el nmero de bits de informacin.
Despus del ejemplo de los papeles, podramos aceptar el concepto de incertidumbre en H. Lo que ahora nos llama la atencin es lo del nmero de bits de informacin.
Jorge Rami Aguirre
Madrid (Espaa) 2006

Teora de la Informacin Propiedades de la entropa


a) La entropa es no negativa y se anula si y slo si un estado de la
variable es igual a 1 y el resto 0. Esta demostracin es sencilla. b) La entropa ser mxima, hay mayor incertidumbre del mensaje, cuando exista una equiprobabilidad en todos los valores de la variable X. La demostracin emprica es muy fcil; no obstante la demostracin matemtica de este mximo no es directa. El valor mximo de H(X) para una variable de n estados ser log2 n. Si hay n estados equiprobables, entonces pi = 1/n.
Luego: H(X) = - pi log2 pi = - n(1/n) log2 (1/n) = - (log2 1 - log2 n)
i

H(X)mx = log2 n
Jorge Rami Aguirre
Madrid (Espaa) 2006

Teora de la Informacin Concepto codificador ptimo


Nos falta encontrar el segundo trmino pendiente en la definicin de cantidad de informacin: codificador ptimo. Introduciendo el signo negativo dentro del logaritmo en la expresin de la entropa, sta nos quedar como:
H(X) = p(x) log2 [1/p(x)]
i

Veamos un ejemplo de codificacin

La expresin log2 [1/p(x)] representar el nmero necesario de bits para codificar el mensaje X en un codificador ptimo. Codificador ptimo es aquel que para codificar un mensaje X usa el menor nmero posible de bits.
Jorge Rami Aguirre
Madrid (Espaa) 2006

Teora de la Informacin Prcticas del tema 6 (1/1)


Software CripClas:
1.
http://www.criptored.upm.es/software/sw_m001c.htm

2.

3. 4.

5.

Encuentre la entropa del mensaje M = MI MAMA ME MIMA, comprela con el resultado de la diapositiva correspondiente, 33 bits para codificar 15 caracteres: 33/15 = 2,2. Por qu no coinciden? Repita este clculo ahora con el mensaje M = RARORARO y saque conclusiones. Encuentre la entropa de M = ABCDEFGHIJKLMNOPQRSTUVWXYZ es decir el alfabeto en castellano mdulo 27, y comprela con el valor que aparece en la dispositiva correspondiente. Cmo son las entropas de M = TE AMO y M = Te amo? Por qu? Copie en el portapapeles todas estas preguntas, guarde el archivo con el nombre prtema6.txt y encuentre su entropa. Encuentre luego la entropa de otros archivos txt, grandes y pequeos, y saque conclusiones. Encuentre la frecuencia de monogramas del archivo anterior, prtema6.txt. Comprela en la misma pantalla con la tabla de frecuencias estndar.
Madrid (Espaa) 2006

Jorge Rami Aguirre

Teora de la Informacin

Cuestiones y ejercicios (2 de 2)
7. Qu representa la expresin log2 [1/p(x)] en la entropa H(X)? Si p(x1)=0,6; p(x2)=0,3; p(x3)=0,1 calcule log2 [1/p(x)]. Qu opina? 8. Definimos un alfabeto con 71 elementos (maysculas y minsculas, minsculas acentuadas, dgitos, punto, coma). Si estos elementos son equiprobables, cul es la ratio absoluta de este alfabeto? 9. La ratio verdadera es mayor o menor que la absoluta? Por qu? 10. Un alfabeto consta de 8 elementos equiprobables. Cuntos posibles mensajes de tamao 4 existen? De stos, cuntos mensajes podran tener sentido si esos 8 elementos representan al idioma castellano? 11. Cundo decimos que un sistema tiene secreto perfecto? En un sistema real, es eso posible? Piense en algn ejemplo y comntelo. 12. Por qu se dice que hay que minimizar las soluciones falsas SF en el modelo aleatorio para romper la clave? Es la clave k nica?
Jorge Rami Aguirre
Madrid (Espaa) 2006

Anda mungkin juga menyukai