Anda di halaman 1dari 14

TRANSMISIN DE MENSAJES ESCRITOS A TRAVS DE LA TARJETA DE

SONIDO UTILIZANDO INTERFAZ EN MATLAB

Presentado por:
JESSICA MARCELA CARDONA REINOSO
JHOAN ESTIVINSON LAGAREJO RIVAS
MANUEL ALEJANDRO MUOZ
DAIRN FERNANDO OSORIO FRANCO
CAMILO PIZA TRUJILLO

rea:
COMUNICACIONES DIGITALES

Director:
Ing. Oscar Gabriel Espejo Mojica

PROYECTO DE AULA

UNIVERIDAD DE CUNDINAMARCA
FACULTAD DE INGENIERA
PROGRAMA DE INGENIERA ELECTRNICA
FUSAGASUG
2008

JUSTIFICACIN
La naturaleza de las fuentes de informacin es muy variada, se puede tener seales de audio
o video anlogas como tambin discretas y la necesidad que se presenta de compartir esta
informacin por distintos motivos obliga a utilizar sistemas de comunicaciones, pero en
cualquier caso un sistema de comunicacin digital debe transmitir la seal que se genere en
la fuente de una forma digital. La importancia de los sistemas de comunicaciones digitales
radica en transmitir la informacin generada por una fuente hacia un destinatario, de una
forma ms confiable que los sistemas anlogos gracias a los bloques funcionales que los
constituyen, los cuales cumplen especficas tareas que garantizan dicha confiabilidad.

OBJETIVOS
Principal.

Transmitir mensajes escritos a travs de la tarjeta de sonido del ordenador,


utilizando la herramienta de software Matlab.

Especficos.

Aplicar los conocimientos adquiridos durante el curso de comunicaciones digitales


para dar solucin al proyecto.

Utilizar cifrado de datos con el fin de salvaguardar la informacin al momento de


transmitirla.

Lograr que la interfaz grafica del software sea lo ms amigable posible, para obtener
una buena aceptacin por parte del usuario.

MARCO TERICO
Codificacin.
La codificacin consiste en establecer una correspondencia entre cada uno de los smbolos
de un alfabeto fuente y una secuencia de smbolos de un alfabeto destino. Al alfabeto
destino se le denomina alfabeto cdigo y a cada una de las secuencias de smbolos de este
alfabeto que se corresponda con un smbolo del alfabeto fuente se denomina palabra de
cdigo.

Figura 1. Alfabeto fuente y alfabeto cdigo.

El alfabeto fuente contiene los smbolos originales que se quieren codificar. El alfabeto
cdigo contiene las palabras de cdigo equivalentes en que se codificarn los smbolos
originales. Estas palabras de cdigo son aptas para ser transmitidas por un sistema de
comunicaciones.
Tendremos 3 tipos de codificacin: codificacin en la fuente, codificacin de compresin y
codificacin del canal.
Clasificacin de los cdigos.
-

Cdigo bloque: es aquel cdigo en el que todas las palabras de cdigo


correspondientes a cada smbolo del alfabeto fuente tienen la misma longitud.
Dentro de estos cdigos podemos distinguir:
Cdigo singular: a cada smbolo del alfabeto fuente le corresponde una nica
palabra de cdigo.
Cdigo no singular: a cada smbolo del alfabeto fuente le corresponde dos o ms
palabras de cdigo.

Cdigo compacto o de longitud variable: se busca que a cada smbolo del alfabeto
fuente le corresponda una palabra de cdigo de longitud mnima segn algn
criterio de minimizacin dado.

Propiedades de los cdigos


-

Longitud media: Cada palabra de cdigo asignada a cada smbolo del alfabeto
fuente tiene una longitud lk. A partir de aqu se define la longitud media de un
cdigo como:

La longitud media representa el nmero medio de bits por smbolo del alfabeto fuente que
se utilizan en el proceso de codificacin.
-

Eficiencia: A partir del concepto de longitud media la eficiencia de un cdigo se


define como:

Siendo:

Para calcular Lmin es necesario tener en cuenta el primer teorema de Shanon o teorema de la
codificacin de la fuente: Dada una fuente discreta de entropa H, la longitud media de la
palabra de cdigo est acotada inferiormente por H. Teniendo esto en cuenta Lmin se fija
como el valor de la entropa con lo que la eficiencia puede escribirse como:

- Redundancia: Se denomina redundancia de un cdigo a la informacin superflua o


innecesaria para interpretar el significado de los datos originales. Se define como:

Codificacin en la fuente.
El objetivo de la codificacin es obtener una representacin eficiente de los smbolos del
alfabeto fuente. Para que la codificacin sea eficiente es necesario tener un conocimiento de
las probabilidades de cada uno de los smbolos del alfabeto fuente. El dispositivo que
realiza esta tarea es el codificador de la fuente. Este codificador debe cumplir el requisito
de que cada palabra de cdigo debe decodificarse de forma nica, de forma que la
secuencia original sea reconstruida perfectamente a partir de la secuencia codificada.
Algunos Cdigos de codificacin de fuente:
Cdigo BCD: (Binary Coded Decimal). Esta tcnica de codificacin permite que un
conjunto de caracteres alfanumricos pueda ser representado mediante 6 bits.

Cdigo EBCDIC: Este cdigo surge como una ampliacin del cdigo BCD. En las
transmisiones de datos es necesario utilizar un gran nmero de caracteres de control
para la manipulacin de los mensajes y realizacin de otras funciones. De ah que el
cdigo BCD se extendiera a una representacin utilizando 8 bits dando origen al cdigo
EBCDIC (Extended Binary Coded Decimal Interchange Code).
Cdigo FIELDATA: Es un cdigo utilizado en transmisiones de datos de algunos
sistemas militares y est orientado al lenguaje mquina.
Cdigo ASCII: (American Standar Code for Information Interchange). Su uso
primordial es facilitar el intercambio de informacin entre sistemas de procesamiento
de datos y equipos asociados y dentro de sistemas de comunicacin de datos. En un
principio cada carcter se codificaba mediante 7 dgitos binarios y fue creado para el
juego de caracteres ingleses ms corrientes, por lo que no contemplaba ni caracteres
especiales ni caracteres especficos de otras lenguas. Esto hizo que posteriormente se
extendiera a 8 dgitos binarios.
Tcnicas de compresin estadsticas.
La compresin estadstica no es una tcnica de compresin propiamente dicha. Se trata de
una tcnica en la que se realiza la codificacin en la fuente y la compresin
simultneamente. De ah que esta tcnica sea tambin conocida con el nombre de
codificacin estadstica.
Su objetivo consiste en realizar una codificacin en la fuente para obtener cdigos tales que
la longitud media de los datos codificados sea menor que la obtenida con cdigos de
longitud fija. Por este motivo, para la construccin de estos cdigos es necesario tener un
conocimiento previo de la frecuencia de ocurrencia de cada uno de los caracteres del cdigo
original. Se usarn codificaciones ms cortas para representar los caracteres con mayor
frecuencia de aparicin.
La construccin de este tipo de cdigos se basa en la propiedad del prefijo, segn la cual,
ninguna secuencia de bits que represente a un carcter del cdigo podr aparecer como
subsecuencia inicial de otra secuencia de longitud mayor que represente a otro carcter del
cdigo. Con esta propiedad se asegura que estos cdigos slo admiten una nica posibilidad
para ser desconfiados.
Algunos cdigos estadsticos son:

Cdigo de Huffman
Cdigo de Shannon-Fano
Cdigos Coma
Codificacin aritmtica
Compresin adaptativa

Cdigos Huffman n-arios.


Este cdigo es un cdigo ptimo dentro de los cdigos de codificacin estadstica, ya
que es el cdigo de menor longitud media. La construccin de este cdigo se
fundamenta en asignar a cada smbolo del alfabeto fuente una secuencia de bits cuya
longitud est relacionada de forma directa con la probabilidad de aparicin de ese
smbolo. De esta forma, a los smbolos con mayor frecuencia de aparicin se les
asignarn las palabras de cdigo de menor longitud.
En el proceso de construccin de este cdigo, lo primero que se hace es ordenar el
conjunto de smbolos del alfabeto fuente en orden decreciente de probabilidades de
aparicin. A continuacin se juntan los dos smbolos con menor probabilidad de
aparicin en un nico smbolo cuya probabilidad ser la suma de las probabilidades de
los smbolos que dieron origen a este nuevo smbolo.
Se repite este proceso hasta que slo tengamos dos smbolos. A continuacin se realiza
el proceso de codificacin. Primeramente asignamos un 1 a uno de los dos smbolos que
tenemos y un 0 al otro. Posteriormente recorreremos la estructura que hemos construido
hacia atrs de forma que cuando dos smbolos hayan dado origen a un nuevo smbolo,
estos dos smbolos "heredarn" la codificacin asignada a este nuevo smbolo y a
continuacin se le aadir un 1 a la codificacin de uno de los smbolos y un 0 a la del
otro smbolo.
Es posible crear cdigos de Huffman ternarios, cuaternarios, y, en general, n-arios. Para
ello slo es necesario realizar dos modificaciones al algoritmo:
1. Los rboles a crear tendrn tantos hijos como smbolos posibles puedan aparecer en
los cdigos Huffman. Por ejemplo, si es ternario se crearn rboles con tres hijos; si
es cuaternario, con cuatro.
2. Si se expresa como s el nmero de smbolos en el alfabeto a codificar, y n el nmero
de smbolos que aparecen en el cdigo Huffman, entonces s-1 debe ser mltiplo de
n-1. Es decir, para un cdigo ternario, s debe valer 3, 5, 7, etc. Si esta condicin no
se cumple, entonces se deben aadir smbolos "nulos" con frecuencia 0, que
servirn slo como relleno a la hora de construir el rbol.

Alfabeto espaol.

Para designar la serie ordenada de las letras con que se representan los sonidos de una
lengua, pueden usarse indistintamente en espaol los trminos abecedario y alfabeto (del
lat. abecedarium y alphabetum, respectivamente). El primer trmino est formado a partir
del nombre de las cuatro primeras letras de la serie latina (a, be, ce, de), y el segundo, a
partir del nombre de las dos primeras de la serie griega (alfa, beta). Aunque son ambos
vlidos, el nombre alfabeto es el de uso ms general y el que ha dado lugar a derivados:
alfabtico, alfabetizacin, analfabeto, etc.

La ortografa del espaol utiliza una variante modificada del alfabeto latino, que consta de
29 smbolos A, B, C, Ch, D, E, F, G, H, I, J, K, L, Ll, M, N, , O, P, Q, R, S, T, U, V, W,
X, Y y Z. La variante espaola del alfabeto latino universal ha sido utilizada por la
academia desde 1803 (cuarta edicin del Diccionario acadmico) en la confeccin de todas
sus listas alfabticas. Desde esa fecha, la Ch y la Ll, que en realidad son dgrafos, es decir,
signos grficos compuestos de dos letras, pasaron a considerarse convencionalmente letras
del abecedario por el hecho de representar, cada uno de ellos, un slo sonido. No obstante,
en el X Congreso de la Asociacin de Academias de la Lengua Espaola, celebrado en
1994, se acord adoptar a peticin de varios organismos internacionales, el orden alfabtico
latino universal, en el que la Ch y la Ll no se consideran letras independientes. En
consecuencia, las palabras que comienzan por estas dos letras o que las contienen, pasan a
alfabetizarse en los lugares que les corresponden dentro de la C y dentro de la L,
respectivamente. Esta reforma afecta nicamente al proceso de ordenacin alfabtica de las
palabras, no a la composicin del abecedario, del que los dgrafos Ch y Ll siguen formando
parte. Las vocales (A, E, I, O y U) aceptan, adems, el acento agudo para indicar la slaba
acentuada y la diresis en la U.
a
b
c
ch
d
e
f
g
h
i
j
k
l
ll
m

a
be
ce
che
de
e
efe
ge
hache
i
jota
ka
ele
elle
eme

o
p
q
r
s
t
u
v
w
x
y
z

ene
ee
o
pe
cu
ere erre
ese
te
u
uve
uve doble
equis
i griega
zeta

Tabla 1. Alfabeto espaol identifica 29 "letras", incluyendo dos que son digrficas.

Frecuencia del uso de las letras:


Cualquier texto en el idioma espaol se construye con las 27 letras del alfabeto. Algunas
letras, como la K o la W se utilizan muy poco, mientras que la A o la E se utilizan mucho.
Naturalmente, la frecuencia de uso de cada letra depender del texto elegido, pero se tiene
la conviccin que cuando el texto es muy largo, las frecuencias relativas convergern a
unos valores bien determinados que llamamos probabilidades.
Cada uno de estos valores indica la probabilidad de que, una determinada letra resulte
elegida cuando en un texto se selecciona una al azar.
La frecuencia de uso de las letras en el castellano, sin incluir los dgrafos Ch y Ll, es la
siguiente.

Figura 2. Frecuencia de uso de las letras en el castellano.

e: 16,78% a: 11,96% o: 8,69%

l: 8,37%

s: 7,88%

n: 7,01%

d: 6,87%

r: 4,94%

u: 4,80%

i: 4,15%

t: 3,31%

c: 2,92%

p: 2,77% m: 2,12% y: 1,54%

q: 1,53%

b: 0,92%

h: 0,89%

g: 0,73%

f: 0,52%

v: 0,39%

j: 0,30%

x: 0,06%

k: 0,01%

w: 0,01%

: 0,29%

z: 0,15%

Tabla 2. Frecuencia de uso de las letras en el castellano en porcentaje.

Criptografa.
La criptologa se compone de dos ciencias contrapuestas, la criptografa y el criptoanlisis.
La primera es la encargada de cifrar los mensajes y convertirlos en criptogramas. A la hora
de cifrar un mensaje podemos hacerlo mediante un algoritmo de encriptacin secreto o de
un algoritmo pblico ms una clave secreta. La opcin ms utilizada es esta ltima,
fundamentalmente porque es ms sencillo y seguro transmitir una clave que un algoritmo,
al tiempo que en los sistemas abiertos (Internet por ejemplo) los algoritmos no deben ser
secretos. As, la seguridad del criptograma depende fundamentalmente de las claves
empleadas.
Frente a los mtodos sencillos de encriptacin, como son los de sustitucin o transposicin,
se encuentran los cifrados mediante clave, que a su vez se pueden dividir en simtricos, o
de clave secreta, y asimtricos, o de clave pblica.
La criptografa de clave secreta es la ms antigua, y utiliza una misma clave para encriptar
y desencriptar, garantizando la confidencialidad pero no la autenticacin. Los cifrados
simtricos se pueden dividir en dos tipos, los cifrados de flujo y los cifrados en bloque. Los
ltimos son lo ms utilizados, y los ms conocidos son:

DES (Data Encryption Standard). El ms utilizado desde hace 20 aos. Usa una
clave de 56 bits. Existe el Triple DES con claves de 128 bits.
IDEA (Internacional Data Encryption Algorithm) de 1990.
RC5, empleado por el navegador de Internet Nestcape.

En los encriptadores de clave pblica o simtrica se utilizan claves distintas para encriptar y
desencriptar, mediante una clave pblica conocida por todos y una clave privada slo
conocida por cada usuario. Su principal virtud radica en la imposibilidad computacional de
obtener la clave privada a partir de la clave pblica. Estn basados en funciones
matemticas tales como la potencia y el logaritmo. La clave privada y la pblica estn
relacionadas matemticamente y se generan conjuntamente. En los sistemas de criptografa
de clave asimtrica, se define una clave de cifrado (clave pblica) K que determina la
funcin TK y una clave de descifrado (clave secreta o privada) que permite el clculo de la
inversa (TK)-1. El conjunto de enteros mod p, siendo p un nmero primo y sus operaciones
aritmticas forman lo que se conoce como Campo de Galois y es de particular inters
porque permite la creacin de algoritmos de cifrado y descifrado sencillos y eficientes.
Dependiendo de la tcnica a utilizar podemos as garantizar:

Confidencialidad: El emisor encripta con la clave pblica del receptor y ste lo


desencripta con su clave privada.
Autenticacin: Se encripta el mensaje, o un resumen del mismo, mediante la clave
privada del emisor, por lo que mediante su clave pblica es posible comprobar que
es el verdadero emisor.
Firma digital: Como el anterior, pero encriptamos el resumen del mensaje, con lo
que se garantiza adems el contenido del mismo.

Los algoritmos ms utilizados para este tipo de sistemas son RSA (Rivest, Shamir y
Adleman), El Gamal y DSS (Digital Signature Standard), ste ltimo para la firma digital.
Mientras el sistema de El Gamal se basa en el problema del logaritmo discreto, el sistema
RSA lo hace en el hecho de que no existe una forma eficiente de factorizar nmeros que
sean productos de dos grandes primos; han sido adoptados como estndares de seguridad
por organismos internacionales y son de gran difusin. El algoritmo RSA (Rivest, Shamir y
Adleman) es usado por el software gratuito PGP (Pretty Good Privacy).
Criptografa de clave simtrica

Se emplea una sola clave para cifrar y descifrar el mensaje.


Su ventaja ms significativa es su velocidad, lo cual la hace apropiada para el
cifrado de grandes cantidades de datos.
Su inconveniente es la seguridad, ya que la clave debe ser distribuida.

Criptografa de clave asimtrica

Se caracterizan por utilizar una pareja de claves creadas mediante mtodos


matemticos complejos.
Clave privada, que ser custodiada por su propietario.
Clave pblica, que ser conocida por todos los usuarios.
Son complementarias entre s; lo que cifra una slo puede descifrarlo la otra y
viceversa.

DESARROLLO DEL PROYECTO

Figura 3. Esquema fsico.

Diagrama de bloques.

Figura 4. Diagrama de bloques modulo de transmisin.

Figura 5. Diagrama de bloques modulo de recepcin.

Codificacin en la fuente.
La obtencin de la probabilidad de ocurrencia de cada letra se realiz por medio del conteo
de caracteres con ayuda de Word office, dentro de un texto de 184.712 caracteres.
El cdigo de fuente se obtuvo por cdigo Huffman.

CARCTER
ESPACIO
E
A
O
S
N
R
I
L
U
D
T
C
M
P
Q
B
,
V
G
H
Y
.
F

Z
:

x
;
k

PROBABILIDAD
0.17821
0.11203
0.086843
0.076032
0.064668
0.053884
0.052942
0.045547
0.040463
0.03657
0.035417
0.035163
0.031189
0.027123
0.022695
0.013199
0.01099
0.010411
0.0083427
0.0081857
0.0078067
0.0076714
0.005717
0.0046288
0.0040929
0.0038763
0.0031346
0.0029451
0.0028856
0.0024741
0.0014726
0.0012073
0.0007417
0.00064425
0.00044935
0.00022738
0.000064966
0.0000487245

CDIGO
000
100
111
0011
0110
1010
1011
1101
00101
01000
01001
01010
01110
01111
11001
110001
0010001
0010010
0101100
0101101
0101111
1100000
00100001
00100110
01011100
01011101
11000010
11000011
001000000
001001110
0010000010
0010011110
00100000110
00100000111
00100111110
001001111110
0010011111110
0010011111111

Tabla 3. Probabilidad de cada letra y cdigo a Huffman.

Cifrado.

Ver archivo anexo. (Cifrado.xls)


Programa.
Cdigo fuente.
Interfaz grafica.
Ver carpeta anexa. (Programa)

BIBLIOGRAFA

FOROUZAN, Behrouz A. Transmisin de datos y redes de comunicaciones. 2da


Edicin. Ed. MacGraw-Hill. 2001.
BATES, Bud. y DONALD, Gregory. Voice and data comunications handbook. Ed.
MacGraw-Hill. 1996.
McCLIMANS, Fred J. Comunications Wiring and Interconections. Ed. MacGrawHill. 1992.

Anda mungkin juga menyukai