)
Si el resultado es por ejemplo 9 y se usan 16 bits para representarlo, entonces quiere decir
que 7 bits pueden ser utilizados para representar la parte fraccional. La precisin de tal
representacin est dada por:
(
)
En el caso en el que nicamente nos interesan los nmeros fraccionales (0,B) entonces se
multiplica al nmero que se desea representar por
. La diferencia entre el
nmero almacenado y el requerido es substancial por lo que puede traer error inaceptable
en el clculo.
Reglas para punto flotante.
Para realizar una suma, resta o divisin, el punto decimal de ambos nmero debe de estar
alineado de lo contrario (x,y) se debe arreglar el nmero para que quede en este formato.
Para ello se puede multiplicar el nmero con ms bits de entero por
o dividir el nmero
con el entero ms pequeo por
Los dos nmeros que se sumaran son 60052 y 40029. Sin embargo, antes de sumarlos se
debe alinear el punto decimal. Para ello se escala al nmero con ms bits de entero. 9,7 por
un factor
.
40029x
=80058
Entonces si se puede realizar la suma (140110) y representa a 547.3046875 en un formato
de 10,8 (
).
La multiplicacin no requiere del alineamiento x(a,b)*y(c,d) da como resultado una parte
entera de a+c y una parte fraccional de b+d. La divisin puede ser implementada como la
multiplicacin de uno por el reciproco de otro.
Cuestiones de sobreflujo.
Cuando se implementa un algoritmo, el resultado no debe ser ms grande de lo que es
capaz de almacenar. De lo contrario ocurre sobreflujo, el resultado almacenado ser
incorrecto y los bits ms significativos se perderan. Para evitarlo hay que determinar el
valor mximo que resulta de la operacin y usar la ecuacin para determinar el tamao del
registro requerido.