Anda di halaman 1dari 7

LECTURA DE INVESTIGACION

CRISTIAN GIL

UNIVERSIDAD MANURLA BELTRAN


AUDITORIA Y CONTROL CORPORATIVO Y EMPRESARIAL
ESPECIALIZACIÓN EN AUDITORA DE SITEMAS
BUCARAMANGA
2019
LECTURA

CRISTIAN GIL

The case for sampling on very large file systems

Mario Fernando Mayorga


Magister en E-Learning y tecnologías educativas

UNIVERSIDAD MANURLA BELTRAN


AUDITORIA Y CONTROL CORPORATIVO Y EMPRESARIAL
ESPECIALIZACIÓN EN AUDITORA DE SISTEMAS
BUCARAMANGA
2019
EL CASO PARA EL MUESTREO EN SISTEMAS DE ARCHIVOS MUY
GRANDES

El análisis de muestreo principalmente se ejecuta en dicho entorno, presentando


retos técnicos que hacen que todo el muestreo no sea beneficioso, con este uso se
obtienen estadísticas significativas y precisas, es abundante en muchos aspectos
de nuestra vida y se ha utilizado de forma metódica durante al menos dos siglos, en
este caso abordaremos varios aspectos.

Aspecto técnico: implementa algoritmos que realmente realizan toma de muestras


con un mínimo gasto, produciendo una interfaz general que se puede llamar en
cualquier recorrido de los metadatos.

Identificación de los datos: se usa para que el muestro en realidad sea beneficioso,
incluyen proceso que requieren la inspección de los datos.

Aplicación analítica: es una función donde se puede calcular una pequeña muestra
del conjunto de datos.

Muestreo: el proceso de muestreo probable implica literal todos los elementos en el


conjunto de datos.

Análisis de ine fi de fi distribuciones de sistemas: complementa cualquier


acercamiento rápido de desplazamiento mediante la creación de un corto, a partir
del cual se puede reducir numerosas estadísticas.

El muestreo ha sido durante mucho tiempo una herramienta central en las


estadísticas, el objetivo principal de este trabajo es apoyar la estimación sobre un
gran conjunto de datos, por tanto, es claro que los archivos se deben tomar
muestras de acuerdo a su capacidad para garantizar la analítica del sonido, dado
que el proceso de muestreo es parte de una interacción sobre fi y aceptar un
expediente a la vez, si el expediente debe o no, debe ser incluida en la muestra,
nuestra primera técnica de fi hace una etapa de preprocesamiento que recoge las
posiciones aleatorias para la muestra, en pocas palabras el procedimiento que todo
el sentimiento fi como un fi en el espacio secuencial que abarca el intervalo 1 y w,
dado que la distribución esta bien definida y bastante simple, la selección de un
subconjunto aleatorio de archivos a partir de una colección dado es un ejercicio de
programación bastante sencillo.

Un ejemplo es la auditoria que requiere una computacional pesada, el muestreo


siempre ha desempeñado un papel clave en la auditoria, y por ejemplo la
comprobación de que el contenido de tv de cierto tipos (anuncios )no excedan un
cierto porcentaje de tiempo de emisión puede ser difícil de lograr de forma
exhaustivas y puede beneficiarse en gran medida del muestreo, en muchos casos
se puede recoger una lista relativamente corta de muestra de archivos
proporcionando resultados precisos demostrables, pero sin requerir un recorrido
adicional del conjunto de datos.

La interfaz proporciona el proceso de muestreo que debe intercalar con un recorrido


completo del conjunto de dato de la mano, en general se espera que el tiempo para
ejecutar el recorrido domina el proceso de muestreo, sin embargo, se intenta que la
cabeza del proceso de muestreo sea tan mínima como sea posible, la filosofía se
aplica para los principales recursos de la memoria y de la CPU. Otras
consideraciones dignas de nota incluyen.

Aleatoriedad: la elección de una distribución aleatoria naturalmente requiere el uso


de generación, si bien esto es un recurso pesado, se observa que se trata de una
limitación de uno cuando varios procesos se ejecutan.

Multiprocesos: es habilitar crucial para la mejora de recorridos de directorio por lo


tanto el apoyo a múltiples hilos es una necesidad.

Conciencia: es crucial que el componente de muestreo (o de análisis) se obtendrá


de extenso uso de memoria para evitar el desalojo de tales datos útiles a partir de
la memoria cache ,esto es crucial para la elaboración justo, ya que se observa una
mejora mucho más dramática en el tiempo de ejecución puede caer por debajo de
un minuto, si bien esto esta fuera de control cuando se ejecuta una travesía en la
máquina de un tercero, que nos da una comprensión de los resultados de la
fluctuante que vemos en tiempo de funcionamiento. Este proceso resulta en una
distribución que es idéntica a la del algoritmo básico de muestreo.

Entorno de pruebas y datos: se implementa un recorrido de directorio distribuido con


algunas optimizaciones de memoria para la manipulación a gran escala atraviesa
una herramienta de estimulación de comprensión.

Impresiones fs.: le reside en un controlador de almacenamiento de la empresa de


gama media conectando a la silla por canal de fibra.

Repositorio del proyecto: los datos residen en un sistema de fi le agrupado y se


accede a Trávez de NFS se compone de tres diferentes puntos de montaje de
diferentes tamaños.

Colección de comprensión: los distintos tipos de datos utilizados para productos


relacionados con la compresión de referencia, reside en un sistema le fi y accede a
través de NFS.

Evaluación del proceso de muestreo: ejecuta al aumentar el numero de hilos y


vemos una mejora constante en el tiempo que se equilibra alrededor de 32 hilos y
vemos una mejora constante en el tiempo que se equilibra en alrededor de 32 hilos
de ejecución.

Comprensión estimación: para ello se implementa un proceso que toma como


entrada una muestra de archivos, al final el proceso vuelve a la relación media de
comprensión en todos los trozos que comprimido.

Evaluación de la o fi ine análisis de caso de uso: en esta sección se muestra


mecanismos de muestreo con herramientas de poca memoria y recursos de fi ine
herramientas de análisis de la comprensión de las tendencias y distribuciones
dentro del sistema fi.

Otra prueba aprender las relaciones de comprensión de cada uno de estos tipos de
expedientes separado. Mientas un expediente tipo era bastante popular, tenemos
suficientes tipos muestreo para mostrar garantías sobre la exactitud de la cifra de
comprensión que atribuimos a la misma.

En este trabajo basamos exploramos aplicaciones de estimaciones basadas en el


muestreo en el dominio del sistema El método de muestreo de trabajo es una
herramienta que permite al analista de estudio de tiempos y métodos obtener los
datos de manera más fácil y rápido.

El muestreo de trabajo es útil para determinar la cantidad de tiempo que puede ser
concedida por retrasos inevitables, suspensión del trabajo etc.

Se dice que el muestreo de trabajo computarizado llegará a ser un método de


trabajo considerablemente extendido para descubrir trabajo improductivo,
asignación desequilibrada de personal, tiempo inactivo, o muerto de máquinas o
instalaciones y áreas con problemas similares.
Toda persona que trabaje en el campo de los métodos, el estudio de tiempos y los
planes de pagos de salario debe estar bien familiarizada con las ventajas,
limitaciones y usos de esta técnica.

para concluir es quel que determina un estudio de una población, al igual las
técnicas selectivas que se requieren para dicho estudio de acuerdo a lo que se va
a evaluar. Esto permite una reducción considerable de los costos materiales del
estudio, una mayor rapidez en la obtención de la información y el logro de resultados
con máxima calidad. Como Una muestra aleatoria simple es aquella muestra en la
que se seleccionan individuos del universo de forma totalmente aleatoria. Esto
implica que todos los individuos deben tener idéntica probabilidad (no nula) de ser
seleccionados en mi muestra.

Pero una cosa es la teoría y otra la práctica. Sólo en entornos muy controlados es
posible hacer muestras aleatorias. Por otra parte, cuando tenemos universos
compuestos por grupos homogéneos (entre si) de personas, podemos aprovechar
esta agrupación para mejorar la calidad de mi muestra (o reducir el tamaño de la
misma).

Referencias:

The Case for Sampling on Very Large File Systems, George Goldberg, Danny Harnik,
Dmitry Sotnikov, IBM Research–Haifa, {georgeg, dannyh,dmitrys}@il.ibm.com

Anda mungkin juga menyukai