lunes, 14 de septiembre de 2020

SISTEMAS DE ARCHIVOS QUE SE UTILIZA PARA EL ALMACENAMIENTO EN LA NUBE


Un sistema de archivos en la nube es un sistema de almacenamiento jerárquico que proporciona acceso compartido a los datos de archivos. Los usuarios pueden crear, eliminar, modificar, leer y escribir archivos, además de organizarlos de manera lógica en árboles de directorios para lograr un acceso intuitivo. Los sistemas de archivos que utilizan los sistemas de almacenamiento en la nube son los siguientes:

1. GlusterFS: Es un sistema de ficheros diseñado para la nube que puede ser escalable y distribuido permitiendo añadir recursos de almacenamiento desde distintos orígenes bajo un mismo espacio de nombres.

GlusterFS empezó siendo un sistema de almacenamiento clásico, basado en archivos. Más tarde pasó a ser orientado a objetos y al hacer el cambio se le dio una especial importancia a que pudiese integrarse adecuadamente en la conocida solución de código abierto OpenStack. En un segundo plano, GlusterFS sigue trabajando con archivos: a cada archivo se le asigna un objeto y la conexión entre ellos se establece mediante hardlinks en el sistema de archivos. De cara al usuario, no se muestra ningún servidor dedicado, sino que él o ella dispone de sus propias interfaces para guardar sus datos en GlusterFS, que se presenta como un único sistema. 

2. HDFS: Hadoop Distributed File System es un sistema distribuido basado en Java que permite obtener una visión de los recursos como una sola unidad. Para ello crea una capa de abstracción como un sistema de ficheros único. HDFS se encarga de almacenar los datos en varios nodos manteniendo sus metadatos. Distribuir los datos en varios nodos de almacenamiento aumenta la velocidad de procesamiento, el paralelismo en las operaciones y permite la replicación de los datos.

Está basado en la idea de que mover el procesamiento es mucho más rápido, fácil y eficiente que mover grandes cantidades de datos, que pueden producir altas latencias y congestión en la red. HDFS proporciona a las aplicaciones la capacidad de acceder a los datos en el lugar en el que se encuentren almacenados. 

3. Ceph – FS: Ceph File System es un sistema de archivos distribuido libre, está diseñado para el uso con gran cantidad de datos, está muy enfocado para el uso con Big Data. Ceph tiene como objetivo ser POSIX-compatible y completamente distribuido sin ningún punto de fallo. Los datos tienen replicación libre de errores, haciéndolo tolerante a fallos. 

Todos los componentes funcionan de manera descentralizada. Todos los OSD (Object Based Storage Device, es decir, los dispositivos de almacenamiento de objetos) tienen los mismos derechos. De esta forma, se pueden conectar entre sí tantos servidores como se quiera, con sus diferentes discos duros, para formar un sistema de almacenamiento unificado. 

4. GooFS: Google File System es un sistema de archivos distribuido que soporta toda su infraestructura informática de procesamiento de información en nube. ​ Está especialmente diseñado para proveer eficiencia, fiabilidad de acceso a datos usando sistemas masivos de clúster de procesamiento en paralelo.

5. MAPR-FS: Es un sistema de archivos distribuido, que es la base de la Plataforma Convergente MapR, con capacidades de almacenamiento distribuido de archivos, una base de datos NoSQL con múltiples APIs, y un sistema de transmisión integrado de mensajes. MAPR-FS está optimizado para la escalabilidad, el rendimiento, la fiabilidad y disponibilidad. Su capacidad de almacenamiento de archivos es compatible con la API de Apache Hadoop Distributed File System (HDFS) pero con varias características de diseño que lo distinguen de HDFS. Entre las diferencias más notables son que MAPR-FS es un sistema de archivos / escritura leído completamente con los metadatos de los archivos y directorios distribuidos en el espacio de nombres, así que no hay NameNode.

6. BeeGFS: Es el sistema de archivos paralelo de alto rendimiento desde el Centro de Competencia de Fraunhofer para la computación de alto rendimiento. La arquitectura de metadatos distribuida de BeeGFS ha sido diseñado para proporcionar la escalabilidad y la flexibilidad necesaria para ejecutar HPC y aplicaciones similares con altas demandas de E/S.

7. PVFS: El sistema de archivos virtual paralelo es un sistema de archivos paralelo de código abierto. Un sistema de archivos paralelo es un tipo de sistema de archivos distribuido que distribuye datos de archivos a través de varios servidores y proporciona acceso simultáneo mediante múltiples tareas de una aplicación paralela.

PVFS consta de 4 componentes principales y varios programas de utilidad. Los componentes son PVFS2-server, pvfslib, PVFS-client-core y el módulo de núcleo PVFS. Las utilidades incluyen la herramienta de administración de karma, utilidades como pvfs-ping, pvfs-ls, pvfs-cp, etc. que operan directamente en el sistema de archivos sin usar el módulo del kernel (principalmente para mantenimiento y pruebas). Otro punto clave del diseño es el protocolo PVFS que describe los mensajes que se pasan entre el cliente y el servidor, aunque esto no es estrictamente un componente. 

8. Lustre-FS: Sistema de archivos de código abierto que ofrece latencias inferiores a milisegundos, hasta cientos de gigabytes por segundo de rendimiento y millones de IOPS. Ofrece múltiples opciones de implementación y tipos de almacenamiento para optimizar el costo y el rendimiento para sus requisitos de carga de trabajo. 

Referencias

·       Andrew, S., & Maarten, V. S. (2006). Distribuidos principios de los sistemas y paradigmas.
·       Aprender BIG DATA. (20 de Julio de 2020). Aprender BIG DATA. Obtenido de https://aprenderbigdata.com/hdfs/
·       IONOS. (28 de Julio de 2020). Digital Guide IONOS. Recuperado el 13 de Septiembre de 2020, de https://www.ionos.es/digitalguide/servidores/know-how/glusterfs-vs-ceph/
·       WIKIPEDIA. (2018). WIKIPEDIA. Recuperado el 13 de Septiembre de 2020, de Enciclopedia Libre: https://es.qwe.wiki/wiki/Distributed_file_system_for_cloud#Google_file_system
·       Zonadam. (2019). Zonadam. Recuperado el 13 de Septiembre de 2020, de https://zonadam.com/glusterfs-sistema-de-almacenamiento-distribuido/

 

FILOSOFÍA DE SISTEMAS

Según lo indicado por (Arnold Cathalifaud & Osorio, 1998) donde tuvo en cuenta la definición proporcionada por Bertalanffy, la filoso...