HDFS vs. HBase: lo que necesitas saber

Hadoop Distributed File System y Hbase (base de datos Hadoop) son segmentos clave de la comunidad biológica Big Data. Este blog aclara la distinción entre HDFS y HBase con situaciones de uso genuino en las que se adaptan mejor.

El incremento repentino en el volumen de información de la solicitud de gigabytes a zettabytes ha hecho el requisito para un marco de documento más compuesto para la capacidad y el manejo de la información.

La petición que viene de la publicidad de la información ha conseguido Hadoop el proyector que le hace uno de los jugadores más grandes en el negocio.

Hadoop Distributed File System (HDFS), el registro de Hadoop y Hbase (base de datos de Hadoop) son los más actuales y propulsados de almacenamiento de información y los marcos de administración accesibles en el mercado.

 ¿Qué son HDFS y HBase?

HDFS es culpable por el plan y respaldos de intercambio de información rápida entre los hubs, a pesar de decepciones en el marco.

HBase es una base de datos Not-Only-SQL no social y de código abierto que sigue funcionando en la parte superior de Hadoop. HBase pasa bajo la clase CP de CAP (consistencia, disponibilidad y tolerancia de partición).

HDFS es más razonable para realizar el examen de clúster. Sin embargo, una de sus mayores desventajas es su impotencia para realizar un examen continuo, necesidad inclinada del negocio TI.

HBase puede hacer frente a importantes colecciones de información y no es apropiado para la investigación de manojo. Por el contrario, se utiliza para componer / leer información de Hadoop progresivamente.

Tanto HDFS como HBase están equipados para manejar información organizada, semi-organizada y además no organizada. HDFS no tiene un motor de preparación en memoria que respalde el procedimiento de investigación de información; Ya que está utilizando MapReduce viejo llano para hacerlo.

HBase, a pesar de lo que se podría esperar, se regodea en un motor de manejo en memoria que definitivamente amplía la velocidad de lectura / composición.

HDFS es excepcionalmente directo en su ejecución del examen de la información. HBase, nuevamente, siendo una base de datos NoSQL en una organización impensable, obtiene valores al clasificarlos bajo varias estimaciones clave.

Mejora de la comprensión con casos de uso para HDFS y HBase

Caso de uso 1 – Cloudera optimización para el banco europeo utilizando HBase

HBase está en un mundo perfecto para condiciones continuas y esto se puede exhibir mejor referiendo al caso de nuestro cliente, un banco europeo famoso.

Para obtener los bits básicos de conocimiento de los registros de los servidores de aplicaciones / web, hemos ejecutado la disposición en Apache Storm y Apache Hbase juntos.

Dada la inmensa velocidad de la información, decidimos HBase sobre HDFS; Ya que HDFS no refuerza la composición continua. Los resultados fueron abrumadores; Disminuyó el tiempo de la pregunta de 3 días a 3 minutos.

Caso de uso 2 – Solución de análisis para el reproductor global CPG usando HDFS y MapReduce

Con nuestro cliente de bebidas en todo el mundo, el objetivo esencial era realizar una investigación de grupo para recoger los bits de conocimiento del nivel SKU, e incluía cálculos recursivos / sucesivos.

Los sistemas HDFS y MapReduce estaban más calificados que las investigaciones complejas de Hive sobre Hbase. MapReduce se utilizó para la discusión de información y para obtener información lista para la investigación consecuente.

La colmena fue utilizada para la investigación de encargo encima de la información manejada por MapReduce. Los resultados fueron dignos de mención.

Ya que hubo una disminución radical en el tiempo necesario para crear el examen personalizado – 3 días a 3 horas.

Para ofrecer un examen razonable entre HDFS y HBase, los enfoques que lo acompañan deben acentuarse en:

HDFS HBase
 Java-based file system utilizado para almacenar grandes conjuntos de datos. HBase es una base de datos SQL no sólo basada en Java
Arquitectura rígida que no permite cambios. No facilita el almacenamiento dinámico. HBase permite cambios dinámicos y puede ser utilizado para aplicaciones independientes.
Ideal para escribir una vez y leer muchas veces casos de uso HBase es ideal para escribir y leer al azar datos almacenados en HDFS.

 

Contact Us!
Your message was successfully sent!