Diferencia entre RDBMS y Hadoop

La principal clave entre RDBMS y Hadoop es que el RDBMS almacena datos estructurados, mientras que Hadoop almacena datos estructurados, semiestructurados y no estructurados.

El RDBMS es un sistema de gestión de bases de datos basado en el modelo relacional. Hadoop es un software para almacenar datos y ejecutar aplicaciones en grupos de hardware básico.

Índice
  1. ¿Qué es RDBMS?
  2. ¿Qué es Hadoop?
  3. ¿Cuál es la diferencia entre RDBMS y Hadoop?
    1. RDBMS frente a Hadoop
  4. Resumen: RDBMS frente a Hadoop

¿Qué es RDBMS?

RDBMS significa Sistema de gestión de bases de datos relacionales basado en el modelo relacional. En el RDBMS, las tablas se utilizan para almacenar datos y las claves y los índices ayudan a conectar las tablas. Una tabla es una colección de elementos de datos, y ellos son las entidades. Contiene filas y columnas. Las filas representan una sola entrada en la tabla. Las columnas representan los atributos.

Por ejemplo, la base de datos de ventas puede tener entidades de productos y clientes. El cliente puede tener atributos como customer_id, name, address, phone_no. El artículo puede tener atributos como product_id, nombre, etc. La clave principal de la tabla de clientes es customer_id, mientras que la clave principal de la tabla de productos es product_id. Colocar product_id en la tabla de clientes como clave externa conecta estas dos entidades. Asimismo, las tablas también están relacionadas entre sí. Proporcionan integridad de datos, normalización y mucho más. Algunos de los RDBMS comunes son MySQL, MSSQL y Oracle. Utilizan SQL para realizar consultas.

¿Qué es Hadoop?

Hadoop es un marco de código abierto de Apache escrito en Java. Ayuda a almacenar y procesar una gran cantidad de datos en grupos de computadoras utilizando modelos de programación simples. El objetivo principal de Hadoop es almacenar y procesar Big Data, que se refiere a una gran cantidad de datos complejos. El rendimiento de Hadoop, que es la capacidad de procesar un volumen de datos en un período de tiempo determinado, es alto.

Te puede interesar   Diferencia entre soltar y truncar

Hay cuatro módulos en la arquitectura de Hadoop. Son Hadoop common, YARN, Hadoop Distributed File System (HDFS) y Hadoop MapReduce. El módulo común contiene las bibliotecas y utilidades de Java. También tiene los archivos para iniciar Hadoop. Hadoop YARN realiza la programación de trabajos y la gestión de recursos del clúster.

Además, el sistema de archivos distribuidos de Hadoop (HDFS) es el sistema de almacenamiento de Hadoop. Utiliza la arquitectura maestro-esclavo. El nodo maestro es NameNode y administra los metadatos del sistema de archivos. Otras computadoras son nodos esclavos o DataNodes. Almacenan los datos reales. Por otro lado, Hadoop MapReduce realiza el cálculo distribuido. Tiene los algoritmos para procesar los datos. En el HDFS, el nodo maestro tiene un rastreador de trabajos. Ejecuta map reduce trabajos en los nodos esclavos. Hay un rastreador de tareas para cada nodo esclavo para completar el procesamiento de datos y enviar el resultado al nodo maestro. En general, Hadoop proporciona un almacenamiento masivo de datos con un alto poder de procesamiento.

¿Cuál es la diferencia entre RDBMS y Hadoop?

RDBMS frente a Hadoop

RDBMS es un software de sistema para crear y administrar bases de datos que se basan en el modelo relacional. Hadoop es una colección de software de código abierto que conecta muchas computadoras para resolver problemas que involucran una gran cantidad de datos y computación.
Variedad de datos
RDBMS almacena datos estructurados. Hadoop almacena datos estructurados, semiestructurados y no estructurados.
Almacenamiento de datos
RDBMS almacena una cantidad promedio de datos. Hadoop almacena una gran cantidad de datos que RDBMS.
Velocidad
En RDBMS, las lecturas son rápidas. En Hadoop, las lecturas y escrituras son rápidas.
Escalabilidad
RDBMS tiene escalabilidad vertical. Hadoop tiene escalabilidad horizontal.
Hardware
RDBMS utiliza servidores de gama alta. Hadoop utiliza hardware básico.
Rendimiento
El rendimiento de RDBMS es mayor. El rendimiento de Hadoop es menor.
Te puede interesar   Diferencia entre cursor explícito y cursor implícito

Resumen: RDBMS frente a Hadoop

Este artículo discutió la diferencia entre RDBMS y Hadoop. La diferencia clave entre RDBMS y Hadoop es que RDBMS almacena datos estructurados, mientras que Hadoop almacena datos estructurados, semiestructurados y no estructurados.

Referencia:

1.Punto de Tutoriales. "Conceptos de SQL RDBMS". , Punto de tutoriales8 de enero de 2018. Disponible aquí
2.Punto de Tutoriales. “Tutorial de Hadoop”. , Punto de tutoriales8 de enero de 2018. Disponible aquí

Imagen de cortesía:

1. '8552968000' de Intel Free Press (CC BY-SA 2.0) a través de Flickr

Si quieres conocer otros artículos parecidos a Diferencia entre RDBMS y Hadoop puedes visitar la categoría Base de datos.

Elis

Elisa Montero es licenciada en Ciencias Biología, tiene un máster en Microbiología Molecular y Aplicada y un doctorado en Microbiología Aplicada. Sus intereses de investigación incluyen los biofertilizantes, las interacciones planta-microbio, la microbiología molecular, los hongos del suelo y la ecología fúngica.

Entradas Relacionadas

Subir

Si continúas navegando por esta web, entendemos que aceptas las cookies que usamos para mejorar nuestros servicios. Más información