¡Te doy la bienvenida!

En esta nueva lección analizaremos lo tipos de datos, las fuentes de dónde son obtenidos, así como su estructura.

¿Actualmente te has preguntado cuáles consideras que deben ser los tipos de datos válidos para el Big Data?

Hoy en día, las fuentes de donde podemos obtener datos pueden ser tan variadas que no debemos limitarnos a un tipo de dato en particular. La idea entonces es poseer la habilidad de conjuntar datos, limpiarlos y pulirlos, para que después sean manipulados en un contexto único. Para ello, es importante determinar qué tipo y origen de datos estamos manipulando.
Un tipo de dato es la más básica y común clasificación de un dato. Existen varios de ellos, en este espacio te mencionaré algunos:

¿Cuáles son los tipos de dato según su estructura?

Estructurados: Son aquellos que ya han sido organizados dentro de un repositorio con un formato (o estructura) predeterminada, en la mayoría de los casos consisten en una tabla de una base de datos o una hoja de cálculo, sólo por mencionar algunos ejemplos.

Semiestructurados: Son información que no reside en una estructura pre-formateada como una base de datos, pero que sí contiene propiedades que indican una organización y que pueden hacer de estos datos más fáciles de analizar

No estructurados: No están organizados en un formato o manera predefinida dentro de un modelo de información, es decir, que ninguna de sus propiedades indica una organización especifica.

Pero ¿qué es en sí una estructura de datos?

Es una colección o conjunto de información sobre diferentes tipos de datos. Esta colección organiza sus items, o elementos con respecto a la memoria, y a la manera de acceder a cada uno de los elementos para ejecutar una operación definida.

En conclusión, determinar las fuentes de los datos, así como su tipo, nos permitirá determinar la manera como los manejamos.