Dades massives: cinc conceptes fonamentals sobre Big Data

Tiempo de lectura: 2 minutos

Fa uns mesos vam explicar-te què és el Big Data, quins són els seus usos i com es pot classificar. També et vam presentar les anomenades ‘4Vs’ (volum, velocitat, varietat i veracitat). En aquest post, anirem una mica més enllà i aprofundirem en alguns conceptes fonamentals per entendre com funciona el Big Data.

1. Tecnologies Big Data

Per poder processar i analitzar grans quantitats de dades és necessari programari lliure. Hi ha moltes eines, però la majoria es basen en el Hadoop Distributed File System (HDFS), un sistema d’arxius distribuït, escalable i portàtil.

El HDFS està escrit en Java per a Hadoop, un framework que permet a les aplicacions treballar amb milers de nodes i petabytes de dades.

2. Real Time o Fast Data

Per Real Time o Fast Data entenem la capacitat d’obtenir dades en temps real, és a dir, al mateix temps que es generen. La transmissió d’informació es produeix a milers de vegades per segon.

A més de l’alta freqüència en l’entrada de dades, el Fast Data també té a veure amb la capacitat de processar aquestes dades i de prendre decisions en base a aquestes en el menor temps possible.

3. Bases de dades NoSQL

El NoSQL (“no només SQL”) engloba una gran classe de sistemes de gestió de bases de dades que es caracteritzen perquè no requereixen estructures fixes com ara taules. Per contra, es basen en altres sistemes d’emmagatzematge com clau-valor, mapatge de columnes o grafs.

A diferència dels models tradicionals d’emmagatzematge d’informació, el NoSQL permet gestionar un major volum de dades i evita que es generin colls d’ampolla. A més, no requereix gaire computació i per això estalvia costos en maquinària.

4. Data Analytics

Una part fonamental del treball amb dades massives és el Data Analytics, el procés d’examinar sèries de dades amb l’objectiu de treure conclusions sobre la informació que contenen.

Les analítiques permeten a les empreses personalitzar els seus serveis o productes. En conseqüència, el Data Analytics ha accelerat el temps de decisió a les empreses, a més de facilitar-los l’estratègia comercial.

5. Cloud Computing

El Cloud és un sector clau per treballar amb Big Data, ja que permet processar grans volums d’informació. A més, es tracta d’un sistema de gran rendiment que no requereix la instal·lació de maquinari específic.

El Cloud Computing és, en definitiva, un sistema barat, ràpid, còmode, accessible i segur, al que cada vegada més empreses recorren. Es preveu que al 2019 gairebé el 100% de les companyies adquiriran dades provinents del núvol relacionades amb el seu negoci.

Trobes a faltar algun concepte important relacionat amb el Big Data? Deixa’ns el teu comentari, estarem encantats de rebre les teves aportacions.