Articles guardats
Big Data, dues paraules imprescindibles?

Actualitat Banca digital

Big Data, dues paraules imprescindibles?

Fa temps que el terme big data va començar a circular i es van començar a celebrar esdeveniments en els quals s’explicava i es presumia de tots els seus avantatges. Des d’aquell moment, el big data era moda. Se li han dedicat congressos, s’ha convertit en un element diferenciador i d’èxit per a les empreses que l’adoptin.

La indústria de les empreses tecnològiques (programari, maquinari, serveis) necessita cada poc temps aportar nous termes i conceptes. Necessita noves modes que permetin argumentar les seves inversions en R+D, modes que també han de permetre als grans bancs i empreses justificar la ingent quantitat de milions que s’hi gasten (encara que no es tingui gaire clar per a què).

Sense menysprear, en cap moment, la tecnologia que hi ha darrere de tots aquests termes i els avantatges que ens poden aportar, què és realment el big data?

En essència, el big data analitza i creua enormes quantitats de dades per detectar nous patrons de consum o identificar noves oportunitats de negoci.

Per exemple, he llegit: “Gràcies al big data, una cadena de supermercats era capaç de fer una segmentació dels seus clients partint de l’històric de compra en les diferents botigues, o que una empresa de telecomunicacions podia saber per quines zones d’una ciutat es mouen els turistes”. Realment aquest és el benefici que li trobem al big data? Això no és nou.

Fa anys que s’analitzen les dades, que les empreses segmenten els seus clients partint de l’històric de compres. El que és nou és la capacitat de les computadores que s’hi utilitzen i l’abaratiment de l’espai en disc (necessari per a l’emmagatzematge d’aquestes dades).

És nou el big data?

No podem negar que han aparegut problemes nous: més quantitat de dades, formats diferents, donar resposta a preguntes en temps real, etc. La indústria del màrqueting hi ha hagut d’inventar noms, com al seu dia es va fer amb Prolog, Corba, SOA, Programació Orientada a Objectes, Servlets…

Les “grans” novetats del big data fa anys que estan inventades: per al volum, les bases de dades distribuïdes, que daten de la dècada dels 80 i el seu boom a finals dels 90; per a la velocitat, s’utilitzen sistemes computacionals distribuïts, els fonaments dels quals ja van sorgir els anys 70; i per a l’anàlisi, les estratègies de Business Ingelligence es remunten els anys 80, amb la seva eclosió al final del segle XX.

Com veiem, no hi ha solucions noves, el que hi ha és una nova tecnologia que ajuda a desenvolupar aquestes solucions de manera més fàcil, eficient i, sobretot, econòmica. Ningú no discuteix que el volum de dades que actualment s’analitza és més gran que mai, però és realment un nou desafiament?

En la dècada de 1880, Herman Hollerith, que treballava a l’Oficina del Cens dels Estats Units dedicat al processament dels registres del cens que es feia cada deu anys, es va enfrontar al desafiament de tabular milions de registres censals i va inventar un sistema electromecànic utilitzant targetes perforades. Les targetes eren essencialment un sistema d’emmagatzematge per a un gran conjunt de dades. La companyia que Hollerith va crear es va convertir en la IBM d’avui. Com veiem, el volum de dades no és un desafiament actual.

Per què no està el big data més estès?

Actualment, la major part de les grans companyies estan en la fase inicial del big data: recopilen la informació i l’emmagatzemen, però saben com explotar-la? Si la necessitat del big data és tan gran per tal que les empreses facin els seus negocis, per què encara no el dominen les grans companyies? Segons es va publicar a Expansión:

  • És nou.
  • N’escassegen els casos d’ús i el coneixement per a la seva explotació.
  • La difícil “governança” de les dades, determinar qui pot accedir a la informació, gestionar la privacitat i els nivells de seguretat que cal aplicar en cada cas.

Segons estimacions de Paradigma, una de cada cinc empreses espanyoles ha posposat, durant l’últim any, algun projecte que incorporava l’ús de tecnologies de big data pel desconeixement legal sobre l’ús i tractament de dades personals.

Avui dia és difícil llegir una publicació (que es preï, clar) sense la paraula big data escrita fins a la sacietat. Tothom en parla -i no falta raó-, ja que hi ha una relació simple: les dades que es processen es converteixen en informació, quan la informació s’analitza es converteix en coneixement, i el coneixement, quan s’hi aplica, es converteix en intel·ligència.

Comercialment, el missatge és directe: a mesura que es recopilen més i més dades, hi ha l’oportunitat de generar més intel·ligència, que millorarà les mesures d’èxit de l’organització. Realment és així de simple?

La recopilació de totes aquestes dades em desperta certs dubtes:

  1. Com gestionar la privacitat de tota aquesta informació.
  2. Aquests enormes repositoris de dades, que gradualment tindran un enorme valor per a les organitzacions, no es convertiran en un objectiu per als lladres?
  3. Un executiu d’un gran banc va publicar recentment que, a causa del creixement de les dades que generen, més del 80 % del seu pressupost de tecnologia el 2019 va ser invertit en emmagatzematge. Va expressar: “He de posar-ho en algun lloc!”. Aquesta afirmació em porta a una reflexió: el guanyador clar en tot això no és la indústria de l’emmagatzematge de dades?

Fins avui, la metodologia que s’aplicava a la ciència consistia a establir una hipòtesi primer i després es validava (contrastar amb la realitat si responia al seu model). L’arribada del big data n’ha canviat el paradigma: la revolució ve perquè els algoritmes generen les hipòtesis a posteriori i es queden amb la millor.

Com s’arriba a aquesta conclusió no s’explica, és una caixa negra. Per exemple, en la detecció de frau en targetes és complicat raonar el per què s’assenyalen determinades operacions com a sospitoses, el que és important és encertar i que quan sigui un frau se’n denegui el càrrec.

Arribats en aquest punt ens hem de preguntar: és important el “per què”?; com a bon directiu, necessito saber per què pugen les meves vendes?; quin és el motiu pel qual se’n van els clients o la raó per la qual un determinat producte no funciona?; em cal conèixer com es prenen aquestes decisions o amb encertar el resultat ja en tinc prou? Ens ho hem de plantejar, decidir si simplement m’importen les conclusions finals i acceptar-ho.

No et perdis la continuació de l’article sobre Big data fent clic aquí.