El lado oscuro del Big Data

Big_data

Hay puestas grandes esperanzas en el Big Data. GE informó en un vídeo online que el Internet Industrial, también conocido como el Internet de las Cosas, nos conducirá a “un mundo más rápido, más seguro, más limpio y más productivo. Será mayor que todo lo realizado con anterioridad”.

Sin embargo, hay también una concienciación creciente de que antes debe lidiar con cuestiones importantes para que esas esperanzas se concreten. Si las cuatro “V” —volumen, velocidad, variedad y verificación— son usadas para definir la naturaleza del Big Data, entonces los cuatro “P” —practicidad, privacidad, poder y privilegio— definirán las dificultades que el Big Data tendrá que resolver en la carrera hacia un futuro sostenible.

Los desafíos prácticos son los que, en general, se resuelven de forma más rápida. La cuestión práctica fundamental que salió a relucir durante el congreso sobre “Sostenibilidad en la Era del Big Data”, patrocinado por la Iniciativa en Liderazgo Global en Medio Ambiente de Wharton (IGEL, en las siglas en inglés) es, irónicamente, la falta de capacidad intelectual.

Según dijo Paul Rogers, director de desarrollo de GE, en su charla final en el congreso de IGEL, “el Big Data existe hoy de una manera muy difícil de comprender”. Ya que buena parte de los datos del Internet Industrial hacen referencia de forma específica a tipos particulares de maquinaria, ellos son inteligibles sólo para los que diseñaron y construyeron los equipos. Es preciso un know-how inmenso para aplicar esos datos a la resolución de problemas y al descubrimiento de eficiencias. Es preciso la experiencia adicional de científicos de la computación y de otros para que se cree un software que haga útiles esos datos para profesionales no especialistas en el futuro.

El problema inmediato es que no hay especialistas suficientes —ingenieros, analistas de Big Data y científicos de la computación— para lidiar con la enorme montaña de datos que va acumulándose de forma rápida. Con el know-how correcto el Big Data se puede usar para aumentar de forma significativa la eficiencia, aumentando tanto la sostenibilidad como el valor comercial. Pero según dijo en el congreso de Wharton Alyssa Farrell, directora de sostenibilidad global de SAS, “para aprovechar las oportunidades, las empresas necesitan tener a su disposición más profesionales de perfil analítico”.

Según Rogers, “la cuestión no es cómo generar más datos, sino saber si la mayor parte de los datos de que disponemos han sido usados para alguna cosa importante. Y la respuesta es no”.

Mark Headd, director de datos de la ciudad de Filadelfia, también habló en el congreso de Wharton. Según Headd, hay otras barreras a la liberación de datos en el mundo real. Buena parte de los datos históricos del Gobierno hoy disponibles, señaló, es incoherente e incompatible con los bancos de datos actuales. “La mayor parte de esos sistemas jamás fueron diseñados para liberar datos fuera del ámbito del Gobierno”, dijo, “por lo tanto es preciso un puente entre el ambiente heredado y el ambiente de datos”.

En el Gobierno, así como en los negocios, las cuestiones relativas a la calidad de los datos suelen enmascarar las cuestiones de control. El hecho de que la información sea almacenada en silos guardados por empleados que no quieren renunciar a ese control hace el trabajo aún más complejo, dijo Headd. Los jefes de departamento, por ejemplo, se resisten con frecuencia a las instrucciones que tienen para liberar los datos de la ciudad bajo el argumento de que ellos no “están filtrados, actualizados o listos para ser liberados”. Según Headd, “vencer la preocupación de que los datos estén desordenados es un obstáculo real, es una cuestión de entropía”.

Otra cuestión práctica: el coste y las dificultades actuales de transmitir grandes volúmenes de datos inalámbricos. El coste debería caer a medida que aumenten las aplicaciones de Big Data y el desarrollo de nuevas tecnologías, pero, de momento, el terabyte de datos generados por los motores a reacción durante el vuelo de una aeronave tienen que ser descargados por un técnico que conecte el sistema de a bordo a computadores en el suelo después de que el avión aterrice. El problema, dice Rogers, es que la “transferencia inalámbrica de datos es extremadamente cara”.

Cuestiones de privacidad
Las cuestiones relativas a la privacidad son bastante conocidas a través de la prensa popular. No suelen faltar informaciones frecuentes sobre la implicación del Gobierno americano en operaciones de vigilancia electrónica a sus propios ciudadanos, así como de gobiernos extranjeros en los supuestamente seguros sistemas del Gobierno y de sus empresas.

New York Times informó de forma reciente que “un grupo criminal ruso se apropió de la mayor cantidad conocida de credenciales de Internet, entre ellas 1.200 millones de combinaciones de nombres y contraseñas de usuarios y de más de 500 millones de direcciones de correo electrónico”. Esto después de que hackers robaran 40 millones de números de tarjetas de crédito de Target, mientras ladrones de datos vietnamitas se apropiaron de “200 millones de datos personales, inclusive de los números de la seguridad social, datos de tarjetas de crédito e informaciones de cuentas bancarias de Court Ventures, una empresa que pertenece actualmente a la firma de corretaje de datos Experian”.

Privacidad y seguridad son también preocupaciones del mundo de la sostenibilidad. David Parker, vicepresidente de Big Data de SAP, dijo en el congreso de Wharton: “Es obvio que la privacidad de datos es la principal preocupación, y la acción de compartir el Big Data puede ser realizada en beneficio del bien común, o con intenciones equivocadas”. Parker dijo que el lobby que SAP hace con los órganos reguladores del Gobierno tiene como objetivo permitir un acceso mayor a los datos y a su utilización, pero con la comprensión de que es preciso establecer límites.

Posibles abusos
El Big Data tiene fuerza para hacer prosperar el comercio y la sostenibilidad, pero eso puede también generar abusos.

En un ejemplo que retrata la preocupación sobre la forma en que el Big Data será usado, Farm Bureau Federation se ha empeñado en que haya más rigor en los controles del uso de los datos que los agricultores entregan a las empresas con las que trabajan. Según Matt Erickson, economista de Farm Bureau, la preocupación es por los grupos que se oponen a prácticas específicas como, por ejemplo, la utilización de GMOs (organismos modificados genéticamente). Se teme que ellos puedan tener acceso a datos supuestamente anónimos conectándolos a granjas específicas —tal y como los hackers conectaron recientemente datos anónimos de Netflix a clientes específicos— usando esos datos contra los agricultores.

Michael Lewis, autor del best-seller “Flash Boys”, muestra en el libro cómo operadores que hacen transacciones de alta velocidad se lucraron de forma ilegal al disminuir en algunos milisegundos el intervalo de tiempo necesario para la transmisión de datos de Nueva York a New Jersey. No hay sospechas de que haya nada tan altamente tecnológico en los mercados de commodities, pero Erickson teme que el Big Data de los agricultores pueda ser usado para manipular esos mercados. Empresas con cantidades elevadas de datos sobre todo esto —desde el uso de fertilizantes al rendimiento de las cosechas— podrían usar esas informaciones para distorsionar el mercado. “Si yo tuviera esas informaciones podría prever fácilmente el comportamiento del mercado”, dice Erickson. “No ha sucedido, pero no hay duda de que puede suceder”.

Es posible que tengan lugar otros posibles abusos del Big Data más sutiles. Durante la charla de apertura del congreso, Parker relató un uso hipotético de datos del consumidor que ahora es posible hacer utilizando los datos obtenidos en la web de un minorista y del móvil de un cliente. El minorista, dijo Parker, puede enviar al cliente un texto sobre una camisa que él estaba buscando online diciendo: “Sr. Parker, ya tenemos la camisa en el color y en el tamaño que usted quería en una tienda próxima; sabemos que se encuentra a sólo dos minutos de la tienda en cuestión”. El minorista puede incluso recurrir a la Gestión de Oferta en Tiempo Real (RTOM, en las siglas en inglés) y añadir al mensaje enviado otro en que ofrece un descuento del 5% al consumidor si la compra se realizara en los 20 minutos siguientes.

El servicio es bueno para el minorista, para el cliente y el medio ambiente (no hay embalaje, costes de envío, no hay necesidad de ir en coche hasta el centro comercial local), pero como Parker observó de pasada, todo eso recuerda un poco al “Big Brother”. Aunque el ejemplo dado por Parker sea el de un servicio optativo, existe la posibilidad de que tales estrategias sean exploradas sin permiso, de manera que dejen de servir al consumidor y pasen a manipularlo, forzándolo, por ejemplo, a comprar o a usar más de lo que estaría efectivamente dispuesto a comprar o a usar.

Como director de gestión de la empresa de Big Data Syncsort e investigador bursátil de IGEL, Gary Survis dijo en un blog de IGEL antes del congreso de Wharton: “Es evidente que […] nos estamos embarcando hacia una nueva era en que se producirá una batalla épica entre los que usarán los datos para el bien y los que intentarán controlarlos para fines perversos”.

El peligro de la manipulación
Una preocupación semejante salió a relucir con la idea de usar el Big Data para motivar el comportamiento sostenible. Hablando sobre gamificación en el congreso de IGEL, Kevin Werbach, profesor de Estudios jurídicos y de Ética en los negocios de Wharton, dijo que los juegos se pueden usar para incentivar la investigación y el desarrollo [I+D] (una empresa puede producir mucho más investigación si anunciase una competición para la creación de una bombilla sostenible, por ejemplo, que si publicase simplemente un requisito de solicitud (RFP, en las siglas en inglés). De igual manera, los municipios podrían aumentar las tasas de reciclaje si transformaran la actividad en una especie de juego: la ciudad monitoriza cuánto recicla un residente y otorga puntos que, a fin de cuentas, tienen como resultado algún tipo de premio. Pero existe el peligro de que tales estrategias puedan ser usadas para motivar a las personas de maneras no éticas.

Según dijo Werbach, “es fácil usar la gamificación para manipular. Haga tal cosa porque es divertido cuando, en realidad, hay algún objetivo que no coincide necesariamente con los intereses del jugador. Por lo tanto, es fundamental en la gamificación ética que el proyecto sea transparente en relación a esos objetivos”. El desafío que enfrenta la gamificación consiste en saber cómo asegurar que el poder del Big Data sea usado para proporcionar respaldo, y no para cohibir el comportamiento. “Es realmente importante para el éxito de largo plazo”, dijo Werbach, “que los participantes sientan que es en su propio interés y, por lo tanto, comprendan la naturaleza del sistema frente a lo que se hace sin su conocimiento”.

Acceso privilegiado
El acceso privilegiado al Big Data es uno de los desafíos más complejos que enfrentan los que actúan en el espacio de la sostenibilidad. Según dijo Rogers, tanto el comercio como la sostenibilidad se benefician de la eficiencia. Pero, en muchas regiones del mundo, el comercio es escaso y los mercados son demasiado frágiles para atraer la inversión seria. Sin embargo, eficiencia y sostenibilidad son aún más esenciales en esas regiones que en el mundo desarrollado, no sólo como formas de mejorar la vida, sino literalmente para su sostén.

Prácticamente todo el crecimiento de la población en las próximas décadas ocurrirá en las regiones en desarrollo donde los alimentos y la energía son muy necesarios, y donde el Big Data puede desempeñar un papel vital. El desafío final es garantizar que las altas esperanzas depositadas en el Big Data se concreten a escala global.

Es natural que surjan dificultades en el momento en que el entusiasmo inicial por un nuevo concepto alcanza su punto máximo. El Hype Cycle [herramienta de representación gráfica de la madurez y adopción de determinadas tecnologías] llama a eso “Categoría del Desencanto”, y que viene a continuación de las “Expectativas Infladas”. Las cuestiones de practicidad, privacidad, poder y privilegio que hoy salen a relucir en relación al Big Data son un antídoto útil a aquellas expectativas exageradas que, una vez resueltas, llevarán, con toda probabilidad, a un esclarecimiento mayor y, en última instancia, a un mundo más sostenible.

Cómo citar a Universia Knowledge@Wharton

Close


Para uso personal:

Por favor, utilice las siguientes citas para las referencias de uso personal:

MLA

"El lado oscuro del Big Data." Universia Knowledge@Wharton. The Wharton School, University of Pennsylvania, [16 diciembre, 2014]. Web. [20 September, 2017] <http://www.knowledgeatwharton.com.es/article/el-lado-oscuro-del-big-data/>

APA

El lado oscuro del Big Data. Universia Knowledge@Wharton (2014, diciembre 16). Retrieved from http://www.knowledgeatwharton.com.es/article/el-lado-oscuro-del-big-data/

Chicago

"El lado oscuro del Big Data" Universia Knowledge@Wharton, [diciembre 16, 2014].
Accessed [September 20, 2017]. [http://www.knowledgeatwharton.com.es/article/el-lado-oscuro-del-big-data/]


Para fines educativos/empresariales, utilice:

Por favor, póngase en contacto con nosotros para utilizar con otros propósitos artículos, podcast o videos a través de nuestro formulario de contacto para licencia de uso de contenido .

 

Join The Discussion

No Comments So Far