big data | Ciencia para llevar

Entradas etiquetadas como ‘big data’

Ojo al ‘data’: un paseo filosófico por las nubes digitales

02 de febrero de 2021

Por Txetxu Ausín (CSIC)*

Las nubes son la exitosa metáfora para referirnos a la nueva realidad digital en la que vivimos. Una realidad configurada por las redes sociales, la inteligencia artificial y la analítica de los datos masivos o big data que se recogen en la interacción e interconexión creciente de humanos, artefactos e instrumentos que registran, procesan y reutilizan enormes cantidades de información. Las nubes parecen blancas, etéreas, inofensivas, pero están reconfigurando radicalmente nuestro mundo y nuestras relaciones; por ello son tecnologías disruptivas, que impulsan transformaciones radicales y a gran velocidad en esta nueva era de los humanos llamada Antropoceno. Cada vez más nos configuramos como sistemas sociotécnicos donde todas nuestras interrelaciones están mediadas tecnológicamente; mantenemos una interacción física, cognitiva y hasta emocional con la tecnología, difuminándose las fronteras entre sujetos humanos y artefactos.

Les invito a dar un paseo por las nubes, a pensar este nuevo ecosistema digital de la mano de la filosofía, para indagar y preguntarnos por su esencia, por la concepción del ser humano que entrañan, por el tipo de conocimiento que generan, por su impacto medioambiental, por su ética y su política.

Ilustración de Irene Cuesta (CSIC).

Empecemos por la realidad de los datos

Los datos están en todas partes (“data is all around”), son ubicuos, de modo que se está produciendo una ‘datificación’ de la vida, una representación digital de la realidad, una ontología de datos donde se pretende poner en un formato cuantificado todo, para que pueda ser medido, registrado y analizado. Es decir, todo se transforma en información cuantificable. Así que el tamaño importa, ya que, cambiando el volumen y la cantidad de datos manejados, se está cambiando en cierto modo la esencia de la realidad.

Esta antigua búsqueda de la humanidad se desarrolla hoy exponencialmente por medio de la digitalización y los sistemas de Tecnologías de la Información y la Comunicación (TIC). Se cuantifica el espacio (geolocalización), se cuantifican las interacciones humanas y todos los elementos intangibles de nuestra vida cotidiana (pensamientos, estados de ánimo, comportamiento) a través de las redes sociales, se ha convertido el cuerpo humano en una plataforma tecnológica y se monitorizan los actos más esenciales de la vida (sueño, actividad física, presión sanguínea, respiración…) mediante dispositivos médicos, prendas de vestir, píldoras digitales, relojes inteligentes, prótesis y tecnologías biométricas, en espacios públicos y privados (lo que se conoce como ‘internet de los cuerpos‘). Se datifica todo lo que nos rodea mediante la incrustación de chips, sensores y módulos de comunicación en todos los objetos cotidianos (‘internet de las cosas‘).

Si pensamos en términos ontológicos, no son ya los átomos sino la información la base de todo lo que es (‘internet del todo‘). Un universo compuesto esencialmente de información (infosfera). Una nueva perspectiva de la realidad, del mundo, como datos que pueden ser explorados y explotados. Además, la llamada ideología del ‘dataísmo’ es una nueva narrativa universal que regula nuestra vida y que viene legitimada por la autoridad de los datos masivos: el universo consiste en flujos de datos y el valor de cualquier fenómeno social o entidad está determinado por su contribución al procesamiento de datos. Y esto no es una teoría científicamente neutral porque pretende determinar lo que está bien y está mal con relación a un valor supremo, el flujo de información: será bueno aquello que contribuya a difundir y profundizar el flujo de información en el universo y malo, lo contrario; la herejía es desconectarse del flujo de datos.

Ilustración de Irene Cuesta (CSIC).

El ser humano de la realidad de los datos

Dicho lo anterior, este paseo nos lleva a la antropología, a la concepción de ser humano y de su identidad que encierran las nubes. Se datifican todos los aspectos de nuestra vida (yo-cuantificado) y, no solo eso, se otorga un valor comercial a esa datificación, de modo que nuestras actividades nos definen como un objeto mercantil (somos el producto). Eso conduce a una constante optimización de uno mismo, donde el tiempo libre se vive igual que el tiempo de trabajo y está atravesado por las mismas técnicas de evaluación, calificación y aumento de la efectividad. Se da una progresiva desaparición de lo privado y una servidumbre voluntaria con relación a las nubes y la ‘mano invisible’ del flujo de datos. El concepto de rendimiento se refiere ya a la vida en su totalidad (24/7) en lo que se ha llamado ‘economía de la atención’ y ‘capitalismo de vigilancia’.

Filosofía del conocimiento

No es más halagüeña la perspectiva desde la filosofía del conocimiento o epistemología. Es cierto que la digitalización ofrece oportunidades de alfabetización científica, de creación de reservas epistémicas, de nuevos espacios formativos y de mayor transparencia y rendición de cuentas de las administraciones, favoreciendo la participación y el compromiso ciudadano con las políticas públicas. Además, las nubes de sanidad digital, educación online o mercados transforman las sociedades de países empobrecidos y contribuyen a la realización de los Objetivos de Desarrollo Sostenible. Sin embargo, la analítica de big data está transformando el método científico privilegiando las correlaciones frente a la causalidad como modelo explicativo de la realidad —recuérdese que una correlación es un vínculo o relación recíproca entre varias cosas—. No obstante, el hecho de que dos eventos se den habitualmente a la vez o de manera consecutiva no implica que uno sea la causa de otro. El big data establece correlaciones muy fuertes entre diferentes eventos o informaciones, pero eso no significa automáticamente que unos constituyan la causa o el origen de los otros, que serían su efecto.

Y aunque el big data se ha planteado como la panacea para la toma de decisiones más acertada, imparcial y eficiente, que evitaría los errores humanos y garantizaría un conocimiento más fiable, ha obviado algo básico, los sesgos. Esto es, los prejuicios y variables ocultas a la hora de procesar la información, las tendencias y predisposiciones a percibir de un modo distorsionado la realidad —sesgos que no desaparecen nunca aumentando el tamaño de la muestra y que están implícitos en los datos o en el algoritmo que los maneja—. Además, disponer de más datos no implica automáticamente un mayor y mejor conocimiento. Tener ingentes cantidades de datos puede conducir a la confusión y al ruido, los datos no son siempre información significativa, y los algoritmos son tremendamente conservadores porque reflejan lo que hay, lo dado, el prejuicio subyacente en la sociedad, escamoteando la discusión acerca de qué valores son preferibles, sin ninguna ambición transformadora. Los algoritmos, que no son sino un conjunto de pasos ordenados empleados para resolver un problema o alcanzar un fin (una codificación de medios y fines), se presentan bajo una apariencia de neutralidad, pero no dejan de ser opiniones encapsuladas.

Ilustración de Irene Cuesta (CSIC).

Ética y ecoética

Ligado a lo anterior, si hablamos de responsabilidad y ética, las nubes digitales presentan riesgos morales importantes en términos de daños a los individuos y a la sociedad:

Discriminación por sobrerrepresentación de personas con ciertas características y exclusión de otras; un asunto vinculado a los sesgos, como la discriminación de género o racial. Por ejemplo, las mujeres tienen menos posibilidades de recibir anuncios de trabajo en Google y el primer certamen de belleza juzgado por un ordenador colocó a una única persona de piel oscura entre los 44 vencedores, como señala Cathy O’Neil en Armas de destrucción matemática.
Dictadura de datos (políticas predictivas), donde ya no somos juzgados sobre la base de nuestras acciones reales, sino sobre la base de lo que los datos indiquen que serán nuestras acciones y situaciones probables (enfermedades, conductas…).
Perfilamiento (configuración de un ‘perfil de riesgo’) y estigmatización, cuando se define y manipula nuestra identidad, invadiéndose la privacidad y espacios íntimos incluso a nivel cognitivo-conductual y emocional.

Pero estas nubes digitales, desde una perspectiva medioambiental y ecoética, tampoco responden a la ‘desmaterialización’ de la economía que prometen. Por un lado, la fabricación de redes y productos electrónicos supera con creces la de otros bienes de consumo en términos de materias primas. Por ejemplo, el gasto en combustibles fósiles utilizados en la fabricación de un ordenador de sobremesa supera 100 veces su propio peso mientras que para un coche o una nevera la relación entre ambos pesos (de los combustibles fósiles usados en su fabricación y del producto en sí) es prácticamente de uno a uno. Por otro lado, los grandes centros de computación y de almacenamiento de datos en la nube requieren enormes cantidades de energía y tienen una alta huella por emisiones de CO₂, con un impacto medioambiental muy elevado. El consumo eléctrico es tan grande que las emisiones de carbono asociadas son ingentes, como denuncia el movimiento Green Artificial Intelligence.

Ilustración de Irene Cuesta (CSIC).

Propiedad y poder

Y es que, para terminar con una reflexión propia de la filosofía política, la que se refiere a la propiedad y al poder, hay que recordar que las nubes digitales son los ordenadores de otros, de esos gigantes tecnológicos, “señores feudales del aire”, como los llama Javier Echeverría, que dominan esta nueva realidad de la internet del todo. Además, las tecnologías digitales, las nubes, modulan la política a través de la manipulación de los mensajes, las fake news, la cultura del espectador o la polarización; los artefactos tienen política, incorporan valores, y la tecnología crea formas de poder y autoridad. Cuando hacemos entrega de (todos) nuestros datos, a cambio de unos servicios relativamente triviales, acaban en el balance de estas grandes compañías. Y, además, esos datos son después utilizados para configurar nuestro mundo de una manera que no es ni transparente (no se conocen los algoritmos de estas grandes compañías) ni deseable, convirtiéndose en un instrumento de dominación.

Un desarrollo justo y socialmente responsable de las nubes digitales exige un empoderamiento tecnológico de la ciudadanía, una alfabetización sobre este nuevo mundo digital, así como un nuevo pacto tecno-social entre usuarios, empresas y estados sobre la base de principios éticos, que evite las injusticias algorítmicas mencionadas (discriminación-perfilamiento-sesgos-exclusión) y que promueva la apropiación social de la tecnología para el bien común. No nos durmamos en las nubes.

* Txetxu Ausín es investigador del Instituto de Filosofía del CSIC (IFS-CSIC), donde dirige el Grupo de Ética Aplicada.

Tags: algoritmos, Antropoceno, antropología, big data, capitalismo de vigilancia, cultura científica, datos masivos, datos personales, Dictadura de datos, ecoética, economía de la atención, epistemología, Ética, fake news, filosofía, filosofía política, geolocalización, gigantes tecnológicos, Green Artificial Intelligence, Instituto de Filosofía (IF-CSIC), Internet, Internet de las cosas, Internet de los cuerpos, Internet del todo, nubes digitales, perfilamiento, redes sociales, sesgos, Tecnologías de la Información y la Comunicación (TIC), Tecnologías socialmente disruptivas, yo-cuantificado | Almacenado en: Historia y Ciencias Sociales, Sin categoría, Tecnologías
Comentarios desactivados en Ojo al ‘data’: un paseo filosófico por las nubes digitales

El negocio de los datos personales en internet: cuando el producto eres tú

14 de julio de 2020

Por David Gómez-Ullate Oteiza (CSIC)*

En la era de internet nos hemos acostumbrado a que muchas cosas sean gratis: la información de los diarios, los navegadores GPS, los gestores de correo… Nadie puede resistirse a la atracción de lo gratuito. Uno se pregunta, sin embargo, dónde está el producto detrás de tanta gratuidad: ¿cómo ganan dinero estas grandes compañías? Y aquí viene a la cabeza la frase del mítico jugador de póquer Amarillo Slim: “Mira a tu alrededor, si no sabes identificar al pardillo en la mesa, entonces el pardillo eres tú”. En internet, cuando no sabes cuál es el producto, entonces el producto eres tú. Para Google, Facebook y el resto de gigantes de internet no somos usuarios, sino productos: los destinatarios de sus campañas de publicidad.

Así pues, el modelo de negocio es un intercambio en el que nos ofrecen un gestor de correo electrónico con grandes capacidades, una plataforma para conversar con amigos o para encontrar a antiguos compañeros de clase, un navegador GPS para no perdernos en la ciudad, una carpeta en la nube para almacenar nuestros ficheros… Todo ello a cambio de recopilar una cantidad de datos tan inmensa que probablemente hace que Google nos conozca mejor que nosotros mismos: qué coche te quieres comprar, dónde vas a ir de vacaciones, cuántos hijos tienes, qué camino tomas para ir a trabajar, a quién vas a votar, cómo te sientes hoy, esa pasión oculta que no has confesado a nadie pero has buscado en internet, a qué hora te acuestas y con quién, etc.

/Wikimedia Commons

Con esta ingente cantidad de datos, la publicidad digital presume de su precisión, al impactar a la persona escogida en el lugar idóneo y el momento adecuado, frente a los anuncios tradicionales en televisión, por ejemplo, que solo permiten segmentar el público objetivo por franja horaria o asociado a ciertos programas. De hecho, cada vez que cargamos la página de nuestro diario favorito para leer las noticias del día, el correspondiente banner publicitario que vemos depende de una compleja subasta (RTB, Real Time Bidding) en la que distintos algoritmos pujan por mostrarnos su anuncio en función de cuánto piensen que nuestro perfil se adapta al producto que desean vender. Todo esto ocurre en la fracción de segundo que tarda el navegador en cargar la página; obviamente, estos algoritmos emplean toda la información que puedan adquirir sobre quién está al otro lado del ordenador para afinar los modelos: más información implica modelos más precisos y, típicamente, mayor rendimiento de la inversión en publicidad.

Así, Google es la mayor agencia de publicidad del mundo. Facebook o Twitter también siguen el mismo modelo de negocio: nos ofrecen una plataforma para que voluntariamente les entreguemos una cantidad inimaginable de datos personales gracias a los cuales pueden afinar campañas de publicidad muy orientadas a su público objetivo.

En la economía digital nadie da duros a cuatro pesetas o, como nos recordaba el Nobel de Economía Milton Friedman: “There ain’t no such a thing as a free lunch (no existen los almuerzos gratis)”. Las principales empresas hoteleras son Airbnb y Booking; no tienen uno solo alojamiento en propiedad. La empresa líder de movilidad es Uber; no posee un solo vehículo. La primera empresa del sector de venta al por menor es Alibaba; no dispone de inventario. La mayor empresa de contenidos digitales es Facebook; no genera su contenido. Todas son empresas de datos. Recopilan, limpian, analizan y desarrollan aplicaciones para poner en contacto productores de servicios con consumidores.

Pero entonces, ¿cuánto deberían valer nuestros datos personales? La pregunta es muy relativa y probablemente tenga dos respuestas bien diferenciadas para la persona que cede los datos y para la que los adquiere. Para el ciudadano o ciudadana media, a tenor del comportamiento observado durante los últimos años, el valor que concedemos a nuestros propios datos es más bien pequeño, pues prácticamente los hemos regalado a cambio de nada a las grandes compañías. Para los gigantes de internet podemos hacer un cálculo sencillo basado en dividir el beneficio del sector publicitario digital en EE UU durante 2016 (83.000 millones de dólares) entre el número de usuarios en el país (280 millones), lo que arrojaría una cifra media de 296 dólares per cápita. Prácticamente nadie en el entorno empresarial duda ya del inmenso valor que tiene la adquisición de datos, aunque la sociedad en su conjunto no sea aún muy consciente de ello.

Privacidad en tiempos de pandemia

Entre 1950 y 1989, la policía política de la RDA articuló métodos de vigilancia que implicaron a 250.000 personas entre empleados e informantes. Para una población de 17 millones suponía un espía por cada 70 habitantes. Con los métodos de supervisión existentes en la actualidad, empleando técnicas de Inteligencia Artificial, tratamiento de imágenes y procesamiento del lenguaje natural, se puede vigilar a miles de millones de ciudadanos con apenas varios miles de empleados.

/Wikimedia Commons

Aunque cuando una empresa conecta el micrófono de mi móvil no está interesada en lo que digo, solo quiere saber qué canal de televisión estoy mirando o qué estoy pensando en adquirir. Porque una parte importante de la industria publicitaria se basa en pagar por los anuncios en función de la contribución que cada uno haya tenido en conseguir que adquieras el producto. En su jerga, ellos usan el término “conversión”, pero no una conversión a los principios socialistas de la República Democrática de Alemania, sino una conversión para ganar personas adeptas al último coche, tableta o viaje.

En los últimos meses se está produciendo un intenso debate sobre la pertinencia del uso de datos personales para luchar contra la pandemia, lo cual ha puesto en el ojo público muchas de las cuestiones mencionadas arriba. Los datos de geolocalización o los contactos con otras personas se pueden usar para diseñar sistemas más eficientes y dirigidos de contención de la epidemia, aislando sólo personas infectadas y sus contactos, o lanzando alertas en los lugares con mayor probabilidad de infección. Compartir datos clínicos de pacientes permite ampliar la base estadística de los estudios sobre COVID y conocer mejor la enfermedad para mejorar el tratamiento de enfermos o las políticas de salud pública.

Todas estas cuestiones requieren un debate sobre el alcance de dichas medidas, que en cualquier caso debe de ser limitado en el tiempo y no ser usado con fines distintos a los mencionados. Este debate contrasta con la noticia publicada recientemente sobre las denuncias de un empleado de Apple que trabajaba en el programa de transcripción de textos grabados por sus dispositivos, sin ningún consentimiento por parte de los usuarios. Es fundamental que la sociedad sea más consciente del uso y abuso de los datos personales por parte de las grandes corporaciones y participe de manera activa en el debate abierto sobre la gestión de los mismos.

* David Gómez-Ullate Oteiza es investigador en la Universidad de Cádiz y coautor del libro Big data de la colección ¿Qué sabemos de? (CSIC-Catarata).

Tags: big data, Colección ¿Qué sabemos de...?, conversión publicidad, covid, CSIC, cultura científica, cultura científica CSIC, datos personales, David Gómez-Ullate Oteiza, divulgación, pandemia, privacidad, publicidad digital, Real Time Biding | Almacenado en: Matemáticas, Tecnologías
1 comentario »