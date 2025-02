Para entrenar una IA necesitas un elemento muy importante, los datos. Los datos aportan a la IA el conocimiento que necesitan para completar su proceso de aprendizaje profundo, así que podemos decir que sin datos no hay inteligencia artificial. Meta, como otros gigantes tecnológicos, son conscientes de la importancia de los datos, ¿pero cómo consiguen grandes cantidades de estos para esos entrenamientos?

En el caso de Meta, infringiendo las leyes de protección de la propiedad intelectual. La compañía que dirige Mark Zuckerberg utilizó torrents para descargar un total de 81,7 TB en libros de diferentes páginas web que no ofrecen esos contenidos de forma legal. Era material pirateado, y esto quedó claro por las comunicaciones internas, cuando un investigador senior de IA dijo que creía que no deberían utilizar material pirateado, y que había que trazar una línea.

Otro trabajador envío un mensaje a otro compañero diciendo que estaba preocupado por el uso de direcciones de Meta para cargar contenidos pirata, y que utilizar torrent para piratear desde un portátil corporativo no le daba buenas sensaciones, seguido de un emoji de carcajada. Los documentos judiciales confirman que Meta tomó medidas para intentar ocultar este tipo de actividad, pero no lo consiguió.

Esta no es la primera vez que se acusa a una empresa de entrenar a una IA con contenidos pirateados, y seguro que no será la última. Precisamente conseguir los datos necesarios para completar este tipo de entrenamientos representa unos de los desafíos más importantes que tienen que afrontar los gigantes tecnológicos, y parece que no están dispuestos a asumir el coste que deben pagar para obtenerlos de forma legal.

El proceso legal contra Meta por este caso sigue adelante, pero el gigante juega con ventaja, ya que tiene unos recursos económicos enormes, y esto le permitirá recurrirlo en caso de perder, lo que hará que el caso se dilate todavía más hasta que se llegue al final del camino y no le quede más remedio que aceptar el último veredicto posible.

Con las pruebas que tiene en su contra está claro que la compañía de Zuckerberg no tiene muchas posibilidades de salir indemne. Con esto en mente, quizá opte por llegar a algún tipo de acuerdo para indemnizar a los escritores y a las editoriales y publicadoras afectadas por esa violación de sus derechos de propiedad intelectual.

Unsealed court documents from February 5th, 2024, in Kadrey v. Meta show Meta (formerly Facebook) illegally torrented 81.7TB of data from «shadow libraries» such as Anna’s Archive, Z-Library, and LibGen to train Meta artificial intelligence.

