En una primera fase, las conseguían en Internet de forma gratuita. Luego, cuando ya asumieron los textos que necesitaban, prosiguieron con las bibliotecas pirata online, lo que terminó con demandas por violación de derechos de autor. Surgió entonces la necesidad de buscar una nueva fuente de alimentación, que no tardaron en encontrar: los libros físicos. Estos tenían una ventaja respecto a los recursos anteriores, y es que su calidad estaba garantizada, dado que han tenido que pasar por un proceso editorial y de corrección antes de publicarse. Eso sí, para evitar al máximo nuevas demandas, no sirve un libro cualquiera. Las compras son siempre ejemplares de segunda mano que, en su mayoría, llevan tiempo en un almacén sin apenas circulación y es más fácil que estén libres de derechos.
“El problema no es la compra actual de libros, sino el tsunami que viene. El patrimonio se pierde”, dice Marçal Font
Guste más o menos que esos libros comprados se destinen a entrenar una IA –cuestiones éticas a un lado–, el verdadero problema llega luego: esos libros se destruyen. ¿Por qué? Porque, para escanearlos mejor (y de forma más rápida, no hay que olvidar que el tiempo es oro), se terminan partiendo sus lomos, lo que los convierte en no aptos para su posterior difusión. Una investigación de The Washington Post desveló a principios de año un “proyecto secreto” de la startup Anthropic, que opera la herramienta de IA Claude, para “escanear y destruir todos los libros del mundo”, según señalaba un informe interno de la compañía. Una operación, conocida como Proyecto Panamá, de la que ellos mismos admitían que preferían que fuera “secreta”.
“El problema de todo esto no es la compra actual de libros, sino el tsunami que viene. El patrimonio bibliográfico se pierde”, advierte el librero Marçal Font, al frente de la Llibreria Fènix de Badalona, durante una conversación con La Vanguardia . Fue él uno de los que dio la voz de alarma de que esta realidad ya había llegado a Catalunya tras recibir una serie de pedidos “algo extraños” entre el 30 de abril y el 8 de mayo. Todos a una misma sede de Estados Unidos para una empresa radicada en Canadá, Zoom Books.
Se interesaban por manuales técnicos de producción de vino, actas de congresos de los años 80, dietarios de la Guerra Civil… “Libros que cuentan con pocos centenares de ejemplares, que son carne de desafección de biblioteca pública y difíciles de encontrar en cualquier otro lugar”, señala en la plataforma de newsletters Substack, donde ha publicado una investigación realizada junto a Xavier Vinaixa, director técnico de Sorensen.ai, empresa tecnológica que desarrolla soluciones de IA.
¿Se sabe a ciencia cierta que Zoom Books es una de esas empresas intermediarias que trabajan para Silicon Valley? No, pero, según apunta Vinaixa, “por los patrones irracionales de compras y gastos de envíos elevados, todo encaja con esta industria súper dopada de dinero. Es evidente que no los compran para vender”. Los libros nunca viajan a oficinas de tecnología, sino a la atención de PrepFort, un proveedor privado de logística para terceros, situado en Illinois.
Si bien Zoom Books asegura no estar relacionada con el Proyecto Panamá, pues dicen ser una empresa que recoge, compra, dona y recicla libros usados, hay quien tuvo tiempo de hacer pantallazos de un post de su web, que explicaba que se ofrecían a laboratorios de IA como antídoto a la falta de datos y como conseguidores de facturas. Sobre este último punto, mencionaban el juicio de Bartz contra Anthropic, que creó un precedente, pues el juez dictaminó que entrenar IA con libros adquiridos legalmente (es decir, comprados y con una factura) es algo legítimo. Una información que ha sido borrada, pero que se puede llegar a rescatar si se le pregunta a las propias IAs. La Vanguardia ha intentado contactar con la entidad, pero no ha obtenido respuesta.
De todos modos, la urgencia ante este escenario es encontrar soluciones. Font y Vinaixa insisten en que esto es lo primordial. En lo que a nivel Catalunya se refiere –pero que se podía ampliar a cualquier parte del mundo–, Vinaixa es partidario de “cobrar a estas empresas por lo que quieren (los datos) y quedarnos con el patrimonio. Hacer negocio nosotros y no un intermediario”. Plantea “un consorcio catalán que ofrezca fondo documental de dominio público con metadatos limpios, contrato único, atribución y auditoría de uso” y aprovecha este reportaje para presentar proyectos como Cedulari.cat. “Por un lado es una base de datos con foco en el corpus pre-ISBN”, es decir, que no está catalogado ni consta en ningún lugar. “Y por otro es un conjunto de herramientas para grandes modelos de lenguaje que les ofrece aquello que le falta a la IA generalista: procedencia, trazabilidad y fuentes verificables”.
Vinaixa plantea “cobrar a estas empresas por los datos y quedarnos con el patrimonio”, sin intermediarios
Desde la Conselleria de Cultura, escuchan las propuestas pero recomiendan que no cunda el pánico, pues, desde el punto de vista patrimonial, “en Catalunya difícilmente se puede hablar de un riesgo de desaparición de libros editados”. Recuerdan que existe la figura del depósito legal, que obliga a editores a librar ejemplares de sus publicaciones para garantizar la conservación permanente. Varios de esos ejemplares quedan preservados en instituciones públicas, como la Biblioteca Nacional de España, la Biblioteca de Catalunya y las bibliotecas públicas provinciales. Igual que los libreros, aseguran asimismo no compartir la “destrucción innecesaria de libros”, y también optan por utilizar “sistemas de digitalización no destructiva”.
Ahora bien, añaden que “no se debe confundir la destrucción de algunos ejemplares comerciales con la destrucción del patrimonio bibliográfico” y concluyen que en Catalunya “existen mecanismos de preservación pública que garantizan la conservación de obras a largo plazo”. Insisten en la necesidad de “encontrar un equilibrio entre la protección de los derechos de los creadores, la preservación del patrimonio cultural y la necesidad de que lenguas como el catalán tengan una presencia significativa en las tecnologías que configurarán el futuro”.
Experiencia previa en escaneo de códigos de barras o documentos, habilidades de mecanografía rápidas y precisas (se prefiere más de 60 palabras por minuto o más de 10.000 pulsaciones por hora) y capacidad para permanecer de pie durante un turno completo de ocho horas. Estos son algunos de los requisitos que pide PrepFort para ser un escaneador. Algo que no deja de llamar la atención pues en teoría esta empresa se dedica solo a recibir millones de paquetes globales y enviarlos hacia su destino final. Lo que viene a ser un proveedor privado de logística para terceros. Los libros que compra Zoom Books se envían a este destino. La oferta de trabajo, pública en internet, está caducada, seguramente porque ya se ha contratado a alguien, pero añadía alguna cláusula más que, si bien no era obligatoria, era “deseable”, como tener capacidad para agacharse y levantar hasta 18 kg con regularidad (¿pilas de libros?) o experiencia en procesamiento de libros, sistemas de bibliotecas y gestión de pedidos de comercio electrónico. Lara Gómez Ruiz








