Reseñas | La IA pone en riesgo nuestra historia

Reseñas |  La IA pone en riesgo nuestra historia

No necesitamos imaginar un mundo en el que los deepfakes puedan imitar de manera tan creíble las voces de los políticos que puedan usarse para provocar escándalos que podrían influir en las elecciones. Ya esta aquí. Afortunadamente, hay muchos las razones para optimismo en la capacidad de la empresa para identificar medios falsos y mantener una comprensión común de los acontecimientos actuales.

Aunque tenemos motivos para creer que el futuro será seguro, tememos que el pasado no lo sea.

La historia puede ser una poderosa herramienta de manipulación y malversación. La misma IA generativa que puede simular eventos actuales también puede simular eventos pasados. Aunque se pueden proteger nuevos contenidos mediante sistemas integrados, existe un mundo de contenidos que no tienen marcas de agua, lo que se consigue añadiendo información imperceptible a un archivo digital para que se pueda rastrear su procedencia. Una vez que las marcas de agua durante la creación se generalizan y la gente se acostumbra a desconfiar del contenido que no tiene marcas de agua, cualquier cosa producida antes de ese momento podrá cuestionarse mucho más fácilmente.

Y creará un tesoro de oportunidades para respaldar afirmaciones falsas con documentos generados, desde fotografías que colocan a personajes históricos en situaciones comprometedoras hasta la alteración de historias individuales en periódicos históricos y el cambio de nombres en títulos de propiedad. Aunque todas estas técnicas se han utilizado antes, es mucho más difícil contrarrestarlas cuando el coste de crear falsificaciones casi perfectas se ha reducido radicalmente.

Esta predicción se basa en la historia. Hay muchos ejemplos de cómo los poderes económicos y políticos han manipulado los registros históricos para sus propios fines. estalin purga camaradas desleales de la historia ejecutándolos y luego alterando los registros fotográficos para que parezca que nunca existieron. Eslovenia, tras convertirse en país independiente en 1992, borrado Más de 18.000 personas están inscritas en el registro de residentes, principalmente miembros de la minoría romaní y otras personas de etnia no eslovena. En muchos casos, el gobierno destruyó sus registros físicos, lo que provocó la pérdida de su vivienda, pensión y acceso a otros servicios, según un informe del Consejo de Europa de 2003. Comisionado de Derechos Humanoss.

Los documentos falsos son una parte clave de muchos esfuerzos por reescribir el registro histórico. El infame Protocolos de los Sabios de Siónpublicado por primera vez en un Periódico ruso en 1903., pretendía recopilar los registros de una conspiración judía para controlar el mundo. Primero desacreditado en agosto de 1921como una falsificación plagiada de varias fuentes independientes, los Protocolos destacado en la propaganda nazi y se han utilizado durante mucho tiempo para justificar la violencia antisemita, incluida una cita en Artículo 32 del Pacto Fundacional de Hamás de 1988.

En 1924, el Carta de ZinovievSe cree que es un comunicado secreto del jefe de la Internacional Comunista en Moscú al Partido Comunista de Gran Bretaña para movilizar apoyo para Normalizar las relaciones con la Unión Soviética., fue publicado por el Daily Mail cuatro días antes de las elecciones generales. El escándalo resultante puede haberle costado las elecciones a los laboristas. El origen de la carta nunca ha sido probado, pero sí se ha demostrado su autenticidad. entrevistado en ese momentoY un investigación oficial en la década de 1990 se llegó a la conclusión de que lo más probable era que fuera obra de los rusos blancos, una facción política conservadora liderada en ese momento por emigrados rusos opuestos al gobierno comunista.

Décadas después Operación Infección –una campaña de desinformación soviética– utilizó documentos falsos para propagar la idea de que Estados Unidos había inventado el VIH, el virus que causa el SIDA, como arma biológica. Y en 2004, CBS News retiró un artículo controvertido porque no pudo autenticar los documentos, que luego fueron publicados. desacreditado como falsificaciones, que puso en duda el servicio anterior del entonces presidente George W. Bush en la Guardia Nacional Aérea de Texas. A medida que se vuelve más fácil generar desinformación histórica y el volumen de falsificaciones digitales se dispara, surgirá la oportunidad de remodelar la historia o al menos desafiar nuestra comprensión actual de ella.

Las perspectivas de que los actores políticos utilicen la IA generativa para remodelar eficazmente la historia (sin mencionar que los estafadores creen documentos legales y registros de transacciones falsos) son aterradoras. Afortunadamente, las mismas empresas que crearon este riesgo han forjado un camino a seguir.

Al indexar gran parte de los medios digitales del mundo para entrenar sus modelos, las empresas de inteligencia artificial han creado efectivamente sistemas y bases de datos que pronto contendrán todo el contenido grabado digitalmente de la humanidad o al menos una aproximación significativa de este. Podrían empezar a trabajar hoy para guardar versiones con marcas de agua de estos documentos primarios, que incluyen hemerotecas y un una amplia gama de otras fuentespara que las falsificaciones posteriores sean inmediatamente detectables.

Este trabajo enfrenta ciertos obstáculos. Los esfuerzos de las Bibliotecas Digitales de Google para digitalizar millones de libros de bibliotecas en todo el mundo y hacerlos fácilmente accesibles en línea topó con los límites de la propiedad intelectual, haciendo que los archivos históricos poco práctico para el propósito previsto de hacer que estos textos sean visibles para cualquier persona con una conexión a Internet. Estas mismas preocupaciones respecto de la propiedad intelectual empujan a los creadores y compañías preocuparse tanto por los datos de entrenamiento proporcionados a la IA generativa como por sus implicaciones cuando se utilizan para generar contenido.

Dada esta tensa historia, incluida la inversión fallida de Google en su proyecto de bibliotecas digitales, ¿quién dará un paso al frente y financiará un esfuerzo masivo similar que crearía versiones inmutables de datos históricos? Hay un fuerte incentivo para que el gobierno y la industria lo hagan, y muchas de las cuestiones de propiedad intelectual asociadas con el suministro de archivos en línea con capacidad de búsqueda no se aplican a la creación de versiones de documentos con marcas de agua y de tiempo, porque no es necesario que estas versiones se hagan públicas para servir a sus necesidades. propósitos. objetivo. Un documento reclamado se puede comparar con el archivo grabado mediante una transformación matemática del documento conocida como «hashing», la misma técnica utilizada para Foro Global de Internet para Combatir el Terrorismo utiliza para ayudar a las empresas a detectar contenido terrorista conocido.

Además de crear un bien público importante y proteger a los ciudadanos de los peligros que plantea la manipulación de narrativas históricas, la creación de registros verificados de documentos históricos puede resultar valiosa para las grandes empresas de inteligencia artificial. Nuevo investigación sugiere que cuando los modelos de IA se entrenan con datos generados por IA, su rendimiento se deteriora rápidamente. Por lo tanto, puede ser crucial separar lo que en realidad es parte del registro histórico de los «hechos» recién creados.

Preservar el pasado también significa preservar los datos de entrenamiento, las herramientas asociadas que se ejecutan en ellos e incluso el entorno en el que se ejecutaron las herramientas. Vint Cerf, uno de los primeros pioneros de Internet, llamó a este tipo de grabación «vitela digital» y la necesitamos para proteger el entorno de la información.

Esta vitela será una herramienta poderosa. Puede ayudar a las empresas a crear mejores modelos al permitirles analizar qué datos incluir para obtener el mejor contenido y ayudar a los reguladores a auditar el sesgo y el contenido dañino en los modelos. Los gigantes tecnológicos ya están liderando esfuerzos similares para registrar nuevo contenido creado por sus modelos, en parte porque tienen que entrenar sus modelos con texto generado por humanos y los datos producidos después de adoptar el lenguaje de modelos grandes pueden verse contaminados por el contenido generado.

Ha llegado el momento de extender este esfuerzo también en el tiempo, antes de que nuestra política también se vea seriamente distorsionada por la historia generada.

Jacob N. Shapiro es profesor de política y asuntos internacionales en la Universidad de Princeton y director ejecutivo del Proyecto de Estudios Empíricos de Conflictos. Chris Mattmann es profesor asistente de investigación en la Universidad del Sur de California y director de su Grupo de Recuperación de Información y Ciencia de Datos.

El Times se compromete a publicar una variedad de letras Para el editor. Nos encantaría saber qué piensas sobre este o cualquiera de nuestros artículos. Aquí hay algo consejo. Y aquí está nuestro correo electrónico: cartas@nytimes.com.

Siga la sección de Opinión del New York Times en Facebook, Instagram, TIC Tac, X Y Temas.