ver en .pdf
Un conjunto de datos del Departamento de Asuntos de Veteranos de los EE. UU. que compilaba el uso de atención médica por parte de veteranos en 2021 se modificó discretamente el 5 de marzo de 2025. Una columna titulada «género» se renombró «sexo», y también se intercambiaron las palabras en el título y la descripción del conjunto de datos ( apéndice pág. 1 ). Antes del 5 de marzo, el conjunto de datos no se había modificado desde su publicación en 2022. Al 1 de mayo, el registro de cambios del conjunto de datos, en el que se deben rastrear las modificaciones, está vacío. 1 El cambio de género a sexo también ocurrió en otros conjuntos de datos de salud pública, incluidos los conjuntos de datos de los Centros para el Control y la Prevención de Enfermedades (CDC) de los EE. UU. que rastrean el consumo mundial de tabaco en adultos, los datos de mortalidad por accidentes cerebrovasculares de 2015 a 2017 y una encuesta sobre nutrición, actividad física y obesidad ( apéndice págs. 4-9 ). Las agencias involucradas no han emitido ninguna declaración que confirme o explique estos cambios, pero podrían tener como objetivo cumplir con una directiva presidencial para que las agencias eliminen “mensajes que promuevan o inculquen de otra manera la ideología de género”. 2
Los investigadores, científicos y profesionales médicos de salud pública dependen en gran medida de los conjuntos de datos gubernamentales para la investigación y la práctica clínica. 3–6 Siguiendo una tendencia global hacia un gobierno abierto, la Ley de Datos Gubernamentales Abiertos de EE. UU. de 20197 autorizó a las agencias federales a poner los conjuntos de datos a disposición del público. El principal repositorio de datos del gobierno estadounidense ahora alberga cientos de miles de conjuntos de datos. La manipulación de datos por parte del gobierno estadounidense, especialmente cuando se oculta, es una crisis: hace que los conjuntos de datos cruciales no sean confiables e inutilizables. Si el gobierno estadounidense modifica secretamente los conjuntos de datos por razones políticas, los investigadores que confían en los datos podrían recomendar erróneamente intervenciones ineficaces o contraproducentes. Además, dichos cambios, al descubrirse, reducen la confianza en los datos que sustentan la salud pública y, en consecuencia, las intervenciones sanitarias. Esta reducción de la confianza obstaculiza el progreso de la ciencia, la medicina y la salud pública, y reduce la disposición individual a confiar en las recomendaciones de los expertos. 8 También es una crisis para los investigadores internacionales que dependen de los conjuntos de datos y la infraestructura de datos del gobierno estadounidense. Sin embargo, existen posibles soluciones y acciones que los investigadores de todo el mundo pueden implementar.
Recopilamos metadatos de las fuentes de recolección de bases de datos del Departamento de Salud y Servicios Humanos de los EE. UU., los CDC y Asuntos de Veteranos (inventarios de metadatos de los conjuntos de datos de la agencia) y seleccionamos bases de datos que se modificaron entre el 20 de enero y el 25 de marzo de 2025. Excluimos duplicados, conjuntos de datos que no tenían copias archivadas para comparación o que no estaban disponibles por algún otro motivo, y conjuntos de datos actualizados rutinariamente mensualmente o con mayor frecuencia. La cohorte final incluyó 232 conjuntos de datos. Comparamos manualmente cada conjunto de datos con versiones archivadas alojadas en Internet Archive . Solo rastreamos alteraciones en las palabras, no en los números de los datos. No rastreamos cambios en los sitios web del Gobierno de los EE. UU. distintos de los que alojan los conjuntos de datos. Los detalles metodológicos completos se encuentran en el apéndice (págs. 2-3 ).
Descubrimos que 114 (49 %) de los 232 conjuntos de datos incluidos se modificaron sustancialmente. De estos, la gran mayoría (106 conjuntos de datos [93 %) tenían la palabra género cambiada a sexo ( apéndice pág. 2 ). Solo 15 (13 %) de los 114 conjuntos de datos modificados registraron o indicaron de otro modo que se había producido el cambio. Las modificaciones en 89 (78 %) de los conjuntos de datos se referían a la clasificación o categorización de los datos, como encabezados de columna o categorías de estratificación, y las modificaciones en los 25 restantes (22 %) se referían a descripciones de los datos, como etiquetas o introducciones narrativas al conjunto de datos.
Las modificaciones abarcan el período estudiado. De los 114 conjuntos de datos con cambios sustanciales, 4 (4%) se modificaron entre el 20 y el 31 de enero de 2025; 30 (26%) se modificaron entre el 1 y el 28 de febrero de 2025; y 82 (72%) entre el 1 y el 25 de marzo de 2025. En 28 (25%) de los conjuntos de datos modificados, el cambio mejoró la coherencia de las descripciones. En estos casos, el término género se había aplicado a datos también etiquetados como sexo (p. ej., una categoría de estratificación etiquetada como género, mientras que la columna de datos subyacente se titulaba sexo; tras el cambio, solo se mantuvo el término sexo).
Este estudio presenta limitaciones. No se realizaron pruebas de fiabilidad entre evaluadores para la distinción subjetiva entre cambios administrativos o rutinarios y cambios potencialmente sustanciales. Tampoco se registraron las modificaciones en las cifras de los datos, ya que no se pudo determinar si estos cambios formaban parte del proceso normal de actualización. Además, muchos conjuntos de datos no contaban con copias archivadas o disponibles, y los conjuntos de datos archivados podrían no ser representativos de todos los conjuntos de datos en los repositorios estudiados.
Como demuestra esta investigación, las agencias de salud pública estadounidenses que publican grandes cantidades de datos en sus sitios web han estado alterando el contenido de dichos conjuntos de datos de maneras que podrían tener motivaciones políticas y no ser transparentes. Hasta ahora, el cambio más común, con diferencia, ha sido de género a sexo. Sin embargo, no se trata de una alteración trivial. Dado que algunos encuestados responden a las preguntas sobre género de forma diferente a las preguntas sobre sexo,<sup> 9</sup> modificar estos términos altera la precisión del conjunto de datos y las conclusiones que se pueden extraer. Estos datos se utilizan actualmente para estudiar intervenciones y resultados sanitarios, por lo que modificar los términos en secreto degrada la calidad de la información subyacente y puede socavar la interpretación de los resultados de estos estudios, o incluso invalidarlos. En términos más generales, si un gobierno modifica un conjunto de datos sin registrarlos, se reduce la confianza en su contenido y se vuelve mucho menos útil para los investigadores. Los datos del gobierno estadounidense solo son útiles si son correctos y fiables.
Existen medidas para garantizar la integridad de los datos federales de salud pública. Muchas organizaciones no gubernamentales están descargando y almacenando datos. Los investigadores individuales que participan en la recopilación de datos pueden intentar publicar sus propias copias. Los investigadores también pueden revisar periódicamente los datos de los que tienen conocimiento personal y advertir sobre los cambios. Algunas bases de datos e infraestructuras de datos del gobierno de EE. UU. cuentan con alternativas alojadas internacionalmente (p. ej., Europe PMC , una base de datos de literatura sobre ciencias de la vida que puede ser una alternativa a PubMed, con sede en EE. UU. [aunque se basa en PubMed]); otros gobiernos podrían tener que intervenir para seguir desarrollando estas alternativas.
A pesar de los llamados del Secretario Robert F Kennedy Jr (Departamento de Salud y Servicios Humanos) a una “transparencia radical”, 10 la manipulación de datos no registrados se aleja de una transparencia significativa. La integridad de los datos en el gobierno de los EE. UU. es particularmente importante porque el gobierno de los EE. UU. alberga muchos repositorios de datos globales que son cruciales para científicos e investigadores de salud pública, como PubMed y ClinVar . El uso de estos repositorios depende de las contribuciones de investigadores de todo el mundo, que podrían estar menos interesados en participar si les preocupa que su investigación y datos sean alterados. Es inevitable que algunas palabras aplicadas a la recopilación de datos sean políticamente controvertidas o el resultado de elecciones politizadas y carezcan de consenso universal. Sin embargo, la transparencia puede garantizar que estos conjuntos de datos sigan siendo confiables y útiles. Para facilitar mejor la investigación científica y de salud pública, las bases de datos deben usar términos que describan con precisión los datos recopilados y, si se deben realizar cambios, estos deben registrarse claramente.
Intereses en competencia
Todos los autores tuvieron pleno acceso a los datos de la correspondencia y fueron los responsables finales de la decisión de enviar el artículo para su publicación. JF declara haber recibido honorarios de Houston Law Review no relacionados con el presente manuscrito. ASK declara no tener conflictos de intereses. En el apéndice se encuentra una tabla de sitios web con modificaciones sustanciales. Cualquier otra información puede solicitarse al autor correspondiente. ASK recibió financiación de Arnold Ventures para este proyecto.
Material complementario (1)
Apéndice suplementario
Referencias
Departamento de Asuntos de Veteranos de los Estados Unidos
Número total de veteranos, usuarios veteranos del VA y usuarios veteranos de atención médica del VA en el año fiscal 2021 por sexo y grupo de edad
https://www.data.va.gov/dataset/FY-2021-Total-Number-of-Veterans-Veteran-VA-Users-/6fsh-rj6s/about_data
Fecha de acceso: 26 de junio de 2025
La Casa Blanca
Defender a las mujeres del extremismo de la ideología de género y restaurar la verdad biológica en el gobierno federal
https://www.whitehouse.gov/presidential-actions/2025/01/defendiendo-a-las-mujeres-de-la-ideología-de-género-y-el-extremismo-y-restaurando-la-verdad-biológica-al-gobierno-federal/
Fecha: 20 de enero de 2025
Fecha de acceso: 26 de junio de 2025
Martín, EG ∙ Gascó-Hernández, M
Datos abiertos de salud en la nueva administración presidencial: oportunidades y estrategias para el éxito
Foro de Salud de JAMA. 2021; 2 , e201619
Precio, 2.º, WN ∙ Freilich, J
Los datos como política
SSRN.2025 ;
publicado en línea el 2 de mayo. https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5199642
Myers, SR ∙ Carr, BG ∙ Branas, CC
Uniendo grandes datos de salud para un sistema nacional de salud de aprendizaje en Estados Unidos
JAMA Pediatr. 2016; 170 :1133-1134
Freilich, J ∙ Price, 2.º, WN ∙ Kesselheim, AS
Datos que desaparecen en el gobierno federal de EE.UU.
N Engl J Med. 2025;
publicado en línea el 26 de marzo. https://doi.org/10.1056/nejmp2502567
Ley Pública 115–435. Título II—Ley de Datos Abiertos del Gobierno
https://www.congress.gov/115/plaws/publ435/PLAW-115publ435.pdf
Fecha de acceso: 26 de junio de 2025
Sachs, JD ∙ Karim, SSA ∙ Aknin, L ∙ et al.
La Comisión Lancet sobre las lecciones para el futuro de la pandemia de COVID-19
Lancet. 2022; 400 :1224-1280
Jacobs, JW ∙ Bibb, LA ∙ Shelton, KM ∙ et al.
Evaluación del uso de la terminología de sexo y género en bases de datos federales, estatales y locales de EE. UU.
Médico Interno JAMA. 2022; 182 :878-879
Lurie, P ∙ Kesselheim, A ∙ Sharfstein, J
No es difícil ver a través de la promesa de «transparencia radical» de RFK Jr.
The Washington Post, 24 de abril de 2025
https://www.washingtonpost.com/opinions/2025/04/24/robert-kennedy-hhs-transparency/
Fecha de acceso: 27 de junio de 2025

















