generAtion of Reliable syntheTIc health data for Federated leArning in seCure daTa Spaces-UC3M. - ARTIFACTS-UC3M Projects uri icon

type

  • National Research Project

reference

  • PID2022-141045OB-C43

date/time interval

  • September 1, 2023 - August 31, 2026

abstract

  • El objetivo principal del proyecto multidisciplinar e interdisciplinar ARTIFACTS es avanzar y escalar la atención médica basada en datos
    mediante el desarrollo de métodos novedosos que preservan la privacidad en centros de datos colaborativos, conformando espacios de
    datos seguros. En particular, se aplicará y probará en el dominio del cáncer de pulmón, pacientes en etapa III.
    En consecuencia, el progreso en la promoción general del conocimiento se realizará en:
    (i) Aprendizaje federado en espacios de datos seguros de múltiples nodos. Los algoritmos de aprendizaje federado se implementarán más
    allá del estado actual, es decir, más allá de una estructura de modelo fijo con pesos que se aprenden de forma incremental entre las
    diferentes instituciones. Datos sintéticos y reales se usarán en diferentes arquitecturas de aprendizaje federado, por lo que el enfoque a
    nivel de datos superará las limitaciones del modelo actual.
    (ii) Generación y uso de datos sintéticos confiables (categóricos, numéricos, lógicos, series temporales) en los centros de datos
    asociados. Los datos sintéticos se validarán estadísticamente para garantizar la solidez y la fiabilidad de las soluciones.
    (iii) Nuevos usos de datos sintéticos en el aprendizaje federado mediante su integración con datos reales en el centro de datos origen.
    Esto se considera una forma de aumento de datos para entrenar modelos locales con datos locales y globales sintéticos.
    El principal producto que demuestra y valida el uso práctico y el impacto de la investigación orientada a la salud del proyecto es la
    plataforma ARTIFACTS, una integración de todos estos elementos en centros de datos de salud ubicados en diferentes hospitales de
    España.
    En consecuencia, la investigación orientada a la salud se realizará en:
    - Diseño e implementación de un espacio de datos seguro orientado a la salud. Las innovaciones técnicas del proyecto se integrarán en
    una plataforma en la que la privacidad proporcionará al personal

keywords

  • datos sintéticos, aprendizaje federado, espacios de datos, privacidad, cancer de pulmón; synthetic data, federated learning, data spaces, privacy, lung cancer