MedGemma forman parte de una serie de modelos de inteligencia artificial (IA) de código abierto desarrollados por Google y su principal característica es que están diseñados específicamente para el campo de la salud. Todos están basados en la arquitectura Gemma 3, que son modelos ligeros y de última generación.
Su principal objetivo es acelerar el desarrollo de aplicaciones de IA en el cuidado de la salud, además de ofrecer herramientas potentes para comprender y analizar tanto texto como imágenes médicas.
También lee: Tecnología médica robótica: ¿Cómo funciona en la rehabilitación de pacientes?
Google quiere revolucionar el campo de la salud con MedGemma
Una tendencia en aumento es la adopción de la IA dentro del sector sanitario. En la actualidad es de utilidad para mejorar la gestión del flujo de trabajo, la comunicación con los pacientes y el apoyo al diagnóstico y al tratamiento. Pero algo que no se puede olvidar es que este tipo de herramientas digitales siempre deben cuidar y preservar la privacidad de los usuarios.
Con esto en mente, a inicios de año Google presentó los nuevos modelos Health AI Developer Foundations (HAI-DEF). Consiste en una colección de modelos abiertos y ligeros diseñados para ofrecer a los desarrolladores puntos de partida sólidos para su propia investigación sanitaria y desarrollo de aplicaciones.
Debido a que los modelos HAI-DEF son abiertos, los desarrolladores mantienen el control total sobre la privacidad, la infraestructura y las modificaciones de los mismos. En el pasado mes de mayo fue lanzada la colección HAI-DEF con MedGemma, la cual contiene modelos generativos basados en Gemma 3 que están diseñados para acelerar el desarrollo de la IA en el sector sanitario.
Nuevos modelos recién lanzados
Mientras que ahora la novedad es el lanzamiento de dos nuevos modelos. El primero es MedGemma 27B Multimodal, que complementa los modelos 4B Multimodal y 27B de solo texto, lanzados anteriormente, al añadir compatibilidad con la interpretación multimodal compleja y longitudinal de historias clínicas electrónicas.
En tanto que el segundo modelo es MedSigLIP, un codificador ligero de imágenes y texto para clasificación, búsqueda y tareas relacionadas. Se basa en el mismo codificador de imágenes que impulsa los modelos MedGemma 4B y 27B.
MedGemma y MedSigLIP son excelentes puntos de partida para la investigación médica y el desarrollo de productos. La herramienta es útil para tareas de texto o imágenes médicas que requieren la generación de texto libre, como la generación de informes o la respuesta visual a preguntas.
MedSigLIP: Un codificador de imágenes especializado para la atención médica
MedSigLIP es un codificador de imágenes ligero con tan solo 400 millones de parámetros que utiliza la arquitectura SigLIP (pérdida sigmoidea para el preentrenamiento de imágenes de lenguaje).
En su caso, se adaptó de SigLIP mediante la optimización con diversos datos de imágenes médicas, como radiografías de tórax, parches histopatológicos , imágenes dermatológicas e imágenes de fondo de ojo , lo que permite al modelo aprender características específicas de estas modalidades.
También lee: Desafíos éticos para los médicos que utilizan la IA: La tecnología no es perfecta
Beneficios de los modelos de código abierto
Dado que la colección MedGemma de Google es abierta, los modelos se pueden descargar, desarrollar y ajustar para satisfacer las necesidades específicas de los desarrolladores. En particular, en el ámbito médico, este enfoque abierto ofrece varias ventajas diferenciadoras sobre otros modelos.
- Flexibilidad y privacidad: los modelos se pueden ejecutar en hardware propietario en el entorno preferido del desarrollador, incluso en Google Cloud Platform o localmente, lo que puede abordar preocupaciones de privacidad o políticas institucionales.
- Personalización para un alto rendimiento: los modelos se pueden ajustar y modificar para lograr un rendimiento óptimo en tareas y conjuntos de datos objetivo.
- Reproducibilidad y estabilidad: Dado que los modelos se distribuyen como instantáneas, sus parámetros están congelados y, a diferencia de una API, no cambian inesperadamente con el tiempo. Esta estabilidad es especialmente crucial para aplicaciones médicas donde la consistencia y la reproducibilidad son fundamentales.