Recibido: 9 de abril de 2024
Aceptado: 16 de julio de 2024
Disponible: 20 de agosto de 2024
La diabetes mellitus tipo 2 es una enfermedad crónica no transmisible, causada por un trastorno en el metabolismo de la glucosa, que provoca un aumento anormal de su concentración en la sangre. El diagnóstico tardío de esta enfermedad contribuye al aumento de las tasas de morbilidad y mortalidad a nivel mundial. El desarrollo de modelos basados en inteligencia artificial para la predicción de diabetes podría acelerar el diagnóstico. Por tanto, el objetivo del presente estudio fue implementar un modelo de predicción de diabetes mellitus tipo 2 basado en mapas cognitivos difusos entrenado con un algoritmo genético. La metodología empleada consistió en utilizar un conjunto de datos del Instituto Nacional de Diabetes y Enfermedades Digestivas y Renales de la población de indios PIMA, que contiene información demográfica y clínica de 768 pacientes. El 70 % de los datos se empleó para el entrenamiento y validación, y el 30 % restante se utilizó para las pruebas de rendimiento. El modelo de mapas cognitivos difusos puede predecir la enfermedad con un 99 % de exactitud, 98 % de precisión y recall de 100 %. Se concluye que el modelo presenta una buena capacidad para predecir y evaluar el comportamiento de las variables de interés en la diabetes mellitus tipo 2, mostrando su valor como herramienta de soporte en la identificación oportuna de la enfermedad y apoyo a la toma de decisiones por parte del profesional médico.
Palabras clave: diabetes Mellitus Tipo 2, mapas cognitivos difusos, factores de riesgo, algoritmos de predicción, algoritmos genéticos.
Type 2 diabetes mellitus is a chronic non-communicable disease caused by a disorder in glucose metabolism, which results in an abnormal increase in glucose concentration in the blood. The late diagnosis of this disease contributes to the increased worldwide rates of morbidity and mortality. The development of models based on artificial intelligence for the prediction of diabetes could accelerate diagnosis. Therefore, the aim of the present study was to develop a prediction model for type 2 diabetes mellitus based on fuzzy cognitive maps trained with a genetic algorithm. The methodology employed consisted of using a dataset from the National Institute of Diabetes and Digestive and Kidney Diseases PIMA Indian population, which contains demographic and clinical information from 768 patients. For training and validation, 70 % of the data was used and the remaining 30 % was used for performance testing. The fuzzy cognitive map model can predict the disease with 99 % accuracy, 98 % precision, and 100 % recall. It is concluded that the model presents a good ability to predict and evaluate the behavior of the variables of interest in type 2 diabetes mellitus, showing its value as a support tool for the timely identification of the disease and support for decision making by the physician.
Keywords: Type 2 Diabetes Mellitus, fuzzy cognitive maps, risk factors, prediction algorithms, genetic algorithms.
La diabetes mellitus tipo 2 (DM2) es un trastorno metabólico crónico caracterizado por presentar resistencia a la insulina y una producción anormal de esta hormona, lo que provoca niveles elevados de glucosa en sangre [
El principal problema asociado a la DM2 es su significativa repercusión tanto en la salud individual como en los sistemas de salud pública, en muchos casos debido a la baja oportunidad para el diagnóstico y manejo clínico. Por lo tanto, un diagnóstico tardío puede generar complicaciones que llevan a la muerte [
Para abordar esta problemática, se han publicado diversos estudios para la predicción y clasificación de la diabetes [
Otros estudios han utilizado un enfoque no estadístico para estudiar el problema de la predicción de diabetes, como los mapas cognitivos difusos (FCM, por sus siglas en inglés) [
Existen pocos reportes en la literatura relacionados con el desarrollo de modelos de FCM y algoritmos de optimización que motivaron la presente investigación. En primer lugar, [
En [
Por lo tanto, el objetivo de la investigación fue implementar un modelo de FCM optimizado con un AG para la predicción inteligente de DM2. El AG es un algoritmo más robusto que puede manejar una amplia variedad de problemas complejos, gracias a la diversidad genética en la población, lo que ayuda a evitar la convergencia prematura. Los AG exploran mejor el espacio de búsqueda de soluciones, desde luego, a costa de una mayor complejidad y tiempo de ejecución [
El documento está organizado de la siguiente manera: en la Sección 2, se detalla la metodología empleada en el estudio, describiendo el conjunto de datos, las técnicas de preprocesamiento, construcción del modelo basado en FCM y AG, configuración experimental y evaluación. En la Sección 3 se muestran los resultados experimentales y se comparan con trabajos relacionados. Finalmente, en la Sección 4 se presentan las conclusiones del estudio, limitaciones y trabajos futuros.
En esta sección, se describe el marco metodológico utilizado para la implementación de los FCM con AG. En la Figura 1 se puede observar la metodología general que incluye varias etapas, desde la recolección de los datos, la fase de preprocesamiento, el entrenamiento del modelo de FCM con un AG y su posterior evaluación en un conjunto de pruebas.
Se utilizó la base de datos de DM2 del Instituto Nacional de Diabetes y Enfermedades Digestivas y Renales de la población de indios Pima [
| Concepto | Nombre de la variable | Breve descripción de la variable |
| C1 | Número de embarazos | Número de veces que la mujer se ha encontrado en estado de embarazo. |
| C2 | Glucosa plasmática (TTOG) | Concentración de glucosa plasmática a las 2 horas, en un test de tolerancia oral a la glucosa (TTOG). |
| C3 | Presión sanguínea diastólica (mmHg) | Presión entre latidos cuando el corazón se está llenando de sangre. |
| C4 | Espesor del pliegue cutáneo del tríceps (mm) | Espesor de la piel que permite estimar la cantidad de tejido adiposo subcutáneo. |
| C5 | Insulina sérica (µU/ml) | Medición de insulina sérica a las 2 horas |
| C6 | Índice de Masa Corporal (kg/m2) | Es un índice que se calcula con base en el peso y la estatura de la persona. |
| C7 | Función del pedigrí de diabetes | Una función que califica la probabilidad de padecer diabetes basado en los antecedentes familiares |
| C8 | Edad | Tiempo que ha pasado desde el nacimiento de un individuo. |
| C9 | Diagnóstico | Proceso en el que se identifica una enfermedad, afección o lesión por sus signos y/o síntomas. |
Teniendo en cuenta que el conjunto de datos consiste en información clínica de 500 individuos sin DM2 y 268 con DM2, el problema del desbalance de clases fue abordado generando instancias sintéticas de los individuos con DM2, con el fin de equilibrar el conjunto de datos. Para ello, se empleó la técnica de Sobremuestreo Sintético de Clase Minoritaria (SMOTE, por sus siglas en inglés) [
Los FCM son una herramienta de IA que utiliza los aspectos principales de la lógica difusa y las redes neuronales artificiales. En los últimos años, han demostrado su potencial para modelar sistemas de apoyo en la toma de decisiones, analizar sistemas complejos por medio del razonamiento causal y facilidad para la representación del conocimiento [
La Figura 2 ilustra los componentes principales que integran un FCM. Este consta en primer lugar de nodos o conceptos (C), que representan las variables incluidas en el conjunto de datos PIMA (Tabla 1) [
Matemáticamente, un FCM es definido mediante (1)
donde 𝑛 es el número de conceptos, 𝑊 representa la matriz de pesos que define las relaciones entre los conceptos, 𝑓(⋅) es una función de activación que mantendrá los valores de los conceptos en un rango determinado por r.
El proceso de inferencia de los FCM consiste en la multiplicación sucesiva de un vector de activación 𝑣(0) y la matriz 𝑊 hasta que el sistema alcanza un estado estacionario. La ecuación 2 resume el proceso de inferencia o razonamiento del FCM:
\[ a_j (t+1) = f \left( \sum_{i=1, i \neg j}^{m} W_{ij} a_j (t) \right) \quad\quad\quad\quad (2) \]
donde 𝑎𝑗 (𝑡 + 1) es el valor del concepto 𝐶𝑗 en la iteración 𝑡 + 1, 𝑚 es el número de conceptos, 𝑊𝑖𝑗 es el valor de la relación entre el concepto 𝐶𝑖 y el concepto 𝐶𝑗, y 𝑎𝑗 (𝑡) es el valor del concepto 𝐶𝑗 en la iteración 𝑡.
En el presente estudio, se empleó un AG para optimizar el modelo de FCM. Los AG son herramientas computacionales de búsqueda aleatoria basada en los principios de la genética y la selección natural biológica de Darwin. Es un algoritmo basado en población, que utiliza el concepto de supervivencia del más apto, en donde la alternativa óptima consta de los mejores componentes (genes) y se transmite de una generación a la siguiente [
La Figura 3 muestra la representación esquemática de las cinco etapas que se llevan a cabo durante la implementación de un AG. Dada una función de aptitud 𝑓, se busca maximizar (o minimizar) 𝑓(𝑥), 𝑥 ∈ 𝑋. Así, el proceso comienza con una población inicial aleatoria. Como ejemplo, tenemos 3 individuos con diferentes tipos de genes. En la etapa dos ocurre la evaluación usando la función de aptitud, lo que permite clasificar a la población como apta o no idónea. Tras el cálculo del valor de aptitud, continúa la etapa de selección para elegir a los mejores padres, los cuales siguen a las etapas de cruce y mutación. La operación de cruce se aplica para intercambiar información entre dos padres seleccionados. Durante la etapa mutación, se cambian los genes de los cromosomas de la descendencia cruzada.
Al finalizar las operaciones de selección, cruce y mutación, la nueva población se genera por completo y se obtendrán los individuos óptimos. El proceso es iterativo y se detendrá si hay convergencia de resultados o si el número de iteraciones supera el umbral máximo[
En la Figura 1, se observa la metodología empleada por el AG para la optimización del FCM. Inicialmente, se inicia una población aleatoria para asignar los pesos (W) del FCM teniendo en cuenta las variables del conjunto de datos. Los modelos de FCM obtenidos se someten a un proceso de inferencia utilizando tres componentes: la matriz de pesos o influencias (𝑊 ∈ ℝ𝑚𝑥𝑚) que define la interacción entre los conceptos; una función de activación matemática que mantiene los valores de los conceptos en un rango; y un vector de estado (𝑎 ∈ ℝ𝑚). En esta etapa se calcula el vector de estado (𝑎) a través de sucesivas multiplicaciones con la matriz de pesos, hasta que el sistema encuentre estabilidad. Tras el proceso de inferencia, los FCM son evaluados a través de métricas para medir el desempeño en el conjunto de datos de validación. Los FCM con mejor rendimiento son seleccionados para la etapa de cruce y mutación con el fin de desarrollar una nueva generación. El proceso se repetirá iterativamente hasta llegar a la condición de parada, que obtendrá el FCM con mejor desempeño.
El conjunto de datos preprocesados se dividió en un 70 % para el entrenamiento y validación del modelo. El 30 % restante de los datos, fue utilizado para la etapa de prueba del FCM seleccionado en la etapa de entrenamiento. La configuración de los hiperparámetros de las técnicas empleadas para la construcción de modelo, se pueden observar en la Tabla 2.
| Técnica | Hiperparámetro | Opciones de configuración |
| FCM | Función de activación | Sigmoide, tangente hiperbólica |
| Función de inferencia | Kosko, Kosko modificado, Rescaled | |
| AG | Población inicial | Valores aleatorios entre 20 y 200 |
| Probabilidad de cruce | Valores aleatorios entre 0 y 1 | |
| Probabilidad de mutación | Valores aleatorios entre 0 y 1 |
Finalmente, el mejor modelo seleccionado se aplicó al conjunto de datos de prueba (30 %) para evaluar su rendimiento. El desempeño predictivo del modelo fue evaluado a través de métricas como exactitud, precisión, recall e índice Kappa. A continuación, se describen brevemente las métricas utilizadas para evaluar el rendimiento del modelo:
Exactitud: proporción de instancias que el modelo clasificó correctamente entre el número total de elementos. Una mayor exactitud significa un mayor rendimiento del modelo (3)
\[ \textit{Exactitud} = \frac{VP + VN}{VP + FN + FP + VN} \quad\quad\quad\quad (3) \]
donde VP son los verdaderos positivos, VN los verdaderos negativos, FN los falsos negativos y FP los falsos positivos.
Precisión: proporción de verdaderos positivos entre la cantidad total de predicciones que el modelo ha clasificado como positivas (4)
\[ \textit{Precisión} = \frac{VP}{VP + FP} \quad\quad\quad\quad (4) \]
Recall: proporción de verdaderos positivos clasificados correctamente entre el total de los casos que realmente son positivos (5)
\[ \textit{Recall} = \frac{VP}{VP + FN} \quad (5) \]
Índice Kappa: medida que compara los resultados de la clasificación con los valores asignados por azar. Tiene valores entre 0 y 1, entre más cercano a uno, más concordancia existe en la clasificación.
Por último, se realizaron iteraciones simuladas usando los paquetes fcmggplot2 [
En esta sección, se presentan los resultados obtenidos en el desempeño del modelo para predicción de DM2 basado en FCM y una comparación cuantitativa con investigaciones reportadas en la literatura que emplearon el mismo conjunto de datos.
En el análisis descriptivo del conjunto de datos, el 100 % de los individuos eran mujeres (35 % eran diabéticas y el 65 % no diabéticas) con edades comprendidas entre 21 y 81 años, con un promedio de 33±12 años. Las mujeres con diabetes presentaron una edad promedio de 37±11 años y las mujeres sin la enfermedad una media de 31±11,7 años. La edad constituye una variable de gran interés en el diagnóstico de la DM2, en [
| Variable | Mujeres sin diabetes (clase 0) n = 500 | Mujeres diabéticas (clase 1) n= 268 | ||
| Media | DE | Media | DE | |
| C1 | 3,3 | 3,0 | 4,9 | 3,0 |
| C2 | 110,6 | 24,8 | 142,3 | 24,8 |
| C3 | 70,9 | 12,2 | 75,3 | 12,2 |
| C4 | 27,2 | 10,0 | 33,0 | 10,0 |
| C5 | 130,3 | 102,5 | 206,8 | 102,5 |
| C6 | 30,9 | 6,6 | 35,4 | 6,6 |
| C7 | 0,4 | 0,3 | 0,6 | 0,3 |
| C8 | 31,2 | 11,7 | 37,1 | 11,7 |
El modelo final optimizado consistió en un FCM entrenado con AG usando los siguientes hiperparámetros: población inicial = 200, probabilidad de cruce = 0.5, probabilidad de mutación = 0.5, función de activación = sigmoidea, función de inferencia = rescaled. El modelo obtuvo una exactitud del 99 %, una precisión de 98 % y un recall del 100 % en la predicción de DM2. Con relación al grado de concordancia entre la predicción de nuestro modelo y el diagnóstico real, se obtuvo un índice Kappa de Cohen de 0,98 un valor casi perfecto según [
| Diagnóstico | |||
| Sin diabetes | Con diabetes | ||
| Predicción con FCM-AG | Negativa | 147 | 3 |
| Positiva | 0 | 150 | |
En la Tabla 5, se muestran las métricas de desempeño obtenidas por el modelo y una comparación con los reportes en la literatura. La exactitud indica que el modelo clasificó correctamente el 99 % de las predicciones, la precisión demostró que el 98 % de las pacientes clasificadas como diabéticas son realmente positivas y un recall de 100 % indica que el modelo tiene una buena capacidad para identificar los casos verdaderamente positivos de DM2, lo que demuestra que en general el enfoque propuesto es confiable y presenta un buen desempeño.
| Autores | Modelo | Exactitud | Precisión | Recall |
| Gupta y Goel [28] | RF | 0,88 | 1,00 | 0,60 |
| Febrian y colaboradores [29] | NB | 0,76 | 0,73 | 0,71 |
| Reza y colaboradores [30] | SVM | 0,85 | 0,83 | 0,87 |
| Tasin y colaboradores [6] | XGBoost | 0,81 | 0,81 | 0,81 |
| Li y colaboradores [31] | KNN + GA | 0,88 | - | 0,89 |
| Olisah [32] | 2GDNN | 0,97 | 0,97 | 0,97 |
| Nuestro modelo | FCM + GA | 0,99 | 0,98 | 1,00 |
En los últimos años, se ha publicado una diversidad de artículos de investigación que emplean técnicas de IA en el conjunto de datos de PIMA para la predicción de la diabetes. Los modelos de ML han sido los más utilizados, presentando una buena capacidad para clasificar y predecir la enfermedad. Una comparativa de las métricas se puede observar en la Tabla 5. Por ejemplo, en [
En [
En [
Al comparar los resultados del modelo propuesto en esta investigación con otros enfoques reportados en la literatura, se puede evidenciar que el FCM optimizado con AG presenta un excelente desempeño para predecir la DM2. El modelo de FCM que se propone en esta investigación presentó un rendimiento superior en comparación con los trabajos de [
Una aplicación importante de los FCM es poder ser utilizados como modelos de apoyo a la toma de decisiones clínicas, por su facilidad en la interpretación. Permiten la generación de gráficas visualizables para el análisis de las variables asociadas al desarrollo de la enfermedad, permitiendo predecir el comportamiento de los conceptos en el tiempo [
Analizar el comportamiento de los factores de riesgo, es una de las prioridades para la detección temprana de la diabetes. El modelo de FCM optimizado con AG identificó relaciones positivas entre el diagnóstico de DM2 y los conceptos: C1 (número de embarazos), C2 (glucosa plasmática), C3 (presión sanguínea diastólica), C5 (insulina sérica) y C7 (función de pedigrí). Estudios han reportado que las mujeres con antecedentes de múltiples embarazos pueden tener un mayor riesgo de desarrollar la enfermedad, principalmente, si experimentaron diabetes gestacional [
En la Figura 4, se observa una representación gráfica del comportamiento de las variables predictoras de DM2. La simulación utiliza a una paciente con antecedentes de embarazo (línea amarilla), presión diastólica alterada (línea verde) e IMC aumentado (línea violeta). Las líneas en el gráfico representan la evolución de los conceptos a lo largo de las 35 iteraciones, donde los valores cercanos a 1 indican una mayor importancia de las variables asociadas. Algunos conceptos que inicialmente se encontraban inactivos, muestran un incremento a medida que avanza la simulación, como la concentración de glucosa (línea roja), niveles de insulina sérica (línea naranjada) y espesor del pliegue cutáneo del tríceps (línea morada), Al inicio no estaban activos, pero, posteriormente aparecen como curvas que incrementan sus valores a lo largo del tiempo.
De esta manera, estos resultados representados en forma gráfica le permiten al profesional médico realizar un análisis más completo de la DM2 para cada paciente. Los FCM pueden analizar variables sociodemográficas (edad, sexo, etc.), variables clínicas (signos, síntomas, historial médico, etc.) y resultados de mediciones biológicas sobre los pacientes (pruebas de laboratorio, índices biológicos, entre otros). Al visualizar estas relaciones, los FCM pueden ayudar a los médicos a predecir la progresión de la enfermedad, identificar el comportamiento de los factores de riesgo y realizar intervenciones tempranas que permitan tomar decisiones informadas al proporcionar una comprensión más completa de la condición del paciente [
La DM2 es una enfermedad metabólica crónica que puede afectar diversos órganos y está influenciada por los estilos de vida. Las altas tasas de morbilidad y mortalidad han centrado la atención de la aplicación de técnicas de IA. En este estudio, se propuso un modelo de predicción inteligente de DM2 basado en FCM optimizado con AG, con el objetivo de analizar el comportamiento de las variables que tienen un riesgo sustancial para predecir la diabetes en mujeres. Los resultados demuestran el potencial de los FCM para la predicción de la DM2 con un excelente desempeño, al lograr una exactitud del 99 %, precisión de 98 % y recall de 100 %, valores superiores a los reportados en la literatura. El modelo permite el análisis del comportamiento de las variables predictoras, al generar gráficos visualizables e interpretables de las variables en el tiempo. Este aspecto lo convierte en una opción para ser utilizado como sistema de apoyo a la toma de decisiones médicas, especialmente para profesionales con experiencia limitada y en zonas con acceso escaso a los sistemas de salud especializados. De esta manera se podría contribuir en la toma de acciones que prevengan el inicio de la enfermedad.
El presente estudio presenta algunas limitaciones. Inicialmente, están relacionadas con el alcance de los datos, debido a que la muestra sólo contiene información de mujeres de la etnia Pima, esto podría limitar la capacidad del modelo para generalizarse en otras poblaciones. Los factores de riesgo pueden variar entre las zonas geográficas, lo que podría disminuir la eficacia del modelo si se aplica en otra población. Por lo tanto, aumentar el número de registros, al incluir datos masculinos o de otros grupos sociales permitiría mejorar el análisis de la enfermedad. Para trabajos futuros, sería de interés emplear otras variables como pruebas de laboratorio, factores sociodemográficos, económicos y estilos de vida, importantes para comprender el riesgo de desarrollar DM2. Además, sería pertinente involucrar expertos en el área que asignen relaciones entre los conceptos de FCM. También incluir datos longitudinales para verificar el comportamiento de las variables a lo largo del tiempo. Finalmente, otro trabajo futuro interesante sería comparar el uso de los FCM con otros modelos de ML.
Los autores agradecen a los creadores del conjunto de datos. Adicionalmente, agradecen a la Universidad Cooperativa de Colombia por el apoyo parcial a esta investigación bajo el proyecto INV3569.
Los autores declaran que no tienen conflictos de interés en competencia, ni relaciones personales conocidas que pudieran haber influido en el desarrollo del trabajo presentado en este artículo.
William Hoyos: conceptualización, metodología, software, análisis, investigación, curación de datos, validación, visualización y escritura final de artículo.
Rander Ruiz: conceptualización, curación de datos, supervisión, redacción, revisión y edición.Kenia Hoyos: conceptualización, metodología, análisis, validación, supervisión, escritura, revisión y edición.