Tuesday, January 24, 2012

Un método para clasificar los patrones de cáncer de mama logra una exactitud del 99,63%

Un estudio realizado en la Universidad Politécnica de Madrid consigue una importante mejora en la clasificación de datos de cáncer de mama gracias a un  método de aprendizaje para redes neuronales artificiales. 




Investigadores del Grupo de Automatización en Señal y Comunicaciones de la Universidad Politécnica de Madrid (GASC/UPM) han aplicado un nuevo método de aprendizaje para redes neuronales artificiales inspirado en la metaplasticidad sináptica de las neuronas biológicas, que ha permitido clasificar los patrones de cáncer de mama de la base de datos Wisconsin (WBCD), referencia internacional en mamografías, con una exactitud del 99.63%.
El cáncer es una de las principales causas de mortalidad en todo el mundo y la investigación en su diagnóstico y tratamiento se ha convertido en un tema de vital importancia para la comunidad científica. La prevención sigue siendo un reto, y la mejor manera de aumentar la supervivencia de los pacientes es a través de la detección temprana.
Si las células cancerosas son detectadas antes de su diseminación a otros órganos, la tasa de supervivencia es superior al 97%. Por esta razón, el uso y perfeccionamiento de clasificadores automáticos que den soporte al diagnóstico médico se ha incrementado notablemente en los últimos tiempos. Estos sistemas de clasificación tratan de minimizar los posibles errores producidos por los especialistas, aumentar el número de diagnosis que pueden realizar en un tiempo dado, y su porcentaje de éxito.
La mayoría de estos sistemas están basados en técnicas de inteligencia artificial combinadas con procesado de señal, principalmente: redes neuronales artificiales, análisis wavelet, análisis de imágenes mediante modelos Bayesianos, máquinas de vector soporte, lógica difusa y modelos fractales entre otras potentes técnicas matemáticas.
Es concretamente una red neuronal artificial (AMMLP), entrenada con un nuevo método (Metaplasticidad Artificial) propuesto por el profesor Diego Andina y aplicado a datos de cáncer por el investigador Alexis Marcano-Cedeño, ambos pertenecientes al Grupo de Automatización en Señal y Comunicaciones de la Universidad Politécnica de Madrid (GASC/UPM), la que ha conseguido los mejores resultados hasta el momento.
Metaplasticidad
El concepto de la Metaplasticidad biológica fue definido en 1996 por Abraham W.C. El prefijo “meta” viene del griego y significa “más allá” o “por encima”, y la palabra “plasticidad” está relacionada con la capacidad que tienen las neuronas de modificar el valor de la fuerza de las uniones sinápticas.
Abraham definió la metaplasticidad como la inducción de los cambios sinápticos en función de la actividad sináptica previa, es decir, que la metaplasticidad depende en buena medida del historial de activación de las sinapsis, y formuló la hipótesis de que la metaplasticidad juega un importante papel en la estabilidad (homeóstasis), eficiencia del aprendizaje y mecanismo de memoria biológica.
La base de datos del cáncer de mama de Wisconsin (WBCD) es una de las más conocidas y utilizada para probar algoritmos de clasificación de patrones de cáncer de mama. La WBCD consta de 699 muestras. Cada registro de la base de datos tiene nueve atributos. Se asignan valores enteros de 1 a 10 a las evaluaciones, siendo 1 el más cercano benigno y 10 el más cercano a maligno. Cada muestra se asocia también con una etiqueta de clase, que puede ser “benigno” o “maligno”. Este conjunto de datos contiene 16 entradas con valores de atributos desaparecidos que en este estudio se excluyeron del análisis. La base de datos contiene 444 (65,0%) muestras benignas y 239 (35,0%) muestras malignas.
Comparación y Discusión
Los resultados obtenidos en este estudio se compararon con otros  resultados, concretamente con los algoritmos actuales de mayor éxito, sobre la base de datos de Wisconsin.
El AMMLP obtuvo una exactitud en la clasificación de 99,63% en la mejor simulación y un 99,58% como  promedio, mejorando los resultados del resto de clasificadores. Además el AMMLP, en comparación con otros algoritmos, exhibe un bajo costo computacional y es fácil de implementar. El éxito del sistema propuesto refuerza algunas de las hipótesis de Abraham, y establece otras nuevas, lo que podría dar lugar a consecuencias relevantes no sólo en medicina, sino en la psicología y la cibernética.