Data Mining: Redes Bayesianas


Una red Bayesiana es un grafo dirigido sin ciclos donde cada nodo representa una variable, la cual puede ser medible, latente o una hipotesis; y cada enlace o arcos representa una dependencia probabilística. Como ejemplo para describir una red bayesiana podemos considerar una variable aleatoria Z dependiente de otras dos variables (F1 y F2) obtendremos el siguiente grafo de esta relación (FÉLIX, 2007).
  
 Figura 1 Grafo simple



Una definición más practica puede ser Modelo gráfico probabilístico que permite descubrir distribuciones conjuntas complejas (modelos) a partir de distribuciones condicionales locales simples. Es la forma más básica y robusta de obtener conocimientos de entornos inciertos (incertidumbre).(Feria, 2016)


El concepto de redes bayesianas se le atribuye al filósofo e informático Judea Pearl quien, en 1985, y quien es considerado como el padre de las redes bayesianas, revolucionando el campo de la inteligencia artificial, y convirtiéndose en una herramienta importante para muchas otras ramas de la ingeniería y las ciencias naturales.


El modelo que se usa las redes bayesianas se basa en la simplificación del mundo para explicarlo de forma sencilla y tener solo en cuenta las variables e iteraciones más significativas.


Las redes bayesianas son un tipo de modelos de minería de datos que pueden ser utilizados en diversas áreas como por ejemplo en la Figura 2 observamos una red bayesiana donde se representa un conocimiento básico en medicina.

 


Figura 2 Ejemplo red Bayesiana en medicina


En este ejemplo los nodos representan enfermedades, síntomas y factores que causan algunas enfermedades. El nodo al que apunta el arco es dependiente del nodo de origen, por ejemplo, fiebre depende de tifoidea y gripe. La estructura de la red brindara información sobre las dependencias probabilísticas entre las variables. En este ejemplo, el nodo REACCIONES (R) es una condicional independiente de COMIDA (C), GRIPE (G), FIEBRE (F) y DOLOR (D) dado TIFOIDEA (T):


P(R|C,T,G,F,D) = P(R|T)


Para el año de 1988 Lauritzen y Spiegelhalter crearon el modelo "Asia", un ejemplo común y básico de una red bayesiana, la cual se puede utilizar para diagnosticar a los nuevos pacientes de un médico. Cada nodo puede ser una característica de un paciente; por ejemplo, "fumador" indica que se trata de un fumador habitual y "VisitaAsia" muestra que recientemente ha viajado a Asia. Los enlaces entre los nodos representan las relaciones probabilísticas; por ejemplo, fumar aumenta las posibilidades de que el paciente padezca bronquitis y cáncer de pulmón, mientras que la edad parece estar relacionada únicamente con la posibilidad de desarrollar cáncer de pulmón. De la misma forma, las anomalías detectadas en una radiografía de los pulmones pueden estar causadas por tuberculosis o cáncer de pulmón, mientras que las posibilidades de que un paciente tenga dificultades respiratorias aumentan si también padece bronquitis o cáncer de pulmón. (IBM, 2019)



Ilustración 2 - Ejemplo de red Asia de Lauritzen y Spegelhalter (tomado de www.ibm.com)


Existen diferentes razones para elegir utilizar una red bayesiana dado a que resulta de gran ayuda para obtener información acerca de las relaciones causales. También permite conocer un área problemática y predecir las consecuencias de cualquier intervención.


Comentarios