Data Mining: Redes Bayesianas
Una
red Bayesiana es un grafo dirigido sin ciclos donde cada nodo representa una
variable, la cual puede ser medible, latente o una hipotesis; y cada enlace o
arcos representa una dependencia probabilística. Como ejemplo para describir
una red bayesiana podemos considerar una variable aleatoria Z dependiente de
otras dos variables (F1 y F2) obtendremos el siguiente grafo de esta relación (FÉLIX, 2007).
Figura 1 Grafo simple
Una
definición más practica puede ser Modelo gráfico probabilístico que permite
descubrir distribuciones conjuntas complejas (modelos) a partir de
distribuciones condicionales locales simples. Es la forma más básica y robusta de
obtener conocimientos de entornos inciertos (incertidumbre).(Feria,
2016)
El
concepto de redes bayesianas se le atribuye al filósofo e informático Judea
Pearl quien, en 1985, y quien es considerado como el padre de las redes
bayesianas, revolucionando el campo de la inteligencia artificial, y
convirtiéndose en una herramienta importante para muchas otras ramas de la
ingeniería y las ciencias naturales.
El
modelo que se usa las redes bayesianas se basa en la simplificación del mundo
para explicarlo de forma sencilla y tener solo en cuenta las variables e
iteraciones más significativas.
Las
redes bayesianas son un tipo de modelos de minería de datos que pueden ser
utilizados en diversas áreas como por ejemplo en la Figura 2 observamos
una red bayesiana donde se representa un conocimiento básico en medicina.
Figura 2 Ejemplo red
Bayesiana en medicina
En
este ejemplo los nodos representan enfermedades, síntomas y factores que causan
algunas enfermedades. El nodo al que apunta el arco es dependiente del nodo de
origen, por ejemplo, fiebre depende de tifoidea y gripe. La estructura de la
red brindara información sobre las dependencias probabilísticas entre las
variables. En este ejemplo, el nodo REACCIONES (R) es una condicional
independiente de COMIDA (C), GRIPE (G), FIEBRE (F) y DOLOR
(D) dado TIFOIDEA (T):
P(R|C,T,G,F,D) = P(R|T)
Para
el año de 1988 Lauritzen y Spiegelhalter crearon el modelo "Asia", un
ejemplo común y básico de una red bayesiana, la cual se puede utilizar para
diagnosticar a los nuevos pacientes de un médico. Cada nodo puede ser una característica
de un paciente; por ejemplo, "fumador" indica que se trata de un
fumador habitual y "VisitaAsia" muestra que recientemente ha viajado
a Asia. Los enlaces entre los nodos representan las relaciones probabilísticas;
por ejemplo, fumar aumenta las posibilidades de que el paciente padezca
bronquitis y cáncer de pulmón, mientras que la edad parece estar relacionada
únicamente con la posibilidad de desarrollar cáncer de pulmón. De la misma
forma, las anomalías detectadas en una radiografía de los pulmones pueden estar
causadas por tuberculosis o cáncer de pulmón, mientras que las posibilidades de
que un paciente tenga dificultades respiratorias aumentan si también padece
bronquitis o cáncer de pulmón. (IBM, 2019)
Ilustración 2 - Ejemplo de red Asia de Lauritzen y
Spegelhalter (tomado de www.ibm.com)
Existen
diferentes razones para elegir utilizar una red bayesiana dado a que resulta de
gran ayuda para obtener información acerca de las relaciones causales. También
permite conocer un área problemática y predecir las consecuencias de cualquier
intervención.
Comentarios
Publicar un comentario