Data Mining: Modelo Bayesiano Naive


Es una técnica de clasificación y predicción bastante usada en machine learning debido a su simplicidad y rapidez para hacer clasificaciones. Este clasificador asume que los atributos son independientes entre sí, basado en el teorema de Bayes, este construye modelos que predicen la probabilidad de posibles resultados. Es una técnica supervisada debido a que necesita tener ejemplos previamente clasificados para que funcione.



Supongamos que, de acuerdo a la información climática del día de hoy, decidir si se juega tenis, teniendo en cuenta que tenemos 14 registros de días anteriores donde hubo ocasiones donde no se pudo jugar.




Con la información de la Tabla 1 calculamos las probabilidades totales cuando se jugó y no se jugó.


Después de esto y continuando con la información de la Tabla 1 armamos las tablas de frecuencia con cada característica climática que se dio, determinando si se jugó o no se jugó, calculando una probabilidad de cada condición.



Ya con estas tablas y tomando la información de las condiciones climáticas del día calculamos la probabilidad de estos valores asumiendo que la clase SI es verdadera.



Y realizamos lo mismo tomando NO como verdadero

Ya con estos datos calculamos el valor de evidencia simplemente sumando las probabilidades calculadas anteriormente


De esta forma obtenemos todos los valores y podemos calcular y determinar si se puede jugar tenis, reemplazando en la formula





De esta forma se determina que hay una probabilidad del 91.3 para poder jugar tenis. Básicamente este es el funcionamiento del Modelo Bayesiano Naive.

Comentarios

Entradas populares de este blog

Data Mining: Redes Bayesianas