Data Mining: Modelo Bayesiano Naive
Es
una técnica de clasificación y predicción bastante usada en machine learning
debido a su simplicidad y rapidez para hacer clasificaciones. Este clasificador
asume que los atributos son independientes entre sí, basado en el teorema de
Bayes, este construye modelos que predicen la probabilidad de posibles
resultados. Es una técnica supervisada debido a que necesita tener ejemplos
previamente clasificados para que funcione.
Supongamos
que, de acuerdo a la información climática del día de hoy, decidir si se juega
tenis, teniendo en cuenta que tenemos 14 registros de días anteriores donde
hubo ocasiones donde no se pudo jugar.
Con la
información de la Tabla 1 calculamos las probabilidades totales cuando
se jugó y no se jugó.
Después de
esto y continuando con la información de la Tabla 1 armamos las tablas
de frecuencia con cada característica climática que se dio, determinando si se
jugó o no se jugó, calculando una probabilidad de cada condición.
Ya
con estas tablas y tomando la información de las condiciones climáticas del día
calculamos la probabilidad de estos valores asumiendo que la clase SI es
verdadera.
Y
realizamos lo mismo tomando NO como verdadero

De
esta forma obtenemos todos los valores y podemos calcular y determinar si se
puede jugar tenis, reemplazando en la formula
De
esta forma se determina que hay una probabilidad del 91.3 para poder jugar
tenis. Básicamente este es el funcionamiento del Modelo Bayesiano Naive.
Comentarios
Publicar un comentario