Bayesian de aprendizagem, o modelo Naive Bayes

Bayesian de aprendizagem, o modelo Naive Bayes

Naïve Bayes é um classificador probabilístico simples baseado na aplicação de teorema de Bayes com suposição de independência entre as características.

Explicação da regra de Bayes:

Regra de Bayes afirma que p (h | e) = p (e | h) * p (h) / p (e)

A probabilidade de uma hipótese ou evento (h) ocorrendo pode ser previsto com base em evidências (e) que podem ser observados a partir de eventos anteriores.

Alguns termos importantes são:

Priori probability- A probabilidade de p (h) caso, antes da prova é observado.

Posterior probabilidade - A probabilidade de p (h | e) caso, após a prova é observado.

Bays ingênuos podem ser usados em áreas como a classificação de documentos (filtragem de spam, a classificação do site, etc ..) e também para eventos que 's características pode-se seguramente assumir independente ou que a criação de dependência com ser muito caro.

Seja H o caso de "febre" e E a evidência da "dor de garganta", então temos

P (febre | dor de garganta) = P (dor de garganta | febre) * P (febre) / P (nuvem escura)

P (dor de garganta | febre) é a probabilidade de que a pessoa tem "dor de garganta", dado ou durante uma "febre".

P (febre) - é a probabilidade de Prior. Isto pode ser obtido a partir dos prontuários de estatística como o número de pessoas que tiveram uma febre quando visitar o médico este ano.

P (dor de garganta) é a probabilidade de provas ocorrendo, que pode ser obtido a partir dos prontuários estatísticas, como o número de pessoas que tiveram uma ferida gargantas quando visitar o médico este ano.

Como se pode observar a partir do exemplo acima, podemos prever um resultado de alguns eventos, observando algumas evidências; os mais evidências a melhor previsão. Quando a inclusão de mais evidências para a construção de nosso modelo NB, poderíamos deparar com um problema de dependências. Por exemplo, incluindo as provas "tosse excessiva" pode ser devido a "dor de garganta" pode tornar o modelo complicado. Assim, assumimos que todas as evidências são "independentes" do outro, portanto, "ingênuo".

Regra de Bayes para várias evidências com independência

P (H | E 1 , E 2 , ..., E n ) = P (E 1 | H) x P (E 2 | H) x ... P (E n | H) x P (H)

P (E 1 , E 2 , ..., E n )

Exemplo 1: Vamos tentar construir um modelo NB. Usando exemplo tempo do livro "Data Mining, práticas ferramentas e técnicas de Aprendizado de Máquina"

Preveja se a equipa vai "brincar" dadas as características "outlook, temperatura, umidade e vento"

Vamos construir a tabela de diferentes evidências por característica e resultado classificação de frequência.

A tabela acima, tabula todos os dados em um único lugar, a fim de fazer uma comparação um pouco mais fácil cada valor de característica, como o Outlook = ensolarado tem freqüência de Sim versus não Sem classificação. A parte inferior tem a frequência relativa expressa em frações, como p (Outlook = ensolarado | Jogar = yes) = 2/9 p (Outlook = ensolarado | Jogar = não) = 3/5.

Agora que criamos o modelo NB através da tabela acima, podemos utilizar este modelo para prever a probabilidade de eventos "jogo" com base em diferentes valores em evidências. Por exemplo,

P [yes | outlook = chuvoso, temperatura = fresco, umidade = alta, ventoso = false] =

P [chuvoso | yes] * P [leve | yes] * P [high | yes] * P [falso | yes] * P [Sim] / P [chuvoso * legal * high falsa *] =

3/9 * 4/9 * 3/9 * 6/9 * 9/14, podemos ignorar P [Evidências] = 0,02116448

Também probabilidade de:

P [nenhum | outlook = chuvoso, temperatura = fresco, umidade = alta, ventoso = false] = 3/9 * 4/9 * 3/9 * 6/9 * 5/14 = 0,01175778

Finalmente irá converter os cálculos de probabilidade acima em probabilidade de normalização

P [Sim] = 0,02116 / (0,01175 + 0,02116) = 0,6431 ou cerca de 64,31% de chance de chover, dadas as evidências

P [No] = 0,01175 / (0,01175 + 0,02116) = 0,3568 ou cerca de 36,68% de chance de chuva dado evidências

Como lidar com zero de freqüência em nossos dados, tais como P (nublado | play = não) = . 0/5 Para estar no cofre do minerador de dados não deve indicar que uma hipótese ou evento nunca poderia ocorrer, a menos que haja verdadeira evidência científica que suporte uma probabilidade zero. Para resolver a frequência zero, usamos uma técnica conhecida como "estimativa de Laplace", adicionando uma constante " m "em todos os aspectos.

Explicação acima da estimativa foi de Laplace Haruechaiyasak, Choochart. "Um tutorial sobre Naive Bayes Classificação.".

Referências

1. http://en.wikipedia.org/wiki/Naive_bayes

2. -Haruechaiyasak, Choochart. "Um tutorial sobre Naive Bayes classificação." . Np, 16 08 2008 Web. 31 de outubro de 2013.

3. Jurafsky, Dan. " A classificação de texto e Naïve Bayes . " . Universidade de Stanford. Web. 31 de outubro de 2013.

Fonte: (Blog compscidata)

BONS ESTUDOS!!

Davi Guimarães©

17 de julho de 2014

Bayesian de aprendizagem, o modelo Naive Bayes

Translate This Site

Redes Sociais

Quem Sou

Visualizações do Blog

Participe do blog

Compartilhe o Blog no Face

Sites Parceiros

Visitantes Online

Origem dos Visitantes

Ultimas Postagens no Blog

Outras Midias:

Press

Outras Postagens

Hora Certa

Previsão do Tempo

Flickr Images