Filtrowanie spamu metodą Bayesa jest bardzo skuteczną formą filtrowania poczty e-mail stosowaną prawie we wszystkich rozwiązaniach antyspamowych. Metoda ta umożliwia identyfikację niepożądanej poczty e-mail z dużym stopniem dokładności. Filtr Bayesa może działać osobno dla każdego użytkownika.
Jego działanie opiera się na następującej zasadzie: W pierwszej
fazie odbywa się proces uczenia. Użytkownik ręcznie oznacza
wystarczającą liczbę wiadomości e-mail jako wiarygodną pocztę lub
jako spam (zazwyczaj 200/200 wiadomości). Filtr analizuje każdą
kategorię i na podstawie trendów dotyczących wiadomości tworzy
reguły filtrowania. Na przykład spam zazwyczaj zawiera takie słowa,
jak „rolex” czy „viagra”, natomiast wiarygodne wiadomości są
wysyłane przez członków rodziny lub z adresów znajdujących się na
liście kontaktów użytkownika. Po przetworzeniu wystarczającej
liczby wiadomości filtr Bayesa może przypisać każdej wiadomości
odpowiednią wartość „wskaźnika spamu” i określić, czy kwalifikuje
się ona jako spam.
Główną zaletą takiego rozwiązania jest jego elastyczność. Jeśli na przykład użytkownik jest biologiem, wszystkim przychodzącym wiadomościom e-mail dotyczącym biologii lub dziedzin pokrewnych ogólnie nadawany jest niższy wskaźnik prawdopodobieństwa, że są spamem. Jeśli wiadomość zawiera słowa, które w zwykłych okolicznościach kwalifikują ją jako niepożądaną, ale została wysłana przez osobę z listy kontaktów, jest ona oznaczana jako wiarygodna, ponieważ fakt wysłania przez osobę z listy kontaktów ogólnie zmniejsza prawdopodobieństwo, że jest ona spamem.












