[LUG.ro] Re: [LUG.ro] Sistemas antispam heurísticos y bayesianos

Fri, 25 Nov 2005 19:00:58 +0000 (GMT)

> POSTFIX-AMAVIS-CLAMAV-SPAMASSASIN 

El spamassain he podido verificar una capacidad
asitótica de acierto del 87% con una confianza del
95%... Es decir como autómata ciego es bastante
efectivo... No me he puesto a calcular la probabilidad
de error tipo I (Si el mensaje es verdadero se lo
considera spam) Y Error del tipo II (Si es spam se lo
considere bueno) (que no son probabilidades
complementarias aunque lo paresca...) En general a ojo
de buen cubero para un tráfico normal de 500 correos
semanales se escapan 4 basura, y 10 buenos son
considerados spam... En un buen entrenamiento... 
El serio problemas con los algoritmos probabilisticos
es que nos son 100% efectivos... y si manejas 5000 o
100000 correos semanales, siempre corres un riesgo de
que justo el mensaje más importante sea considerado
spam por error... 

Uno de los trucos más conocidos para burlar al
spam-assasin es colocar en le "Subject" de 7 a 10
caracteres aleatorios e intercambiar en el cuerpo del
mensaje enlaces a páginas porno o de ventas basura con
texto aleatório...
El perjuicio de que entrenar el filtro con estos
mensajes radica en que la probabilidad de cometer
error de tipo I se incrementa exponencialmente hasta
hacer peligroso el filtrado...

___________________________________________________________ 
1GB gratis, Antivirus y Antispam 
Correo Yahoo!, el mejor correo web del mundo 
http://correo.yahoo.com.ar