Menú
Daniel Rodríguez Herrera

El spam es mi debilidad

0
Todos recibimos en nuestro buzón de correos un montón de panfletos publicitarios que, en su mayor parte, no solemos ni siquiera leer. Pero ese montón nunca crece por encima de lo manejable pues existen diversas formas de impedirlo. La más evidente es que producir y repartir esa publicidad cuesta dinero, y nadie suele gastar si no piensa que va a reportarle algo. Por otro lado, siempre podemos ignorar las llamadas al portero automático por parte de los jóvenes “carteros comerciales”.

Desafortunadamente, no existe nada de esto en Internet. El spam (palabra que, lo crean o no, proviene de una escena de los Monty Python) es el correo electrónico no solicitado generado de forma automática. El coste de enviar enormes cantidades de mensajes electrónicos es casi cero, estando ese “casi” formado principalmente por la tarea de recopilar direcciones electrónicas válidas. Por otro lado, no se disponía de ninguna manera de evitar la recepción de los mismos. Esto ha provocado que aproximadamente un tercio de todos los mensajes que circulan por la red sean de este tipo, y su proporción siga aumentando. Por eso he apoyado todo esfuerzo legislativo para frenar esta práctica, incluyendo la LSSI, aún cuando el carácter internacional de la red siempre permita a los spammers continuar sus prácticas de una manera u otra.

Pero he aquí que la gran capacidad autocorrectora de la red está actuando una vez más, por medio de unos programas (que como Bogofilter, de Eric S. Raymond, aún no están disponibles en Windows) que emplean la probabilidad bayesiana para marcar los mensajes como spam. La técnica bayesiana permite hallar la probabilidad de que una hipótesis sea cierta (en este caso, que el mensaje sea spam), una vez comprobado que suceden ciertos eventos (por ejemplo, la aparición de palabras como “sex” o “unsuscribe”), a partir de las probabilidades de que sucedan esos eventos sabiendo que la hipótesis es cierta. Estas últimas son relativamente fáciles de calcular en nuestro caso, cogiendo mensajes calificados como spam, y observando las palabras que aparecen en ellos.

En definitiva, estos filtros lo que hacen es aprovechar la experiencia de los usuarios, que detectamos a primera vista este tipo de misivas, para mejorar y depurar su comportamiento. Su mayor defecto, como el de todo filtro, es que es inevitable que eliminen algún mensaje útil. Sin embargo, se puede reducir ese riesgo de modo que resulte insignificante. Paul Graham, el autor del invento, asegura que actualmente el programa que está desarrollando sólo deja pasar un 0’5% de los mensajes publicitarios, sin falsos positivos.

Tan sólo nos queda esperar a que dichos programas pasen del campo de la experimentación al de la comercialización. Ignoro si Microsoft estará por la labor de actualizar su Outlook, pero el gestor de correo de Mozilla ya está planeando la incorporación de la implementación de Raymond. Parece que sólo reste esperar unos meses.

En Tecnociencia

    Lo más popular

    0
    comentarios

    Servicios