Evil Mail
Hace tiempo escribí un filtro de direcciones de correo electrónico en Python. Se trata de un script que realiza, de forma automática, una búsqueda de las direcciones de correo electrónico que se encuentren dentro de cualquier texto, como correos electrónicos. Desafortunadamente tenía algunos problemas, había casos en que detectaba como dirección de correo una cadena que no lo era y omitía algunas que sí lo eran. En fin, necesitaba corregir esos errores.
Aprovechando las vacaciones retomé el pequeño proyecto. Hice una función de validación muy elegante a partir de una máquina de estados finitos (FSM) que contempla cada caso posible según se especifica en el estándar RFC 2822 para que no se vaya a escapar ningún correo.
El script quedó listo, reutilicé la mayor parte del código original y afiné algunos detallitos. Para hacer una prueba busqué en mi cuenta de correo las cadenitas que me mandaron en el año (2007). Son pocas realmente, porque quienes me conocen saben que me desagradan estas cosas, así que casi no me llegan.
En fin, juntar todos los correos de este tipo llevó muy poco tiempo y, aún así, logre extraer 836 direcciones de correo electrónico, ninguna de ellas repetida. El siguiente paso será obtener todas las direcciones de mi cuenta actual de correo y algunas más de mi abandonada cuenta de hotmail, la cual (a diferencia de la otra) se encuentra atascada de cadenitas, spam y otras linduras.
Todas estas direcciones de correo llegan a mi gracias a todos aquellos que; ya sea por pereza, indiferencia o ignorancia; reenvían sus cadenitas a todos sus contactos, sin tener la gentileza de ocultar sus direcciones a fin de evitar que personas como yo se hagan de una compilación de direcciones, como la que acabo de obtener, y que seguramente será usada para oscuros y misteriosos propósitos spam-eros.
18 de Diciembre de 2007, 16:05
Este… si sale alguna dirección mía no vayas a ser ogeis.