October 27th, 2009

nepal

wiki spam checker

За обедом придумали с коллегой некий антиспам, позволяющий выставить оценку изменению вики-страницы. Ну, то есть, если изменение хорошее, то оценка положительная, а если плохое, то отрицательная. Принцип довольно простой, но я не хочу тут его описывать, чтобы спамеры не читали.

Тулза представляет из себя дикую смесь shell-скриптов с вкраплениями sed, awk, sort и т.п. Воткнул вызов в крон, получаю отчёты по почте. Вот пример отчёта:

-274.38	http://wiki.openvz.org/w/index.php?title=Talk:Main_Page&oldid=7616&diff=7852
  -8.00	http://wiki.openvz.org/w/index.php?title=Compiling_the_OpenVZ_kernel_(the_Debian_way)&oldid=6641&diff=7857
   0.00	http://wiki.openvz.org/w/index.php?title=Main_Page&oldid=7484&diff=7854
   0.00	http://wiki.openvz.org/w/index.php?title=Template:List_of_precreated_contrib_templates&oldid=7572&diff=7856
  31.22	http://wiki.openvz.org/w/index.php?title=Download_mirrors&oldid=7467&diff=7855
 100.67	http://wiki.openvz.org/w/index.php?title=A_managed_OpenVZ_installation&oldid=7834&diff=7846
 140.15	http://wiki.openvz.org/w/index.php?title=Multiple_network_interfaces_and_ARP_flux&oldid=7835&diff=7847
 187.22	http://wiki.openvz.org/w/index.php?title=Installing_Trixbox_2.0_in_CentOS_VE&oldid=7833&diff=7845
 233.31	http://wiki.openvz.org/w/index.php?title=PPP_in_container&oldid=7836&diff=7848
 274.38	http://wiki.openvz.org/w/index.php?title=Talk:Main_Page&oldid=7852&diff=7853


В каждой строчке оценка изменения и ссылка на него. Отчёт отсортирован так, чтобы вначале были изменения с самыми плохими оценками (более всего похожие на спам, с точки зрения программулины).

Буду примерно месяц эксплуатировать в тестовом режиме, чтобы понять, помогает ли. Пока ощущения скорее положительные.