Temat na luźną dyskusję.
Tak się zastanawiam jak walczycie ze spamem?
Bo na pewno wielu z was ma serwery pocztowe.
Ja mam zaprzęgnięty do tego skrypt fail2ban automatycznie wysyłający powiadomienia do zarządcy adresu IP delikwenta (KLIK)
Poważnie się też zastanawiam, czy nie dorobić do tego wpisywania na sorbsa czy inne rble.
Walka ze spamem
- LordRuthwen
- Moderator
- Posty: 2324
- Rejestracja: 18 września 2009, 21:45
- Lokalizacja: klikash?
-
- Beginner
- Posty: 257
- Rejestracja: 14 maja 2013, 17:18
z perspektywy programistycznej, to wygląda ciekawie:
1. najprościej:
wrzucasz string do input
słowa kluczowe = "tani kredyt", "jestem spamem"
jeżeli PRAWDA występowanie słów kluczowych to USUŃ.
output to USUŃ lub ZOSTAW string który wrzuciłeś
2. można byloby też to zrobić na zasadzie statystyki:
string z emaila idzie do input,
jeżeli słów kluczowych więcej niż np. 5% tekstu, to odrzuć
opcjonalne ustawienia: 5%, 10, 15% całego tekstu...
3. oczywiście filtrowanie adresów,
jeżeli e-mail=[email protected] ,to USUŃ.
4. znaleźć 15 różnych filtrów e-mailowych (podobnych do tych wyżej).
jeżeli dana wiadomość przejdzie pozytywnie weryfikację więcej niż 10 razy, to nie jest spamem. a jak mniej niż 10, to jest. Kwestia ustawień.
paradoksalnie analiza stricte tekstowo/stringowa jest prosta, problem pojawić się może jeżeli wiadomość e-mail to jest obrazek (np. jpg w całości wpisany w html), bo wtedy trudniej to wykryć, że to spam
wiem, że jest przynajmniej kilkadziesiąt skryptów PERLa, które to robią (powiedzmy, że każdy skrypt to 1 filtr), tutaj można pogrzebać:
http://www.cpan.org/index.html
1. najprościej:
wrzucasz string do input
słowa kluczowe = "tani kredyt", "jestem spamem"
jeżeli PRAWDA występowanie słów kluczowych to USUŃ.
output to USUŃ lub ZOSTAW string który wrzuciłeś
2. można byloby też to zrobić na zasadzie statystyki:
string z emaila idzie do input,
jeżeli słów kluczowych więcej niż np. 5% tekstu, to odrzuć
opcjonalne ustawienia: 5%, 10, 15% całego tekstu...
3. oczywiście filtrowanie adresów,
jeżeli e-mail=[email protected] ,to USUŃ.
4. znaleźć 15 różnych filtrów e-mailowych (podobnych do tych wyżej).
jeżeli dana wiadomość przejdzie pozytywnie weryfikację więcej niż 10 razy, to nie jest spamem. a jak mniej niż 10, to jest. Kwestia ustawień.
paradoksalnie analiza stricte tekstowo/stringowa jest prosta, problem pojawić się może jeżeli wiadomość e-mail to jest obrazek (np. jpg w całości wpisany w html), bo wtedy trudniej to wykryć, że to spam
wiem, że jest przynajmniej kilkadziesiąt skryptów PERLa, które to robią (powiedzmy, że każdy skrypt to 1 filtr), tutaj można pogrzebać:
http://www.cpan.org/index.html
- LordRuthwen
- Moderator
- Posty: 2324
- Rejestracja: 18 września 2009, 21:45
- Lokalizacja: klikash?
Przepraszam, zastosowałem skrót myślowy, spam swoją drogą, chociaż dość długo uczyłem bayesa i nie puszcza więcej niż 1-2 wiadomości miesięcznie, ale przychodzi mi tego masa na niefiltrowane postmaster.
Chodziło mi raczej o próby wysyłania, logowania i tak dalej, bo o tym mi f2b raportuje.
Do analizy obrazków też są odpowiednie narzędzia, jak choćby OcrPlugin: https://wiki.apache.org/spamassassin/OcrPlugin
Chodziło mi raczej o próby wysyłania, logowania i tak dalej, bo o tym mi f2b raportuje.
Do analizy obrazków też są odpowiednie narzędzia, jak choćby OcrPlugin: https://wiki.apache.org/spamassassin/OcrPlugin