Auch wenn wir das schon oft hatten muss ich das Thema Sapmassassin nochmal aufgreifen.
Ich habe das Gefühl, dass meiner nicht lernt bzw. um genau zu sein, das Gelernte nicht anwendet.
Zur Konfiguration:
Basissystem Suse 10.2 aktueller SW-Stand
Fetchmail holt mails ab, postfix nimmt an, amavisd-new filtert (virus und spam), postfix (2.) liefert aus, procmail sortiert
Ich habe die Spamaassassin-konfig in amavisd.conf ein klein wenig angepaßt (tagging, tag-levels). Die eigentliche Spamassassin-konfig in "/etc/mail/spamassassin" blieb unberührt.
unerkannte Spams werden vom User in einen speziellen Ordner verschoben und täglich gelernt. Falsch erkannte ebenso. Hier das Skript:
Die Ausgabe der letzten Zeile sieht aktuell so aus:
Learned tokens from 0 message(s) (18 message(s) examined)
Soweit so gut.
Leider ist der Effekt vernachlässigbar, d.h. die Erkennungsrate liegt bei ca. 1%.
Die Headereinträge bei richtig "gutem" Spam sehen so aus
Ich dachte eigentlich die Bayesfilter wären besser
Hat irgendjemand 'ne Idee woran es liegt bzw. wie ich das verbessern kann?
Kann man irgendwie überprüfen ob das lernen einen Effekt auf das Filtern hat?
Ich habe das Gefühl, dass meiner nicht lernt bzw. um genau zu sein, das Gelernte nicht anwendet.
Zur Konfiguration:
Basissystem Suse 10.2 aktueller SW-Stand
Fetchmail holt mails ab, postfix nimmt an, amavisd-new filtert (virus und spam), postfix (2.) liefert aus, procmail sortiert
Ich habe die Spamaassassin-konfig in amavisd.conf ein klein wenig angepaßt (tagging, tag-levels). Die eigentliche Spamassassin-konfig in "/etc/mail/spamassassin" blieb unberührt.
unerkannte Spams werden vom User in einen speziellen Ordner verschoben und täglich gelernt. Falsch erkannte ebenso. Hier das Skript:
Code:
sa-learn --dbpath /var/spool/amavis/.spamassassin -u vscan --showdots --spam --mbox "/home/user1/Mail/Spam nicht erkannt"
sa-learn --dbpath /var/spool/amavis/.spamassassin -u vscan --showdots --ham --mbox "/home/user1/Mail/Spam falsch erkannt"
sa-learn --dbpath /var/spool/amavis/.spamassassin -u vscan --showdots --spam --mbox "/home/user2/Mail/Spam nicht erkannt"
sa-learn --dump magic --dbpath /var/spool/amavis/.spamassassin -u vscan
Die Ausgabe der letzten Zeile sieht aktuell so aus:
Learned tokens from 0 message(s) (18 message(s) examined)
Code:
0.000 0 3 0 non-token data: bayes db version
0.000 0 319 0 non-token data: nspam
0.000 0 3683 0 non-token data: nham
0.000 0 153713 0 non-token data: ntokens
0.000 0 1186066559 0 non-token data: oldest atime
0.000 0 1208296800 0 non-token data: newest atime
0.000 0 0 0 non-token data: last journal sync atime
0.000 0 1208318455 0 non-token data: last expiry atime
0.000 0 22118400 0 non-token data: last expire atime delta
0.000 0 1517 0 non-token data: last expire reduction count
Soweit so gut.
Leider ist der Effekt vernachlässigbar, d.h. die Erkennungsrate liegt bei ca. 1%.
Die Headereinträge bei richtig "gutem" Spam sehen so aus
Code:
X-Virus-Scanned: by amavisd-new at mydomain.de
X-Spam-Score: 3.409
X-Spam-Level: ***
X-Spam-Status: No, score=3.409 tagged_above=0 required=6.31
tests=[HTML_20_30=0.911, HTML_MESSAGE=0.001, HTML_MIME_NO_HTML_TAG=0,
MIME_HTML_ONLY=0.414, PLING_PLING=1.034, SUBJ_ALL_CAPS=1.049]
Ich dachte eigentlich die Bayesfilter wären besser
Hat irgendjemand 'ne Idee woran es liegt bzw. wie ich das verbessern kann?
Kann man irgendwie überprüfen ob das lernen einen Effekt auf das Filtern hat?