Vor- und Nachteile von Spam-Erkennungstechniken
Es gibt sehr viele Techniken, welche heutzutage standardmässig benutzt werden, um Spam zu erkennen. Zusätzlich gibt es noch weitere spezifische Techniken, welche laufend verbessert oder neu entwickelt werden. Alle Spam-Erkennungstechniken haben ihre Vor- und Nachteile. Wichtig ist, dass man diese kennt und diese für den richtigen Zweck einsetzt. Die besten Spamfilter sind eine ausgeklügelte Kombination aus vielen verschiedenen Techniken um die jeweiligen Nachteile zu minimieren und von den individuellen Vorteilen profitieren zu können.
Im Prinzip ist ein Spamfilter ein Punktesystem, welches für suspekte Merkmale Punkte vergibt. Für gute Merkmale werden negative Punkte vergeben. Am Schluss wird die Gesamtpunktzahl zusammengezählt. Wenn nun die erreichte Punktzahl einen festgelegten Wert überschreitet, wird die Interaktion als Spam erkannt und blockiert oder als spamverdächtig markiert. Mit diesem System, kann man Spaltfilter entwickeln, welche sehr gut darin sind Spam abzuwehren, während dem es gleichzeitig fast keine legitimen Aktivitäten blockiert.
IP Blacklisten
Blocklisten für IP-Adressen sind sehr effektiv im Blockieren von Spam, da diese mit nur einem Eintrag tausende von Nachrichten blockieren können. Das Problem ist jedoch, dass man bei Externen Listen keine Kontrolle über deren Qualität hat. Bei internen Listen hat man zwar die Kontrolle über die Qualität jedoch kann es vorkommen, dass eine IP-Adresse, welche von sehr vielen Geräten gleichzeitig benutzt, in die Blackliste aufgenommen wird und somit Benutzer blockiert werden, welche es eigentlich nicht betreffen sollte. Ein weitere Problem ist, dass die meisten IP-Adressen für Internetanschlüsse dynamisch vergeben werden. Dies heisst, dass in ein paar Minuten, Stunden oder Tagen ein anderes Gerät die genau gleich IP-Adresse haben kann, wie ein Gerät, welches sich Problematisch verhält. Dies führt zum Teil dazu, dass legitime Benutzer abgestraft werden für etwas, was ein anderer gemacht hat.
Um dieses Problem abzuschwächen, sollten deshalb IP-Adressen in der Regel nur kurzfristig mit negativen Punkten verknüpft werden. Besser ist noch, wenn suspekte Aktivitäten negative Punkte erhalten, welche sich über die Zeit abschwächen bis diese ganz weg sind.
E-Mail Blacklisten
Bei Blocklisten für E-Mail-Adressen ist es ähnlich, wie für IP-Adressen. Auch hier hat man das Problem, dass nicht nur der Schuldige bestraft wird, sondern auch Leute, von welchen die E-Mail-Adressen missbraucht wurden. Deshalb sollte man auch hier in der Regel die E-Mail-Adressen nicht komplett sperren, sondern nur für eine gewisse Zeit.
Ei weiteres Problem bei E-Mail Blacklisten ist, dass Spammer bei jeder Anfrage die E-Mail-Adresse wieder ändern können. Oft verwenden Sie E-Mail-Adressen, welche anderen Personen gehören. Bei Kontaktformularspam verwenden sie oft die gleiche Domain, wie die Webseite.
Metadaten basierte Filter
Sehr viele Spammer operieren nach einem gewissen Muster, welches andere Metadaten liefert als normale Benutzer. Anhand dieser muster kann man sehr gute Abschätzungen dazu machen, ob gewisse Interaktionen legitim oder sind oder nicht. Diese Filter müssen jedoch über die Zeit an die aktuellen Verhaltensmuster angepasst werden. Das gute dabei ist, dass oft selbst die besten Spammer sich nicht darum kümmern diese Daten zu optimieren.
Inhaltsbasierte Filter
Diese Filtermöglichkeiten sind einiges komplexer. Ein grosser Vorteil von diesen Filtern ist, dass diese Spam-Nachrichten erkennen können, welche mit den anderen Filtern zum Teil nicht erkannt werden können. Die Schwierigkeit ist jedoch, dass sich die Inhalte über die Zeit Ändern und diese Filter daher dynamisch aufgebaut werden müssen. Sehr wichtig ist aus, dass die Daten, welche benutzt werden, um die Filter zu trainieren, eine gute Qualität aufweisen und dass genug Daten zur Verfügung stehen um die Filter zu trainieren.
Bei diesen Filtern gibt es fast unendliche Verbesserungsmöglichkeiten. Ein einfaches Beispiel dazu ist die Überprüfung, wie viele unterschiedliche Wörter eine Nachricht enthält. Dies ist ein sehr einfacher Test, welcher jedoch relativ effektiv ist, weil Spammer in der Regel weniger gute Sprachkenntnisse haben und sich daher öfters wiederholen.
Auch diese Filter sind nicht fehlerfrei, da gewisse Wörter in einem Zusammenhang eher auf Spam hinweisen und in einem anderen eher auf normale E-Mails (Ham).
Erfahren Sie hier mehr über FormCheck unserem Spam-Filter für Kontaktformulare.