24. Januar 2021

Spam stoppen und helfen Bücher zu scannen

Bei meiner Spiegel-Lektüre bin ich heute über was interessantes unter dem Thema „Schwarm-Intelligenz“ gestoßen: reCAPTCHA.
Anders als beim reinen CAPTCHA, also der Unterscheidung, ob ein Mensch oder ein Search/Spam-Bot über die Site und Foren läuft, an Hand von Grafike mit Zahlen oder Buchstaben, haben die Entwickler hier die gescannten Bilder von nicht erkannten Bücherseiten für eine offene und digitale Bibliothek. Die Entwickler scannen was das Zeug hält Copyright freie Bücher ein, damit diese irgendwann nicht mehr „unfrei“ nur noch gegen Bezahlung zur Verfügung stehen (Seitenhieb auf Google).
Es funktioniert ganz einfach, statt einer Grafik entscheidt man als Mensch, was ein oder zwei Worte bedeuten sollen, die geht über eine Datenbank natürlich wieder zurück in die OCR-Erkennung des Archives.
Voilá, wir haben keinen Spam mehr und was sinnvolles auch noch gleich erledigt, für einige CMS-tools gibt es auch schon fertige Plugins, wie beispielsweise hier für unser WordPress.

Links: Spiegel-Online, reCAPTCHA, ARCHIV, WORDPress Plugin

Schreibe einen Kommentar