Um Teile von Texten unkenntlich zu machen, werden statt traditioneller
schwarzer Balken oft Methoden verwendet, die den Text zu unscharf
erschienen lassen, um ihn noch lesen zu können.
Dass diese Methoden nicht immer sicher sind, ist bereits bekannt. Auf
dem Privacy Enhancing Technologies Symposium, das vom 19. bis 22. Juli
2016 in Darmstadt stattfand, haben Forscher der UC San Diego nun einen
verbesserten Angriff vorgestellt. Durch die Anwendung von
Hidden-Markov-Modellen kann die benötigte Rechenzeit verkürzt und die
Erfolgsrate erhöht werden. Die Anwendung eines Sprachmodells kann in
vielen Fällen die Erkennung weiter verbessern. Die in dem Beitrag
gezeigten Beispiele machen deutlich, dass bei der Anonymisierung bzw.
Unkenntlichmachung von Texten große Vorsicht geboten ist.

Deutschsprachige Quelle:
http://www.nerdcore.de/2016/07/20/they-can-tell-by-the-pixels/
Konferenz-Website:
https://www.petsymposium.org/
Original-Paper:
http://cseweb.ucsd.edu/~saul/papers/pets16-redact.pdf