![]() |
| | Themen-Optionen | Thema durchsuchen |
| | Nach oben #1 |
| Lutz Registriert seit: 14.08.2005 Ort: Nienburg / Weser
Beiträge: 687
|
Moin! Ich habe heute früh mal eine kleine Entwicklung im Bereich Captcha vollendet, an die ich schon seit einigen Wochen gedacht habe. Ich bin zwar nicht sicher, ob das so wirklich sinnvoll ist und von OCR nicht gelesen werden kann, aber genau deshalb schreibe ich das hier ja auch. Dazu sei gesagt, dass ich mit der Grafik noch nicht fertig bin, es handelt sich also nur momentan um eine Schwarz-Weiß-Zeichnung. Farbig wird das ganze noch. Aber hat vielleicht noch jemand Ideen für die Hintergrundgestaltung? Oder generelle Anmerkungen? Hier jedenfalls erstmal das Aussehen der Grafik: Achso, zur Info: Es werden aktuell nur Buchstaben erstellt, es sind also keine Zahlen dabei!
__________________ Paradox ist, wenn jemand für seinen Alkoholkonsum geradestehen soll |
| | |
| | Nach oben #2 |
| Johannes Müller Registriert seit: 15.09.2005 Ort: Königreich Flieden
Beiträge: 549
|
solche rechtecke lassen sich meiner ansicht nach relativ einfach erkennen und daraus dann auch wieder buchstaben ableiten. ich würde es vielleicht mal mit undefinierteren formen probieren, die aus nem kreis abgeleitet werden.
__________________ Weißt Bescheid - Scheiß wie weit |
| | |
| | Nach oben #3 |
| Lutz Registriert seit: 14.08.2005 Ort: Nienburg / Weser
Beiträge: 687
|
Ich weiß leider nicht, wie gut verschiedene OCR-Softwareprofukte arbeiten, aber ABBYY FineReader 9.0 kann da nichts erkennen. Ich werde aber mal schauen, ob ich da auch andere Formen hinbekomme. War "auf die Schnelle" jedenfalls das einfachste mit Rechtecken. Weiß hier zufällig jemand, wie diese Texterkennungs-Algorithmen in etwa arbeiten?
__________________ Paradox ist, wenn jemand für seinen Alkoholkonsum geradestehen soll |
| | |
| | Nach oben #4 | |
| Benjamin Steininger Registriert seit: 02.06.2005 Ort: weiher im tiefsten Odenwald
Beiträge: 1.203
| Zitat:
Als erstes lässt man sich einen haufen grafiken erzeugen, dann setzt sich jemand hin und gibt die passenden Codes dazu ein daraus wird ne art "lern-datei" für die ocr-software gemacht. Alternativ kann man auch wenn sich das Verfahren mit einer recht konstanten Schrift zusammensetzt, solange captchas erzeugen bis man alle zeichen mal hat und dann ne art schrift-datei daraus machen. | |
| | |
| | Nach oben #5 |
| Jann Hendrik Bekaan Registriert seit: 02.12.2004 Ort: Wildeshausen
Beiträge: 2.374
|
Ich meine mal gelesen zu haben, dass OCR-tool Probleme damit haben, wenn die Buchstaben nicht mehr aus einem Stück bestehen. Wenn du nun also bei deinen Buchstaben in dem Beispiel immer wieder mal eine Lücke zwischen den einzelnen Kästchen hast, dann verringert das zwar den Lesekomfort, aber eben auch die Lesbarkeit für tools.
__________________ Umfragen: Wenn du dich in ein interessantes Thema eingearbeitet hast, dann lass andere daran teilhaben! Danke! |
| | |
| | Nach oben #6 |
| Lutz Registriert seit: 14.08.2005 Ort: Nienburg / Weser
Beiträge: 687
|
Habe ich ja, die größe der Kästchen wird zufällig berechnet. Mal überlappen sie sich und mal ist eine Lücke dazwischen. Aber vielleicht mache ich die Lücken noch etwas größer!? Mal schauen. @Robo: Du hast mir schon sehr weitergeholfen Hat eigentlich schon irgendwer mal darüber nachgedacht ein Rebus als Captcha zu nutzen? Ist mir irgendwie gerade mal so eingefallen
__________________ Paradox ist, wenn jemand für seinen Alkoholkonsum geradestehen soll |
| | |
| | Nach oben #7 |
| Benjamin Steininger Registriert seit: 02.06.2005 Ort: weiher im tiefsten Odenwald
Beiträge: 1.203
|
Ein Rebus hat denke ich eine viel höhere Anforderungen, noch dazu ist es eine sprachbezogene Sache und deren zufällige Generation ist auch noch ein Stück komplexer. Erinnert mich gerade daran: http://www2.picfront.org/picture/slq...e_captchas.png |
| | |
| | Nach oben #8 |
| Jann Hendrik Bekaan Registriert seit: 02.12.2004 Ort: Wildeshausen
Beiträge: 2.374
|
Mmh... das gleicht ja mehr einem Intelligenztest als der Unterscheidung zwischen Mensch und Maschine.
__________________ Umfragen: Wenn du dich in ein interessantes Thema eingearbeitet hast, dann lass andere daran teilhaben! Danke! |
| | |
| | Nach oben #10 |
| Jann Hendrik Bekaan Registriert seit: 02.12.2004 Ort: Wildeshausen
Beiträge: 2.374
|
Sry, ich war beim posten aufgehalten worden. Ich bezog mich mit meiner Aussage auf die Frage nach den Rebus.
__________________ Umfragen: Wenn du dich in ein interessantes Thema eingearbeitet hast, dann lass andere daran teilhaben! Danke! |
| | |
| | Nach oben #11 |
| Lutz Registriert seit: 14.08.2005 Ort: Nienburg / Weser
Beiträge: 687
|
Nunja, wenn man sich bestimmte Begriffe raussucht, wie z.B. "Pferd", kann man ja verschiedene Abbildungen von Pferden sammeln und diese zufällig ins Bild einbauen lassen, Dazu dann noch ein "3=a,4=d" und eine durchstrichene 5 und schon hat man "Pfad" statt "Pferd"!? Ansich sehe ich das nicht als SO wahnsinnig schwierig an, man braucht nur eine große Menge an bestimmten Bild-Begriffen und dazu passende Möglichkeiten?!
__________________ Paradox ist, wenn jemand für seinen Alkoholkonsum geradestehen soll |
| | |
| | Nach oben #12 |
| Jann Hendrik Bekaan Registriert seit: 02.12.2004 Ort: Wildeshausen
Beiträge: 2.374
|
Dann kannst auch auch gleich ein Bild eines Pferdes, einer Kuh, Elefant.... einblenden und man muss den Namen der Tieres eingeben. Kommt doch dann auf das gleiche raus, oder?
__________________ Umfragen: Wenn du dich in ein interessantes Thema eingearbeitet hast, dann lass andere daran teilhaben! Danke! |
| | |
| | Nach oben #13 |
| Lutz Registriert seit: 14.08.2005 Ort: Nienburg / Weser
Beiträge: 687
|
Um nicht zu sehr an die Sprache gebunden zu sein und Legasthenikern eine Chance zu geben sollte die Lösung schon mit im Bild stehen. Außerdem muss man in Zeiten, in denen Fast-Jugendliche ertrinken, weil sie nicht schwimmen können nicht davon ausgehen, dass jeder weiß, wie ein Elefanten aussieht...
__________________ Paradox ist, wenn jemand für seinen Alkoholkonsum geradestehen soll |
| | |
| | Nach oben #14 | |
| Benjamin Steininger Registriert seit: 02.06.2005 Ort: weiher im tiefsten Odenwald
Beiträge: 1.203
| Zitat:
Vielleicht steigt die Trefferquote wenn man anstatt Bilder von Tieren, Bilder von DSDS-Stars, Sido oder ähnliches verwendet | |
| | |
| | Nach oben #16 |
| Erfahrener Benutzer Registriert seit: 12.06.2006
Beiträge: 205
|
Bild-CAPTCHAs, die nicht erkannt werden können, sind schlicht und einfach auch für Menschen schlecht oder gar nicht lesbar. Ich selber hatte Probleme beim 5. Buchstaben des ersten Bildes. Außerdem denke ich, dass das immernoch relativ einfach für ein OCR ist, das zu lösen. Mathe-CAPTCHAs oder Multiple-Choice-Anworten (z.B. Welches Tier ist das?) halte ich aus mehreren Gründen für besser - einmal sind sie gut les-/lösbar für Menschen und zweitens sind sie nicht weit verbreitet und somit nicht von der Standwardsoftware lösbar. Zudem sind sie (großteils) unabhängig von Sprachen (oder können leicht internationalisiert werden). Versteckte Felder mit Timestamp u.ä. sowie IP-Tables bieten zusätzlichen Schutz. Da fällt mir gerade ein - wie siehts mit ASCII-Bildern aus? Hat jemand schonmal sowas probiert? |
| | |
| | Nach oben #17 |
| Lutz Registriert seit: 14.08.2005 Ort: Nienburg / Weser
Beiträge: 687
|
Ja, habe ich schon probiert, aber da scheitert man - neben der verdammt hohen Datenmenge im Vergleich zu "normalen" Grafiken - schon an simplen Text-Browsern. Außerdem halte ich es für viel zu leicht mittels RegEx ein ASCII-Bild zu analysieren. Achso, was ich noch fast vergessen hätte: Kennt sich überhaupt einer mit OCR-Software aus? Würde es normal reichen, einfach die Grafik analysieren zu lassen oder müsste ich das mit mehr Pixeln machen, damit die OCR-Software überhaupt erst etwas rausbekommt? Oder wie müsste das laufen? Weiß das jemand?
__________________ Paradox ist, wenn jemand für seinen Alkoholkonsum geradestehen soll |
| | |
| | Nach oben #18 |
| Jann Hendrik Bekaan Registriert seit: 02.12.2004 Ort: Wildeshausen
Beiträge: 2.374
|
mmh.... man könnte ja auch 4 Bild-Buttons nehmen. Kuh - Pferd - Elefant - Schlange jeweils halt ein Bild, das als Button fungiert. Als Anweisung darüber dann: Klicke zum Absenden des Formulars auf 'Pferd' oder eben eines der anderen Bilder. Wenn man ausreichend Bilder hat kann man die zufällig positionieren und schon müsste das machbar sein, oder? ASCII-Bilder bringen wohl nicht so viel.... Denke ich mal.
__________________ Umfragen: Wenn du dich in ein interessantes Thema eingearbeitet hast, dann lass andere daran teilhaben! Danke! |
| | |
| | Nach oben #19 |
| Benjamin Steininger Registriert seit: 02.06.2005 Ort: weiher im tiefsten Odenwald
Beiträge: 1.203
|
Für ein eigenes privates System sind auf nicht dynamisch erstellen Bildern arbeitende Systeme vielleicht okay, solange niemand Interesse hat genau für diese Seite das ganze zu knacken, aber für ein System das öfters eingesetzt wird (phpbb, vbulletin, wordpress ... ) oder ähnliches -> sinnlos, innerhalb kürzester Zeit wären alle bilder in ein system eingegeben. Im ersten Schritt wäre sowas ja schon über den Hashwert der Bilddatei selbst zu knacken, eine kleine liste mit Hashwert und dazugehörigem Namen und fertig. Mögliche Variationen wären dann beispielsweise das Bild innerhalb einem anderen zu platzieren (quasi wechselnder Hintergrund), bilder invertieren, in SW umwandeln, etc, oder um einfach gegen Hashwert vorzugehen wäre es möglich einzelne Pixel des Bildes zu verändern, bei jpegs variable Kompression. Da aber alle diese Verfahren und sämtliche "Veränderungen" auf Bildern aus einem quasi festgelegten Satz "Ausgangsmaterial" bestehen,wird es wiederrum sehr einfach möglich sein Bilder zu "vergleichen" bzw zu schauen ob ein Bild in einem anderen vorkommt, ähnlich OCR nur für Bilder. Das ganze ist nicht an den Haaren herbeigezogen, falls das jemand denkt, Tools und Bibliotheken zu diesem Zweck gibt es bereits: http://pdiff.sourceforge.net/ http://www.vncrobot.com/docs/v1.3/gui/comparison.html weiteres findet man bei Google mit stichworten wie "image comparison algorithm", "image comparison library" etc |
| | |
| | Nach oben #20 |
| Lutz Registriert seit: 14.08.2005 Ort: Nienburg / Weser
Beiträge: 687
|
Also wenn ich ein Bild von meinem Hund abbilde und die Lösung daneben schreibe "Hund" und auf der anderen Seite ist dann eine Abbildung von Grommit, dann erkennen das Systeme irgendwann? Ich meine, dass man die Bildinformationen anpassen müsste, damit nicht irgendwann alle bekannt sind ist mir schon klar, aber das kann man ja auch anders variieren, indem man nicht unbedingt den Namen des abgebildeten Objektes daneben schreibt, sondern ein zufällig gewähltes Wort. Das würde die Trefferrate schon wieder verdammt schwierig machen!? Aber ganz klar: Je stärker die Seite genutzt wird, desto größer ist die Wahrscheinlichkeit, dass irgendwann jemand alles geknackt hat. Allerdings sei dazu gesagt, dass JEDES CAPTCHA-System eine gewisse Wartung benötigt, sonst kann das auch - auf lange Sicht - nicht klappen.
__________________ Paradox ist, wenn jemand für seinen Alkoholkonsum geradestehen soll |
| | |
![]() |
| Lesezeichen |
| Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1) | |
| Themen-Optionen | Thema durchsuchen |
| |