Web Scraping APIs

Was ist ein CAPTCHA-Solver?

Was ist ein CAPTCHA-Solver? — konzeptionelle Illustration
Auf dieser Seite

Ein CAPTCHA-Solver ist Software, die CAPTCHA-Aufgaben automatisch für einen automatisierten Client löst. Ein CAPTCHA ist der "Beweise, dass du ein Mensch bist"-Test, den eine Website anzeigt: das Anklicken von Ampel-Bildern oder eine versteckte Hintergrundprüfung. Der Solver nimmt diese Aufgabe von der Website entgegen, löst sie mit KI-Modellen, Browser-Automatisierung oder echten Menschen, die fürs Lösen bezahlt werden, und liefert ein Token zurück: einen Zugangscode, den die Website als Nachweis akzeptiert, dass man ein Mensch ist. So kann ein Scraper, Bot oder Test-Skript die Aufgabe abschließen, ohne dass jemand von Hand klickt.

Kurzfakten

Auch bekannt alsCAPTCHA-Automatisierung, automatische CAPTCHA-Verarbeitung, Anti-CAPTCHA
Gelöste TypenreCAPTCHA v2/v3, hCaptcha, Cloudflare Turnstile, FunCaptcha, Bild-CAPTCHAs
HauptanwendungScraper, automatisierte Tests und Konto-Workflows am Laufen halten
Typischer Preis1-3 USD pro 1.000 Lösungen (Maschine), 1-2 USD pro 1.000 (Mensch)
RisikostufeMittel: Website-Bedingungen beachten; verbreitet beim Scrapen offentlicher Daten und in QA

Wie CAPTCHA-Solver funktionieren

Die meisten Solver arbeiten in drei Schritten. Zuerst erkennt der Scraper ein CAPTCHA auf der Seite (oder weiß, dass eines kommt) und liest die Angaben aus, die die Aufgabe braucht: den Site Key (die öffentliche ID, die die Aufgabe mit dieser Website verknüpft), die Seiten-URL und um welchen CAPTCHA-Typ es sich handelt. Zweitens sendet er diese Angaben an ein Lösungs-Backend: das kann ein eigenes, mit Millionen früherer Aufgaben trainiertes KI-Modell sein, ein Netzwerk günstiger menschlicher Bearbeiter oder ein Hybrid, der die schweren Fälle an Menschen weitergibt. Drittens liefert das Backend ein Token zurück (eine lange, scheinbar bedeutungslose Zeichenkette), das der Scraper in das Formular der Seite einfügt oder an seine nächste Anfrage anhängt. Die Zielwebsite prüft dieses Token bei ihrem CAPTCHA-Anbieter, sieht eine bestandene Bewertung und lässt die Anfrage durch. Bei unsichtbaren CAPTCHAs wie reCAPTCHA v3 oder Turnstile -die einen still bewerten, statt einen Klick zu verlangen- führt der Solver die Aufgabe oft innerhalb eines echten Browser-Fingerprints aus (das einzigartige Signalprofil, das ein Browser aussendet), damit das Token vertrauenswürdige Verhaltens- und TLS-Signale trägt. TLS ist die Verschlüsselungsschicht hinter https, und sein Handshake hinterlässt einen eigenen Fingerprint.

Warum CAPTCHA-Solver fürs Web Scraping wichtig sind

CAPTCHAs sind die sichtbarste Schicht der Bot-Abwehr, und jedes nicht-triviale Scraping-Projekt stößt auf sie. Ohne Solver kann eine einzige CAPTCHA-geschützte Seite einen Job für immer blockieren. Mit einem schließt der Scraper die Aufgabe automatisch ab und macht weiter. Solver sind auch wichtig, weil sie Skalierung ermöglichen: 50.000 Aufgaben von Hand zu lösen ist kein Workflow, aber sie zu 2 USD pro Tausend zu lösen, ist nur ein Posten auf der Rechnung. Der Haken: Solver sind kein Allheilmittel - sie erledigen die Aufgabe selbst, aber wenn deine IP, deine Header oder dein TLS-Fingerprint weiterhin automatisiert wirken, schickt die Website ein paar Anfragen später einfach die nächste Aufgabe. Ein Solver ist ein Teil eines funktionierenden Scraping-Setups, nicht das Ganze.

Gängige Implementierungen

Solver gibt es in drei gängigen Formen. Reine API-Dienste (2Captcha, Anti-Captcha, CapSolver) nehmen einen Auftrag per HTTP entgegen und liefern ein Token; du bindest sie in deinen eigenen Code ein. Browser-Automatisierungs-Bibliotheken (Playwright-/Puppeteer-Plugins - Werkzeuge, die einen echten Browser per Code steuern) schleusen den Solver in eine laufende Browser-Sitzung ein und arbeiten die Aufgaben für dich ab. Vollständige Scraping-APIs wie Scrappey integrieren den Solver in dieselbe Anfrage, die die Seite abruft: du sendest eine URL, und die API kümmert sich um Proxys, JS-Rendering, Fingerprinting und CAPTCHAs in einem Aufruf und gibt das fertige HTML oder JSON zurück. Die meisten Produktions-Scraper nutzen am Ende entweder die dritte Option oder eine Mischung aus den ersten beiden.

Grenzen und Alternativen

Solver kosten echtes Geld pro Aufgabe, daher wird ein schlecht gebauter Scraper, der bei jeder Anfrage ein CAPTCHA auslöst, schnell teuer. Sie verursachen außerdem Verzögerung: das Lösen einer Turnstile-Aufgabe kann 8 bis 20 Sekunden dauern. Der beste erste Schritt ist, zu reduzieren, wie oft überhaupt ein CAPTCHA erscheint: nutze hochwertige Residential-Proxys, einen stimmigen Browser-Fingerprint, eine moderate Anfragerate und wiederverwendete Session-Cookies, damit wiederholte Anfragen eine konsistente Sitzung teilen, statt wie viele Fremde zu wirken. Wenn du dann doch auf ein CAPTCHA triffst, greife auf den Solver zurück. Bei Websites, die jede einzelne Anfrage hinter einem CAPTCHA verlangen, ist der Wechsel zu einer offiziellen API (falls die Website eine anbietet) oder zu einem verwalteten Scraping-Endpunkt fast immer günstiger, als Tausende Aufgaben pro Stunde zu lösen.

Codebeispiel

python
import requests

resp = requests.post(
    'https://publisher.scrappey.com/api/v1?key=YOUR_API_KEY',
    json={
        'cmd': 'request.get',
        'url': 'https://example.com/protected',
        'autoparse': True
    }
)

# CAPTCHA + proxy + fingerprinting handled server-side
html = resp.json()['solution']['response']

Verwandte Begriffe

Concept map

How CAPTCHA Solver connects

The terms most directly tied to this one. Hover a node to see its neighbours, click to preview, drag to rearrange.

0 terms · 0 connections
You are here · Web Scraping APIs
Building map…

Häufige Fragen

Sind CAPTCHA-Solver legal?

Einen Solver bei öffentlichen Daten, eigenen Konten oder fürs QA-Testen einzusetzen, ist an den meisten Orten in der Regel legal. Ihn gegen ein Login zu verwenden, das dir nicht gehört, um die Nutzungsbedingungen einer Website auf vertraglich durchsetzbare Weise zu brechen, oder um Betrug zu begehen, ist es nicht. Das Werkzeug selbst ist neutral; entscheidend ist, wofür du es nutzt.

Wie genau sind CAPTCHA-Solver?

Bei Bild-CAPTCHAs und reCAPTCHA v2 liegen die Lösungsraten guter Anbieter im Bereich von 90 bis 99 %. Turnstile und reCAPTCHA v3 sind schwieriger, weil sie dein Verhalten bewerten und nicht nur, ob du das Rätsel gelöst hast - die Genauigkeit hängt also ebenso vom umgebenden Fingerprint ab wie vom Solver selbst.

Was kostet das Lösen eines CAPTCHAs?

Maschinelle Solver verlangen typischerweise 1 bis 3 USD pro 1.000 Lösungen. Menschliche Solver kosten etwa gleich viel, sind aber langsamer. Integrierte Scraping-APIs rechnen die Kosten in ihren Preis pro Anfrage ein, was meist günstiger ist, als selbst in großem Maßstab zu lösen.

Können Websites erkennen, dass ein CAPTCHA-Solver verwendet wurde?

Nicht direkt - das Token, das ein Solver zurückgibt, sieht identisch zu dem eines Menschen aus. Aber Websites erkennen den Kontext drumherum: eine IP ohne Browsing-Verlauf, ein fehlender TLS-Fingerprint oder eine verdächtig perfekte Antwortzeit von 200 ms verraten weit mehr als das Token selbst.

Zuletzt aktualisiert: 2026-05-31