Web Scraping APIs

O que é um solucionador de CAPTCHA?

O que é um solucionador de CAPTCHA? — ilustração conceitual
Nesta página

Um solucionador de CAPTCHA é um software que resolve automaticamente os desafios CAPTCHA para um cliente automatizado. Um CAPTCHA é o teste de "prove que você é humano" que um site exibe: clicar em imagens de semáforos ou uma verificação oculta em segundo plano. O solucionador pega esse desafio do site, resolve usando modelos de IA, automação de navegador ou pessoas reais pagas para resolvê-los, e devolve um token: um código de acesso que o site aceita como prova de que você é humano. Isso permite que um scraper, bot ou script de teste conclua o desafio sem que ninguém precise clicar manualmente.

Resumo rápido

Também conhecido comoAutomação de CAPTCHA, tratamento automático de CAPTCHA, anti-CAPTCHA
Tipos resolvidosreCAPTCHA v2/v3, hCaptcha, Cloudflare Turnstile, FunCaptcha, CAPTCHA de imagem
Uso principalManter scrapers, testes automatizados e fluxos de contas funcionando
Preço típicoUS$ 1-3 por 1.000 resoluções (máquina), US$ 1-2 por 1.000 (humano)
Nível de riscoMédio: é preciso respeitar os termos do site; comum em scraping de dados públicos e QA

Como funcionam os solucionadores de CAPTCHA

A maioria dos solucionadores trabalha em três etapas. Primeiro, o scraper detecta um CAPTCHA na página (ou já sabe que deve esperá-lo) e lê os dados de que o desafio precisa: a site key (o ID público que liga o desafio àquele site), a URL da página e qual o tipo de CAPTCHA. Segundo, ele envia esses dados a um backend de resolução: pode ser um modelo de IA próprio treinado com milhões de desafios anteriores, uma rede de trabalhadores humanos de baixo custo, ou um híbrido que repassa os difíceis para pessoas. Terceiro, o backend devolve um token (uma sequência longa e aparentemente sem sentido) que o scraper cola no formulário da página ou anexa à próxima requisição. O site de destino verifica esse token com seu provedor de CAPTCHA, vê uma pontuação aprovada e deixa a requisição passar. Para CAPTCHAs invisíveis como reCAPTCHA v3 ou Turnstile -que avaliam você em silêncio em vez de pedir um clique- o solucionador costuma executar o desafio dentro de uma impressão digital de navegador real (o perfil único de sinais que um navegador emite), para que o token carregue sinais comportamentais e de TLS confiáveis. TLS é a camada de criptografia por trás do https, e seu handshake deixa uma impressão digital própria.

Por que solucionadores de CAPTCHA importam no web scraping

Os CAPTCHAs são a camada mais visível da defesa contra bots, e qualquer projeto de scraping minimamente sério vai esbarrar neles. Sem um solucionador, uma única página protegida por CAPTCHA pode travar um trabalho para sempre. Com um, o scraper conclui o desafio automaticamente e segue em frente. Os solucionadores também importam porque permitem escalar: resolver 50.000 desafios à mão não é um fluxo de trabalho, mas resolvê-los a US$ 2 por mil é apenas um item na fatura. O detalhe é que solucionadores não são uma solução mágica: eles tratam o desafio em si, mas se o seu IP, seus cabeçalhos ou sua impressão digital TLS ainda parecerem automatizados, o site simplesmente vai lançar outro desafio algumas requisições depois. Um solucionador é uma parte de uma configuração de scraping que funciona, não o todo.

Implementações comuns

Os solucionadores aparecem em três formatos comuns. Serviços de API pura (2Captcha, Anti-Captcha, CapSolver) recebem um trabalho por HTTP e devolvem um token; você os conecta ao seu próprio código. Bibliotecas de automação de navegador (plugins de Playwright/Puppeteer, ferramentas que controlam um navegador real a partir do código) injetam o solucionador em uma sessão de navegador ativa e resolvem os desafios por você. APIs de scraping completas como a Scrappey integram o solucionador na mesma requisição que busca a página: você envia uma URL e a API cuida de proxies, renderização de JS, impressão digital e CAPTCHAs em uma única chamada, devolvendo o HTML ou JSON pronto. A maioria dos scrapers em produção acaba usando a terceira opção ou uma mistura das duas primeiras.

Limitações e alternativas

Os solucionadores custam dinheiro real por desafio, então um scraper mal construído que dispara um CAPTCHA a cada requisição fica caro rápido. Eles também adicionam atraso: resolver um desafio do Turnstile pode levar de 8 a 20 segundos. A melhor primeira medida é reduzir a frequência com que um CAPTCHA aparece: use proxies residenciais de qualidade, uma impressão digital de navegador coerente, uma taxa de requisições moderada e cookies de sessão reaproveitados, para que requisições repetidas compartilhem uma sessão consistente em vez de parecerem muitos estranhos. Quando você de fato encontrar um CAPTCHA, recorra ao solucionador. Para sites que exigem um CAPTCHA em cada requisição, migrar para uma API oficial (se o site oferecer) ou para um endpoint de scraping gerenciado quase sempre sai mais barato do que resolver milhares de desafios por hora.

Exemplo de código

python
import requests

resp = requests.post(
    'https://publisher.scrappey.com/api/v1?key=YOUR_API_KEY',
    json={
        'cmd': 'request.get',
        'url': 'https://example.com/protected',
        'autoparse': True
    }
)

# CAPTCHA + proxy + fingerprinting handled server-side
html = resp.json()['solution']['response']

Termos relacionados

Concept map

How CAPTCHA Solver connects

The terms most directly tied to this one. Hover a node to see its neighbours, click to preview, drag to rearrange.

0 terms · 0 connections
You are here · Web Scraping APIs
Building map…

Perguntas frequentes

Solucionadores de CAPTCHA são legais?

Usar um solucionador em dados públicos, nas suas próprias contas ou para testes de QA costuma ser legal na maioria dos lugares. Usá-lo contra um login que não é seu, para violar os termos de serviço de um site de forma contratualmente exigível ou para cometer fraude, não é. A ferramenta em si é neutra; o que importa é o que você faz com ela.

Qual a precisão dos solucionadores de CAPTCHA?

Para CAPTCHAs de imagem e reCAPTCHA v2, as taxas de resolução de bons provedores ficam entre 90 e 99%. Turnstile e reCAPTCHA v3 são mais difíceis porque pontuam o seu comportamento, não apenas se você acertou o quebra-cabeça, então a precisão depende tanto da impressão digital ao redor quanto do próprio solucionador.

Quanto custa resolver um CAPTCHA?

Solucionadores por máquina costumam cobrar de US$ 1 a US$ 3 por 1.000 resoluções. Os humanos custam quase o mesmo, mas são mais lentos. APIs de scraping integradas embutem o custo no preço por requisição, que normalmente é mais barato do que resolver em grande escala por conta própria.

Os sites conseguem detectar que um solucionador de CAPTCHA foi usado?

Não diretamente: o token que um solucionador devolve é idêntico ao que uma pessoa produziria. Mas os sites conseguem perceber o contexto ao redor: um IP sem histórico de navegação, uma impressão digital TLS ausente ou um tempo de resposta suspeitosamente perfeito de 200 ms denunciam muito mais do que o próprio token.

Última atualização: 2026-05-31