Web Scraping APIs

¿Qué es un solucionador de CAPTCHA?

¿Qué es un solucionador de CAPTCHA? — ilustración conceptual
En esta página

Un solucionador de CAPTCHA es software que completa automáticamente los retos CAPTCHA para un cliente automatizado. Un CAPTCHA es la prueba de "demuestra que eres humano" que un sitio te muestra: hacer clic en imágenes de semáforos o una comprobación oculta en segundo plano. El solucionador toma ese reto del sitio, lo resuelve con modelos de IA, automatización del navegador o personas reales a las que se paga por resolverlos, y devuelve un token: un código de acceso que el sitio acepta como prueba de que eres humano. Eso permite que un scraper, bot o script de pruebas complete el reto sin que nadie tenga que hacer clic a mano.

Datos rápidos

También conocido comoAutomatización de CAPTCHA, gestión automática de CAPTCHA, anti-CAPTCHA
Tipos que resuelvereCAPTCHA v2/v3, hCaptcha, Cloudflare Turnstile, FunCaptcha, CAPTCHA de imagen
Uso principalMantener en marcha scrapers, pruebas automatizadas y flujos de cuentas
Precio típico1-3 USD por cada 1.000 resoluciones (máquina), 1-2 USD por 1.000 (humano)
Nivel de riesgoMedio: hay que respetar los términos del sitio; común en scraping de datos públicos y QA

Cómo funcionan los solucionadores de CAPTCHA

La mayoría de los solucionadores trabajan en tres pasos. Primero, el scraper detecta un CAPTCHA en la página (o sabe que debe esperarlo) y lee los datos que necesita el reto: la site key (el ID público que vincula el reto con ese sitio web), la URL de la página y qué tipo de CAPTCHA es. Segundo, envía esos datos a un backend de resolución: puede ser un modelo de IA propio entrenado con millones de retos anteriores, una red de trabajadores humanos de bajo coste, o un híbrido que pasa los difíciles a personas. Tercero, el backend devuelve un token (una cadena larga y aparentemente sin sentido) que el scraper pega en el formulario de la página o adjunta a su siguiente solicitud. El sitio de destino verifica ese token con su proveedor de CAPTCHA, ve una puntuación válida y deja pasar la solicitud. En los CAPTCHA invisibles como reCAPTCHA v3 o Turnstile -que te evalúan en silencio en lugar de pedirte que hagas clic- el solucionador suele ejecutar el reto dentro de una huella de navegador real (el perfil único de señales que emite un navegador), de modo que el token lleve señales de comportamiento y de TLS fiables. TLS es la capa de cifrado detrás de https, y su handshake deja una huella propia.

Por qué los solucionadores de CAPTCHA importan en el web scraping

Los CAPTCHA son la capa más visible de la defensa antibots, y cualquier proyecto de scraping serio se topará con ellos. Sin un solucionador, una sola página protegida con CAPTCHA puede detener un trabajo para siempre. Con uno, el scraper completa el reto automáticamente y sigue adelante. Los solucionadores también importan porque te permiten escalar: resolver 50.000 retos a mano no es un flujo de trabajo, pero resolverlos a 2 USD por mil es solo una línea más en la factura. La trampa es que los solucionadores no son una solución mágica: gestionan el reto en sí, pero si tu IP, tus cabeceras o tu huella TLS siguen pareciendo automatizadas, el sitio simplemente te lanzará otro reto unas solicitudes después. Un solucionador es una parte de un montaje de scraping que funciona, no la totalidad.

Implementaciones habituales

Los solucionadores vienen en tres formas habituales. Los servicios de API pura (2Captcha, Anti-Captcha, CapSolver) reciben un trabajo por HTTP y devuelven un token; tú los conectas a tu propio código. Las bibliotecas de automatización del navegador (plugins de Playwright/Puppeteer, herramientas que controlan un navegador real desde el código) inyectan el solucionador en una sesión de navegador en vivo y resuelven los retos por ti. Las API de scraping completas como Scrappey integran el solucionador en la misma solicitud que obtiene la página: envías una URL y la API gestiona proxies, renderizado de JS, huellas y CAPTCHA en una sola llamada, devolviendo el HTML o JSON ya terminado. La mayoría de los scrapers en producción acaban usando la tercera opción o una mezcla de las dos primeras.

Limitaciones y alternativas

Los solucionadores cuestan dinero real por reto, así que un scraper mal construido que dispara un CAPTCHA en cada solicitud se vuelve caro muy rápido. También añaden retraso: resolver un reto de Turnstile puede tardar entre 8 y 20 segundos. La mejor primera medida es reducir la frecuencia con la que aparece un CAPTCHA: usa proxies residenciales de calidad, una huella de navegador coherente, un ritmo de solicitudes moderado y cookies de sesión reutilizadas, de modo que las solicitudes repetidas compartan una sesión consistente en vez de parecer muchos desconocidos. Cuando sí te encuentres con un CAPTCHA, recurre al solucionador. Para los sitios que ponen un CAPTCHA en cada solicitud, cambiar a una API oficial (si el sitio la ofrece) o a un endpoint de scraping gestionado casi siempre sale más barato que resolver miles de retos por hora.

Ejemplo de código

python
import requests

resp = requests.post(
    'https://publisher.scrappey.com/api/v1?key=YOUR_API_KEY',
    json={
        'cmd': 'request.get',
        'url': 'https://example.com/protected',
        'autoparse': True
    }
)

# CAPTCHA + proxy + fingerprinting handled server-side
html = resp.json()['solution']['response']

Términos relacionados

Concept map

How CAPTCHA Solver connects

The terms most directly tied to this one. Hover a node to see its neighbours, click to preview, drag to rearrange.

0 terms · 0 connections
You are here · Web Scraping APIs
Building map…

Preguntas frecuentes

¿Son legales los solucionadores de CAPTCHA?

Usar un solucionador sobre datos públicos, tus propias cuentas o para pruebas de QA suele ser legal en la mayoría de los sitios. Usarlo contra un inicio de sesión que no es tuyo, para incumplir los términos de servicio de forma contractualmente exigible o para cometer fraude, no lo es. La herramienta en sí es neutral; lo que importa es el uso que le des.

¿Qué precisión tienen los solucionadores de CAPTCHA?

Para los CAPTCHA de imagen y reCAPTCHA v2, las tasas de resolución de proveedores de calidad están entre el 90 y el 99 %. Turnstile y reCAPTCHA v3 son más difíciles porque puntúan tu comportamiento, no solo si resolviste el puzle, así que la precisión depende tanto de la huella que lo rodea como del propio solucionador.

¿Cuánto cuesta resolver un CAPTCHA?

Los solucionadores por máquina suelen cobrar entre 1 y 3 USD por cada 1.000 resoluciones. Los humanos cuestan algo parecido pero son más lentos. Las API de scraping integradas incluyen el coste en su precio por solicitud, que normalmente sale más barato que resolver a gran escala por tu cuenta.

¿Pueden los sitios detectar que se usó un solucionador de CAPTCHA?

No directamente: el token que devuelve un solucionador es idéntico al que produciría una persona. Pero los sitios sí detectan el contexto que lo rodea: una IP sin historial de navegación, una huella TLS ausente o un tiempo de respuesta sospechosamente perfecto de 200 ms delatan mucho más que el propio token.

Última actualización: 2026-05-31