Manual para activar un MCP Browser

📖 Guía completa para activar y utilizar el MCP Browser

💡 ¿Conocías el potencial de conectar tu navegador con Visual Studio Code? Gracias al MCP Browser, esta integración es posible, permitiendo la automatización de procesos y facilitando el desarrollo web.

MCP (Model Context Protocol) habilita una “puerta” segura entre tu asistente en VS Code y el navegador para ejecutar acciones controladas en páginas web.

🎯 Introducción

El MCP Browser es una extensión versátil que facilita la integración entre los navegadores y Visual Studio Code, permitiendo la automatización de tareas de navegación web y procesos de desarrollo.

¿Qué es MCP en pocas palabras?

MCP (Model Context Protocol) es un estándar para que asistentes/IA interactúen de forma segura con herramientas externas (navegador, repos, bases de datos). MCP Browser actúa como “conector” entre tu IA en VS Code y Chrome/Chromium, exponiendo capacidades como visitar URLs, hacer clic, extraer datos y tomar capturas.

Arquitectura resumida

Extensión Web (Chrome/Chromium) + servicio de fondo.
Canal local seguro hacia VS Code (MCP client/servidor).
Acciones controladas: navegación, interacción, lectura DOM.
Permisos explícitos y estado de conexión visible (“Connected”).

🔍 ¿Qué funcionalidades ofrece MCP Browser?

🔄 Automatización de la navegación web
📸 Captura de pantallas
🎯 Interacción con elementos web
📊 Extracción de datos
📝 Automatización de formularios

🔄

Navegación inteligente

Visitar URLs, avanzar/retroceder, recargar.
Esperar por selectores o estados de red (idle/complete).
Ejemplo prompt “Abre https://example.com y haz clic en ‘Pricing’.”

🎯

Interacción DOM

Click, type, select, scroll, focus.
Soporta selectores CSS y XPath (según la implementación).
Ejemplo prompt “Rellena el campo #email y envía el formulario.”

📊

Extracción y reporting

Leer texto, atributos y tablas.
Exportar JSON/CSV (vía asistente en VS Code).
Ejemplo prompt “Extrae los precios de la tabla y genera un CSV.”

📋 Requisitos previos para su instalación

⚠️ Antes de comenzar, verifica que tienes:

✅ Google Chrome instalado
✅ Visual Studio Code instalado
✅ Acceso a la Chrome Web Store

Compatibilidad y versiones recomendadas

Chrome/Chromium 109+ (ideal: última versión estable).
VS Code 1.85+ (ideal: última versión estable).
Sistemas: Windows 10/11, macOS 12+, Ubuntu 20.04+.
Asistente compatible MCP en VS Code (p.ej., Chat/AI que soporte herramientas MCP).

En entornos corporativos, confirma políticas de extensiones y proxy.

Requisitos de red y permisos

Permitir ejecución de extensiones y popups en Chrome.
Sin bloqueos de firewall para la comunicación local del MCP.
Espacio suficiente para logs y capturas.

Si usas VPN/Proxy, verifica reglas locales y certificados.

🚀 Paso 1: Cómo instalar la extensión MCP Browser

🌐 Abre Google Chrome
🏪 Visita la Chrome Web Store
🔍 Busca “Browser MCP”
➕ Haz clic en “Agregar a Chrome”
✅ Confirma la instalación

1Consejo: Verifica el publisher de la extensión y revisa la sección “Permisos”. Evita extensiones no oficiales o con valoraciones sospechosas.

2Atajo: Accede a chrome://extensions/ para gestionar extensiones instaladas.

📌 Paso 2: Localiza la extensión en tu navegador

🧩 Icono de extensiones → Browser MCP → 📌 Anclar

Resultado esperado: El icono de Browser MCP debe aparecer de manera fija en la barra de herramientas de Chrome.

Tip: Usa Ctrl + Shift + B para mostrar/ocultar la barra de marcadores sin afectar el icono de la extensión.

🔗 Paso 3: Activación y conexión con Visual Studio Code

Haz clic en el icono de Browser MCP
En el popup, selecciona “Connect”
Verifica que el estado cambie a “Connected”

Estado esperado: Connected ✅

Resultado esperado: El navegador está perfectamente vinculado con Visual Studio Code.

Notas: Si tienes varias ventanas de VS Code o múltiples workspaces, asegúrate de que tu asistente con soporte MCP esté activo en la sesión correcta.

🧪 Paso 4: Verificación en Visual Studio Code

En GitHub Copilot Chat o tu asistente AI, escribe:

navega a google.com

Resultado esperado: El navegador deberá abrir Google.com automáticamente.

Prompts adicionales útiles

“Busca ‘automatización web con MCP’ y abre el primer resultado no patrocinado.”
“Completa el formulario de contacto con estos datos: … y haz submit.”
“Toma una captura de pantalla de toda la página y guárdala como report.png.”
“Extrae las filas de la tabla con selector .pricing-table y devuélvelas en JSON.”

Si tu asistente soporta herramientas MCP, sabrá cuándo usar el navegador automáticamente.

Verifica la herramienta desde VS Code

Abrir paleta: Ctrl + Shift + P → “Developer: Toggle Developer Tools” (para ver logs del panel).
Confirma que la herramienta “browser”/“mcp-browser” aparece en la lista de herramientas del asistente.

# Comprobar versión de VS Code
code --version
# Instalar/actualizar extensión de tu asistente (ejemplo)
code --install-extension publisher.assistant-extension

🛠️ Solución a problemas comunes

La extensión no aparece

chrome://extensions/

Resultado esperado: En esta página podrás confirmar si la extensión está activada.

Error de conexión

Asegúrate de que Visual Studio Code esté abierto
Intenta desconectar y volver a conectar la extensión
Verifica que no haya otros navegadores interfiriendo

Pasos de diagnóstico rápidos

Reinicia el servicio de la extensión: desactiva/activa desde chrome://extensions/.
Comprueba bloqueadores de anuncios/privacidad que limiten scripts.
Revisa políticas empresariales: chrome://policy.
Prueba en una ventana de incógnito (si lo permite la extensión) para descartar interferencias.

Logs y reporte

Abre DevTools de la extensión: chrome://extensions/ → “Detalles” → “Inspeccionar vistas” (Service Worker).
Captura errores y versión de Chrome/VS Code para reportar.

# Datos útiles
chrome://version
code --version

IA no controla el navegador

Confirma que hiciste clic en "Connect"
Verifica los permisos de la extensión
Asegura que el asistente en VS Code soporte herramientas MCP y que estén habilitadas.
Comprueba que la pestaña objetivo no esté en segundo plano con suspensión agresiva.

💼 Casos de uso de MCP Browser

Función	Descripción	Ejemplo
🧪 Automatizar pruebas	Verificar formularios automáticamente	Test funcional de registro
📊 Extracción de datos	Recopilar información de sitios web	Obtener precios
📸 Capturas	Documentar errores	Capturas automáticas

Casos avanzados

Paginas con autenticación: flujo login + 2FA con pausas y confirmaciones.
Extracción paginada: seguir “Siguiente” hasta agotar resultados.
Validación visual: capturas antes/después para comparar UI.
Multi-pestaña: abrir enlaces en nuevas tabs y consolidar datos.

Define límites de tiempo y dominos permitidos para evitar derivas de navegación.

Prompts prácticos

- Abre https://sitio.com/login
- Introduce usuario y contraseña (proporcionados)
- Espera selector .dashboard
- Toma captura completa y guarda como dashboard.png

- Visita la lista de productos
- Extrae nombre, precio y stock de cada card .product
- Genera un archivo CSV productos.csv

🛡️ Seguridad al utilizar MCP Browser

🔒 Conecta solo cuando sea necesario
👁️ Revisa los permisos de la extensión
🔴 Desconecta cuando no se use
🔄 Mantén actualizada la extensión

Buenas prácticas de la industria

Principio de mínimo privilegio: limita el alcance de navegación (dominios, entornos).
Gestión de secretos: nunca hardcodees credenciales en prompts; usa gestores seguros.
Cumplimiento y privacidad: respeta políticas de uso de datos, TOS y robots.txt al extraer información.
Auditoría: habilita logs mínimos necesarios y rotación de registros.

Revisa periódicamente chrome://extensions/ y políticas chrome://policy.

Controles rápidos

# Verificar extensiones en Chrome
chrome://extensions/

Bloquea dominios sensibles en el asistente si es posible.
Desactiva la extensión en perfiles de trabajo si no es requerida.

⚙️ Configuración avanzada

Preferencias de la extensión

Auto-conexión al abrir Chrome (si está disponible).
Tiempo de espera para selectores y navegación.
Formato de capturas: PNG/JPEG, calidad, viewport.
Lista de dominios permitidos (whitelist) para mayor control.

Accede a “Opciones” desde la página de extensiones para ajustar parámetros.

Integración con VS Code

Activa/desactiva herramientas MCP desde la configuración del asistente.
Perfiles por workspace: distintos límites y permisos por proyecto.
Registro de acciones: guarda evidencias (capturas, JSON) en la carpeta del proyecto.

{
  "mcpBrowser": {
    "timeoutMs": 15000,
    "allowedHosts": ["example.com", "tusitio.com"],
    "artifactsDir": ".mcp-artifacts"
  }
}

🧭 Compatibilidad y limitaciones

Funciona en navegadores Chromium; en Edge (Chromium) suele ser compatible.
Limitaciones con iframes de terceros, ventanas emergentes y contenidos protegidos por CORS.
Descargas de archivos pueden requerir confirmación del usuario según políticas del navegador.
Sitios con protección anti-bot pueden bloquear automatización; respeta sus políticas.

Para interacciones complejas, evalúa herramientas de testing dedicadas (ver comparativa).

Consejo: Para scraping a gran escala usa APIs oficiales o herramientas de crawling con control de rate limit y retentativas.

📈 Optimización de rendimiento

Reduce el número de pasos por tarea; combina acciones (rellenar varios campos antes de enviar).
Usa selectores estables (data-test-id) en lugar de selectores frágiles.
Configura un viewport consistente y evita redes lentas (o simúlalas para pruebas concretas).
Evita renders innecesarios: espera a “network idle” antes de extraer datos.

🔄 Comparativa con otras tecnologías

Herramienta	Objetivo	Ventajas	Cuándo usar
MCP Browser	Control del navegador vía asistente en VS Code	Rápido para tareas guiadas por IA, integración directa con flujo de desarrollo.	Exploración, prototipos, asistencia contextual en proyectos.
Playwright	Testing/E2E y scraping programático	API robusta, multi-navegador, headless, trazas y fixtures.	Suites de QA, CI/CD, pruebas deterministas y paralelas.
Selenium	Automatización clásica de navegadores	Amplio ecosistema, soporte multi-lenguaje.	Integración con infra existente y grids de pruebas.
Puppeteer	Control de Chromium vía DevTools	Sencillo para tareas en Chromium, buen API de scraping.	Automatizaciones específicas en Chrome/Chromium.

Analogía: así como “Docker vs Podman” ofrecen caminos similares con diferencias operativas, MCP Browser y herramientas como Playwright resuelven problemas cercanos pero con enfoques distintos (IA asistida vs. suites de testing).

🧩 Alternativas y complementos

Ejemplo Playwright (Node.js)

import { chromium } from 'playwright';
(async () => {
  const browser = await chromium.launch();
  const page = await browser.newPage();
  await page.goto('https://example.com');
  await page.click('text=Pricing');
  const rows = await page.$$eval('.pricing-row', els => els.map(e => e.textContent.trim()));
  console.log(rows);
  await browser.close();
})();

Ideal para pipelines repetibles en CI/CD y pruebas deterministas.

Workflows híbridos

Prototipa pasos con MCP Browser y genera scripts en Playwright.
Usa el asistente para crear fixtures y asserts a partir de interacciones reales.
Convierte prompts en casos de prueba versionados.

❓ Preguntas frecuentes (FAQ)

No necesariamente. Requieres un asistente en VS Code compatible con MCP. Revisa la documentación del asistente que utilices para confirmar compatibilidad y permisos.

Algunas implementaciones ofrecen capturas y trazas; para video usa herramientas de terceros (p.ej., Playwright Trace Viewer o grabadores de pantalla) junto con MCP Browser.

Configura dominios permitidos en las opciones del asistente/extensión y establece políticas claras en tus prompts. Desconecta cuando no esté en uso.

🧭 Checklists rápidas

Antes de usar

Chrome y VS Code actualizados.
Extensión MCP instalada y visible.
Asistente en VS Code con herramientas MCP activas.
Permisos revisados, dominios permitidos definidos.

Durante la sesión

Conexión “Connected” confirmada.
Logs monitoreados si hay fallos.
Desconexión al finalizar las tareas.

🎉 Conclusión

MCP Browser es una herramienta que amplía las capacidades de automatización web y permite a los asistentes inteligentes interactuar en tiempo real con las páginas web. Siguiendo esta guía, podrás realizar pruebas, recopilar información y automatizar tareas de manera eficiente.

Próximos pasos:

✅ Prueba los comandos de navegación
📚 Investiga casos de uso avanzados
🤝 Comparte tus experiencias con la comunidad

Tip final: Establece un “playbook” de prompts reutilizables por equipo (login, extracción, reporte) y versiona tus artefactos en el repositorio.

Beneficio clave: Ahorra tiempo en flujos repetitivos y mejora la trazabilidad de tus tareas de navegación y QA.

en Programación

# Al

ASIMOV Ingeniería S. de R.L. de C.V., Emiliano Nava 9 de agosto de 2025

Nuestros blogs

Iniciar sesión dejar un comentario

Cómo Instalar Odoo con Docker en Ubuntu: Guía Paso a Paso para Desarrolladores y Empresas