Puppeteer Vision MCP Server
Automatizujte odolný web scraping s podporou AI a konverziu do Markdownu – aj na interaktívnych či chránených stránkach – vďaka Puppeteer Vision MCP Serveru.

Čo robí „Puppeteer Vision“ MCP Server?
Puppeteer Vision MCP Server umožňuje AI asistentom scrapovať a konvertovať webové stránky do formátu Markdown pomocou Puppeteer, Readability a Turndown. Vďaka pokročilej AI interakcii automaticky zvláda webové prvky ako cookie lišty, CAPTCHA, paywally a ďalšie, čo zabezpečuje robustnú extrakciu obsahu aj z interaktívnych alebo chránených stránok. Server túto schopnosť sprístupňuje cez Model Context Protocol (MCP), čo uľahčuje integráciu do AI vývojových workflow. Umožňuje tak automatizovaný web scraping, sumarizáciu obsahu aj získavanie dát priamo LLM modelmi. Server je jednoducho nasaditeľný cez npx
, vyžaduje len minimálnu konfiguráciu a podporuje komunikáciu cez stdio aj SSE pre flexibilnú integráciu.
Zoznam promptov
V repozitári alebo dokumentácii nie sú uvedené žiadne prompt šablóny.
Zoznam zdrojov
V repozitári alebo dokumentácii nie sú explicitne uvedené žiadne MCP zdroje.
Zoznam nástrojov
- scrape-webpage: Scrapuje webovú stránku na určenej URL adrese, využíva AI na interakciu a obchádzanie interaktívnych prvkov (napr. cookie lišta, CAPTCHA), extrahuje hlavný obsah cez Readability a výsledok prevádza do Markdownu. Parametre zahŕňajú:
url
(string, povinné): Webová stránka na scrapovanie.autoInteract
(boolean, voliteľné, predvolené: true): Či má automaticky riešiť interaktívne prvky.maxInteractionAttempts
(number, voliteľné, predvolené: 3): Maximálny počet AI pokusov o interakciu.waitForNetworkIdle
(boolean, voliteľné, predvolené: true): Čakať na neaktívnu sieť pred scrapovaním.
Prípady použitia tohto MCP servera
- Automatizovaný web scraping pre získavanie znalostí
Vývojári môžu extrahovať čitateľný, dobre formátovaný Markdown z ľubovoľných webstránok, vďaka čomu ľahko zaradia aktuálny obsah do AI workflow, databáz alebo znalostných báz. - Obchádzanie interaktívnych bariér
Interakcia poháňaná AI umožní automaticky obísť CAPTCHA, cookie lišty a ďalšie interaktívne prekážky, čím umožní plynulú extrakciu obsahu aj zo stránok, ktoré by inak blokovali automatizáciu. - Sumarizácia a analýza obsahu
Extrahovaný Markdown je možné vkladať do LLM modelov pre sumarizáciu, analýzu sentimentu alebo klasifikáciu, čo zjednodušuje výskum a spracovanie dát. - Automatizácia prehliadača v reálnom čase
Nástroj možno spustiť vo viditeľnom (non-headless) režime na ladenie, ukážky alebo keď je potrebné vizuálne potvrdenie činnosti prehliadača. - Integrácia do LLM orchestrátorov
Ako MCP server ho možno použiť v orchestrátoroch ako Windsurf, Claude, Cursor a Cline, čím rozširuje možnosti AI agentov pre prácu s reálnym webom.
Ako ho nastaviť
Windsurf
Predpoklady: Nainštalujte Node.js a npm.
Nastavenie prostredia: Vytvorte súbor
.env
alebo exportujte požadované environmentálne premenné vrátaneOPENAI_API_KEY
.Úprava konfigurácie: Nájdite konfiguračný súbor Windsurf.
Pridajte Puppeteer Vision MCP: Vložte tento JSON úsek:
{ "mcpServers": { "web-scraper": { "command": "npx", "args": ["-y", "puppeteer-vision-mcp-server"], "env": { "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE" } } } }
Uložiť/reštartovať: Uložte súbor a reštartujte Windsurf.
Overiť: Skontrolujte logy alebo UI pre potvrdenie spustenia MCP servera.
Zabezpečenie API kľúčov:
Tajomstvá ukladajte do environmentálnych premenných (napr. .env
):
"env": {
"OPENAI_API_KEY": "${OPENAI_API_KEY}"
}
Claude
Predpoklady: Uistite sa, že Node.js a npm sú nainštalované.
Nastavenie prostredia: Pripravte
.env
alebo exportujteOPENAI_API_KEY
a ďalšie premenné.Úprava konfigurácie: Otvorte Claude MCP konfiguráciu.
Pridajte MCP server:
{ "mcpServers": { "web-scraper": { "command": "npx", "args": ["-y", "puppeteer-vision-mcp-server"], "env": { "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE" } } } }
Reštartujte Claude: Uložte zmeny a reštartujte platformu.
Overiť: Potvrďte úspešné spustenie.
Cursor
Predpoklady: Nainštalujte Node.js a npm.
Prostredie: Nastavte
.env
s OpenAI API kľúčom.Úprava Cursor konfigurácie: Pridajte MCP server nasledovne:
{ "mcpServers": { "web-scraper": { "command": "npx", "args": ["-y", "puppeteer-vision-mcp-server"], "env": { "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE" } } } }
Uložiť & reštartovať: Uložte zmeny a reštartujte Cursor.
Skontrolujte logy: Overte, že server beží.
Cline
Predpoklady: Nainštalujte Node.js a npm.
Prostredie: Nastavte alebo exportujte
OPENAI_API_KEY
.Konfigurácia: Pridajte do Cline MCP konfigurácie:
{ "mcpServers": { "web-scraper": { "command": "npx", "args": ["-y", "puppeteer-vision-mcp-server"], "env": { "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE" } } } }
Reštartujte Cline: Použite zmeny a reštartujte.
Overte: Overte, že server je dostupný.
Poznámka: API kľúče zabezpečte prostredníctvom environmentálnych premenných a nikdy ich neukladajte priamo do konfigurácie.
Ako použiť tento MCP vo flow
Použitie MCP vo FlowHunt
Na integráciu MCP serverov do vášho FlowHunt workflow pridajte MCP komponent do flow a prepojte ho s AI agentom:

Kliknite na MCP komponent pre otvorenie konfiguračného panela. V časti systémová MCP konfigurácia vložte detaily MCP servera v tomto JSON formáte:
{
"puppeteer-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Po uložení je AI agent schopný používať tento MCP ako nástroj so všetkými jeho funkciami. Nezabudnite zmeniť “puppeteer-vision” na skutočný názov vášho MCP servera a nahraďte URL adresou vášho MCP servera.
Prehľad
Sekcia | Dostupnosť | Podrobnosti/Poznámky |
---|---|---|
Prehľad | ✅ | Uvedené v README. |
Zoznam promptov | ⛔ | Neboli nájdené žiadne prompt šablóny. |
Zoznam zdrojov | ⛔ | Nie sú popísané explicitné MCP zdroje. |
Zoznam nástrojov | ✅ | Nástroj scrape-webpage , podrobne v README. |
Zabezpečenie API kľúčov | ✅ | Návod na .env a environmentálne premenné je uvedený. |
Podpora sampling (menej dôležité v hodnotení) | ⛔ | Nie je spomenutá podpora sampling. |
| Podpora Roots | ⛔ | Nie je spomenutý Roots. |
Na základe vyššie uvedeného, Puppeteer Vision MCP Server ponúka robustný a zameraný nástroj na web scraping s kvalitnou dokumentáciou a bezpečnostnými odporúčaniami, no chýba viacero nástrojov, prompt šablóny, zdroje či pokročilé MCP funkcie ako roots alebo sampling. Vďaka jednému účelu má vysokú spoľahlivosť pre svoj prípad použitia, no obmedzenú rozšíriteľnosť.
Náš názor
MCP skóre: 5/10
Tento MCP server je dobre zdokumentovaný, užitočný pre svoj konkrétny účel a ľahko nastaviteľný, avšak absencia prompt šablón, explicitných zdrojov a pokročilých MCP funkcií (roots, sampling) obmedzuje jeho univerzálnosť a integráciu do ekosystému.
MCP skóre
Má LICENSE | ⛔ |
---|---|
Má aspoň jeden nástroj | ✅ |
Počet Forkov | 5 |
Počet Starov | 12 |
Najčastejšie kladené otázky
- Čo je Puppeteer Vision MCP Server?
Je to MCP server, ktorý umožňuje AI agentom scrapovať a konvertovať webové stránky do Markdownu pomocou Puppeteer, Readability a Turndown. Automaticky interaguje a obchádza bežné webové bariéry (ako CAPTCHA alebo cookie lišty), čím umožňuje robustnú extrakciu obsahu pre AI workflow.
- Aké sú hlavné prípady použitia?
Automatizovaný web scraping pre získavanie znalostí, obchádzanie interaktívnych bariér, sumarizácia a analýza obsahu, automatizácia prehliadača v reálnom čase a bezproblémová integrácia do LLM orchestrátorov.
- Ako nastavím Puppeteer Vision MCP so svojím orchestrátorom?
Nakonfigurujte ho vo svojej MCP konfigurácii orchestrátora, zadajte príkaz a environmentálne premenné (vrátane OpenAI API kľúča). Podrobné inštrukcie sú uvedené vyššie pre Windsurf, Claude, Cursor a Cline.
- Ako server zvláda interaktívne prvky ako cookie lišty alebo paywally?
Využíva automatizáciu poháňanú AI na interakciu, odmietnutie alebo obídenie webových prvkov ako sú cookie lišty, CAPTCHA či paywally, takže extrakcia obsahu funguje aj na chránených alebo interaktívnych stránkach.
- Je môj API kľúč v bezpečí?
Áno. API kľúče vždy ukladajte do environmentálnych premenných alebo `.env` súborov. Nikdy ich neukladajte priamo do konfiguračných súborov.
- Aké nástroje MCP server poskytuje?
Hlavným nástrojom je `scrape-webpage`, ktorý scrapuje dané URL, prípadne interaguje s webovými prvkami a výstupom je hlavný obsah v Markdown formáte.
Začnite s Puppeteer Vision MCP
Zrýchlite svoje AI workflow vďaka pokročilému web scrapingu a extrakcii obsahu. Nastavte Puppeteer Vision MCP Server za pár minút a začnite vkladať živý web do svojich AI pipeline.