Kokoro TTS MCP Server

Kokoro TTS MCP Server dostarcza naturalnie brzmiącą, konfigurowalną syntezę mowy do Twoich aplikacji AI, z obsługą lokalnego i chmurowego przechowywania dźwięku – idealny dla dostępności, automatyzacji oraz tworzenia treści.

Kokoro TTS MCP Server

Co robi serwer “Kokoro TTS” MCP?

Kokoro Text to Speech (TTS) MCP Server to serwer Model Context Protocol (MCP), który umożliwia asystentom AI i klientom generowanie wysokiej jakości dźwięku mowy na podstawie wprowadzonego tekstu. Dzięki połączeniu workflow AI z tym serwerem użytkownicy mogą konwertować tekst na pliki .mp3 i opcjonalnie przesyłać je do Amazon S3 lub kompatybilnych magazynów. Kokoro TTS wykorzystuje zaawansowane modele (poprzez HuggingFace spaces i wagi ONNX), oferując konfigurowalne głosy, prędkości oraz języki, co ułatwia integrację funkcji text-to-speech w środowiskach deweloperskich, chatbotach lub pipeline’ach automatyzacji. Ten serwer MCP jest szczególnie przydatny w sytuacjach, gdzie potrzebna jest syntezowana mowa – na potrzeby dostępności, powiadomień lub tworzenia treści.

Lista promptów

W repozytorium nie udokumentowano jawnych szablonów promptów.

Lista zasobów

W plikach repozytorium lub README nie udokumentowano jawnych zasobów.

Lista narzędzi

  • Generowanie Text-to-Speech
    Konwertuje wprowadzony tekst na plik audio .mp3 przy użyciu modeli Kokoro TTS. Oferuje konfigurację głosu, prędkości i języka.
  • Wysyłanie do S3
    Opcjonalnie przesyła wygenerowane pliki .mp3 do wskazanego zasobnika/folderu Amazon S3, jeśli taka opcja jest włączona w konfiguracji.
  • Lokalne zarządzanie MP3
    Przechowuje wygenerowane pliki .mp3 w wyznaczonym folderze lokalnym i może je automatycznie usuwać po przesłaniu lub po okresie retencji.

Przykładowe zastosowania tego serwera MCP

  • Rozwiązania dostępnościowe:
    Zintegruj Kokoro TTS z aplikacjami, aby zapewnić informację głosową dla użytkowników niedowidzących lub odczytywać treści na głos.
  • Powiadomienia głosowe:
    Automatyzuj alerty głosowe w systemach monitoringu lub IoT, konwertując komunikaty zdarzeń na mowę.
  • Tworzenie treści:
    Generuj lektora do wideo, podcastów lub interaktywnych mediów bezpośrednio ze scenariuszy tekstowych.
  • Konwersacyjna AI/Chatboty:
    Pozwól chatbotom odpowiadać głosowo, zwiększając zaangażowanie użytkowników w obsłudze klienta lub wirtualnych asystentach.
  • Archiwizacja dźwięku i zgodność:
    Twórz nagrania audio komunikacji tekstowej na potrzeby zgodności lub archiwizacji.

Jak to skonfigurować

Windsurf

  1. Upewnij się, że masz zainstalowane uv oraz pobrane wszystkie pliki modeli Kokoro.
  2. Sklonuj repozytorium Kokoro TTS MCP na swój lokalny komputer.
  3. Edytuj plik konfiguracyjny Windsurf, dodając serwer Kokoro TTS MCP.
  4. Dodaj poniższy fragment JSON do obiektu mcpServers:
    {
      "kokoro-tts-mcp": {
        "command": "uv",
        "args": [
          "--directory",
          "/path/toyourlocal/kokoro-tts-mcp",
          "run",
          "mcp-tts.py"
        ],
        "env": {
          "TTS_VOICE": "af_heart",
          "TTS_SPEED": "1.0",
          "TTS_LANGUAGE": "en-us",
          "AWS_ACCESS_KEY_ID": "",
          "AWS_SECRET_ACCESS_KEY": "",
          "AWS_REGION": "us-east-1",
          "AWS_S3_FOLDER": "mp3",
          "S3_ENABLED": "true",
          "MP3_FOLDER": "/path/to/mp3"
        }
      }
    }
    
  5. Zapisz konfigurację i zrestartuj Windsurf.

Claude

  1. Zainstaluj wymagane zależności (Node.js, uv, modele Kokoro).
  2. Dodaj serwer Kokoro TTS MCP w sekcji mcpServers Claude’a.
  3. Wstaw konfigurację JSON jak wyżej.
  4. Zapisz i zrestartuj środowisko Claude.

Cursor

  1. Pobierz repozytorium oraz wymagane pliki modeli.
  2. Zaktualizuj plik cursor.json lub równoważny, aby dodać serwer Kokoro TTS MCP.
  3. Skopiuj podany fragment JSON, aktualizując ścieżki według potrzeb.
  4. Zapisz zmiany i zrestartuj Cursor.

Cline

  1. Sklonuj repozytorium i skonfiguruj zmienne środowiskowe.
  2. Edytuj konfigurację Cline, dodając serwer Kokoro TTS MCP zgodnie z instrukcją.
  3. Zapisz i zrestartuj klienta Cline.

Zabezpieczanie kluczy API

Zawsze używaj zmiennych środowiskowych do przechowywania wrażliwych informacji, takich jak dane uwierzytelniające AWS. Przykład:

"env": {
  "AWS_ACCESS_KEY_ID": "${AWS_ACCESS_KEY_ID}",
  "AWS_SECRET_ACCESS_KEY": "${AWS_SECRET_ACCESS_KEY}",
  ...
}

Ustaw te zmienne w swoim systemie lub środowisku CI – nigdy nie zapisuj sekretów na stałe w plikach konfiguracyjnych.

Jak korzystać z tego MCP we flow

Użycie MCP w FlowHunt

Aby zintegrować serwery MCP z workflow FlowHunt, zacznij od dodania komponentu MCP do swojego flow i podłączenia go do agenta AI:

FlowHunt MCP flow

Kliknij na komponent MCP, aby otworzyć panel konfiguracji. W sekcji konfiguracji MCP systemu wstaw dane swojego serwera MCP w formacie JSON:

{
  "kokoro-tts-mcp": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

Po zapisaniu konfiguracji agent AI może korzystać z tego MCP jako narzędzia z dostępem do wszystkich jego funkcji. Pamiętaj, aby zmienić “kokoro-tts-mcp” na faktyczną nazwę swojego serwera MCP i podać własny URL serwera.


Podsumowanie

SekcjaDostępnośćSzczegóły/Uwagi
PrzeglądSerwer text-to-speech dla workflow AI
Lista promptówBrak szablonów promptów
Lista zasobówBrak jawnych zasobów MCP w dokumentacji
Lista narzędziTTS, wysyłka do S3, zarządzanie plikami lokalnymi
Zabezpieczanie kluczy APIUdokumentowane użycie zmiennych środowiskowych dla AWS i konfiguracji
Wsparcie próbkowania (mniej istotne w ocenie)Brak wzmianki o funkcji próbkowania LLM

Nasza opinia

Kokoro TTS MCP Server to narzędzie ukierunkowane i praktyczne, oferujące wyspecjalizowane rozwiązanie do zadań text-to-speech z integracją chmurową. Brakuje w nim prymitywów promptów i zasobów, ale jest open source, dobrze skonfigurowany i obsługuje bezpieczne zarządzanie kluczami. Nie wspomina się o wsparciu próbkowania czy Roots, co ogranicza zaawansowane możliwości agentowe. Do zastosowań TTS jest solidny i użyteczny, choć mniej rozbudowany niż bardziej ogólne serwery MCP.

Ocena MCP

Posiada LICENCJĘ✅ (Apache-2.0)
Ma przynajmniej jedno narzędzie
Liczba forków7
Liczba gwiazdek39

Najczęściej zadawane pytania

Czym jest Kokoro TTS MCP Server?

Kokoro TTS MCP Server to serwer Model Context Protocol, który umożliwia agentom i klientom AI konwersję tekstu na wysokiej jakości dźwięk mowy, z opcjami wyboru głosu, prędkości, języka oraz przechowywania w chmurze. Idealny do dodania funkcji text-to-speech do chatbotów, narzędzi dostępności czy automatyzacji.

Jakie są główne funkcje Kokoro TTS MCP?

Obsługuje konfigurowalne głosy, prędkości i języki wykorzystując modele HuggingFace i wagi ONNX. Dźwięk może być przechowywany lokalnie lub przesyłany do Amazon S3. Integracja z środowiskami deweloperskimi, chatbotami i pipeline’ami automatyzacji jest prosta.

Jak zabezpieczyć dane AWS do przesyłania na S3?

Nigdy nie umieszczaj danych uwierzytelniających w plikach konfiguracyjnych. Używaj zmiennych środowiskowych, aby bezpiecznie przekazywać wrażliwe informacje, takie jak AWS_ACCESS_KEY_ID i AWS_SECRET_ACCESS_KEY, do serwera Kokoro TTS MCP.

Jakie są typowe zastosowania?

Przykłady zastosowań to rozwiązania dla dostępności (mowa dla osób niedowidzących), powiadomienia głosowe, tworzenie treści (lektor do materiałów), konwersacyjna AI oraz archiwizacja dźwięku dla zgodności.

Czy mogę używać Kokoro TTS z FlowHunt?

Tak, możesz dodać Kokoro TTS jako komponent MCP w swoim workflow FlowHunt, umożliwiając agentom generowanie odpowiedzi głosowych i korzystanie ze wszystkich obsługiwanych narzędzi oraz konfiguracji.

Czy Kokoro TTS obsługuje zaawansowane próbkowanie LLM lub szablony promptów?

Nie, Kokoro TTS skupia się na wysokiej jakości syntezie mowy i nie udostępnia prymitywów promptów ani funkcji próbkowania LLM.

Zintegruj Kokoro TTS z Twoim workflow AI

Dodaj naturalną, wysokiej jakości syntezę mowy do swoich chatbotów i automatyzacji za pomocą Kokoro TTS MCP Server. Wypróbuj w FlowHunt lub połącz z własną infrastrukturą.

Dowiedz się więcej