Kokoro TTS MCP Server
Kokoro TTS MCP Server leva síntese de voz natural e personalizável para suas aplicações de IA, com suporte a armazenamento local e em nuvem, ideal para acessibilidade, automação e criação de conteúdo.

O que faz o servidor MCP “Kokoro TTS”?
O Kokoro Text to Speech (TTS) MCP Server é um servidor Model Context Protocol (MCP) que permite que assistentes e clientes de IA gerem áudio de fala de alta qualidade a partir de texto. Ao conectar workflows de IA a este servidor, os usuários podem converter texto em arquivos .mp3 e, opcionalmente, enviá-los para a Amazon S3 ou outro armazenamento compatível. O Kokoro TTS utiliza modelos avançados (via espaços HuggingFace e pesos ONNX) para fornecer vozes, velocidades e idiomas personalizáveis, facilitando a integração de capacidades de texto-para-fala em ambientes de desenvolvimento, chatbots ou pipelines de automação. Este MCP é especialmente valioso para cenários que demandam fala sintetizada para acessibilidade, notificações ou criação de conteúdo.
Lista de Prompts
Nenhum template de prompt explícito está documentado no repositório.
Lista de Recursos
Nenhum recurso explícito está documentado nos arquivos do repositório ou README.
Lista de Ferramentas
- Geração de Texto-para-Fala
Converte texto de entrada em um arquivo de áudio .mp3 usando modelos Kokoro TTS. Oferece configuração para voz, velocidade e idioma. - Upload para S3
Opcionalmente, envia arquivos .mp3 gerados para um bucket/pasta especificada da Amazon S3, se habilitado na configuração. - Gerenciamento Local de MP3
Armazena arquivos .mp3 gerados em uma pasta local designada e pode excluí-los automaticamente após upload ou período de retenção.
Casos de Uso deste MCP Server
- Soluções de Acessibilidade:
Integre o Kokoro TTS em aplicações para fornecer feedback por voz a usuários com deficiência visual ou para leitura de conteúdos. - Notificações por Voz:
Automatize alertas de voz em sistemas de monitoramento ou IoT convertendo mensagens de eventos em áudio. - Criação de Conteúdo:
Gere narrações para vídeos, podcasts ou mídias interativas diretamente a partir de roteiros escritos. - IA Conversacional/Chatbots:
Permita que chatbots respondam com saída falada, ampliando o engajamento em atendimentos ou assistentes virtuais. - Arquivamento & Conformidade:
Crie registros em áudio de comunicações baseadas em texto para conformidade ou arquivamento.
Como configurar
Windsurf
- Certifique-se de ter o
uv
e todos os arquivos de modelo Kokoro baixados. - Clone o repositório Kokoro TTS MCP para sua máquina local.
- Edite seu arquivo de configuração do Windsurf para adicionar o servidor Kokoro TTS MCP.
- Adicione o seguinte trecho JSON ao seu objeto
mcpServers
:{ "kokoro-tts-mcp": { "command": "uv", "args": [ "--directory", "/path/toyourlocal/kokoro-tts-mcp", "run", "mcp-tts.py" ], "env": { "TTS_VOICE": "af_heart", "TTS_SPEED": "1.0", "TTS_LANGUAGE": "en-us", "AWS_ACCESS_KEY_ID": "", "AWS_SECRET_ACCESS_KEY": "", "AWS_REGION": "us-east-1", "AWS_S3_FOLDER": "mp3", "S3_ENABLED": "true", "MP3_FOLDER": "/path/to/mp3" } } }
- Salve sua configuração e reinicie o Windsurf.
Claude
- Instale os pré-requisitos (Node.js, uv, modelos Kokoro).
- Adicione o servidor Kokoro TTS MCP na seção
mcpServers
do Claude. - Insira a configuração JSON conforme acima.
- Salve e reinicie o ambiente Claude.
Cursor
- Baixe o repositório e os arquivos de modelo necessários.
- Atualize o
cursor.json
ou configuração equivalente para incluir o servidor Kokoro TTS MCP. - Copie o trecho JSON fornecido, atualizando os caminhos conforme necessário.
- Salve as alterações e reinicie o Cursor.
Cline
- Clone o repositório e configure as variáveis de ambiente.
- Edite a configuração do Cline, adicionando o servidor Kokoro TTS MCP conforme mostrado.
- Salve e reinicie o cliente Cline.
Protegendo as Chaves de API
Sempre utilize variáveis de ambiente para armazenar informações sensíveis como credenciais AWS. Exemplo:
"env": {
"AWS_ACCESS_KEY_ID": "${AWS_ACCESS_KEY_ID}",
"AWS_SECRET_ACCESS_KEY": "${AWS_SECRET_ACCESS_KEY}",
...
}
Defina essas variáveis no seu sistema ou ambiente de CI, nunca insira segredos diretamente nos arquivos de configuração.
Como usar este MCP em fluxos
Usando MCP no FlowHunt
Para integrar servidores MCP no seu workflow FlowHunt, comece adicionando o componente MCP ao seu fluxo e conectando-o ao seu agente de IA:

Clique no componente MCP para abrir o painel de configuração. Na seção de configuração MCP do sistema, insira os detalhes do seu servidor MCP usando este formato JSON:
{
"kokoro-tts-mcp": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Uma vez configurado, o agente de IA poderá usar este MCP como ferramenta com acesso a todas as suas funções e capacidades. Lembre-se de alterar “kokoro-tts-mcp” para o nome real do seu servidor MCP e substituir a URL pela URL do seu servidor MCP.
Visão Geral
Seção | Disponibilidade | Detalhes/Notas |
---|---|---|
Visão geral | ✅ | Servidor texto-para-fala para workflows de IA |
Lista de Prompts | ⛔ | Nenhum template de prompt encontrado |
Lista de Recursos | ⛔ | Nenhum recurso MCP explícito documentado |
Lista de Ferramentas | ✅ | TTS, upload S3, gerenciamento de arquivos locais |
Proteção de Chaves de API | ✅ | Uso documentado de variáveis de ambiente para AWS e configuração |
Suporte a Amostragem (menos relevante) | ⛔ | Nenhuma menção ao recurso de amostragem de LLM |
Nossa Opinião
O Kokoro TTS MCP Server é focado e prático, oferecendo uma ferramenta especializada para tarefas de texto-para-fala com integração à nuvem. Não possui primitivas de prompt e recursos, mas é open source, bem configurado e suporta gerenciamento seguro de chaves. Não há menção a sampling ou suporte a Roots, limitando capacidades avançadas de agentes. Para casos de uso TTS, é robusto e útil, embora não tão completo quanto MCPs mais generalistas.
Pontuação MCP
Possui LICENSE? | ✅ (Apache-2.0) |
---|---|
Possui ao menos uma ferramenta | ✅ |
Número de Forks | 7 |
Número de Stars | 39 |
Perguntas frequentes
- O que é o Kokoro TTS MCP Server?
O Kokoro TTS MCP Server é um servidor Model Context Protocol que permite que agentes e clientes de IA convertam texto em áudio de fala de alta qualidade, com opções de voz, velocidade, idioma e armazenamento em nuvem. É ideal para adicionar texto-para-fala a chatbots, ferramentas de acessibilidade e automações.
- Quais são os principais recursos do Kokoro TTS MCP?
Ele suporta vozes, velocidades e idiomas personalizáveis usando modelos do HuggingFace e pesos ONNX. O áudio pode ser armazenado localmente ou enviado à Amazon S3. É fácil de integrar em ambientes de desenvolvimento, chatbots e pipelines de automação.
- Como proteger minhas credenciais AWS para upload no S3?
Nunca codifique credenciais diretamente nos arquivos de configuração. Use variáveis de ambiente para passar informações sensíveis como AWS_ACCESS_KEY_ID e AWS_SECRET_ACCESS_KEY com segurança para o Kokoro TTS MCP Server.
- Quais são os casos de uso típicos?
Os casos de uso incluem soluções de acessibilidade (leitura para deficientes visuais), notificações por voz, criação de conteúdo (narração para mídias), IA conversacional e arquivamento de áudio para conformidade.
- Posso usar o Kokoro TTS com o FlowHunt?
Sim, você pode adicionar o Kokoro TTS como componente MCP no seu fluxo do FlowHunt, permitindo que seus agentes gerem respostas em áudio e usem todas as ferramentas e configurações suportadas.
- O Kokoro TTS suporta amostragem avançada de LLM ou templates de prompt?
Não, o Kokoro TTS é focado em texto-para-fala de alta qualidade e não oferece primitivas de prompt ou recursos de amostragem de LLM.
Integre o Kokoro TTS ao seu Workflow de IA
Adicione síntese de voz natural e de alta qualidade aos seus chatbots e automações com o Kokoro TTS MCP Server. Experimente no FlowHunt ou conecte à sua própria infraestrutura.