Remover Punctuation

Input
Replace with
Keep
Output
Result will appear here…
🔒Seu texto nunca sai do seu navegador. Não coletamos, armazenamos ou transmitimos nenhum dado. 100% privado.
Free forever & no sign-up needed 🙌
If this saved you time, a pizza would mean the world!
Buy me a pizza

Compartilhar Esta Ferramenta

Estás a preparar um conjunto de dados para um modelo de machine learning, ou talvez estás a fazer uma análise de frequência de palavras, e de repente os resultados são um caos. "Olá," e "Olá" são contados como duas palavras diferentes. "Não's" divide-se em tokens que não pediste. O culpado não é o teu código — é a pontuação que se esconde tranquilamente no teu texto, complicando tudo mais do que o necessário.

O que faz realmente o Remove Punctuation

O Remove Punctuation elimina cada sinal de pontuação do teu texto — vírgulas, pontos, pontos de exclamação, pontos de interrogação, dois pontos, ponto e vírgula, aspas, hífens, parênteses e tudo o mais. O que fica são palavras puras e espaços, nada mais.

Por exemplo, se colares isto:

Olá, mundo! É um "ótimo" dia — não é?

Obtens isto:

Olá mundo É um ótimo dia  não é

Texto limpo, sem pontuação, pronto para o que precisares de fazer com ele a seguir.

Como usar

  1. Cola o teu texto na caixa de entrada.
  2. Clica em Remover pontuação.
  3. Copia o resultado limpo.

É mesmo tudo. Sem opções para configurar, sem formatos para selecionar. Colar, clicar, copiar — feito.

Quando é que realmente precisas disto

Se és cientista de dados ou engenheiro NLP e estás a pré-processar texto antes de o introduzir num modelo, a pontuação é geralmente ruído de que precisas de te livrar. Quer estejas a construir um classificador de sentimentos, um modelo de tópicos, ou simplesmente a fazer uma contagem de frequência de tokens, ter vírgulas e pontos parasitas no teu corpus distorce os teus resultados de uma forma que é chata de depurar depois.

Se és programador e estás a limpar conteúdo gerado por utilizadores antes de o armazenar ou comparar numa base de dados, as inconsistências de pontuação causam falhas silenciosas nas correspondências. Dois utilizadores que escrevem "Lisboa" e "Lisboa." não deviam ser tratados como entradas diferentes — mas serão se não removeres a pontuação primeiro.

Se és investigador ou académico a fazer análise de texto manual — contar ocorrências de palavras, construir tabelas de frequência, comparar passagens — passar o teu texto por um processo para remover a pontuação poupa-te muito trabalho de limpeza manual tedioso no Excel ou Google Sheets.

E se és estratega de conteúdo a extrair palavras-chave de um lote de artigos ou conteúdo web extraído por scraping, a pontuação presa às bordas das palavras vai estragar cada contagem e comparação que tentares fazer. Limpa primeiro, analisa depois.

Porque é que ser gratuito e sem servidor importa

Construí esta ferramenta para funcionar completamente no teu navegador porque não acho que deves ter de entregar o teu texto a um servidor só para remover umas vírgulas. Nada do que colas aqui vai a lado nenhum — sem conta, sem envio, sem dados recolhidos. Funciona em qualquer dispositivo, qualquer navegador, e honestamente poderias usá-lo sem WiFi se a página já tivesse sido carregada antes.

Dicas e armadilhas comuns

Os apóstrofes nas contrações serão removidos, o que significa que "não's" perde o apóstrofe por completo. Para a maioria das tarefas de NLP e limpeza de dados é exatamente isso que queres. Mas se estás a preparar texto para leitura humana em vez de processamento automático, tem isso em mente — o resultado não pretende ser gramaticalmente correto, pretende estar limpo para análise.

Os hífens em palavras compostas também são eliminados. "Bem-conhecido" torna-se "bemconhecido" como um único token. Se isso for importante para o teu caso de uso, podes fazer um localizar e substituir nos hífens antes de usar a ferramenta — substitui-os por espaços primeiro, depois remove a pontuação.

Os números ficam completamente intactos. Se o teu texto contiver coisas como "3,14" ou "99,99 €", os dígitos ficam mas a pontuação à volta ou dentro deles é removida, dando "314" e "9999". Se precisares de preservar a formatação numérica, trata esses casos separadamente antes de remover a pontuação.

Perguntas Frequentes

1Como removo toda a pontuacao de um grande bloco de texto de uma so vez?

Cola simplesmente o bloco completo na caixa de entrada e clica em Remover pontuacao. A ferramenta processa tudo numa unica passagem, nao precisas de dividir o teu texto em partes. Copia o resultado quando tiveres terminado.

2Funciona com texto que contem numeros e caracteres especiais?

Os numeros sao preservados tal como estao, por isso os digitos no teu texto nao serao afetados. Os sinais de pontuacao padrao sao removidos. Caracteres especiais como simbolos de moeda, sinais de percentagem e operadores matematicos tambem sao eliminados, tem isso em conta se o teu texto contiver dados formatados que precisas de preservar.

3O meu texto e enviado para um servidor quando uso esta ferramenta?

Nao, nunca. A ferramenta funciona completamente no teu navegador, o teu texto nao sai do teu dispositivo, nenhum servidor o recebe e nada e armazenado ou registado em lado nenhum. Podes verificar isso tu mesmo carregando a pagina e depois desligando a tua ligacao a internet antes de a usar.

4O que acontece com as contracoes quando a pontuacao e removida?

O apostrofe e completamente removido. Para o pre-processamento NLP e limpeza de dados este e geralmente o comportamento desejado. Se precisares de expandir as contracoes antes de remover a pontuacao esse e um passo separado que deveras fazer primeiro.

5Porque nao usar Localizar e Substituir no Word ou uma regex em Python?

Podes perfeitamente faze-lo, e se ja estiveres num script Python uma regex e provavelmente a melhor opcao. Mas se so precisares de limpar rapidamente um bloco de texto sem abrir um IDE ou escrever codigo, colar numa ferramenta dedicada e clicar uma vez e muito mais rapido. O Localizar e Substituir do Word tambem nao tem uma opcao simples de um so clique para remover todos os tipos de pontuacao de uma vez.

Ferramentas Relacionadas

Ferramentas Relacionadas