Treze ferramentas úteis para trabalhar com texto na linha de comando

Treisprezece instrumente utile pentru lucrul cu textul pe linia de comandă
⏱️ 9 min read

As distribuições GNU / Linux incluem uma variedade de programas para manipulação de texto, a maioria dos quais são fornecidos pelos utilitários GNU principais. Existe uma certa curva de aprendizado, mas esses utilitários podem ser muito úteis e eficientes quando usados ​​corretamente.

Aqui estão treze poderosas ferramentas de manipulação de texto que todo usuário de linha de comando deve conhecer.

1. gato

Cat foi projetado para enganargatoenate arquivos, mas é mais frequentemente usado para exibir um único arquivo. Sem nenhum argumento, cat lê a entrada padrão até Ctrl + D é pressionado (do terminal ou de outra saída do programa se estiver usando um tubo). A entrada padrão também pode ser explicitamente especificada com um -.

Cat tem uma série de opções úteis, principalmente:

  • -A imprime “$” no final de cada linha e exibe os caracteres não imprimíveis usando a notação circunflexa.
  • -n numera todas as linhas.
  • -b numera as linhas que não estão em branco.
  • -s reduz uma série de linhas em branco a uma única linha em branco.

No exemplo a seguir, estamos concatenando e numerando o conteúdo de arquivo1, entrada padrão e arquivo3.

2. classificar

Como o nome sugere, sort classifica o conteúdo do arquivo em ordem alfabética e numérica.

Ferramentas de texto Linux Classificar

3. uniq

Uniq pega um arquivo classificado e remove linhas duplicadas. Muitas vezes é acorrentado com sort em um único comando.

Linux Text Tools Uniq

4. comunicação

Comm é usado para comparar dois arquivos classificados, linha por linha. Ele produz três colunas: as primeiras duas colunas contêm linhas exclusivas para o primeiro e o segundo arquivo, respectivamente, e a terceira exibe aquelas encontradas em ambos os arquivos.

Linux Text Tools Comm

5. corte

Cut é usado para recuperar seções específicas de linhas, com base em caracteres, campos ou bytes. Ele pode ler de um arquivo ou da entrada padrão se nenhum arquivo for especificado.

Corte pela posição do personagem

o -c opção especifica a posição de um único caractere ou um ou mais intervalos de caracteres.

Por exemplo:

  • -c 3: o terceiro personagem.
  • -c 3-5: do 3º ao 5º caractere.
  • -c -5 ou -c 1-5: do 1º ao 5º caractere.
  • -c 5-: do 5º caractere até o final da linha.
  • -c 3,5-7: o 3º e do 5º ao 7º caractere.
Ferramentas de texto Linux Cut Char

Corte por campo

Os campos são separados por um delimitador que consiste em um único caractere, que é especificado com o -d opção. o -f opção seleciona uma posição de campo ou um ou mais intervalos de campos usando o mesmo formato acima.

Campo de corte de ferramentas de texto do Linux

6. dos2unix

GNU / Linux e Unix geralmente terminam as linhas de texto com um avanço de linha (LF), enquanto o Windows usa retorno de carro e avanço de linha (CRLF). Podem surgir problemas de compatibilidade ao lidar com texto CRLF no Linux, que é onde o dos2unix entra. Ele converte terminadores CRLF em LF.

No exemplo a seguir, o file comando é usado para verificar o formato do texto antes e depois de usar dos2unix.

Linux Text Tools Dos2unix
Treze ferramentas úteis para trabalhar com texto na linha de comando

7. dobrar

Para facilitar a leitura e o manuseio de longas linhas de texto, você pode usar fold, que quebra as linhas em uma largura especificada.

Dobrar corresponde estritamente à largura especificada por padrão, separando as palavras quando necessário.

Linux Text Tools Fold

Se quebrar palavras for indesejável, você pode usar o -s opção de quebrar em espaços.

Linux Text Tools Fold Spaces

8. iconv

Essa ferramenta converte texto de uma codificação para outra, o que é muito útil ao lidar com codificações incomuns.

  • “Input_encoding” é a codificação da qual você está convertendo.
  • “Output_encoding” é a codificação para a qual você está convertendo.
  • “Output_file” é o nome do arquivo no qual o iconv salvará.
  • “Input_file” é o nome do arquivo de onde o iconv fará a leitura.

Nota: você pode listar as codificações disponíveis com iconv -l

9. sed

sed é um poderoso e flexível samarração editor, mais comumente usado para localizar e substituir strings com a seguinte sintaxe.

O comando a seguir lerá do arquivo especificado (ou entrada padrão), substituindo as partes do texto que correspondem ao padrão de expressão regular pela string de substituição e enviando o resultado para o terminal.

Para modificar o arquivo original, você pode usar o -i bandeira.

Linux Text Tools Sed

10. wc

o wc utilitário imprime o número de bytes, caracteres, palavras ou linhas em um arquivo.

Linux Text Tools Wc

11. dividir

Você pode usar split para dividir um arquivo em arquivos menores, por número de linhas, por tamanho ou em um número específico de arquivos.

Divisão por número de linhas

Linux Text Tools Split Lines

Divisão por bytes

Linux Text Tools Split Bytes

Dividindo em um número específico de arquivos

Número de divisão das ferramentas de texto do Linux

12. tac

O Tac, que é gato ao contrário, faz exatamente isso: exibe arquivos com as linhas na ordem inversa.

Linux Text Tools Tac

13. tr

A ferramenta tr é usada para traduzir ou excluir conjuntos de caracteres.

Um conjunto de caracteres geralmente é uma string ou intervalos de caracteres. Por exemplo:

  • “AZ”: todas as letras maiúsculas
  • “A-z0-9”: letras minúsculas e dígitos
  • “ N[:punct:]”: Caracteres de nova linha e pontuação

Consulte o página de manual tr para mais detalhes.

Para traduzir um conjunto para outro, use a seguinte sintaxe:

Por exemplo, para substituir caracteres minúsculos por seus equivalentes em maiúsculas, você pode usar o seguinte:

Linux Text Tools Tr

Para excluir um conjunto de caracteres, use o -d bandeira.

Linux Text Tools Tr D

Para excluir o complemento de um conjunto de caracteres (ou seja, tudo, exceto o conjunto), use -dc.

Linux Text Tools Tr Dc

Conclusão

Há muito o que aprender quando se trata de linha de comando do Linux. Felizmente, os comandos acima podem ajudá-lo a lidar melhor com o texto na linha de comando.

Join our Newsletter and receive offers and updates! ✅

0 0 votes
Article Rating
Avatar of Routech

Routech

Routech is a website that provides technology news, reviews and tips. It covers a wide range of topics including smartphones, laptops, tablets, gaming, gadgets, software, internet and more. The website is updated daily with new articles and videos, and also has a forum where users can discuss technology-related topics.

Você pode gostar...

Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x