[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
RES: Grep - Outra Solução
From: |
Monteiro Andre (LBR) |
Subject: |
RES: Grep - Outra Solução |
Date: |
Wed, 10 Oct 2001 13:30:58 -0300 |
Após pensar mais um pouco, cheguei a esta solução (que independe do tamanho
do arquivo):
cut -c 6 arquivo > arq_tmp1
paste -d " " arq_tmp1 arquivo | grep -v "^ " | cut -c 3-
A primeira linha irá criar um arquivo com o sexto caracter de cada linha (se
houver; se não houver o sexto caracter, será o caracter nulo).
Na segunda linha, o comando paste irá colar as respectivas linhas dos dois
arquivos, sendo a primeira coluna a do arquivo criado anteriormente. Assim,
se a linha tinha menos de seis caracteres, a linha irá começar com um
espaço. Aí, é só dar um grep eliminando as linhas que iniciem com espaço, e
desprezar os dois primeiros caracteres de cada linha (cut).
Obs: Uso o HP-UX aqui no trabalho, por isso, não me lembro se o paste está
incluído nas distros Linux atuais.
[]s
Andre Luis Arantes Monteiro
address@hidden <mailto:address@hidden>
Programador
----- Mensagem original -----
De: Laudelino Lima [SMTP:address@hidden]
Enviada em: Quarta-feira, 10 de Outubro de 2001 09:51
Para: address@hidden
Assunto: [shell-script] Grep
Tenho uma lista com 60.000 sites inúteis que vou usar no meu squid.
1 por linha.
Só Que.
tem alguns sites com nomes muito curtos tipo 4 caracteres que se confundem
com sites válidos
Tipo
0069
sex0
sex01
só que tem sites em que a url aparece essas letras
www.odia.com.br/materias/maio/diasemana-sex01/topicos.htm
www.odia.com.br/materias/maio/diasemana-sex02/topicos.htm
quero tirar do arquivo todas as linhas que tenham menos que 5 caracteres !
[As partes desta mensagem que não continham texto foram removidas]
Sair da lista: address@hidden
Banco Dados: http://www.egroups.com/group/shell-script
Seu uso do Yahoo! Grupos é sujeito às regras descritas em:
http://br.yahoo.com/info/utos.html
[Prev in Thread] |
Current Thread |
[Next in Thread] |
- RES: Grep - Outra Solução,
Monteiro Andre (LBR) <=