Questão Existe uma ferramenta para remover todos os hiperlinks de um arquivo html?


Existe uma maneira de fazer isso no Ubuntu? Eu li que é possível em php, mas eu não estou familiarizado com o PHP em tudo.


4
2018-05-29 14:33


origem




Respostas:


Você poderia usar sed para isso, mas só funcionará para links que estão em uma única linha no código html.

Atualizar:

Maldito regex ganancioso! ;) Este deve funcionar agora!

sed -i 's|<a[^>]\+>|<a>|g' <the-html-file>


3
2018-05-29 14:49



Está se comportando de maneira estranha! Excluindo todas as sentenças, após uma âncora de link em um parágrafo até a próxima âncora de link, que não está sendo removida. Deixando muitos links como estão. :( - 22lk94k943 only
Você pode dar um arquivo de amostra? - ortang
Claro, por que não. skydrive.live.com/redir?resid=98CCEEFEF56EFF2A!118 - 22lk94k943 only
Atualizei minha resposta - ortang
Droga! Está funcionando como uma faca no queijo. Muito obrigado. Será altamente educativo se você puder adicionar a descrição de "Greex regex" à resposta. - 22lk94k943 only


Depende do que você está tentando fazer:

Se você tiver uma pilha de arquivos em sua máquina e quiser remover os links, use algo como um pequeno script perl para remover <a ...> ... </a> Tag. Você pode remover outras tags (ou até mesmo todas as tags) de maneira semelhante. Com as opções de correspondência de padrão corretas, essa abordagem pode manipular tags divididas em várias linhas. (É muito elegante, mas os detalhes não cabem na margem deste post).

Se você está tentando procurar arquivos em algum servidor web, usando o firefox (ou outro navegador), algum tipo de script greasemonkey que modifica automaticamente as páginas na hora, antes de mostrá-las, pode ser o que você deseja.


1
2018-05-29 14:50