Madrid: cambio el método para extraer la URL del PDF que descargamos. El nuevo método se basa más en el contenido del código HTML que en su formato y creo que puede ser mejor a largo plazo. fanta, puedes cambiarlo si lo ves peor.

main
Pseudavid 2 months ago
parent 00855ea3aa
commit 490b04802c

@ -50,7 +50,7 @@ function madrid {
comunidad="Madrid"
pdfFile=".boletin$comunidad.pdf"
mainURL="https://bocm.es"
pdfURL=$(wget -q $mainURL -O - | grep -i "Descargar el boletín completo" | awk '{ print $12 }' | cut -d "\"" -f 2)
pdfURL=$(wget -q $mainURL -O - | grep -i -o "<a.*Descargar el boletín completo.*/a>" | grep -o -i "http.*\.PDF")
wget -q $pdfURL -O $pdfFile
if [ "$(pdftotext $pdfFile - | grep -i -E -n -3 "$keyWords" | tee .cpds | wc -l)" = 0 ]; then echo "0 resultados"; rm -rf .cpds .boletin*; exit; else sendMail $pdfURL $comunidad;fi
rm -rf .cpds .boletin*

Loading…
Cancel
Save