Madrid: cambio el método para extraer la URL del PDF que descargamos. El nuevo método se basa más en el contenido del código HTML que en su formato y creo que puede ser mejor a largo plazo. fanta, puedes cambiarlo si lo ves peor.

1 year ago · 490b04802c
parent 00855ea3aa
commit 490b04802c
1 changed files with 1 additions and 1 deletions
--- a/cpdAlerts.sh
+++ b/cpdAlerts.sh
@ -50,7 +50,7 @@ function madrid {
  comunidad="Madrid"
  pdfFile=".boletin$comunidad.pdf"
  mainURL="https://bocm.es"
-  pdfURL=$(wget -q $mainURL -O - | grep -i "Descargar el boletín completo" | awk '{ print $12 }' | cut -d "\"" -f 2)
+  pdfURL=$(wget -q $mainURL -O - | grep -i -o "<a.*Descargar el boletín completo.*/a>" | grep -o -i "http.*\.PDF")
  wget -q $pdfURL -O $pdfFile
  if [ "$(pdftotext $pdfFile - | grep -i -E -n -3 "$keyWords" | tee .cpds | wc -l)" = 0 ]; then echo "0 resultados"; rm -rf .cpds .boletin*; exit; else sendMail $pdfURL $comunidad;fi
  rm -rf .cpds .boletin*