Lese neueste Meldungen von bienenjournal.de
Code:
#!/usr/bin/env
# Definiere Start und Ende der auszulesenden Webseite
START='^Meldungen'
ENDE='\* 1' # Lese bis zum Navigations-Knopf für Seite '1'
# Definiere URL
SITE_URL='http://www.bienenjournal.de/aktuelles/meldungen/'
# Lese Meldungen von www.bienenjournal.de/aktuelles/meldungen/
site_url_parser() {
lynx -dump -nolist $SITE_URL|sed -n "/$START/,/$ENDE/p";
}
site_url_parser
Ausgabe (gekürzt):
Meldungen
Glyphosat
Glyphosat: Entscheidung lange vorbereitet
Bundeslandwirtschaftsminister Christian Schmidt ...
...
Sommerhonig 2017: Bessere Ernte im Süden
Die Ergebnisse der Umfrage ...
...
* 1
Hinweis: Weblinks werden nicht ausgegeben. Das Bienenjournal veröffentlicht mehrmals in der Woche eine Meldung. Das Abrufen einer Webseite kostet die Betreiber Geld. Bitte Rücksicht darauf nehmen und ressourcenschonend crawlen.
Benötigte Programme:
Umlaute richtig darstellen:
Es kann passieren, dass die Umlaute nicht richtig dargestellt werden. In solchen Fällen sollte man die Konfiguration von Lynx an das eigene System anpassen:
sed -e '/#LOCALE/ a LOCALE_CHARSET:TRUE' \
-i /etc/lynx.cfg
Quelle: http://www.linuxfromscratch.org/blfs/view/cvs/basicnet/lynx.html