blog:2016:01_07_categorygrabber
Dies ist eine alte Version des Dokuments!
Categorygrabber
Ich habe ein kleines Programm namens Categorygrabber geschrieben um Mediawikis, wie zum Beispiel Wikipedia zu durchsuchen und alle Seitennamen einer Kategorie runterzuladen. Das Script gibt's auf Github.
Was man abgrasen könnte:
Beispiel:
$ categorygrabber -w https://en.wikipedia.org -c Category:Offspring_of_Gaia
Ergibt:
Aergia Ananke Antaeus Ceto Charybdis Coeus Creusa Crius Cronus Cyclops Echidna Erichthonius of Athens Erinyes Euonymus Eurybia Giants Hekatonkheires Hyperion Iapetus Manes Mimas Mnemosyne Nereus Oceanus Ourea Pheme Phoebe Phorcys Polybotes Pontus Python Rhea Tartarus Tethys Thaumas Theia Themis Titan Typhon Uranus
Programmieren Categorygrabber
Kommentare
<pagemod add_comment output_befor> @@Name@@ - @@meta.date.format.d.m.Y H:i@@ :
@@Kommentar@@
</pagemod>
<form> action pagemod _self add_comment fieldset "Schreibe einen Kommentar" textbox "Name" textarea "Kommentar" submit </form>
blog/2016/01_07_categorygrabber.1487971703.txt.gz · Zuletzt geändert: 2017/02/24 22:28 von 127.0.0.1