Readme

parent 4e0313a5
# M³ - Descarga de Noticias e Texto
Rastreadore (Crawlers) para medios escritos de información en linea basados en [Scrapy](http://scrapy.org/).
Los ratreadores estan divididos en tres clases.
Se incluyen los siguientes medios nacionales:
* [Al Chile](http://alchile.com.mx)
* spiders/daily: Sitios que su verion impresa es publicada diariamente.
* spiders/monthly: SItios de publcacion mensual.
* spiders/RSS: Sitio que ofrecen sus noticias en formato RSS
Uso:
Acceso por día:
```bash
http://alchile.com.mx/2017/9/13/
```
Uso:
```bash
cd alChile/
scrapy crawl noticias --nolog -s filename=2017-03-22.json -a year=2017 -a month=3 -a day=22
```
No se encontró notas antes del 2014.06.01.
```bash
cd laJornada/
scrapy crawl noticias --nolog -O filename=2017-03-22.json -a year=2017 -a month=3 -a day=22
```
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment