Commit 2cc23082 authored by Renán Sosa Guillen's avatar Renán Sosa Guillen

Actualizacion README

parent 3a02f7e1
Crawlers para medios de información en linea nacionales basados en [Scrapy](http://scrapy.org/) Crawlers para medios de información en linea nacionales basados en [Scrapy](http://scrapy.org/)
Se incluyen los siguientes medios: Se incluyen los siguientes medios:
* [La Jornada](http://www.jornada.unam.mx) * [Al Chile](http://alchile.com.mx/)
Uso: Uso:
```bash ```bash
cd lajornada cd alChile
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=22
```
No se encontró notas antes del 2014.06.01.
* [Desde el Balcón](http://www.desdeelbalcon.com/)
Uso:
```bash
cd desdeElBalcon
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=30
```
No se encontró notas antes del 2014.01.11.
* [Diario del Yaqui](http://diariodelyaqui.mx)
Uso:
```bash
cd diarioYaqui
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2016 -a month=12 -a day=24 scrapy crawl noticias -t json --nolog -o noticias.json -a year=2016 -a month=12 -a day=24
``` ```
No se encontró notas antes del 2016.12.30.
* [Diario de Yucatán](http://yucatan.com.mx/) * [Diario de Yucatán](http://yucatan.com.mx/)
...@@ -20,50 +41,88 @@ Se incluyen los siguientes medios: ...@@ -20,50 +41,88 @@ Se incluyen los siguientes medios:
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2016 -a month=12 -a day=24 scrapy crawl noticias -t json --nolog -o noticias.json -a year=2016 -a month=12 -a day=24
``` ```
No se encontró notas antes del 2012.04.02. No se encontró notas antes del 2012.04.02.
* [Yucatán al Minuto](http://www.yucatanalminuto.com/) * [El Grillo Porteño](http://grilloporteno.com/)
Uso: Uso:
```bash ```bash
cd yucatanAlMinuto cd grilloPorteno
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=03 -a day=22 scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=26
``` ```
No se encontró notas antes del 2017.01.03. No se encontró notas antes del 2013.11.04.
* [Al Chile](http://alchile.com.mx/) * [La Jornada Aguascalientes](http://www.lja.mx/)
Uso: Uso:
```bash ```bash
cd alChile cd laJornadaAgs
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=22 scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=26
``` ```
Ejecutado el 2017.03.29. No se encontró notas antes del 2008.11.29.
Se bajaron notas en el rango del 2014.06.01 hasta el 2017.03.29 a las 15:30 hrs. * [La Jornada Baja California](http://jornadabc.mx)
No se encontró notas antes del 2014.06.01.
* [Desde el Balcón](http://www.desdeelbalcon.com/)
Uso: Uso:
```bash ```bash
cd desdeElBalcon cd laJornadaBC
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=30 scrapy crawl noticias -t json --nolog -o noticias.json -a seccion=<categoria>
donde <categoria> puede ser uno de los siguientes:
[ baja-california, chihuahua, mexico, mundo, cultura, espectaculos, deportes ]
``` ```
No se encontró notas antes del 2014.01.11. * [La Jornada Guerrero](http://www.lajornadaguerrero.com.mx)
* [El Grillo Porteño](http://grilloporteno.com/)
Uso: Uso:
```bash ```bash
cd grilloPorteno cd laJornadaGro
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=26 scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=26
``` ```
Ejecutado el 2017.03.29. No se encontró notas antes del 2007.01.22.
Se bajaron notas en el rango del 2013.11.04 hasta el 2015.12.31. * [La Jornada de Oriente](http://www.lajornadadeoriente.com.mx/)
No se encontró notas antes del 2013.11.04.
Uso:
```bash
cd laJornadaOte
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2013.06.01.
* [La Jornada San Luis](http://lajornadasanluis.com.mx)
Uso:
```bash
cd laJornadaSanLuis
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2014.10.08.
* [La Jornada Veracruz](http://www.jornadaveracruz.com.mx)
Uso:
```bash
cd laJornadaVer
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2009.06.29.
* [La Jornada Zacatecas](http://ljz.mx)
Uso:
```bash
cd laJornadaZac
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2013.06.10.
* [La Verdad Yucatán](http://laverdadnoticias.com/) * [La Verdad Yucatán](http://laverdadnoticias.com/)
...@@ -74,6 +133,15 @@ Se incluyen los siguientes medios: ...@@ -74,6 +133,15 @@ Se incluyen los siguientes medios:
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=24 scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=24
``` ```
No se encontró notas antes del 2015.12.01. No se encontró notas antes del 2015.12.01.
* [La Jornada](http://www.jornada.unam.mx)
Uso:
```bash
cd lajornada
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2016 -a month=12 -a day=24
```
* [Lector MX](http://lectormx.com/) * [Lector MX](http://lectormx.com/)
...@@ -144,6 +212,16 @@ Se incluyen los siguientes medios: ...@@ -144,6 +212,16 @@ Se incluyen los siguientes medios:
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=25 scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=25
``` ```
No se encontró notas antes del 2014.12.01. No se encontró notas antes del 2014.12.01.
* [Yucatán al Minuto](http://www.yucatanalminuto.com/)
Uso:
```bash
cd yucatanAlMinuto
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=03 -a day=22
```
No se encontró notas antes del 2017.01.03.
* [Yucatán en Corto](http://florcastillo.mx/noticias/) * [Yucatán en Corto](http://florcastillo.mx/noticias/)
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment