Commit 10ab6dd7 authored by Renán Sosa Guillen's avatar Renán Sosa Guillen

README

parent 6beff693
...@@ -10,7 +10,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -10,7 +10,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd alChile cd alChile/
scrapy crawl noticias --nolog -s filename=2017-03-22.json -a year=2017 -a month=3 -a day=22 scrapy crawl noticias --nolog -s filename=2017-03-22.json -a year=2017 -a month=3 -a day=22
``` ```
No se encontró notas antes del 2014.06.01. No se encontró notas antes del 2014.06.01.
...@@ -23,10 +23,36 @@ Se incluyen los siguientes medios nacionales: ...@@ -23,10 +23,36 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd campecheHoy cd campecheHoy/
scrapy crawl noticias --nolog -s filename=2018-01-22.json -a year=2018 -a month=1 -a day=22 scrapy crawl noticias --nolog -s filename=2018-01-22.json -a year=2018 -a month=1 -a day=22
``` ```
No se encontró notas antes del 2017.06.01. No se encontró notas antes del 2017.06.01.
* [Chiapas Hoy](http://www.chiapashoy.com.mx)
Acceso por día:
```bash
http://www.chiapashoy.com.mx/notashoy/2018/01/25/
```
Uso:
```bash
cd chiapasHoy/
scrapy crawl noticias --nolog -s filename=2018-01-25.json -a year=2018 -a month=1 -a day=25
```
No se encontró notas antes del 2017.03.08.
* [Cuarto Poder](http://www.cuartopoder.mx)
Acceso por día:
```bash
http://www.cuartopoder.mx/archivo/portada/listado/30-08-2018/30-08-2018/
```
Uso:
```bash
cd cuartoPoder/
scrapy crawl noticias --nolog -s filename=2018-08-30.json -a year=2018 -a month=8 -a day=30
```
No se encontró notas antes del 2010.01.01.
* [Desde el Balcón](http://www.desdeelbalcon.com) * [Desde el Balcón](http://www.desdeelbalcon.com)
Acceso por día: Acceso por día:
...@@ -36,10 +62,36 @@ Se incluyen los siguientes medios nacionales: ...@@ -36,10 +62,36 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd desdeElBalcon cd desdeElBalcon/
scrapy crawl noticias --nolog -s filename=2017-03-30.json -a year=2017 -a month=3 -a day=30 scrapy crawl noticias --nolog -s filename=2017-03-30.json -a year=2017 -a month=3 -a day=30
``` ```
No se encontró notas antes del 2014.01.11. No se encontró notas antes del 2014.01.11.
* [El Despertar de Oaxaca](http://despertardeoaxaca.com)
Acceso por día:
```bash
http://despertardeoaxaca.com/2018/2/4/
```
Uso:
```bash
cd despertarOaxaca/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2011.12.06.
* [Puntual](http://diario-puntual.com.mx)
Acceso por día:
```bash
http://diario-puntual.com.mx/2018/9/5/
```
Uso:
```bash
cd diarioPuntual/
scrapy crawl noticias --nolog -s filename=2018-09-05.json -a year=2018 -a month=9 -a day=5
```
No se encontró notas antes del 2016.07.12.
* [Diario del Yaqui](http://diariodelyaqui.mx) * [Diario del Yaqui](http://diariodelyaqui.mx)
Acceso por día: Acceso por día:
...@@ -49,7 +101,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -49,7 +101,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd diarioYaqui cd diarioYaqui/
scrapy crawl noticias --nolog -s filename=2016-12-24.json -a year=2016 -a month=12 -a day=24 scrapy crawl noticias --nolog -s filename=2016-12-24.json -a year=2016 -a month=12 -a day=24
``` ```
No se encontró notas antes del 2016.12.30. No se encontró notas antes del 2016.12.30.
...@@ -59,7 +111,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -59,7 +111,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd diarioYucatan cd diarioYucatan/
scrapy crawl noticias --nolog -s filename=noticias.json scrapy crawl noticias --nolog -s filename=noticias.json
``` ```
No se encontró notas antes del 2012.04.02. No se encontró notas antes del 2012.04.02.
...@@ -72,10 +124,62 @@ Se incluyen los siguientes medios nacionales: ...@@ -72,10 +124,62 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd edoMexDia cd edoMexDia/
scrapy crawl noticias --nolog -s filename=2018-01-30.json -a year=2018 -a month=1 -a day=30 scrapy crawl noticias --nolog -s filename=2018-01-30.json -a year=2018 -a month=1 -a day=30
``` ```
No se encontró notas antes del 2011.09.21. No se encontró notas antes del 2011.09.21.
* [El Comentario](https://elcomentario.ucol.mx)
Acceso por día:
```bash
https://elcomentario.ucol.mx/2018/9/5/
```
Uso:
```bash
cd elComentario/
scrapy crawl noticias --nolog -s filename=2018-09-05.json -a year=2018 -a month=9 -a day=5
```
No se encontró notas antes del 2016.07.01.
* [El Independiente](http://www.el-independiente.com.mx)
Acceso por día:
```bash
http://www.el-independiente.com.mx/2018/2/1/
```
Uso:
```bash
cd elIndependiente/
scrapy crawl noticias --nolog -s filename=2018-02-01.json -a year=2018 -a month=2 -a day=1
```
No se encontró notas antes del 2012.03.05.
* [El Sur](https://suracapulco.mx)
Acceso por día:
```bash
hhttps://suracapulco.mx/2018/9/5/
```
Uso:
```bash
cd elSur/
scrapy crawl noticias --nolog -s filename=2018-09-05.json -a year=2018 -a month=9 -a day=5
```
No se encontró notas antes del 2017.09.06.
* [El Valle](http://elvalle.com.mx)
Acceso por día:
```bash
http://elvalle.com.mx/2018/2/1/
```
Uso:
```bash
cd elValle/
scrapy crawl noticias --nolog -s filename=2018-02-01.json -a year=2018 -a month=2 -a day=1
```
No se encontró notas antes del 2016.04.19.
* [Expreso Chiapas](http://expresochiapas.com/noticias) * [Expreso Chiapas](http://expresochiapas.com/noticias)
Acceso por día: Acceso por día:
...@@ -85,7 +189,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -85,7 +189,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd expresoChiapas cd expresoChiapas/
scrapy crawl noticias --nolog -s filename=2018-01-30.json -a year=2018 -a month=1 -a day=30 scrapy crawl noticias --nolog -s filename=2018-01-30.json -a year=2018 -a month=1 -a day=30
``` ```
No se encontró notas antes del 2015.09.26. No se encontró notas antes del 2015.09.26.
...@@ -98,7 +202,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -98,7 +202,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd grilloPorteno cd grilloPorteno/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26 scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
``` ```
No se encontró notas antes del 2013.11.04. No se encontró notas antes del 2013.11.04.
...@@ -111,7 +215,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -111,7 +215,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd heraldoAgs cd heraldoAgs/
scrapy crawl noticias --nolog -s filename=2018-01-22.json -a year=2018 -a month=1 -a day=22 scrapy crawl noticias --nolog -s filename=2018-01-22.json -a year=2018 -a month=1 -a day=22
``` ```
No se encontró notas antes del 2014.01.23. No se encontró notas antes del 2014.01.23.
...@@ -124,7 +228,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -124,7 +228,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd heraldoLeon cd heraldoLeon/
scrapy crawl noticias --nolog -s filename=2018-01-29.json -a year=2018 -a month=1 -a day=29 scrapy crawl noticias --nolog -s filename=2018-01-29.json -a year=2018 -a month=1 -a day=29
``` ```
No se encontró notas antes del 2016.07.06. No se encontró notas antes del 2016.07.06.
...@@ -137,7 +241,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -137,7 +241,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd laJornada cd laJornada/
scrapy crawl noticias --nolog -s filename=2017-04-23.json -a year=2017 -a month=4 -a day=23 scrapy crawl noticias --nolog -s filename=2017-04-23.json -a year=2017 -a month=4 -a day=23
``` ```
No se encontró notas antes del 1996.03.03. No se encontró notas antes del 1996.03.03.
...@@ -150,7 +254,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -150,7 +254,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd laJornadaAgs cd laJornadaAgs/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26 scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
``` ```
No se encontró notas antes del 2008.12.01. No se encontró notas antes del 2008.12.01.
...@@ -160,7 +264,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -160,7 +264,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd laJornadaBC cd laJornadaBC/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=4 -a day=26 scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=4 -a day=26
``` ```
No se encontró notas antes del 2015.02.09. No se encontró notas antes del 2015.02.09.
...@@ -174,7 +278,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -174,7 +278,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd laJornadaGro cd laJornadaGro/
scrapy crawl noticias --nolog -s filename=2017-09-17.json -a year=2017 -a month=9 -a day=17 scrapy crawl noticias --nolog -s filename=2017-09-17.json -a year=2017 -a month=9 -a day=17
``` ```
No se encontró notas antes del 2017.08.15 para esta version del crawler. No se encontró notas antes del 2017.08.15 para esta version del crawler.
...@@ -185,7 +289,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -185,7 +289,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd laJornadaMaya cd laJornadaMaya/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=4 -a day=25 scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=4 -a day=25
``` ```
No se encontró notas antes del 2015.03.12. No se encontró notas antes del 2015.03.12.
...@@ -198,7 +302,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -198,7 +302,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd laJornadaOte cd laJornadaOte/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26 scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
``` ```
No se encontró notas antes del 2013.06.01. No se encontró notas antes del 2013.06.01.
...@@ -211,7 +315,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -211,7 +315,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd laJornadaSanLuis cd laJornadaSanLuis/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26 scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
``` ```
No se encontró notas antes del 2014.10.08. No se encontró notas antes del 2014.10.08.
...@@ -224,7 +328,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -224,7 +328,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd laJornadaVer cd laJornadaVer/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26 scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
``` ```
No se encontró notas antes del 2009.05.11. No se encontró notas antes del 2009.05.11.
...@@ -237,7 +341,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -237,7 +341,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd laJornadaZac cd laJornadaZac/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26 scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
``` ```
No se encontró notas antes del 2013.06.10. No se encontró notas antes del 2013.06.10.
...@@ -250,7 +354,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -250,7 +354,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd laRazon cd laRazon/
scrapy crawl noticias --nolog -s filename=2017-09-28.json -a year=2017 -a month=9 -a day=28 scrapy crawl noticias --nolog -s filename=2017-09-28.json -a year=2017 -a month=9 -a day=28
``` ```
No se encontró notas antes del 2015.01.01. No se encontró notas antes del 2015.01.01.
...@@ -263,7 +367,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -263,7 +367,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd laVerdadYuc cd laVerdadYuc/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=24 scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=24
``` ```
No se encontró notas antes del 2017.07.18. No se encontró notas antes del 2017.07.18.
...@@ -271,15 +375,28 @@ Se incluyen los siguientes medios nacionales: ...@@ -271,15 +375,28 @@ Se incluyen los siguientes medios nacionales:
Acceso por día: Acceso por día:
```bash ```bash
http://lectormx.com/2017/9/16/ http://lectormx.com/2017/3/30/
``` ```
Uso: Uso:
```bash ```bash
cd lectorMX cd lectorMX/
scrapy crawl noticias --nolog -s filename=2017-03-30.json -a year=2017 -a month=3 -a day=30 scrapy crawl noticias --nolog -s filename=2017-03-30.json -a year=2017 -a month=3 -a day=30
``` ```
No se encontró notas antes del 2015.10.23. No se encontró notas antes del 2015.10.23.
* [Marca](http://www.diariomarca.com.mx)
Acceso por día:
```bash
http://www.diariomarca.com.mx/2018/2/4/
```
Uso:
```bash
cd marca/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2012.07.31.
* [Mi Punto de Vista](http://www.mipuntodevista.com.mx) * [Mi Punto de Vista](http://www.mipuntodevista.com.mx)
Acceso por día: Acceso por día:
...@@ -289,10 +406,23 @@ Se incluyen los siguientes medios nacionales: ...@@ -289,10 +406,23 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd miPuntoDeVista cd miPuntoDeVista/
scrapy crawl noticias --nolog -s filename=2017-03-28.json -a year=2017 -a month=3 -a day=28 scrapy crawl noticias --nolog -s filename=2017-03-28.json -a year=2017 -a month=3 -a day=28
``` ```
No se encontró notas antes del 2008.10.04. No se encontró notas antes del 2008.10.04.
* [Noticias de la Bahía](https://noticiasdelabahia.com)
Acceso por día:
```bash
https://noticiasdelabahia.com/2018/2/1/
```
Uso:
```bash
cd noticiasBahia/
scrapy crawl noticias --nolog -s filename=2018-02-01.json -a year=2018 -a month=2 -a day=1
```
No se encontró notas antes del 2016.05.23.
* [El Noticiero en Línea](http://www.elnoticieroenlinea.com) * [El Noticiero en Línea](http://www.elnoticieroenlinea.com)
Acceso por día: Acceso por día:
...@@ -302,7 +432,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -302,7 +432,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd noticieroLinea cd noticieroLinea/
scrapy crawl noticias --nolog -s filename=2018-01-03.json -a year=2018 -a month=1 -a day=3 scrapy crawl noticias --nolog -s filename=2018-01-03.json -a year=2018 -a month=1 -a day=3
``` ```
No se encontró notas antes del 2014.01.16. No se encontró notas antes del 2014.01.16.
...@@ -315,7 +445,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -315,7 +445,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd notirivas cd notirivas/
scrapy crawl noticias --nolog -s filename=2017-03-30.json -a year=2017 -a month=3 -a day=30 scrapy crawl noticias --nolog -s filename=2017-03-30.json -a year=2017 -a month=3 -a day=30
``` ```
No se encontró notas antes del 2016.11.22. No se encontró notas antes del 2016.11.22.
...@@ -328,10 +458,23 @@ Se incluyen los siguientes medios nacionales: ...@@ -328,10 +458,23 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd notisureste cd notisureste/
scrapy crawl noticias --nolog -s filename=2017-03-22.json -a year=2017 -a month=3 -a day=22 scrapy crawl noticias --nolog -s filename=2017-03-22.json -a year=2017 -a month=3 -a day=22
``` ```
No se encontró notas antes del 2011.11.28. No se encontró notas antes del 2011.11.28.
* [La Opinión de Puebla](http://www.laopinionpuebla.com)
Acceso por día:
```bash
http://www.laopinionpuebla.com/2018/2/4/
```
Uso:
```bash
cd opinionPuebla/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2011.07.01.
* [Periodico Correo](https://periodicocorreo.com.mx) * [Periodico Correo](https://periodicocorreo.com.mx)
Acceso por día: Acceso por día:
...@@ -341,10 +484,36 @@ Se incluyen los siguientes medios nacionales: ...@@ -341,10 +484,36 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd periodicoCorreo cd periodicoCorreo/
scrapy crawl noticias --nolog -s filename=2018-01-29.json -a year=2018 -a month=1 -a day=29 scrapy crawl noticias --nolog -s filename=2018-01-29.json -a year=2018 -a month=1 -a day=29
``` ```
No se encontró notas antes del 2013.09.08. No se encontró notas antes del 2013.09.08.
* [Periódico Enfoque Informativo](https://enfoquenayarit.com)
Acceso por día:
```bash
https://enfoquenayarit.com/2018/2/4/
```
Uso:
```bash
cd periodicoEnfoque/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2014.12.19.
* [Periódico Express](http://www.periodicoexpress.com.mx)
Acceso por día:
```bash
http://www.periodicoexpress.com.mx/2018/2/4/
```
Uso:
```bash
cd periodicoExpress/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2017.03.25.
* [Periodico Victoria](http://periodicovictoria.mx) * [Periodico Victoria](http://periodicovictoria.mx)
Acceso por día: Acceso por día:
...@@ -354,17 +523,30 @@ Se incluyen los siguientes medios nacionales: ...@@ -354,17 +523,30 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd periodicoVictoria cd periodicoVictoria/
scrapy crawl noticias --nolog -s filename=2018-01-28.json -a year=2018 -a month=1 -a day=28 scrapy crawl noticias --nolog -s filename=2018-01-28.json -a year=2018 -a month=1 -a day=28
``` ```
No se encontró notas antes del 2013.10.09. No se encontró notas antes del 2013.10.09.
* [Por Esto](http://www.poresto.net)
Acceso por día:
```bash
http://www.poresto.net/2018/8/22/
```
Uso:
```bash
cd porEsto/
scrapy crawl noticias --nolog -s filename=2018-08-22.json -a year=2018 -a month=8 -a day=22
```
No se encontró notas antes del 2018.07.03.
* [Proceso](http://www.proceso.com.mx) * [Proceso](http://www.proceso.com.mx)
Uso: Uso:
```bash ```bash
cd proceso cd proceso/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3
``` ```
No se encontró notas antes de Nov. 1976. No se encontró notas antes de Nov. 1976.
...@@ -377,10 +559,36 @@ Se incluyen los siguientes medios nacionales: ...@@ -377,10 +559,36 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd puntoMedio cd puntoMedio/
scrapy crawl noticias --nolog -s filename=2017-03-27.json -a year=2017 -a month=3 -a day=27 scrapy crawl noticias --nolog -s filename=2017-03-27.json -a year=2017 -a month=3 -a day=27
``` ```
No se encontró notas antes del 2015.08.02. No se encontró notas antes del 2015.08.02.
* [Red Crucero](http://www.red-crucero.com)
Acceso por día:
```bash
http://www.red-crucero.com/news/2018/2/4/
```
Uso:
```bash
cd redCrucero/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2016.02.08.
* [Síntesis](https://www.sintesis.mx)
Acceso por día:
```bash
https://www.sintesis.mx/2018/2/4/
```
Uso:
```bash
cd sintesis/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2016.10.02.
* [Sona 89.3](http://sona893.fm) * [Sona 89.3](http://sona893.fm)
Acceso por día: Acceso por día:
...@@ -390,10 +598,23 @@ Se incluyen los siguientes medios nacionales: ...@@ -390,10 +598,23 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd sona893 cd sona893/
scrapy crawl noticias --nolog -s filename=2017-03-24.json -a year=2017 -a month=3 -a day=24 scrapy crawl noticias --nolog -s filename=2017-03-24.json -a year=2017 -a month=3 -a day=24
``` ```
No se encontró notas antes del 2012.04.09. No se encontró notas antes del 2012.04.09.
* [El Sur de Campeche](http://www.elsur.mx)
Acceso por día:
```bash
http://www.elsur.mx/2018/8/10/
```
Uso:
```bash
cd surDeCampeche/
scrapy crawl noticias --nolog -s filename=2018-08-10.json -a year=2018 -a month=8 -a day=10
```
No se encontró notas antes del 2011.10.01.
* [Tribuna de los Cabos](http://www.tribunadeloscabos.com.mx/) * [Tribuna de los Cabos](http://www.tribunadeloscabos.com.mx/)
Acceso por día: Acceso por día:
...@@ -403,10 +624,23 @@ Se incluyen los siguientes medios nacionales: ...@@ -403,10 +624,23 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd tribunaCabos cd tribunaCabos/
scrapy crawl noticias --nolog -s filename=2018-01-18.json -a year=2018 -a month=1 -a day=18 scrapy crawl noticias --nolog -s filename=2018-01-18.json -a year=2018 -a month=1 -a day=18
``` ```
No se encontró notas antes del 2016.06.01. No se encontró notas antes del 2016.06.01.
* [Tribuna](http://tribunacampeche.com)
Acceso por día:
```bash
http://tribunacampeche.com/2018/8/10/
```
Uso:
```bash
cd tribunaCampeche/
scrapy crawl noticias --nolog -s filename=2018-08-10.json -a year=2018 -a month=8 -a day=10
```
No se encontró notas antes del 2013.11.28.
* [Uno Más Uno](http://www.unomasuno.com.mx) * [Uno Más Uno](http://www.unomasuno.com.mx)
Acceso por día: Acceso por día:
...@@ -416,7 +650,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -416,7 +650,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd unoMasUno cd unoMasUno/
scrapy crawl noticias --nolog -s filename=2017-09-22.json -a year=2017 -a month=09 -a day=22 scrapy crawl noticias --nolog -s filename=2017-09-22.json -a year=2017 -a month=09 -a day=22
``` ```
No se encontró notas antes del 2017.05.04. No se encontró notas antes del 2017.05.04.
...@@ -429,7 +663,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -429,7 +663,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd yucatanALaMano cd yucatanALaMano/
scrapy crawl noticias --nolog -s filename=2017-03-25.json -a year=2017 -a month=3 -a day=25 scrapy crawl noticias --nolog -s filename=2017-03-25.json -a year=2017 -a month=3 -a day=25
``` ```
No se encontró notas antes del 2015.05.11. No se encontró notas antes del 2015.05.11.
...@@ -439,7 +673,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -439,7 +673,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd yucatanAlMinuto cd yucatanAlMinuto/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=03 -a day=22 scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=03 -a day=22
``` ```
No se encontró notas antes del 2017.01.17. No se encontró notas antes del 2017.01.17.
...@@ -452,7 +686,7 @@ Se incluyen los siguientes medios nacionales: ...@@ -452,7 +686,7 @@ Se incluyen los siguientes medios nacionales:
Uso: Uso:
```bash ```bash
cd yucatanEnCorto cd yucatanEnCorto/
scrapy crawl noticias --nolog -s filename=2017-03-29.json -a year=2017 -a month=3 -a day=29 scrapy crawl noticias --nolog -s filename=2017-03-29.json -a year=2017 -a month=3 -a day=29
``` ```
No se encontró notas antes del 2017.10.18 para esta version del crawler. No se encontró notas antes del 2017.10.18 para esta version del crawler.
...@@ -469,7 +703,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros: ...@@ -469,7 +703,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso: Uso:
```bash ```bash
cd descarga_por_dia/foraneos/diarioCoLatino cd descarga_por_dia/foraneos/diarioCoLatino/
scrapy crawl noticias --nolog -s filename=2018-02-23.json -a year=2018 -a month=2 -a day=23 scrapy crawl noticias --nolog -s filename=2018-02-23.json -a year=2018 -a month=2 -a day=23
``` ```
No se encontró notas antes del 2013.10.04. No se encontró notas antes del 2013.10.04.
...@@ -488,7 +722,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros: ...@@ -488,7 +722,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso: Uso:
```bash ```bash
cd descarga_hacia_atras/foraneos/prensaGrafica cd descarga_hacia_atras/foraneos/prensaGrafica/
scrapy crawl noticias --nolog -s filename=noticias.json // obtiene todas las posibles scrapy crawl noticias --nolog -s filename=noticias.json // obtiene todas las posibles
scrapy crawl noticias --nolog -s filename=noticias.json -a year=2018 -a month=2 -a day=29 //obtiene hasta una fecha dada scrapy crawl noticias --nolog -s filename=noticias.json -a year=2018 -a month=2 -a day=29 //obtiene hasta una fecha dada
``` ```
...@@ -502,7 +736,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros: ...@@ -502,7 +736,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso: Uso:
```bash ```bash
cd descarga_por_dia/foraneos/sanPedroSun cd descarga_por_dia/foraneos/sanPedroSun/
scrapy crawl noticias --nolog -s filename=2018-02-23.json -a year=2018 -a month=2 -a day=23 scrapy crawl noticias --nolog -s filename=2018-02-23.json -a year=2018 -a month=2 -a day=23
``` ```
No se encontró notas antes del 2008.07.21. No se encontró notas antes del 2008.07.21.
...@@ -515,7 +749,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros: ...@@ -515,7 +749,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso: Uso:
```bash ```bash
cd descarga_por_dia/foraneos/tiempoDigitalHn cd descarga_por_dia/foraneos/tiempoDigitalHn/
scrapy crawl noticias --nolog -s filename=2018-02-23.json -a year=2018 -a month=2 -a day=23 scrapy crawl noticias --nolog -s filename=2018-02-23.json -a year=2018 -a month=2 -a day=23
``` ```
No se encontró notas antes del 2015.04.17. No se encontró notas antes del 2015.04.17.
...@@ -524,7 +758,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros: ...@@ -524,7 +758,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso: Uso:
```bash ```bash
cd descarga_hacia_atras/foraneos/tribunaHn cd descarga_hacia_atras/foraneos/tribunaHn/
scrapy crawl noticias --nolog -s filename=noticias.json // obtiene todas las posibles scrapy crawl noticias --nolog -s filename=noticias.json // obtiene todas las posibles
scrapy crawl noticias --nolog -s filename=noticias.json -a year=2018 -a month=2 -a day=29 //obtiene hasta una fecha dada scrapy crawl noticias --nolog -s filename=noticias.json -a year=2018 -a month=2 -a day=29 //obtiene hasta una fecha dada
``` ```
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment