Commit 10ab6dd7 authored by Renán Sosa Guillen's avatar Renán Sosa Guillen

README

parent 6beff693
......@@ -10,7 +10,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd alChile
cd alChile/
scrapy crawl noticias --nolog -s filename=2017-03-22.json -a year=2017 -a month=3 -a day=22
```
No se encontró notas antes del 2014.06.01.
......@@ -23,10 +23,36 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd campecheHoy
cd campecheHoy/
scrapy crawl noticias --nolog -s filename=2018-01-22.json -a year=2018 -a month=1 -a day=22
```
No se encontró notas antes del 2017.06.01.
* [Chiapas Hoy](http://www.chiapashoy.com.mx)
Acceso por día:
```bash
http://www.chiapashoy.com.mx/notashoy/2018/01/25/
```
Uso:
```bash
cd chiapasHoy/
scrapy crawl noticias --nolog -s filename=2018-01-25.json -a year=2018 -a month=1 -a day=25
```
No se encontró notas antes del 2017.03.08.
* [Cuarto Poder](http://www.cuartopoder.mx)
Acceso por día:
```bash
http://www.cuartopoder.mx/archivo/portada/listado/30-08-2018/30-08-2018/
```
Uso:
```bash
cd cuartoPoder/
scrapy crawl noticias --nolog -s filename=2018-08-30.json -a year=2018 -a month=8 -a day=30
```
No se encontró notas antes del 2010.01.01.
* [Desde el Balcón](http://www.desdeelbalcon.com)
Acceso por día:
......@@ -36,10 +62,36 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd desdeElBalcon
cd desdeElBalcon/
scrapy crawl noticias --nolog -s filename=2017-03-30.json -a year=2017 -a month=3 -a day=30
```
No se encontró notas antes del 2014.01.11.
* [El Despertar de Oaxaca](http://despertardeoaxaca.com)
Acceso por día:
```bash
http://despertardeoaxaca.com/2018/2/4/
```
Uso:
```bash
cd despertarOaxaca/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2011.12.06.
* [Puntual](http://diario-puntual.com.mx)
Acceso por día:
```bash
http://diario-puntual.com.mx/2018/9/5/
```
Uso:
```bash
cd diarioPuntual/
scrapy crawl noticias --nolog -s filename=2018-09-05.json -a year=2018 -a month=9 -a day=5
```
No se encontró notas antes del 2016.07.12.
* [Diario del Yaqui](http://diariodelyaqui.mx)
Acceso por día:
......@@ -49,7 +101,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd diarioYaqui
cd diarioYaqui/
scrapy crawl noticias --nolog -s filename=2016-12-24.json -a year=2016 -a month=12 -a day=24
```
No se encontró notas antes del 2016.12.30.
......@@ -59,7 +111,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd diarioYucatan
cd diarioYucatan/
scrapy crawl noticias --nolog -s filename=noticias.json
```
No se encontró notas antes del 2012.04.02.
......@@ -72,10 +124,62 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd edoMexDia
cd edoMexDia/
scrapy crawl noticias --nolog -s filename=2018-01-30.json -a year=2018 -a month=1 -a day=30
```
No se encontró notas antes del 2011.09.21.
* [El Comentario](https://elcomentario.ucol.mx)
Acceso por día:
```bash
https://elcomentario.ucol.mx/2018/9/5/
```
Uso:
```bash
cd elComentario/
scrapy crawl noticias --nolog -s filename=2018-09-05.json -a year=2018 -a month=9 -a day=5
```
No se encontró notas antes del 2016.07.01.
* [El Independiente](http://www.el-independiente.com.mx)
Acceso por día:
```bash
http://www.el-independiente.com.mx/2018/2/1/
```
Uso:
```bash
cd elIndependiente/
scrapy crawl noticias --nolog -s filename=2018-02-01.json -a year=2018 -a month=2 -a day=1
```
No se encontró notas antes del 2012.03.05.
* [El Sur](https://suracapulco.mx)
Acceso por día:
```bash
hhttps://suracapulco.mx/2018/9/5/
```
Uso:
```bash
cd elSur/
scrapy crawl noticias --nolog -s filename=2018-09-05.json -a year=2018 -a month=9 -a day=5
```
No se encontró notas antes del 2017.09.06.
* [El Valle](http://elvalle.com.mx)
Acceso por día:
```bash
http://elvalle.com.mx/2018/2/1/
```
Uso:
```bash
cd elValle/
scrapy crawl noticias --nolog -s filename=2018-02-01.json -a year=2018 -a month=2 -a day=1
```
No se encontró notas antes del 2016.04.19.
* [Expreso Chiapas](http://expresochiapas.com/noticias)
Acceso por día:
......@@ -85,7 +189,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd expresoChiapas
cd expresoChiapas/
scrapy crawl noticias --nolog -s filename=2018-01-30.json -a year=2018 -a month=1 -a day=30
```
No se encontró notas antes del 2015.09.26.
......@@ -98,7 +202,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd grilloPorteno
cd grilloPorteno/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2013.11.04.
......@@ -111,7 +215,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd heraldoAgs
cd heraldoAgs/
scrapy crawl noticias --nolog -s filename=2018-01-22.json -a year=2018 -a month=1 -a day=22
```
No se encontró notas antes del 2014.01.23.
......@@ -124,7 +228,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd heraldoLeon
cd heraldoLeon/
scrapy crawl noticias --nolog -s filename=2018-01-29.json -a year=2018 -a month=1 -a day=29
```
No se encontró notas antes del 2016.07.06.
......@@ -137,7 +241,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornada
cd laJornada/
scrapy crawl noticias --nolog -s filename=2017-04-23.json -a year=2017 -a month=4 -a day=23
```
No se encontró notas antes del 1996.03.03.
......@@ -150,7 +254,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaAgs
cd laJornadaAgs/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2008.12.01.
......@@ -160,7 +264,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaBC
cd laJornadaBC/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=4 -a day=26
```
No se encontró notas antes del 2015.02.09.
......@@ -174,7 +278,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaGro
cd laJornadaGro/
scrapy crawl noticias --nolog -s filename=2017-09-17.json -a year=2017 -a month=9 -a day=17
```
No se encontró notas antes del 2017.08.15 para esta version del crawler.
......@@ -185,7 +289,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaMaya
cd laJornadaMaya/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=4 -a day=25
```
No se encontró notas antes del 2015.03.12.
......@@ -198,7 +302,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaOte
cd laJornadaOte/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2013.06.01.
......@@ -211,7 +315,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaSanLuis
cd laJornadaSanLuis/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2014.10.08.
......@@ -224,7 +328,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaVer
cd laJornadaVer/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2009.05.11.
......@@ -237,7 +341,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaZac
cd laJornadaZac/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2013.06.10.
......@@ -250,7 +354,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laRazon
cd laRazon/
scrapy crawl noticias --nolog -s filename=2017-09-28.json -a year=2017 -a month=9 -a day=28
```
No se encontró notas antes del 2015.01.01.
......@@ -263,7 +367,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laVerdadYuc
cd laVerdadYuc/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=24
```
No se encontró notas antes del 2017.07.18.
......@@ -271,15 +375,28 @@ Se incluyen los siguientes medios nacionales:
Acceso por día:
```bash
http://lectormx.com/2017/9/16/
http://lectormx.com/2017/3/30/
```
Uso:
```bash
cd lectorMX
cd lectorMX/
scrapy crawl noticias --nolog -s filename=2017-03-30.json -a year=2017 -a month=3 -a day=30
```
No se encontró notas antes del 2015.10.23.
* [Marca](http://www.diariomarca.com.mx)
Acceso por día:
```bash
http://www.diariomarca.com.mx/2018/2/4/
```
Uso:
```bash
cd marca/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2012.07.31.
* [Mi Punto de Vista](http://www.mipuntodevista.com.mx)
Acceso por día:
......@@ -289,10 +406,23 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd miPuntoDeVista
cd miPuntoDeVista/
scrapy crawl noticias --nolog -s filename=2017-03-28.json -a year=2017 -a month=3 -a day=28
```
No se encontró notas antes del 2008.10.04.
* [Noticias de la Bahía](https://noticiasdelabahia.com)
Acceso por día:
```bash
https://noticiasdelabahia.com/2018/2/1/
```
Uso:
```bash
cd noticiasBahia/
scrapy crawl noticias --nolog -s filename=2018-02-01.json -a year=2018 -a month=2 -a day=1
```
No se encontró notas antes del 2016.05.23.
* [El Noticiero en Línea](http://www.elnoticieroenlinea.com)
Acceso por día:
......@@ -302,7 +432,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd noticieroLinea
cd noticieroLinea/
scrapy crawl noticias --nolog -s filename=2018-01-03.json -a year=2018 -a month=1 -a day=3
```
No se encontró notas antes del 2014.01.16.
......@@ -315,7 +445,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd notirivas
cd notirivas/
scrapy crawl noticias --nolog -s filename=2017-03-30.json -a year=2017 -a month=3 -a day=30
```
No se encontró notas antes del 2016.11.22.
......@@ -328,10 +458,23 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd notisureste
cd notisureste/
scrapy crawl noticias --nolog -s filename=2017-03-22.json -a year=2017 -a month=3 -a day=22
```
No se encontró notas antes del 2011.11.28.
* [La Opinión de Puebla](http://www.laopinionpuebla.com)
Acceso por día:
```bash
http://www.laopinionpuebla.com/2018/2/4/
```
Uso:
```bash
cd opinionPuebla/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2011.07.01.
* [Periodico Correo](https://periodicocorreo.com.mx)
Acceso por día:
......@@ -341,10 +484,36 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd periodicoCorreo
cd periodicoCorreo/
scrapy crawl noticias --nolog -s filename=2018-01-29.json -a year=2018 -a month=1 -a day=29
```
No se encontró notas antes del 2013.09.08.
* [Periódico Enfoque Informativo](https://enfoquenayarit.com)
Acceso por día:
```bash
https://enfoquenayarit.com/2018/2/4/
```
Uso:
```bash
cd periodicoEnfoque/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2014.12.19.
* [Periódico Express](http://www.periodicoexpress.com.mx)
Acceso por día:
```bash
http://www.periodicoexpress.com.mx/2018/2/4/
```
Uso:
```bash
cd periodicoExpress/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2017.03.25.
* [Periodico Victoria](http://periodicovictoria.mx)
Acceso por día:
......@@ -354,17 +523,30 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd periodicoVictoria
cd periodicoVictoria/
scrapy crawl noticias --nolog -s filename=2018-01-28.json -a year=2018 -a month=1 -a day=28
```
No se encontró notas antes del 2013.10.09.
* [Por Esto](http://www.poresto.net)
Acceso por día:
```bash
http://www.poresto.net/2018/8/22/
```
Uso:
```bash
cd porEsto/
scrapy crawl noticias --nolog -s filename=2018-08-22.json -a year=2018 -a month=8 -a day=22
```
No se encontró notas antes del 2018.07.03.
* [Proceso](http://www.proceso.com.mx)
Uso:
```bash
cd proceso
cd proceso/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3
```
No se encontró notas antes de Nov. 1976.
......@@ -377,10 +559,36 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd puntoMedio
cd puntoMedio/
scrapy crawl noticias --nolog -s filename=2017-03-27.json -a year=2017 -a month=3 -a day=27
```
No se encontró notas antes del 2015.08.02.
* [Red Crucero](http://www.red-crucero.com)
Acceso por día:
```bash
http://www.red-crucero.com/news/2018/2/4/
```
Uso:
```bash
cd redCrucero/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2016.02.08.
* [Síntesis](https://www.sintesis.mx)
Acceso por día:
```bash
https://www.sintesis.mx/2018/2/4/
```
Uso:
```bash
cd sintesis/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2016.10.02.
* [Sona 89.3](http://sona893.fm)
Acceso por día:
......@@ -390,10 +598,23 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd sona893
cd sona893/
scrapy crawl noticias --nolog -s filename=2017-03-24.json -a year=2017 -a month=3 -a day=24
```
No se encontró notas antes del 2012.04.09.
* [El Sur de Campeche](http://www.elsur.mx)
Acceso por día:
```bash
http://www.elsur.mx/2018/8/10/
```
Uso:
```bash
cd surDeCampeche/
scrapy crawl noticias --nolog -s filename=2018-08-10.json -a year=2018 -a month=8 -a day=10
```
No se encontró notas antes del 2011.10.01.
* [Tribuna de los Cabos](http://www.tribunadeloscabos.com.mx/)
Acceso por día:
......@@ -403,10 +624,23 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd tribunaCabos
cd tribunaCabos/
scrapy crawl noticias --nolog -s filename=2018-01-18.json -a year=2018 -a month=1 -a day=18
```
No se encontró notas antes del 2016.06.01.
* [Tribuna](http://tribunacampeche.com)
Acceso por día:
```bash
http://tribunacampeche.com/2018/8/10/
```
Uso:
```bash
cd tribunaCampeche/
scrapy crawl noticias --nolog -s filename=2018-08-10.json -a year=2018 -a month=8 -a day=10
```
No se encontró notas antes del 2013.11.28.
* [Uno Más Uno](http://www.unomasuno.com.mx)
Acceso por día:
......@@ -416,7 +650,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd unoMasUno
cd unoMasUno/
scrapy crawl noticias --nolog -s filename=2017-09-22.json -a year=2017 -a month=09 -a day=22
```
No se encontró notas antes del 2017.05.04.
......@@ -429,7 +663,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd yucatanALaMano
cd yucatanALaMano/
scrapy crawl noticias --nolog -s filename=2017-03-25.json -a year=2017 -a month=3 -a day=25
```
No se encontró notas antes del 2015.05.11.
......@@ -439,7 +673,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd yucatanAlMinuto
cd yucatanAlMinuto/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=03 -a day=22
```
No se encontró notas antes del 2017.01.17.
......@@ -452,7 +686,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd yucatanEnCorto
cd yucatanEnCorto/
scrapy crawl noticias --nolog -s filename=2017-03-29.json -a year=2017 -a month=3 -a day=29
```
No se encontró notas antes del 2017.10.18 para esta version del crawler.
......@@ -469,7 +703,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso:
```bash
cd descarga_por_dia/foraneos/diarioCoLatino
cd descarga_por_dia/foraneos/diarioCoLatino/
scrapy crawl noticias --nolog -s filename=2018-02-23.json -a year=2018 -a month=2 -a day=23
```
No se encontró notas antes del 2013.10.04.
......@@ -488,7 +722,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso:
```bash
cd descarga_hacia_atras/foraneos/prensaGrafica
cd descarga_hacia_atras/foraneos/prensaGrafica/
scrapy crawl noticias --nolog -s filename=noticias.json // obtiene todas las posibles
scrapy crawl noticias --nolog -s filename=noticias.json -a year=2018 -a month=2 -a day=29 //obtiene hasta una fecha dada
```
......@@ -502,7 +736,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso:
```bash
cd descarga_por_dia/foraneos/sanPedroSun
cd descarga_por_dia/foraneos/sanPedroSun/
scrapy crawl noticias --nolog -s filename=2018-02-23.json -a year=2018 -a month=2 -a day=23
```
No se encontró notas antes del 2008.07.21.
......@@ -515,7 +749,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso:
```bash
cd descarga_por_dia/foraneos/tiempoDigitalHn
cd descarga_por_dia/foraneos/tiempoDigitalHn/
scrapy crawl noticias --nolog -s filename=2018-02-23.json -a year=2018 -a month=2 -a day=23
```
No se encontró notas antes del 2015.04.17.
......@@ -524,7 +758,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso:
```bash
cd descarga_hacia_atras/foraneos/tribunaHn
cd descarga_hacia_atras/foraneos/tribunaHn/
scrapy crawl noticias --nolog -s filename=noticias.json // obtiene todas las posibles
scrapy crawl noticias --nolog -s filename=noticias.json -a year=2018 -a month=2 -a day=29 //obtiene hasta una fecha dada
```
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment