Skip to content
Projects
Groups
Snippets
Help
Loading...
Help
Submit feedback
Contribute to GitLab
Sign in
Toggle navigation
crawlersNoticias
Project
Project
Details
Activity
Releases
Cycle Analytics
Repository
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
Issues
4
Issues
4
List
Board
Labels
Milestones
Merge Requests
0
Merge Requests
0
CI / CD
CI / CD
Pipelines
Jobs
Schedules
Charts
Wiki
Wiki
Members
Members
Collapse sidebar
Close sidebar
Activity
Graph
Charts
Create a new issue
Jobs
Commits
Issue Boards
Open sidebar
m3
crawlersNoticias
Commits
10ab6dd7
Commit
10ab6dd7
authored
Nov 13, 2018
by
Renán Sosa Guillen
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
README
parent
6beff693
Changes
1
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
276 additions
and
42 deletions
+276
-42
README.md
README.md
+276
-42
No files found.
README.md
View file @
10ab6dd7
...
...
@@ -10,7 +10,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd alChile
cd alChile
/
scrapy crawl noticias --nolog -s filename=2017-03-22.json -a year=2017 -a month=3 -a day=22
```
No se encontró notas antes del 2014.06.01.
...
...
@@ -23,10 +23,36 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd campecheHoy
cd campecheHoy
/
scrapy crawl noticias --nolog -s filename=2018-01-22.json -a year=2018 -a month=1 -a day=22
```
No se encontró notas antes del 2017.06.01.
*
[
Chiapas Hoy
](
http://www.chiapashoy.com.mx
)
Acceso por día:
```bash
http://www.chiapashoy.com.mx/notashoy/2018/01/25/
```
Uso:
```bash
cd chiapasHoy/
scrapy crawl noticias --nolog -s filename=2018-01-25.json -a year=2018 -a month=1 -a day=25
```
No se encontró notas antes del 2017.03.08.
*
[
Cuarto Poder
](
http://www.cuartopoder.mx
)
Acceso por día:
```bash
http://www.cuartopoder.mx/archivo/portada/listado/30-08-2018/30-08-2018/
```
Uso:
```bash
cd cuartoPoder/
scrapy crawl noticias --nolog -s filename=2018-08-30.json -a year=2018 -a month=8 -a day=30
```
No se encontró notas antes del 2010.01.01.
*
[
Desde el Balcón
](
http://www.desdeelbalcon.com
)
Acceso por día:
...
...
@@ -36,10 +62,36 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd desdeElBalcon
cd desdeElBalcon
/
scrapy crawl noticias --nolog -s filename=2017-03-30.json -a year=2017 -a month=3 -a day=30
```
No se encontró notas antes del 2014.01.11.
*
[
El Despertar de Oaxaca
](
http://despertardeoaxaca.com
)
Acceso por día:
```bash
http://despertardeoaxaca.com/2018/2/4/
```
Uso:
```bash
cd despertarOaxaca/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2011.12.06.
*
[
Puntual
](
http://diario-puntual.com.mx
)
Acceso por día:
```bash
http://diario-puntual.com.mx/2018/9/5/
```
Uso:
```bash
cd diarioPuntual/
scrapy crawl noticias --nolog -s filename=2018-09-05.json -a year=2018 -a month=9 -a day=5
```
No se encontró notas antes del 2016.07.12.
*
[
Diario del Yaqui
](
http://diariodelyaqui.mx
)
Acceso por día:
...
...
@@ -49,7 +101,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd diarioYaqui
cd diarioYaqui
/
scrapy crawl noticias --nolog -s filename=2016-12-24.json -a year=2016 -a month=12 -a day=24
```
No se encontró notas antes del 2016.12.30.
...
...
@@ -59,7 +111,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd diarioYucatan
cd diarioYucatan
/
scrapy crawl noticias --nolog -s filename=noticias.json
```
No se encontró notas antes del 2012.04.02.
...
...
@@ -72,10 +124,62 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd edoMexDia
cd edoMexDia
/
scrapy crawl noticias --nolog -s filename=2018-01-30.json -a year=2018 -a month=1 -a day=30
```
No se encontró notas antes del 2011.09.21.
*
[
El Comentario
](
https://elcomentario.ucol.mx
)
Acceso por día:
```bash
https://elcomentario.ucol.mx/2018/9/5/
```
Uso:
```bash
cd elComentario/
scrapy crawl noticias --nolog -s filename=2018-09-05.json -a year=2018 -a month=9 -a day=5
```
No se encontró notas antes del 2016.07.01.
*
[
El Independiente
](
http://www.el-independiente.com.mx
)
Acceso por día:
```bash
http://www.el-independiente.com.mx/2018/2/1/
```
Uso:
```bash
cd elIndependiente/
scrapy crawl noticias --nolog -s filename=2018-02-01.json -a year=2018 -a month=2 -a day=1
```
No se encontró notas antes del 2012.03.05.
*
[
El Sur
](
https://suracapulco.mx
)
Acceso por día:
```bash
hhttps://suracapulco.mx/2018/9/5/
```
Uso:
```bash
cd elSur/
scrapy crawl noticias --nolog -s filename=2018-09-05.json -a year=2018 -a month=9 -a day=5
```
No se encontró notas antes del 2017.09.06.
*
[
El Valle
](
http://elvalle.com.mx
)
Acceso por día:
```bash
http://elvalle.com.mx/2018/2/1/
```
Uso:
```bash
cd elValle/
scrapy crawl noticias --nolog -s filename=2018-02-01.json -a year=2018 -a month=2 -a day=1
```
No se encontró notas antes del 2016.04.19.
*
[
Expreso Chiapas
](
http://expresochiapas.com/noticias
)
Acceso por día:
...
...
@@ -85,7 +189,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd expresoChiapas
cd expresoChiapas
/
scrapy crawl noticias --nolog -s filename=2018-01-30.json -a year=2018 -a month=1 -a day=30
```
No se encontró notas antes del 2015.09.26.
...
...
@@ -98,7 +202,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd grilloPorteno
cd grilloPorteno
/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2013.11.04.
...
...
@@ -111,7 +215,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd heraldoAgs
cd heraldoAgs
/
scrapy crawl noticias --nolog -s filename=2018-01-22.json -a year=2018 -a month=1 -a day=22
```
No se encontró notas antes del 2014.01.23.
...
...
@@ -124,7 +228,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd heraldoLeon
cd heraldoLeon
/
scrapy crawl noticias --nolog -s filename=2018-01-29.json -a year=2018 -a month=1 -a day=29
```
No se encontró notas antes del 2016.07.06.
...
...
@@ -137,7 +241,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornada
cd laJornada
/
scrapy crawl noticias --nolog -s filename=2017-04-23.json -a year=2017 -a month=4 -a day=23
```
No se encontró notas antes del 1996.03.03.
...
...
@@ -150,7 +254,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaAgs
cd laJornadaAgs
/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2008.12.01.
...
...
@@ -160,7 +264,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaBC
cd laJornadaBC
/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=4 -a day=26
```
No se encontró notas antes del 2015.02.09.
...
...
@@ -174,7 +278,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaGro
cd laJornadaGro
/
scrapy crawl noticias --nolog -s filename=2017-09-17.json -a year=2017 -a month=9 -a day=17
```
No se encontró notas antes del 2017.08.15 para esta version del crawler.
...
...
@@ -185,7 +289,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaMaya
cd laJornadaMaya
/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=4 -a day=25
```
No se encontró notas antes del 2015.03.12.
...
...
@@ -198,7 +302,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaOte
cd laJornadaOte
/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2013.06.01.
...
...
@@ -211,7 +315,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaSanLuis
cd laJornadaSanLuis
/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2014.10.08.
...
...
@@ -224,7 +328,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaVer
cd laJornadaVer
/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2009.05.11.
...
...
@@ -237,7 +341,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laJornadaZac
cd laJornadaZac
/
scrapy crawl noticias --nolog -s filename=2017-03-26.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2013.06.10.
...
...
@@ -250,7 +354,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laRazon
cd laRazon
/
scrapy crawl noticias --nolog -s filename=2017-09-28.json -a year=2017 -a month=9 -a day=28
```
No se encontró notas antes del 2015.01.01.
...
...
@@ -263,7 +367,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd laVerdadYuc
cd laVerdadYuc
/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=24
```
No se encontró notas antes del 2017.07.18.
...
...
@@ -271,15 +375,28 @@ Se incluyen los siguientes medios nacionales:
Acceso por día:
```bash
http://lectormx.com/2017/
9/16
/
http://lectormx.com/2017/
3/30
/
```
Uso:
```bash
cd lectorMX
cd lectorMX
/
scrapy crawl noticias --nolog -s filename=2017-03-30.json -a year=2017 -a month=3 -a day=30
```
No se encontró notas antes del 2015.10.23.
*
[
Marca
](
http://www.diariomarca.com.mx
)
Acceso por día:
```bash
http://www.diariomarca.com.mx/2018/2/4/
```
Uso:
```bash
cd marca/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2012.07.31.
*
[
Mi Punto de Vista
](
http://www.mipuntodevista.com.mx
)
Acceso por día:
...
...
@@ -289,10 +406,23 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd miPuntoDeVista
cd miPuntoDeVista
/
scrapy crawl noticias --nolog -s filename=2017-03-28.json -a year=2017 -a month=3 -a day=28
```
No se encontró notas antes del 2008.10.04.
*
[
Noticias de la Bahía
](
https://noticiasdelabahia.com
)
Acceso por día:
```bash
https://noticiasdelabahia.com/2018/2/1/
```
Uso:
```bash
cd noticiasBahia/
scrapy crawl noticias --nolog -s filename=2018-02-01.json -a year=2018 -a month=2 -a day=1
```
No se encontró notas antes del 2016.05.23.
*
[
El Noticiero en Línea
](
http://www.elnoticieroenlinea.com
)
Acceso por día:
...
...
@@ -302,7 +432,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd noticieroLinea
cd noticieroLinea
/
scrapy crawl noticias --nolog -s filename=2018-01-03.json -a year=2018 -a month=1 -a day=3
```
No se encontró notas antes del 2014.01.16.
...
...
@@ -315,7 +445,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd notirivas
cd notirivas
/
scrapy crawl noticias --nolog -s filename=2017-03-30.json -a year=2017 -a month=3 -a day=30
```
No se encontró notas antes del 2016.11.22.
...
...
@@ -328,10 +458,23 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd notisureste
cd notisureste
/
scrapy crawl noticias --nolog -s filename=2017-03-22.json -a year=2017 -a month=3 -a day=22
```
No se encontró notas antes del 2011.11.28.
*
[
La Opinión de Puebla
](
http://www.laopinionpuebla.com
)
Acceso por día:
```bash
http://www.laopinionpuebla.com/2018/2/4/
```
Uso:
```bash
cd opinionPuebla/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2011.07.01.
*
[
Periodico Correo
](
https://periodicocorreo.com.mx
)
Acceso por día:
...
...
@@ -341,10 +484,36 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd periodicoCorreo
cd periodicoCorreo
/
scrapy crawl noticias --nolog -s filename=2018-01-29.json -a year=2018 -a month=1 -a day=29
```
No se encontró notas antes del 2013.09.08.
*
[
Periódico Enfoque Informativo
](
https://enfoquenayarit.com
)
Acceso por día:
```bash
https://enfoquenayarit.com/2018/2/4/
```
Uso:
```bash
cd periodicoEnfoque/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2014.12.19.
*
[
Periódico Express
](
http://www.periodicoexpress.com.mx
)
Acceso por día:
```bash
http://www.periodicoexpress.com.mx/2018/2/4/
```
Uso:
```bash
cd periodicoExpress/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2017.03.25.
*
[
Periodico Victoria
](
http://periodicovictoria.mx
)
Acceso por día:
...
...
@@ -354,17 +523,30 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd periodicoVictoria
cd periodicoVictoria
/
scrapy crawl noticias --nolog -s filename=2018-01-28.json -a year=2018 -a month=1 -a day=28
```
No se encontró notas antes del 2013.10.09.
*
[
Por Esto
](
http://www.poresto.net
)
Acceso por día:
```bash
http://www.poresto.net/2018/8/22/
```
Uso:
```bash
cd porEsto/
scrapy crawl noticias --nolog -s filename=2018-08-22.json -a year=2018 -a month=8 -a day=22
```
No se encontró notas antes del 2018.07.03.
*
[
Proceso
](
http://www.proceso.com.mx
)
Uso:
```bash
cd proceso
cd proceso
/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3
```
No se encontró notas antes de Nov. 1976.
...
...
@@ -377,10 +559,36 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd puntoMedio
cd puntoMedio
/
scrapy crawl noticias --nolog -s filename=2017-03-27.json -a year=2017 -a month=3 -a day=27
```
No se encontró notas antes del 2015.08.02.
*
[
Red Crucero
](
http://www.red-crucero.com
)
Acceso por día:
```bash
http://www.red-crucero.com/news/2018/2/4/
```
Uso:
```bash
cd redCrucero/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2016.02.08.
*
[
Síntesis
](
https://www.sintesis.mx
)
Acceso por día:
```bash
https://www.sintesis.mx/2018/2/4/
```
Uso:
```bash
cd sintesis/
scrapy crawl noticias --nolog -s filename=2018-02-04.json -a year=2018 -a month=2 -a day=4
```
No se encontró notas antes del 2016.10.02.
*
[
Sona 89.3
](
http://sona893.fm
)
Acceso por día:
...
...
@@ -390,10 +598,23 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd sona893
cd sona893
/
scrapy crawl noticias --nolog -s filename=2017-03-24.json -a year=2017 -a month=3 -a day=24
```
No se encontró notas antes del 2012.04.09.
*
[
El Sur de Campeche
](
http://www.elsur.mx
)
Acceso por día:
```bash
http://www.elsur.mx/2018/8/10/
```
Uso:
```bash
cd surDeCampeche/
scrapy crawl noticias --nolog -s filename=2018-08-10.json -a year=2018 -a month=8 -a day=10
```
No se encontró notas antes del 2011.10.01.
*
[
Tribuna de los Cabos
](
http://www.tribunadeloscabos.com.mx/
)
Acceso por día:
...
...
@@ -403,10 +624,23 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd tribunaCabos
cd tribunaCabos
/
scrapy crawl noticias --nolog -s filename=2018-01-18.json -a year=2018 -a month=1 -a day=18
```
No se encontró notas antes del 2016.06.01.
*
[
Tribuna
](
http://tribunacampeche.com
)
Acceso por día:
```bash
http://tribunacampeche.com/2018/8/10/
```
Uso:
```bash
cd tribunaCampeche/
scrapy crawl noticias --nolog -s filename=2018-08-10.json -a year=2018 -a month=8 -a day=10
```
No se encontró notas antes del 2013.11.28.
*
[
Uno Más Uno
](
http://www.unomasuno.com.mx
)
Acceso por día:
...
...
@@ -416,7 +650,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd unoMasUno
cd unoMasUno
/
scrapy crawl noticias --nolog -s filename=2017-09-22.json -a year=2017 -a month=09 -a day=22
```
No se encontró notas antes del 2017.05.04.
...
...
@@ -429,7 +663,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd yucatanALaMano
cd yucatanALaMano
/
scrapy crawl noticias --nolog -s filename=2017-03-25.json -a year=2017 -a month=3 -a day=25
```
No se encontró notas antes del 2015.05.11.
...
...
@@ -439,7 +673,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd yucatanAlMinuto
cd yucatanAlMinuto
/
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=03 -a day=22
```
No se encontró notas antes del 2017.01.17.
...
...
@@ -452,7 +686,7 @@ Se incluyen los siguientes medios nacionales:
Uso:
```bash
cd yucatanEnCorto
cd yucatanEnCorto
/
scrapy crawl noticias --nolog -s filename=2017-03-29.json -a year=2017 -a month=3 -a day=29
```
No se encontró notas antes del 2017.10.18 para esta version del crawler.
...
...
@@ -469,7 +703,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso:
```bash
cd descarga_por_dia/foraneos/diarioCoLatino
cd descarga_por_dia/foraneos/diarioCoLatino
/
scrapy crawl noticias --nolog -s filename=2018-02-23.json -a year=2018 -a month=2 -a day=23
```
No se encontró notas antes del 2013.10.04.
...
...
@@ -488,7 +722,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso:
```bash
cd descarga_hacia_atras/foraneos/prensaGrafica
cd descarga_hacia_atras/foraneos/prensaGrafica
/
scrapy crawl noticias --nolog -s filename=noticias.json // obtiene todas las posibles
scrapy crawl noticias --nolog -s filename=noticias.json -a year=2018 -a month=2 -a day=29 //obtiene hasta una fecha dada
```
...
...
@@ -502,7 +736,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso:
```bash
cd descarga_por_dia/foraneos/sanPedroSun
cd descarga_por_dia/foraneos/sanPedroSun
/
scrapy crawl noticias --nolog -s filename=2018-02-23.json -a year=2018 -a month=2 -a day=23
```
No se encontró notas antes del 2008.07.21.
...
...
@@ -515,7 +749,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso:
```bash
cd descarga_por_dia/foraneos/tiempoDigitalHn
cd descarga_por_dia/foraneos/tiempoDigitalHn
/
scrapy crawl noticias --nolog -s filename=2018-02-23.json -a year=2018 -a month=2 -a day=23
```
No se encontró notas antes del 2015.04.17.
...
...
@@ -524,7 +758,7 @@ Adicionalmente se cuenta con los siguientes medios extranjeros:
Uso:
```bash
cd descarga_hacia_atras/foraneos/tribunaHn
cd descarga_hacia_atras/foraneos/tribunaHn
/
scrapy crawl noticias --nolog -s filename=noticias.json // obtiene todas las posibles
scrapy crawl noticias --nolog -s filename=noticias.json -a year=2018 -a month=2 -a day=29 //obtiene hasta una fecha dada
```
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment