Skip to content
Projects
Groups
Snippets
Help
Loading...
Help
Submit feedback
Contribute to GitLab
Sign in
Toggle navigation
crawlersNoticias
Project
Project
Details
Activity
Releases
Cycle Analytics
Repository
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
Issues
4
Issues
4
List
Board
Labels
Milestones
Merge Requests
0
Merge Requests
0
CI / CD
CI / CD
Pipelines
Jobs
Schedules
Charts
Wiki
Wiki
Members
Members
Collapse sidebar
Close sidebar
Activity
Graph
Charts
Create a new issue
Jobs
Commits
Issue Boards
Open sidebar
m3
crawlersNoticias
Commits
2cc23082
Commit
2cc23082
authored
Apr 26, 2017
by
Renán Sosa Guillen
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
Actualizacion README
parent
3a02f7e1
Changes
1
Show whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
99 additions
and
21 deletions
+99
-21
README.md
README.md
+99
-21
No files found.
README.md
View file @
2cc23082
Crawlers para medios de información en linea nacionales basados en
[
Scrapy
](
http://scrapy.org/
)
Se incluyen los siguientes medios:
*
[
La Jornada
](
http://www.jornada.unam.mx
)
*
[
Al Chile
](
http://alchile.com.mx/
)
Uso:
```bash
cd lajornada
cd alChile
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=22
```
No se encontró notas antes del 2014.06.01.
*
[
Desde el Balcón
](
http://www.desdeelbalcon.com/
)
Uso:
```bash
cd desdeElBalcon
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=30
```
No se encontró notas antes del 2014.01.11.
*
[
Diario del Yaqui
](
http://diariodelyaqui.mx
)
Uso:
```bash
cd diarioYaqui
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2016 -a month=12 -a day=24
```
No se encontró notas antes del 2016.12.30.
*
[
Diario de Yucatán
](
http://yucatan.com.mx/
)
...
...
@@ -20,50 +41,88 @@ Se incluyen los siguientes medios:
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2016 -a month=12 -a day=24
```
No se encontró notas antes del 2012.04.02.
*
[
Yucatán al Minuto
](
http://www.yucatanalminut
o.com/
)
*
[
El Grillo Porteño
](
http://grilloporten
o.com/
)
Uso:
```bash
cd
yucatanAlMinut
o
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=
03 -a day=22
cd
grilloPorten
o
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=
3 -a day=26
```
No se encontró notas antes del 201
7.01.03
.
*
[
Al Chile
](
http://alchile.com
.mx/
)
No se encontró notas antes del 201
3.11.04
.
*
[
La Jornada Aguascalientes
](
http://www.lja
.mx/
)
Uso:
```bash
cd
alChile
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=2
2
cd
laJornadaAgs
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=2
6
```
Ejecutado el 2017.03.29.
Se bajaron notas en el rango del 2014.06.01 hasta el 2017.03.29 a las 15:30 hrs.
No se encontró notas antes del 2014.06.01.
*
[
Desde el Balcón
](
http://www.desdeelbalcon.com/
)
No se encontró notas antes del 2008.11.29.
*
[
La Jornada Baja California
](
http://jornadabc.mx
)
Uso:
```bash
cd desdeElBalcon
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=30
cd laJornadaBC
scrapy crawl noticias -t json --nolog -o noticias.json -a seccion=<categoria>
donde <categoria> puede ser uno de los siguientes:
[ baja-california, chihuahua, mexico, mundo, cultura, espectaculos, deportes ]
```
No se encontró notas antes del 2014.01.11.
*
[
El Grillo Porteño
](
http://grilloporteno.com/
)
*
[
La Jornada Guerrero
](
http://www.lajornadaguerrero.com.mx
)
Uso:
```bash
cd
grilloPorten
o
cd
laJornadaGr
o
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=26
```
Ejecutado el 2017.03.29.
Se bajaron notas en el rango del 2013.11.04 hasta el 2015.12.31.
No se encontró notas antes del 2013.11.04.
No se encontró notas antes del 2007.01.22.
*
[
La Jornada de Oriente
](
http://www.lajornadadeoriente.com.mx/
)
Uso:
```bash
cd laJornadaOte
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2013.06.01.
*
[
La Jornada San Luis
](
http://lajornadasanluis.com.mx
)
Uso:
```bash
cd laJornadaSanLuis
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2014.10.08.
*
[
La Jornada Veracruz
](
http://www.jornadaveracruz.com.mx
)
Uso:
```bash
cd laJornadaVer
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2009.06.29.
*
[
La Jornada Zacatecas
](
http://ljz.mx
)
Uso:
```bash
cd laJornadaZac
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=26
```
No se encontró notas antes del 2013.06.10.
*
[
La Verdad Yucatán
](
http://laverdadnoticias.com/
)
...
...
@@ -74,6 +133,15 @@ Se incluyen los siguientes medios:
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=24
```
No se encontró notas antes del 2015.12.01.
*
[
La Jornada
](
http://www.jornada.unam.mx
)
Uso:
```bash
cd lajornada
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2016 -a month=12 -a day=24
```
*
[
Lector MX
](
http://lectormx.com/
)
...
...
@@ -144,6 +212,16 @@ Se incluyen los siguientes medios:
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=3 -a day=25
```
No se encontró notas antes del 2014.12.01.
*
[
Yucatán al Minuto
](
http://www.yucatanalminuto.com/
)
Uso:
```bash
cd yucatanAlMinuto
scrapy crawl noticias -t json --nolog -o noticias.json -a year=2017 -a month=03 -a day=22
```
No se encontró notas antes del 2017.01.03.
*
[
Yucatán en Corto
](
http://florcastillo.mx/noticias/
)
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment