uodate

b87a9982 · Mario Chirinos Colunga · ffb846a2 · b87a9982 · b87a9982 · b87a9982
Commit b87a9982 authored Mar 06, 2022 by Mario Chirinos Colunga
786 changed files
--- a/crawler_script/check_empty_file.py
+++ b/crawler_script/check_empty_file.py
+import os
+
+newsDir = '/home/geoint/virtualHDD/m3/noticias'
+# newsDir = '/home/cna_service/noticias/'
+os.chdir(newsDir)
+
+mediaLst = os.listdir('.')
+mediaLst.sort()
+vacios_txt = open('vacios.txt','w')
+
+empty_count = 0
+for media in mediaLst:
+	os.chdir(media)
+	yearLst = os.listdir('.')
+	yearLst.sort()
+
+	for year in yearLst:
+		os.chdir(year)
+		fileLst = os.listdir('.')
+		fileLst.sort()
+
+		for file in fileLst:
+			fileSize = os.stat(file).st_size
+			
+			if not file.startswith('.') and fileSize <= 3:
+				empty_count += 1
+				if empty_count == 1:
+					vacios_txt.write(media+'/'+year+'/'+file+', '+'File size: '+str(fileSize))
+				else:
+					vacios_txt.write('\n'+media+'/'+year+'/'+file+', '+'File size: '+str(fileSize))
+				print(media+'/'+year+'/'+file+', '+'File size: '+str(fileSize))
+				os.system('rm '+file)
+
+		os.chdir('..')
+
+	os.chdir('..')
+
+vacios_txt.write('\n'+'Total archivos vacios: '+str(empty_count)+'\n')
+vacios_txt.close()
+print('Total archivos vacios: '+str(empty_count))
\ No newline at end of file
--- a/crawler_script/crawl_all.sh
+++ b/crawler_script/crawl_all.sh
+#!/bin/bash
+
+python /home/geoint/crawlerNoticias/crawler_script.py /home/geoint/crawlerNoticias/crawler_data.json
--- a/crawler_script/crawler.sh
+++ b/crawler_script/crawler.sh
+#!/bin/bash
+## ------------------------------------------------------------------
+## SCRIPT PARA LA DESCARGA AUTOMATICA DE NOTICIAS CON EL CRAWLER
+## ------------------------------------------------------------------
+
+
+site_section=( otros_sitios sitios_yucatan )
+other_site_list=( diarioYaqui laJornada laJornadaAgs laJornadaBC laJornadaGro laJornadaMaya laJornadaOte laJornadaSanLuis laJornadaVer laJornadaZac )
+yuc_site_list=( alChile desdeElBalcon diarioYucatan grilloPorteno laVerdadYuc lectorMX miPuntoDeVista notirivas notisureste puntoMedio sona893 yucatanALaMano yucatanAlMinuto yucatanEnCorto )
+
+base_path=$HOME/crawler/
+cd $base_path                    # activando el venv (entorno virtual) del crawler
+source bin/activate
+
+PATH=$PATH:$HOME/crawler/bin/python:$HOME/crawler/bin/scrapy       # rutas donde se encuentran el scrapy y python
+export PATH
+
+
+## CALCULO DEL NUMERO DE DIAS PARA DESCARGAR NOTICIAS -------------------------
+function obtain_days() {
+	local last_date=$1          # parametro 1
+	local stop_date=$2	        # parametro 2
+
+
+	local day_date_1=`date -d "$last_date" '+%j'`      # numero del dia del anio de la fecha en "last_date"
+	local y1=`date -d "$last_date" '+%Y'`
+	local day_date_2=`date -d "$stop_date" '+%j'`
+	local y2=`date -d "$stop_date" '+%Y'`
+
+
+	if [ $y1 -eq $y2 ]  # si $y1 es igual a $y2
+	then
+		local num_days=$(expr $day_date_2 - $day_date_1)
+	elif [ $y1 -lt $y2 ]
+	then
+		local days_date_1=0
+		for year in `seq $y1 $y2`
+		do
+			if [ $year -eq $y1 ]
+			then
+				local days_date=$(expr `date -d "$y1-12-31" '+%j'` - $day_date_1)
+			elif [ $year -eq $y2 ]
+			then
+				days_date=$day_date_2
+			else
+				days_date=`date -d "$year-12-31" '+%j'`
+			fi
+			days_date_1=$(expr $days_date_1 + $days_date)
+		done
+		local num_days=$(expr $days_date_1)
+	fi
+
+	return $num_days
+}
+## ----------------------------------------------------------------------------
+
+
+## SECUENCIA DE DESCARGA DE NOTICIAS --------------------------------------------------------------
+
+for section in ${site_section[@]}
+do
+	if [ $section = otros_sitios ]
+	then
+		list=${other_site_list[@]}
+	else
+		list=${yuc_site_list[@]}
+	fi
+
+	for site in $list
+	do
+		## POR CADA SITIO ENCUENTRA EL ARCHIVO CON LA ULTIMA FECHA EN QUE SE DESCARGO NOTICIAS ----
+		cd crawledJsonFiles/$section/$site
+		max=`ls | tail -1`           # obtiene el ultimo directorio
+
+		cd $max
+		json_file=`ls | tail -1`     # obtiene el ultimo archivo dentro del directorio
+		## ----------------------------------------------------------------------------------------
+		cd ~/crawler
+
+		last_date=`date -d "${json_file%%.*}" '+%Y-%m-%d'`
+		stop_date=`date -d "now" '+%Y-%m-%d'`        # descarga hasta una fecha antes de esta
+		## NOTA: Para que descargue hasta una fecha antes, el paro debe fijarse una fecha despues. Por eso 'stop_date' se fija con 'now'.
+
+		if [ $last_date != $stop_date ]
+		then
+			last_date=`date -d "$last_date +1 days" '+%Y-%m-%d'`                  
+
+			## FUNCION 'obtain_days' CALCULA EL NUMERO DE DIAS ENTRE LA ULTIMA FECHA DE DESCARGA Y LA FECHA DE PARO
+			obtain_days $last_date $stop_date    # parametros que se pasan a la funcion
+			num_days=$?                          # retorno del valor por parte de la funcion 'obtain_days'
+
+			for i in `seq $num_days -1 1`
+			do
+				y=`date -d "$stop_date - $i days" '+%Y'`
+				m=`date -d "$stop_date - $i days" '+%m'`
+				d=`date -d "$stop_date - $i days" '+%d'`
+				
+				cd cawlersNoticias/$section/$site/       # ruta donde se encuentran alojados los crawlers de cada sitio
+				
+				scrapy crawl noticias -t json -o $y-$m-$d.json -a year=$y -a month=$m -a day=$d      # ejecucion del crawler correspondiente segun el sitio
+				[ -s $y-$m-$d.json ] || rm $y-$m-$d.json    # revisa si el archivo contiene informacion, sino lo elimina
+			
+				if [ -e $y-$m-$d.json ]                  # revisa si se genero el archivo json con las noticias
+				then
+					destination=$HOME/crawler/prueba/$section/$site/$y/      # ruta donde se guardaran los json generados
+					
+					if [ ! -d $destination ]             # si no existe la ruta de destino la crea
+					then
+						mkdir -p $destination
+					fi
+					
+					mv -f $y-$m-$d.json $destination     # mueve el archivo json a la ruta de destino
+				fi
+
+				cd ~/crawler
+			done
+		fi
+	done
+done
+
+deactivate
+## ------------------------------------------------------------------------------------------------
\ No newline at end of file
--- a/crawler_script/download_backwards.py
+++ b/crawler_script/download_backwards.py
+#!/usr/bin/python
+# -*- coding: utf-8 -*-
+
+"""
+    Script para la descarga constante de histórico de medios del tipo "descarga_hacia_atras".
+"""
+
+import sys
+import json
+import os
+import datetime
+
+
+today = datetime.datetime.now()
+baseDir = "/home/geoint/M3NAS/noticias/"
+scrapyDir = "/home/geoint/crawlersNoticias/"
+with open(sys.argv[1]) as data_file:
+    siteList = json.load(data_file)
+    os.chdir(baseDir)
+
+    for s in siteList:
+        media = s['crawler'][s['crawler'].rfind("/")+1:]
+        try:
+            os.makedirs(media)
+        except:
+            print "ok"
+        os.chdir(media)
+
+        lstYears = os.listdir(".")
+        lstYears.sort()
+        if len(lstYears) > 0:
+            year = int(lstYears[len(lstYears)-1])
+        else:
+            year = today.date().year
+
+        print year
+        try:
+            os.makedirs(str(year))
+        except:
+            print "ok"
+
+        os.chdir(str(year))
+
+        lstDays = os.listdir(".")
+        lstDays = [l for l in lstDays if not l.startswith('.')]
+        lstDays.sort()
+        print lstDays
+
+        filename = "noticias.json"
+        if len(lstDays) > 0:
+            strDate = lstDays[len(lstDays)-1]
+            print strDate
+            strDate = strDate[:strDate.find(".")]
+            currentDate = datetime.datetime.strptime(strDate, '%Y-%m-%d')
+            scrapycommand = "scrapy crawl noticias --nolog -s filename=" + filename + " -a year=" + str(currentDate.year) + " -a month=" + str(currentDate.month) + " -a day=" + str(currentDate.day)
+
+        else:
+            scrapycommand = "scrapy crawl noticias --nolog -s filename=" + filename
+
+        mydir = os.getcwd()
+        print mydir
+        os.chdir(scrapyDir+s['crawler'])
+        print media
+        print scrapycommand
+        os.system(scrapycommand)
+        fileSize = os.stat(filename).st_size
+        if fileSize <= 3: os.system("rm " + filename)
+        else:
+            os.chdir(scrapyDir)
+            os.system("python3 parse_date_files.py " + s['crawler'] + " " + filename)
+            os.chdir(media)
+            mediaYears = os.listdir(".")
+            mediaYears.sort()
+
+            for yy in mediaYears:
+                os.chdir(yy)
+                try:
+                   os.makedirs(baseDir + media + "/" + yy)
+                except:
+                    pass
+                mediaDays = os.listdir(".")
+                mediaDays = [l for l in mediaDays if not l.startswith('.')]
+                mediaDays.sort()
+
+                for dd in mediaDays:
+                    os.system("mv " + dd + " " + baseDir + media + "/" + yy)
+
+                os.chdir("..")
+                os.system("rm -R " + yy)
+
+            os.chdir("..")
+            os.system("rm -R " + media)
+            os.chdir(s['crawler'])
+            os.system("rm " + filename)
+            os.chdir(mydir)
+
+        os.chdir("..")
+        os.chdir("..")
+
+# print today.year
+#	scrapy crawl noticias -t json -o $y-$m-$d.json -a year=$y -a month=$m -a day=$d      # ejecucion del crawler correspondiente segun el sitio
--- a/crawler_script/download_by_day.py
+++ b/crawler_script/download_by_day.py
+#!/usr/bin/python
+# -*- coding: utf-8 -*-
+
+"""
+    Script para la descarga constante de histórico de medios del tipo "descarga_por_dia".
+"""
+
+import sys
+import json
+import os
+import datetime
+
+
+today = datetime.datetime.now()
+baseDir = "/home/geoint/M3NAS/noticias/"
+scrapyDir = "/home/geoint/crawlersNoticias/"
+with open(sys.argv[1]) as data_file:    
+    siteList = json.load(data_file)
+    os.chdir(baseDir)
+
+    for s in siteList:
+        desde =  datetime.datetime.strptime(s['desde'], '%d-%m-%Y')
+        print str(s['nombre'] +", desde:" + desde.strftime("%Y-%m-%d"))
+        media = s['crawler'][s['crawler'].rfind("/")+1:]
+        try:
+            os.makedirs(media)
+        except:
+            print "ok"
+        os.chdir(media)
+
+        lstYears = os.listdir(".")
+        lstYears.sort()
+        year = desde.year
+        if len(lstYears) > 0:
+            year = int(lstYears[len(lstYears)-1])
+
+        for y in range(year, today.year+1):
+            print y
+            try:
+                os.makedirs(str(y))
+            except:
+                print "ok"
+
+            os.chdir(str(y))
+#			print os.getcwd()
+
+            lstDays = os.listdir(".")
+            lstDays = [l for l in lstDays if not l.startswith('.')]
+            lstDays.sort()
+            print lstDays
+
+            day = desde.timetuple().tm_yday
+            print day
+            currentDate = desde
+            if len(lstDays) > 0:
+                strDate = lstDays[len(lstDays)-1]
+                strDate = strDate[:strDate.find(".")]
+                currentDate = datetime.datetime.strptime(strDate, '%Y-%m-%d')
+                day = currentDate.timetuple().tm_yday
+            elif y != desde.year:
+                currentDate = datetime.datetime.strptime(str(y)+"-01-01", '%Y-%m-%d')
+                day = 1
+
+            for d in range(day, ((datetime.date(y,12,31)-datetime.date(y,1,1)).days + 1 if today.year!=y else today.timetuple().tm_yday)+1):
+                filename = currentDate.strftime('%Y-%m-%d')+".json"
+                scrapycommand = "scrapy crawl noticias --nolog -s filename=" + filename + " -a year="+str(currentDate.year)+ " -a month="+str(currentDate.month)+" -a day="+str(currentDate.day)
+                mydir = os.getcwd()
+                print mydir
+                os.chdir(scrapyDir+s['crawler'])
+                print media
+                print scrapycommand
+                os.system(scrapycommand)
+                fileSize = os.stat(filename).st_size
+                if fileSize <= 3: os.system("rm " + filename)
+                else: os.system("mv " + filename + " " + mydir)
+                os.chdir(mydir)
+                currentDate = currentDate + datetime.timedelta(days=1)
+
+            os.chdir("..")
+
+        os.chdir("..")
+# print today.year
+#	scrapy crawl noticias -t json -o $y-$m-$d.json -a year=$y -a month=$m -a day=$d      # ejecucion del crawler correspondiente segun el sitio
--- a/crawler_script/download_often.py
+++ b/crawler_script/download_often.py
+#!/usr/bin/python
+# -*- coding: utf-8 -*-
+
+"""
+    Script para la descarga automatica de noticias por rss
+"""
+
+import sys
+import json
+import os
+import datetime
+from collections import OrderedDict
+
+
+def dictRowGenerator(line):
+    row = []
+
+    try:
+        row.append(("date", line['date']))
+    except:
+        pass
+    try:
+        row.append(("topic", line['topic']))
+    except:
+        pass
+    try:
+        row.append(("title", line['title']))
+    except:
+        pass
+    try:
+        row.append(("author", line['author']))
+    except:
+        pass
+    try:
+        row.append(("location", line['location']))
+    except:
+        pass
+    try:
+        row.append(("text", line['text']))
+    except:
+        pass
+    try:
+        row.append(("url", line['url']))
+    except:
+        pass
+
+    return row
+
+
+today = datetime.datetime.now()
+baseDir = "/home/geoint/M3NAS/noticias/"
+scrapyDir = "/home/geoint/crawlersNoticias/"
+with open(sys.argv[1]) as data_file:
+    siteList = json.load(data_file)
+    os.chdir(baseDir)
+
+    for s in siteList:
+        # desde = datetime.datetime.strptime(s['desde'], '%d-%m-%Y')
+        desde = today
+        print str(s['nombre'] + ", desde:" + desde.strftime("%Y-%m-%d"))
+        media = s['crawler'][s['crawler'].rfind("/") + 1:]
+        try:
+            os.makedirs(media)
+        except:
+            print "ok"
+        os.chdir(media)
+        CORRECT_YEAR = False
+
+        while not CORRECT_YEAR:
+            lstYears = os.listdir(".")
+            lstYears.sort()
+            if len(lstYears) > 0:
+                element = lstYears[len(lstYears) - 1]
+                if element[-4:] == 'json':
+                    os.system('rm ' + element)
+                else:
+                    CORRECT_YEAR = True
+            else:
+                break
+
+        if CORRECT_YEAR: year = int(element)
+        else: year = desde.year
+
+        for y in range(year, today.year + 1):
+            print y
+            try:
+                os.makedirs(str(y))
+            except:
+                print "ok"
+
+            os.chdir(str(y))
+            #			print os.getcwd()
+
+            lstDays = os.listdir(".")
+            lstDays = [l for l in lstDays if not l.startswith('.')]
+            lstDays.sort()
+            print lstDays
+
+            day = desde.timetuple().tm_yday
+            print day
+            currentDate = desde.date()
+            # if len(lstDays) > 0:
+            #     strDate = lstDays[len(lstDays) - 1]
+            #     strDate = strDate[:strDate.find(".")]
+            #     currentDate = datetime.datetime.strptime(strDate, '%Y-%m-%d')
+            #     day = currentDate.timetuple().tm_yday
+            # elif y != desde.year:
+            #     currentDate = datetime.datetime.strptime(str(y) + "-01-01", '%Y-%m-%d')
+            #     day = 1
+
+            for d in range(day, ((datetime.date(y, 12, 31) - datetime.date(y, 1, 1)).days + 1 if today.year != y else today.timetuple().tm_yday) + 1):
+                YESTERDAY = False
+                filename = currentDate.strftime('%Y-%m-%d') + ".json"
+                scrapycommand = "scrapy crawl noticias --nolog -s filename=" + filename
+                mydir = os.getcwd()
+                print mydir
+                os.chdir(scrapyDir + s['crawler'])
+                print media
+                print scrapycommand
+                os.system(scrapycommand)
+                fileSize = os.stat(filename).st_size
+                if fileSize <= 3:
+                    os.system("rm " + filename)
+                else:
+                    f1 = mydir + "/" + filename
+                    f2 = filename
+                    f3 = baseDir + media + "/" + filename
+                    try:
+                        with open(f1) as infile1, open(f2) as infile2, open(f3, 'a') as infile3:
+                            master = json.load(infile1)
+                            slave = json.load(infile2)
+
+                            urlSet = set([line['url'] for line in master])
+                            counter = 0
+                            infile3.write("[")
+
+                            for line in master:
+                                lineDate = datetime.datetime.strptime(line['date'][:10], '%Y-%m-%d').date()
+                                if lineDate == currentDate:
+                                    counter += 1
+                                    auxRow = dictRowGenerator(line)
+                                    row = OrderedDict(auxRow)
+
+                                    if counter == 1:
+                                        infile3.write(json.dumps(row))
+                                    elif counter > 1:
+                                        infile3.write(",\n" + json.dumps(row))
+
+                            for line in slave:
+                                lineDate = datetime.datetime.strptime(line['date'][:10], '%Y-%m-%d').date()
+                                if not line['url'] in urlSet and lineDate == currentDate:
+                                    auxRow = dictRowGenerator(line)
+                                    row = OrderedDict(auxRow)
+                                    infile3.write(",\n" + json.dumps(row))
+
+                                elif lineDate != currentDate and (currentDate - lineDate).days == 1:
+                                    YESTERDAY = True
+
+                            infile3.write("]")
+
+                        os.system("mv " + f3 + " " + mydir)
+                        # os.system("rm " + f2)
+                    except:
+                        os.system("cp " + f2 + " " + mydir)
+
+                    if YESTERDAY:
+                        currentDate -= datetime.timedelta(days=1)
+                        filenameYesterday = currentDate.strftime('%Y-%m-%d') + ".json"
+
+                        f1 = mydir + '/' + filenameYesterday
+                        f2 = filename
+                        f3 = baseDir + media + '/' + filenameYesterday
+                        with open(f2) as infile2, open(f3, 'a') as infile3:
+                            try:
+                                infile1 = open(f1)
+                                master = json.load(infile1)
+                                yesterdayFlag = True
+                            except:
+                                yesterdayFlag = False
+
+                            urlSet = set()
+                            slave = json.load(infile2)
+                            infile3.write("[")
+
+                            if yesterdayFlag:
+                                urlSet = set([line['url'] for line in master])
+                                counter = 0
+                                for line in master:
+                                    counter += 1
+
+                                    auxRow = dictRowGenerator(line)
+                                    row = OrderedDict(auxRow)
+
+                                    if counter == 1:
+                                        infile3.write(json.dumps(row))
+                                    elif counter > 1:
+                                        infile3.write(",\n" + json.dumps(row))
+
+                            counter = 0
+                            for line in slave:
+                                lineDate = datetime.datetime.strptime(line['date'][:10], '%Y-%m-%d').date()
+                                if not line['url'] in urlSet and lineDate == currentDate:
+                                    counter += 1
+                                    auxRow = dictRowGenerator(line)
+                                    row = OrderedDict(auxRow)
+                                    if not yesterdayFlag and counter == 1:
+                                        infile3.write(json.dumps(row))
+                                    else:
+                                        infile3.write(",\n" + json.dumps(row))
+
+                            infile3.write("]")
+                            if yesterdayFlag: infile1.close()
+
+                        os.system("mv " + f3 + " " + mydir)
+                    os.system("rm " + f2)
+
+                os.chdir(mydir)
+                if YESTERDAY:
+                    currentDate += datetime.timedelta(days=2)
+                else:
+                    currentDate += datetime.timedelta(days=1)
+
+            os.chdir("..")
+
+        os.chdir("..")
+print today.year
+#	scrapy crawl noticias -t json -o $y-$m-$d.json -a year=$y -a month=$m -a day=$d      # ejecucion del crawler correspondiente segun el sitio
--- a/crawler_script/tracker_backwards.py
+++ b/crawler_script/tracker_backwards.py
+#!/usr/bin/python
+# -*- coding: utf-8 -*-
+
+"""
+    Script para el trackeo de histórico de medios del tipo "descarga_hacia_atras".
+"""
+
+import sys
+import json
+import os
+import datetime
+
+today = datetime.datetime.now()
+baseDir = "/home/geoint/M3NAS/noticias/"
+scrapyDir = "/home/geoint/crawlersNoticias/"
+with open(sys.argv[1]) as data_file:
+    siteList = json.load(data_file)
+    os.chdir(baseDir)
+
+    for s in siteList:
+        media = s['crawler'][s['crawler'].rfind("/")+1:]
+        try:
+            os.makedirs(media)
+        except:
+            print "ok"
+        os.chdir(media)
+
+        lstYears = os.listdir(".")
+        lstYears.sort()
+        if len(lstYears) > 0:
+            year = int(lstYears[len(lstYears)-1])
+        else:
+            year = today.date().year
+
+        print year
+        try:
+            os.makedirs(str(year))
+        except:
+            print "ok"
+
+        os.chdir(str(year))
+
+        lstDays = os.listdir(".")
+        lstDays = [l for l in lstDays if not l.startswith('.')]
+        lstDays.sort()
+        print lstDays
+
+        filename = "news.json"
+        # if len(lstDays) > 0:
+        #     strDate = lstDays[len(lstDays)-1]
+        #     print strDate
+        #     strDate = strDate[:strDate.find(".")]
+        #     currentDate = datetime.datetime.strptime(strDate, '%Y-%m-%d')
+        #     scrapycommand = "scrapy crawl noticias --nolog -s filename=" + filename + " -a year=" + str(currentDate.year) + " -a month=" + str(currentDate.month) + " -a day=" + str(currentDate.day)
+        #
+        # else:
+        scrapycommand = "scrapy crawl noticias --nolog -s filename=" + filename
+
+        mydir = os.getcwd()
+        print mydir
+        os.chdir(scrapyDir+s['crawler'])
+        print media
+        print scrapycommand
+        os.system(scrapycommand)
+        fileSize = os.stat(filename).st_size
+        if fileSize <= 3: os.system("rm " + filename)
+        else:
+            os.chdir(scrapyDir)
+            os.system("python3 parse_date_files.py " + s['crawler'] + " " + filename)
+            os.chdir(media)
+            mediaYears = os.listdir(".")
+            mediaYears.sort()
+
+            for yy in mediaYears:
+                os.chdir(yy)
+                try:
+                   os.makedirs(baseDir + media + "/" + yy)
+                except:
+                    pass
+                mediaDays = os.listdir(".")
+                mediaDays = [l for l in mediaDays if not l.startswith('.')]
+                mediaDays.sort()
+
+                for dd in mediaDays:
+                    os.system("mv " + dd + " " + baseDir + media + "/" + yy)
+
+                os.chdir("..")
+                os.system("rm -R " + yy)
+
+            os.chdir("..")
+            os.system("rm -R " + media)
+            os.chdir(s['crawler'])
+            # os.system("rm " + filename)
+            os.chdir(mydir)
+
+        os.chdir("..")
+        os.chdir("..")
+
+# print today.year
+#	scrapy crawl noticias -t json -o $y-$m-$d.json -a year=$y -a month=$m -a day=$d      # ejecucion del crawler correspondiente segun el sitio
--- a/crawler_script/tracker_by_day.py
+++ b/crawler_script/tracker_by_day.py
+#!/usr/bin/python
+# -*- coding: utf-8 -*-
+
+"""
+Descarga las noticias de un sitio desde entre dos fechas especificas para medios del tipo 'descarga_por_dia'.
+USO:
+tracker.py data.json
+"""
+
+import sys
+import json
+import os
+import datetime
+
+
+# today = datetime.datetime.now()
+baseDir = "/home/geoint/M3NAS/noticias/"
+scrapyDir = "/home/geoint/crawlersNoticias/"
+with open(sys.argv[1]) as data_file:
+    siteList = json.load(data_file)
+    os.chdir(baseDir)
+
+    for s in siteList:
+        desde = datetime.datetime.strptime(s['desde'], "%d-%m-%Y")
+        hasta = datetime.datetime.strptime(s['hasta'], "%d-%m-%Y")
+        print str(s['nombre'] +", desde:" + desde.strftime("%Y-%m-%d"))
+        media = s['crawler'][s['crawler'].rfind("/")+1:]
+        try:
+            os.makedirs(media)
+        except:
+            print "ok"
+        os.chdir(media)
+
+        # lstYears = os.listdir(".")
+        # lstYears.sort()
+        year = desde.year
+        # if len(lstYears) > 0:
+        #     year = int(lstYears[len(lstYears)-1])
+
+        for y in range(year, hasta.year+1):
+            print y
+            try:
+                os.makedirs(str(y))
+            except:
+                print "ok"
+
+            os.chdir(str(y))
+#			print os.getcwd()
+
+            # lstDays = os.listdir(".")
+            # lstDays = [l for l in lstDays if not l.startswith('.')]
+            # lstDays.sort()
+            # print lstDays
+
+            day = desde.timetuple().tm_yday
+            print day
+            currentDate = desde
+            # if len(lstDays) > 0:
+            #     strDate = lstDays[len(lstDays)-1]
+            #     strDate = strDate[:strDate.find(".")]
+            #     currentDate = datetime.datetime.strptime(strDate, '%Y-%m-%d')
+            #     day = currentDate.timetuple().tm_yday
+            # elif y != desde.year:
+            if y != desde.year:
+                currentDate = datetime.datetime.strptime(str(y)+"-01-01", '%Y-%m-%d')
+                day = 1
+
+            for d in range(day, ((datetime.date(y,12,31)-datetime.date(y,1,1)).days + 1 if hasta.year!=y else hasta.timetuple().tm_yday)+1):
+                filename = currentDate.strftime('%Y-%m-%d')+".json"
+                scrapycommand = "scrapy crawl noticias --nolog -s filename=" + filename + " -a year="+str(currentDate.year)+ " -a month="+str(currentDate.month)+" -a day="+str(currentDate.day)
+                mydir = os.getcwd()
+                print mydir
+                os.chdir(scrapyDir+s['crawler'])
+                print media
+                print scrapycommand
+                os.system(scrapycommand)
+                fileSize = os.stat(filename).st_size
+                if fileSize <= 3: os.system("rm " + filename)
+                else: os.system("mv " + filename + " " + mydir)
+                os.chdir(mydir)
+                currentDate = currentDate + datetime.timedelta(days=1)
+
+            os.chdir("..")
+
+        os.chdir("..")
+# print hasta.year
+#	scrapy crawl noticias -t json -o $y-$m-$d.json -a year=$y -a month=$m -a day=$d      # ejecucion del crawler correspondiente segun el sitio
--- a/crawler_script/tracker_proceso.py
+++ b/crawler_script/tracker_proceso.py
+#!/usr/bin/python
+# -*- coding: utf-8 -*-
+
+"""
+    Script para el trackeo del medio PROCESO.
+"""
+
+import sys
+import os
+
+
+
+baseDir   = "/home/geoint/M3NAS/noticias/"
+scrapyDir = "/home/geoint/crawlersNoticias/"
+s = {"crawler": "descarga_por_mes/proceso"}
+
+media = s['crawler'][s['crawler'].rfind("/")+1:]
+
+os.chdir(baseDir)
+
+try:
+    os.makedirs(media)
+except:
+    print "ok"
+
+os.chdir(media)
+
+# rango va de 1976 a 2018
+for year in xrange(1976, 2019):
+    try:
+        os.makedirs(str(year))
+    except:
+        print "ok"
+
+    os.chdir(str(year))
+    filename = str(year) + ".json"
+
+    scrapycommand = "scrapy crawl noticias --nolog -s filename={0} -a year={1}".format(filename, str(year))
+
+    mydir = os.getcwd()
+    print mydir
+    os.chdir(scrapyDir + s['crawler'])
+    print media
+    print scrapycommand
+    os.system(scrapycommand)
+    fileSize = os.stat(filename).st_size
+    if fileSize <= 3: os.system("rm " + filename)
+    else:
+        os.chdir(scrapyDir)
+        sys_command = "python3 parse_date_files.py {0} {1}".format(s['crawler'], filename)
+        os.system(sys_command)
+        os.chdir(media)
+        mediaYears = os.listdir(".")
+        mediaYears.sort()
+
+        for yy in mediaYears:
+            os.chdir(yy)
+            try:
+                os.makedirs(baseDir + media + "/" + yy)
+            except:
+                pass
+            mediaDays = os.listdir(".")
+            mediaDays = [l for l in mediaDays if not l.startswith('.')]
+            mediaDays.sort()
+
+            for dd in mediaDays:
+                os.system("mv " + dd + " " + baseDir + media + "/" + yy)
+
+            os.chdir("..")
+            os.system("rm -R " + yy)
+
+        os.chdir("..")
+        os.system("rm -R " + media)
+        os.chdir(s['crawler'])
+        os.system("rm " + filename)
+        os.chdir(mydir)
+
+    os.chdir("..")
+    # os.chdir("..")
--- a/deprecated_versions/laJornada_deprecated/laJornada/__init__.py
+++ b/deprecated_versions/laJornada_deprecated/laJornada/__init__.py
--- a/deprecated_versions/laJornada_deprecated/laJornada/items.py
+++ b/deprecated_versions/laJornada_deprecated/laJornada/items.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your scraped items
+#
+# See documentation in:
+# http://doc.scrapy.org/en/latest/topics/items.html
+
+import scrapy
+
+
+class NoticiasItem(scrapy.Item):
+    # define the fields for your item here like:
+    # name = scrapy.Field()
+    title = scrapy.Field()
+    text = scrapy.Field()
+    date = scrapy.Field()
+    location = scrapy.Field()
+    author = scrapy.Field()
+    topic = scrapy.Field()
+    url = scrapy.Field()
--- a/deprecated_versions/laJornada_deprecated/laJornada/middlewares.py
+++ b/deprecated_versions/laJornada_deprecated/laJornada/middlewares.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your spider middleware
+#
+# See documentation in:
+# http://doc.scrapy.org/en/latest/topics/spider-middleware.html
+
+from scrapy import signals
+
+
+class LajornadaSpiderMiddleware(object):
+    # Not all methods need to be defined. If a method is not defined,
+    # scrapy acts as if the spider middleware does not modify the
+    # passed objects.
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # This method is used by Scrapy to create your spiders.
+        s = cls()
+        crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
+        return s
+
+    def process_spider_input(response, spider):
+        # Called for each response that goes through the spider
+        # middleware and into the spider.
+
+        # Should return None or raise an exception.
+        return None
+
+    def process_spider_output(response, result, spider):
+        # Called with the results returned from the Spider, after
+        # it has processed the response.
+
+        # Must return an iterable of Request, dict or Item objects.
+        for i in result:
+            yield i
+
+    def process_spider_exception(response, exception, spider):
+        # Called when a spider or process_spider_input() method
+        # (from other spider middleware) raises an exception.
+
+        # Should return either None or an iterable of Response, dict
+        # or Item objects.
+        pass
+
+    def process_start_requests(start_requests, spider):
+        # Called with the start requests of the spider, and works
+        # similarly to the process_spider_output() method, except
+        # that it doesn’t have a response associated.
+
+        # Must return only requests (not items).
+        for r in start_requests:
+            yield r
+
+    def spider_opened(self, spider):
+        spider.logger.info('Spider opened: %s' % spider.name)
--- a/deprecated_versions/laJornada_deprecated/laJornada/pipelines.py
+++ b/deprecated_versions/laJornada_deprecated/laJornada/pipelines.py
+# -*- coding: utf-8 -*-
+
+# Define your item pipelines here
+#
+# Don't forget to add your pipeline to the ITEM_PIPELINES setting
+# See: http://doc.scrapy.org/en/latest/topics/item-pipeline.html
+
+import json
+from collections import OrderedDict
+
+
+class JsonWriterPipeline(object):
+
+    def __init__(self, filename):
+        self.filename = filename
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # Here you get whatever value was passed through the "filename" command line parameter
+        settings = crawler.settings
+        filename = settings.get('filename')
+
+        # Instantiate the pipeline with the file name
+        return cls(filename)
+
+    def open_spider(self, spider):
+        self.counter = 0
+        self.file = open(self.filename, 'w')
+        self.file.write("[")
+
+    def close_spider(self, spider):
+        self.file.write("]")
+        self.file.close()
+
+    def process_item(self, item, spider):
+        # print("this is my item", item)
+        row = []
+        try:
+            row.append(("date", item['date']))
+        except:
+            pass
+        try:
+            row.append(("topic", item['topic']))
+        except:
+            pass
+        try:
+            row.append(("title", item['title']))
+        except:
+            pass
+        try:
+            row.append(("author", item['author']))
+        except:
+            pass
+        try:
+            row.append(("location", item['location']))
+        except:
+            pass
+        try:
+            row.append(("text", item['text']))
+        except:
+            pass
+        try:
+            row.append(("url", item['url']))
+        except:
+            pass
+
+        line = OrderedDict(row)
+
+        self.counter += 1
+        if self.counter == 1:
+            self.file.write(json.dumps(line))
+        elif self.counter > 1:
+            self.file.write(",\n" + json.dumps(line))
+
+        return item
--- a/deprecated_versions/laJornada_deprecated/laJornada/settings.py
+++ b/deprecated_versions/laJornada_deprecated/laJornada/settings.py
+# -*- coding: utf-8 -*-
+
+# Scrapy settings for laJornada project
+#
+# For simplicity, this file contains only settings considered important or
+# commonly used. You can find more settings consulting the documentation:
+#
+#     http://doc.scrapy.org/en/latest/topics/settings.html
+#     http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html
+#     http://scrapy.readthedocs.org/en/latest/topics/spider-middleware.html
+
+BOT_NAME = 'laJornada'
+
+SPIDER_MODULES = ['laJornada.spiders']
+NEWSPIDER_MODULE = 'laJornada.spiders'
+
+
+# Crawl responsibly by identifying yourself (and your website) on the user-agent
+#USER_AGENT = 'laJornada (+http://www.yourdomain.com)'
+
+# Obey robots.txt rules
+# ROBOTSTXT_OBEY = True
+
+# Configure maximum concurrent requests performed by Scrapy (default: 16)
+#CONCURRENT_REQUESTS = 32
+
+# Configure a delay for requests for the same website (default: 0)
+# See http://scrapy.readthedocs.org/en/latest/topics/settings.html#download-delay
+# See also autothrottle settings and docs
+DOWNLOAD_DELAY = 0.5
+# The download delay setting will honor only one of:
+#CONCURRENT_REQUESTS_PER_DOMAIN = 16
+#CONCURRENT_REQUESTS_PER_IP = 16
+
+# Disable cookies (enabled by default)
+COOKIES_ENABLED = False
+
+# Disable Telnet Console (enabled by default)
+#TELNETCONSOLE_ENABLED = False
+
+# Override the default request headers:
+#DEFAULT_REQUEST_HEADERS = {
+#   'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
+#   'Accept-Language': 'en',
+#}
+
+# Enable or disable spider middlewares
+# See http://scrapy.readthedocs.org/en/latest/topics/spider-middleware.html
+#SPIDER_MIDDLEWARES = {
+#    'laJornada.middlewares.LajornadaSpiderMiddleware': 543,
+#}
+
+# Enable or disable downloader middlewares
+# See http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html
+#DOWNLOADER_MIDDLEWARES = {
+#    'laJornada.middlewares.MyCustomDownloaderMiddleware': 543,
+#}
+
+# Enable or disable extensions
+# See http://scrapy.readthedocs.org/en/latest/topics/extensions.html
+#EXTENSIONS = {
+#    'scrapy.extensions.telnet.TelnetConsole': None,
+#}
+
+# Configure item pipelines
+# See http://scrapy.readthedocs.org/en/latest/topics/item-pipeline.html
+ITEM_PIPELINES = {
+   'laJornada.pipelines.JsonWriterPipeline': 300,
+}
+
+# Enable and configure the AutoThrottle extension (disabled by default)
+# See http://doc.scrapy.org/en/latest/topics/autothrottle.html
+#AUTOTHROTTLE_ENABLED = True
+# The initial download delay
+#AUTOTHROTTLE_START_DELAY = 5
+# The maximum download delay to be set in case of high latencies
+#AUTOTHROTTLE_MAX_DELAY = 60
+# The average number of requests Scrapy should be sending in parallel to
+# each remote server
+#AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0
+# Enable showing throttling stats for every response received:
+#AUTOTHROTTLE_DEBUG = False
+
+# Enable and configure HTTP caching (disabled by default)
+# See http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html#httpcache-middleware-settings
+#HTTPCACHE_ENABLED = True
+#HTTPCACHE_EXPIRATION_SECS = 0
+#HTTPCACHE_DIR = 'httpcache'
+#HTTPCACHE_IGNORE_HTTP_CODES = []
+#HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'
--- a/deprecated_versions/laJornada_deprecated/laJornada/spiders/__init__.py
+++ b/deprecated_versions/laJornada_deprecated/laJornada/spiders/__init__.py
+# This package will contain the spiders of your Scrapy project
+#
+# Please refer to the documentation for information on how to create and manage
+# your spiders.
--- a/deprecated_versions/laJornada_deprecated/laJornada/spiders/noticias.py
+++ b/deprecated_versions/laJornada_deprecated/laJornada/spiders/noticias.py
--- a/deprecated_versions/laJornada_deprecated/scrapy.cfg
+++ b/deprecated_versions/laJornada_deprecated/scrapy.cfg
+# Automatically created by: scrapy startproject
+#
+# For more information about the [deploy] section see:
+# https://scrapyd.readthedocs.org/en/latest/deploy.html
+
+[settings]
+default = laJornada.settings
+
+[deploy]
+#url = http://localhost:6800/
+project = laJornada
--- a/deprecated_versions/tribunaHn_deprecated/scrapy.cfg
+++ b/deprecated_versions/tribunaHn_deprecated/scrapy.cfg
+# Automatically created by: scrapy startproject
+#
+# For more information about the [deploy] section see:
+# https://scrapyd.readthedocs.org/en/latest/deploy.html
+
+[settings]
+default = tribunaHn.settings
+
+[deploy]
+#url = http://localhost:6800/
+project = tribunaHn
--- a/deprecated_versions/tribunaHn_deprecated/tribunaHn/__init__.py
+++ b/deprecated_versions/tribunaHn_deprecated/tribunaHn/__init__.py
--- a/deprecated_versions/tribunaHn_deprecated/tribunaHn/items.py
+++ b/deprecated_versions/tribunaHn_deprecated/tribunaHn/items.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your scraped items
+#
+# See documentation in:
+# http://doc.scrapy.org/en/latest/topics/items.html
+
+import scrapy
+
+
+class NoticiasItem(scrapy.Item):
+    # define the fields for your item here like:
+    # name = scrapy.Field()
+    title = scrapy.Field()
+    text = scrapy.Field()
+    date = scrapy.Field()
+    location = scrapy.Field()
+    author = scrapy.Field()
+    topic = scrapy.Field()
+    url = scrapy.Field()
--- a/deprecated_versions/tribunaHn_deprecated/tribunaHn/middlewares.py
+++ b/deprecated_versions/tribunaHn_deprecated/tribunaHn/middlewares.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your spider middleware
+#
+# See documentation in:
+# http://doc.scrapy.org/en/latest/topics/spider-middleware.html
+
+from scrapy import signals
+
+
+class TribunahnSpiderMiddleware(object):
+    # Not all methods need to be defined. If a method is not defined,
+    # scrapy acts as if the spider middleware does not modify the
+    # passed objects.
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # This method is used by Scrapy to create your spiders.
+        s = cls()
+        crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
+        return s
+
+    def process_spider_input(response, spider):
+        # Called for each response that goes through the spider
+        # middleware and into the spider.
+
+        # Should return None or raise an exception.
+        return None
+
+    def process_spider_output(response, result, spider):
+        # Called with the results returned from the Spider, after
+        # it has processed the response.
+
+        # Must return an iterable of Request, dict or Item objects.
+        for i in result:
+            yield i
+
+    def process_spider_exception(response, exception, spider):
+        # Called when a spider or process_spider_input() method
+        # (from other spider middleware) raises an exception.
+
+        # Should return either None or an iterable of Response, dict
+        # or Item objects.
+        pass
+
+    def process_start_requests(start_requests, spider):
+        # Called with the start requests of the spider, and works
+        # similarly to the process_spider_output() method, except
+        # that it doesn’t have a response associated.
+
+        # Must return only requests (not items).
+        for r in start_requests:
+            yield r
+
+    def spider_opened(self, spider):
+        spider.logger.info('Spider opened: %s' % spider.name)
--- a/deprecated_versions/tribunaHn_deprecated/tribunaHn/pipelines.py
+++ b/deprecated_versions/tribunaHn_deprecated/tribunaHn/pipelines.py
+# -*- coding: utf-8 -*-
+
+# Define your item pipelines here
+#
+# Don't forget to add your pipeline to the ITEM_PIPELINES setting
+# See: http://doc.scrapy.org/en/latest/topics/item-pipeline.html
+
+import json
+from collections import OrderedDict
+
+
+class JsonWriterPipeline(object):
+
+    def __init__(self, filename):
+        self.filename = filename
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # Here you get whatever value was passed through the "filename" command line parameter
+        settings = crawler.settings
+        filename = settings.get('filename')
+
+        # Instantiate the pipeline with the file name
+        return cls(filename)
+
+    def open_spider(self, spider):
+        self.counter = 0
+        self.file = open(self.filename, 'w')
+        self.file.write("[")
+
+    def close_spider(self, spider):
+        self.file.write("]")
+        self.file.close()
+
+    def process_item(self, item, spider):
+        # print("this is my item", item)
+        row = []
+        try:
+            row.append(("date", item['date']))
+        except:
+            pass
+        try:
+            row.append(("topic", item['topic']))
+        except:
+            pass
+        try:
+            row.append(("title", item['title']))
+        except:
+            pass
+        try:
+            row.append(("author", item['author']))
+        except:
+            pass
+        try:
+            row.append(("location", item['location']))
+        except:
+            pass
+        try:
+            row.append(("text", item['text']))
+        except:
+            pass
+        try:
+            row.append(("url", item['url']))
+        except:
+            pass
+
+        line = OrderedDict(row)
+
+        self.counter += 1
+        if self.counter == 1:
+            self.file.write(json.dumps(line))
+        elif self.counter > 1:
+            self.file.write(",\n" + json.dumps(line))
+
+        return item
--- a/deprecated_versions/tribunaHn_deprecated/tribunaHn/settings.py
+++ b/deprecated_versions/tribunaHn_deprecated/tribunaHn/settings.py
+# -*- coding: utf-8 -*-
+
+# Scrapy settings for tribunaHn project
+#
+# For simplicity, this file contains only settings considered important or
+# commonly used. You can find more settings consulting the documentation:
+#
+#     http://doc.scrapy.org/en/latest/topics/settings.html
+#     http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html
+#     http://scrapy.readthedocs.org/en/latest/topics/spider-middleware.html
+
+BOT_NAME = 'tribunaHn'
+
+SPIDER_MODULES = ['tribunaHn.spiders']
+NEWSPIDER_MODULE = 'tribunaHn.spiders'
+
+
+# Crawl responsibly by identifying yourself (and your website) on the user-agent
+#USER_AGENT = 'tribunaHn (+http://www.yourdomain.com)'
+
+# Obey robots.txt rules
+# ROBOTSTXT_OBEY = True
+
+# Configure maximum concurrent requests performed by Scrapy (default: 16)
+#CONCURRENT_REQUESTS = 32
+
+# Configure a delay for requests for the same website (default: 0)
+# See http://scrapy.readthedocs.org/en/latest/topics/settings.html#download-delay
+# See also autothrottle settings and docs
+DOWNLOAD_DELAY = 0.5
+# The download delay setting will honor only one of:
+#CONCURRENT_REQUESTS_PER_DOMAIN = 16
+#CONCURRENT_REQUESTS_PER_IP = 16
+
+# Disable cookies (enabled by default)
+COOKIES_ENABLED = False
+
+# Disable Telnet Console (enabled by default)
+#TELNETCONSOLE_ENABLED = False
+
+# Override the default request headers:
+#DEFAULT_REQUEST_HEADERS = {
+#   'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
+#   'Accept-Language': 'en',
+#}
+
+# Enable or disable spider middlewares
+# See http://scrapy.readthedocs.org/en/latest/topics/spider-middleware.html
+#SPIDER_MIDDLEWARES = {
+#    'tribunaHn.middlewares.TribunahnSpiderMiddleware': 543,
+#}
+
+# Enable or disable downloader middlewares
+# See http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html
+#DOWNLOADER_MIDDLEWARES = {
+#    'tribunaHn.middlewares.MyCustomDownloaderMiddleware': 543,
+#}
+
+# Enable or disable extensions
+# See http://scrapy.readthedocs.org/en/latest/topics/extensions.html
+#EXTENSIONS = {
+#    'scrapy.extensions.telnet.TelnetConsole': None,
+#}
+
+# Configure item pipelines
+# See http://scrapy.readthedocs.org/en/latest/topics/item-pipeline.html
+ITEM_PIPELINES = {
+   'tribunaHn.pipelines.JsonWriterPipeline': 300,
+}
+
+# Enable and configure the AutoThrottle extension (disabled by default)
+# See http://doc.scrapy.org/en/latest/topics/autothrottle.html
+#AUTOTHROTTLE_ENABLED = True
+# The initial download delay
+#AUTOTHROTTLE_START_DELAY = 5
+# The maximum download delay to be set in case of high latencies
+#AUTOTHROTTLE_MAX_DELAY = 60
+# The average number of requests Scrapy should be sending in parallel to
+# each remote server
+#AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0
+# Enable showing throttling stats for every response received:
+#AUTOTHROTTLE_DEBUG = False
+
+# Enable and configure HTTP caching (disabled by default)
+# See http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html#httpcache-middleware-settings
+#HTTPCACHE_ENABLED = True
+#HTTPCACHE_EXPIRATION_SECS = 0
+#HTTPCACHE_DIR = 'httpcache'
+#HTTPCACHE_IGNORE_HTTP_CODES = []
+#HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'
--- a/deprecated_versions/tribunaHn_deprecated/tribunaHn/spiders/__init__.py
+++ b/deprecated_versions/tribunaHn_deprecated/tribunaHn/spiders/__init__.py
+# This package will contain the spiders of your Scrapy project
+#
+# Please refer to the documentation for information on how to create and manage
+# your spiders.
--- a/deprecated_versions/tribunaHn_deprecated/tribunaHn/spiders/noticias.py
+++ b/deprecated_versions/tribunaHn_deprecated/tribunaHn/spiders/noticias.py
+# -*- coding: utf-8 -*-
+
+"""
+    ===============================================================================
+
+    THIS VERSION OF La Tribuna Honduras IS NOW DEPRECATED SINCE THE SITE'S WEB PAGE
+    CHANGED ITS ACCESS TO ACCES BY DAY.
+    THE NEW VERSION CAN BE FOUNd IN THE descarga_por_dia/foraneos FOLDER.
+
+    ===============================================================================
+"""
+
+import scrapy, re, json
+from datetime import date
+from tribunaHn.items import NoticiasItem
+
+"""
+MEDIO:
+La Tribuna, Honduras
+USO:
+// Si se quiere obtener todas las noticias desde las más actuales hasta las más antiguas. //
+scrapy crawl noticias --nolog -s filename=noticias.json
+-------------------------------------------------------------------------------------------------
+// Si se quiere obtener todas las noticias desde las más actuales hasta una fecha específica. //
+scrapy crawl noticias --nolog -s filename=noticias.json -a year=2018 -a month=2 -a day=29
+-------------------------------------------------------------------------------------------------
+Después será necesario hacer uso del archivo parse_date_files.py para que las noticias contenidas
+en noticias.json sean separadas en archivos por fecha.
+"""
+
+TAG_RE = re.compile(r'<[^>]+>')
+def remove_tags(text):
+    return TAG_RE.sub('', text)
+
+DAT_RE = re.compile(r'\d{4}\/\d{2}\/\d{2}')
+
+
+class ImportantData(scrapy.Item):
+    section = scrapy.Field()
+    page = scrapy.Field()
+
+
+class QuotesSpider(scrapy.Spider):
+    name = "noticias"
+
+    def start_requests(self):
+        self.year = getattr(self, "year", None)
+        self.month = getattr(self, "month", None)
+        self.day = getattr(self, "day", None)
+
+        if self.year is not None and self.month is not None and self.day is not None:
+            self.stopDate = date(int(self.year), int(self.month), int(self.day))
+        else:
+            self.stopDate = None
+
+        baseURL = "http://www.latribuna.hn/"
+
+        sectionList = ["noticias", "honduras", "sociedad", "cafeteando", "dejenme-decirles", "desde-usa",
+                       "ecomentarios", "el-cambio-climatico", "el-dossier-de-atenea", "enfoques",
+                       "pecadillos-idiomaticos", "pildoritas", "columnistas", "editorial", "tribuna-del-pueblo",
+                       "anales-historicos", "cine", "dejando-huellas", "dia-7", "dominicales", "done-un-aula",
+                       "especiales-lt", "la-cobra-pregunta", "la-tribuna-agropecuaria", "la-tribuna-cultural",
+                       "nuestro-orgullo", "turismo"]
+        # sectionList = ["noticias"]
+
+        for s in sectionList:
+            yield scrapy.Request(url=baseURL + s, callback=self.parse)
+
+
+    def parse(self, response):
+        CONTINUE_SEARCHING = True
+        linkList = response.xpath('//div[@id="main"]').css('article.linkbox').xpath('./a[@itemprop="url"]/@href').extract()
+        linkList.extend(response.xpath('//div[@id="main"]').css('div.bottom-margin').css('div.col-sm-6').xpath('./h3/a[@itemprop="url"]/@href').extract())
+
+        if self.stopDate is None:
+            for link in linkList:
+                yield scrapy.Request(url=link, callback=self.parse_item)
+
+        else:
+            for link in linkList:
+                res = DAT_RE.search(link)
+                if res:
+                    dat = map(int, res.group(0).split("/"))
+                    newsDate = date(dat[0], dat[1], dat[2])
+                    if newsDate >= self.stopDate:
+                        yield scrapy.Request(url=link, callback=self.parse_item)
+
+                    else:
+                        CONTINUE_SEARCHING = False
+                        break
+
+        if CONTINUE_SEARCHING:
+            nextPage = response.xpath('//span[@class="next"]/a/@href').extract_first()
+            if nextPage is not None:
+                yield scrapy.Request(url=nextPage, callback=self.parse)
+
+
+    def parse_item(self, response):
+        item = NoticiasItem()
+        text = ''
+
+        "La fecha obtenida ya incluye formato y zona horaria"
+        item['date'] = response.xpath('//meta[@property="article:published_time"]/@content').extract_first()
+        item['title'] = remove_tags(response.xpath('//header/h1[@itemprop="name"]').extract_first())
+
+        try:
+            topic = response.xpath('//aside[@class="tags"]/ul/li/a/text()').extract()[0]
+        except:
+            topic = None
+        item['topic'] = topic
+
+        for p in response.css('div.article-post-content').css('p').extract():
+            text += remove_tags(p) + "\n"
+
+        item['text'] = text.strip()
+
+        item['url'] = response.url
+
+        yield item
--- a/deprecated_versions/yucatanALaMano_20190918/2017-03-22.json
+++ b/deprecated_versions/yucatanALaMano_20190918/2017-03-22.json
+[]
\ No newline at end of file
--- a/deprecated_versions/yucatanALaMano_20190918/2019-09-17.json
+++ b/deprecated_versions/yucatanALaMano_20190918/2019-09-17.json
+[]
\ No newline at end of file
--- a/deprecated_versions/yucatanALaMano_20190918/scrapy.cfg
+++ b/deprecated_versions/yucatanALaMano_20190918/scrapy.cfg
+# Automatically created by: scrapy startproject
+#
+# For more information about the [deploy] section see:
+# https://scrapyd.readthedocs.org/en/latest/deploy.html
+
+[settings]
+default = yucatanALaMano.settings
+
+[deploy]
+#url = http://localhost:6800/
+project = yucatanALaMano
--- a/deprecated_versions/yucatanALaMano_20190918/yucatanALaMano/__init__.py
+++ b/deprecated_versions/yucatanALaMano_20190918/yucatanALaMano/__init__.py
--- a/deprecated_versions/yucatanALaMano_20190918/yucatanALaMano/items.py
+++ b/deprecated_versions/yucatanALaMano_20190918/yucatanALaMano/items.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your scraped items
+#
+# See documentation in:
+# http://doc.scrapy.org/en/latest/topics/items.html
+
+import scrapy
+
+
+class NoticiasItem(scrapy.Item):
+    # define the fields for your item here like:
+    # name = scrapy.Field()
+    title = scrapy.Field()
+    text = scrapy.Field()
+    date = scrapy.Field()
+    location = scrapy.Field()
+    author = scrapy.Field()
+    topic = scrapy.Field()
+    url = scrapy.Field()
--- a/deprecated_versions/yucatanALaMano_20190918/yucatanALaMano/middlewares.py
+++ b/deprecated_versions/yucatanALaMano_20190918/yucatanALaMano/middlewares.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your spider middleware
+#
+# See documentation in:
+# http://doc.scrapy.org/en/latest/topics/spider-middleware.html
+
+from scrapy import signals
+
+
+class YucatanalamanoSpiderMiddleware(object):
+    # Not all methods need to be defined. If a method is not defined,
+    # scrapy acts as if the spider middleware does not modify the
+    # passed objects.
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # This method is used by Scrapy to create your spiders.
+        s = cls()
+        crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
+        return s
+
+    def process_spider_input(response, spider):
+        # Called for each response that goes through the spider
+        # middleware and into the spider.
+
+        # Should return None or raise an exception.
+        return None
+
+    def process_spider_output(response, result, spider):
+        # Called with the results returned from the Spider, after
+        # it has processed the response.
+
+        # Must return an iterable of Request, dict or Item objects.
+        for i in result:
+            yield i
+
+    def process_spider_exception(response, exception, spider):
+        # Called when a spider or process_spider_input() method
+        # (from other spider middleware) raises an exception.
+
+        # Should return either None or an iterable of Response, dict
+        # or Item objects.
+        pass
+
+    def process_start_requests(start_requests, spider):
+        # Called with the start requests of the spider, and works
+        # similarly to the process_spider_output() method, except
+        # that it doesn’t have a response associated.
+
+        # Must return only requests (not items).
+        for r in start_requests:
+            yield r
+
+    def spider_opened(self, spider):
+        spider.logger.info('Spider opened: %s' % spider.name)
--- a/deprecated_versions/yucatanALaMano_20190918/yucatanALaMano/pipelines.py
+++ b/deprecated_versions/yucatanALaMano_20190918/yucatanALaMano/pipelines.py
+# -*- coding: utf-8 -*-
+
+# Define your item pipelines here
+#
+# Don't forget to add your pipeline to the ITEM_PIPELINES setting
+# See: http://doc.scrapy.org/en/latest/topics/item-pipeline.html
+
+import json
+from collections import OrderedDict
+
+
+class JsonWriterPipeline(object):
+
+    def __init__(self, filename):
+        self.filename = filename
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # Here you get whatever value was passed through the "filename" command line parameter
+        settings = crawler.settings
+        filename = settings.get('filename')
+
+        # Instantiate the pipeline with the file name
+        return cls(filename)
+
+    def open_spider(self, spider):
+        self.counter = 0
+        self.file = open(self.filename, 'w')
+        self.file.write("[")
+
+    def close_spider(self, spider):
+        self.file.write("]")
+        self.file.close()
+
+    def process_item(self, item, spider):
+        # print("this is my item", item)
+        row = []
+        try:
+            row.append(("date", item['date']))
+        except:
+            pass
+        try:
+            row.append(("topic", item['topic']))
+        except:
+            pass
+        try:
+            row.append(("title", item['title']))
+        except:
+            pass
+        try:
+            row.append(("author", item['author']))
+        except:
+            pass
+        try:
+            row.append(("location", item['location']))
+        except:
+            pass
+        try:
+            row.append(("text", item['text']))
+        except:
+            pass
+        try:
+            row.append(("url", item['url']))
+        except:
+            pass
+
+        line = OrderedDict(row)
+
+        self.counter += 1
+        if self.counter == 1:
+            self.file.write(json.dumps(line))
+        elif self.counter > 1:
+            self.file.write(",\n" + json.dumps(line))
+
+        return item
--- a/deprecated_versions/yucatanALaMano_20190918/yucatanALaMano/settings.py
+++ b/deprecated_versions/yucatanALaMano_20190918/yucatanALaMano/settings.py
+# -*- coding: utf-8 -*-
+
+# Scrapy settings for yucatanALaMano project
+#
+# For simplicity, this file contains only settings considered important or
+# commonly used. You can find more settings consulting the documentation:
+#
+#     http://doc.scrapy.org/en/latest/topics/settings.html
+#     http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html
+#     http://scrapy.readthedocs.org/en/latest/topics/spider-middleware.html
+
+BOT_NAME = 'yucatanALaMano'
+
+SPIDER_MODULES = ['yucatanALaMano.spiders']
+NEWSPIDER_MODULE = 'yucatanALaMano.spiders'
+
+
+# Crawl responsibly by identifying yourself (and your website) on the user-agent
+#USER_AGENT = 'yucatanALaMano (+http://www.yourdomain.com)'
+
+# Obey robots.txt rules
+# ROBOTSTXT_OBEY = True
+
+# Configure maximum concurrent requests performed by Scrapy (default: 16)
+#CONCURRENT_REQUESTS = 32
+
+# Configure a delay for requests for the same website (default: 0)
+# See http://scrapy.readthedocs.org/en/latest/topics/settings.html#download-delay
+# See also autothrottle settings and docs
+DOWNLOAD_DELAY = 0.5
+# The download delay setting will honor only one of:
+#CONCURRENT_REQUESTS_PER_DOMAIN = 16
+#CONCURRENT_REQUESTS_PER_IP = 16
+
+# Disable cookies (enabled by default)
+COOKIES_ENABLED = False
+
+# Disable Telnet Console (enabled by default)
+#TELNETCONSOLE_ENABLED = False
+
+# Override the default request headers:
+#DEFAULT_REQUEST_HEADERS = {
+#   'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
+#   'Accept-Language': 'en',
+#}
+
+# Enable or disable spider middlewares
+# See http://scrapy.readthedocs.org/en/latest/topics/spider-middleware.html
+#SPIDER_MIDDLEWARES = {
+#    'yucatanALaMano.middlewares.YucatanalamanoSpiderMiddleware': 543,
+#}
+
+# Enable or disable downloader middlewares
+# See http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html
+#DOWNLOADER_MIDDLEWARES = {
+#    'yucatanALaMano.middlewares.MyCustomDownloaderMiddleware': 543,
+#}
+
+# Enable or disable extensions
+# See http://scrapy.readthedocs.org/en/latest/topics/extensions.html
+#EXTENSIONS = {
+#    'scrapy.extensions.telnet.TelnetConsole': None,
+#}
+
+# Configure item pipelines
+# See http://scrapy.readthedocs.org/en/latest/topics/item-pipeline.html
+ITEM_PIPELINES = {
+   'yucatanALaMano.pipelines.JsonWriterPipeline': 300,
+}
+
+# Enable and configure the AutoThrottle extension (disabled by default)
+# See http://doc.scrapy.org/en/latest/topics/autothrottle.html
+#AUTOTHROTTLE_ENABLED = True
+# The initial download delay
+#AUTOTHROTTLE_START_DELAY = 5
+# The maximum download delay to be set in case of high latencies
+#AUTOTHROTTLE_MAX_DELAY = 60
+# The average number of requests Scrapy should be sending in parallel to
+# each remote server
+#AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0
+# Enable showing throttling stats for every response received:
+#AUTOTHROTTLE_DEBUG = False
+
+# Enable and configure HTTP caching (disabled by default)
+# See http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html#httpcache-middleware-settings
+#HTTPCACHE_ENABLED = True
+#HTTPCACHE_EXPIRATION_SECS = 0
+#HTTPCACHE_DIR = 'httpcache'
+#HTTPCACHE_IGNORE_HTTP_CODES = []
+#HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'
--- a/deprecated_versions/yucatanALaMano_20190918/yucatanALaMano/spiders/__init__.py
+++ b/deprecated_versions/yucatanALaMano_20190918/yucatanALaMano/spiders/__init__.py
+# This package will contain the spiders of your Scrapy project
+#
+# Please refer to the documentation for information on how to create and manage
+# your spiders.
--- a/deprecated_versions/yucatanALaMano_20190918/yucatanALaMano/spiders/noticias.py
+++ b/deprecated_versions/yucatanALaMano_20190918/yucatanALaMano/spiders/noticias.py
+# -*- coding: utf-8 -*-
+import scrapy, re
+from yucatanALaMano.items import NoticiasItem
+
+"""
+MEDIO:
+Yucatán a la Mano, Yuc.
+USO:
+scrapy crawl noticias --nolog -s filename=2017-03-22.json -a year=2017 -a month=3 -a day=22
+"""
+
+TAG_RE = re.compile(r'<[^>]+>')
+def remove_tags(text):
+    return TAG_RE.sub('', text)
+
+
+class QuotesSpider(scrapy.Spider):
+    name = "noticias"
+
+    def start_requests(self):
+        year = getattr(self, 'year', None)
+        month = getattr(self, 'month', None)
+        day = getattr(self, 'day', None)
+
+        # self.baseURL = "http://www.yucatanalamano.com/" + year + "/" + month + "/" + day
+        # self.baseURL = "http://yucatanalamano.com/" + year + "/" + month + "/" + day
+        urlList = ["http://www.yucatanalamano.com/" + year + "/" + month + "/" + day,
+                   "http://yucatanalamano.com/" + year + "/" + month + "/" + day]
+
+        for url in urlList:
+            yield scrapy.Request(url=url, callback=self.parse)
+
+
+    def parse(self, response):
+        yield scrapy.Request(url=response.url, callback=self.parse_page, dont_filter=True)
+
+        pagination = response.css('div.pagination').css('a::attr(href)').extract()
+        if len(pagination) > 0:
+            pagination = pagination[-1].strip('/')
+            pages = int(pagination[pagination.rfind('/')+1:])
+
+            for page in range(1, pages):
+                yield scrapy.Request(url=response.url+"/page/"+str(page+1), callback=self.parse_page)
+
+
+    def parse_page(self, response):
+        for link in response.css('div.bp-head').css('h2').css('a::attr(href)').extract():
+            yield scrapy.Request(url=link, callback=self.parse_item)
+
+
+    def parse_item(self, response):
+        item = NoticiasItem()
+        text = ''
+        title = response.xpath('//div[@class="main-col"]/div[@itemprop="name"]/text()').extract_first()
+        if title is None:
+            title = response.xpath('//div[@class="main-col"]').css('h1').extract_first()
+        if title is not None:
+            item['title'] = remove_tags(title)
+        else:
+            item['title'] = title
+
+        d = response.css('div.mom-post-meta').css('span').css('time::attr(datetime)').extract_first()
+        ## '-06:00' corresponde al UTC-6, zona horaria de yucatan (centro de mexico)
+        if d[-6:] != '-06:00':
+            d = d[:-6] + '-06:00'
+        item['date'] = d
+
+        item['topic'] = response.css('div.breadcrumbs-plus').css('span').css('a::attr(title)').extract_first()
+
+        for paragraph in response.css('div.entry-content').css('p').extract():
+            text += remove_tags(paragraph) + '\n'
+        item['text'] = text
+        item['url'] = response.url
+
+        # print item['title']
+        yield item
+
--- a/descarga_hacia_atras/diarioDeChiapas/diarioDeChiapas/__init__.py
+++ b/descarga_hacia_atras/diarioDeChiapas/diarioDeChiapas/__init__.py
--- a/descarga_hacia_atras/diarioDeChiapas/diarioDeChiapas/items.py
+++ b/descarga_hacia_atras/diarioDeChiapas/diarioDeChiapas/items.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your scraped items
+#
+# See documentation in:
+# https://doc.scrapy.org/en/latest/topics/items.html
+
+import scrapy
+
+
+class NoticiasItem(scrapy.Item):
+    # define the fields for your item here like:
+    # name = scrapy.Field()
+    title = scrapy.Field()
+    text = scrapy.Field()
+    date = scrapy.Field()
+    location = scrapy.Field()
+    author = scrapy.Field()
+    topic = scrapy.Field()
+    url = scrapy.Field()
--- a/descarga_hacia_atras/diarioDeChiapas/diarioDeChiapas/middlewares.py
+++ b/descarga_hacia_atras/diarioDeChiapas/diarioDeChiapas/middlewares.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your spider middleware
+#
+# See documentation in:
+# https://doc.scrapy.org/en/latest/topics/spider-middleware.html
+
+from scrapy import signals
+
+
+class DiariodechiapasSpiderMiddleware(object):
+    # Not all methods need to be defined. If a method is not defined,
+    # scrapy acts as if the spider middleware does not modify the
+    # passed objects.
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # This method is used by Scrapy to create your spiders.
+        s = cls()
+        crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
+        return s
+
+    def process_spider_input(self, response, spider):
+        # Called for each response that goes through the spider
+        # middleware and into the spider.
+
+        # Should return None or raise an exception.
+        return None
+
+    def process_spider_output(self, response, result, spider):
+        # Called with the results returned from the Spider, after
+        # it has processed the response.
+
+        # Must return an iterable of Request, dict or Item objects.
+        for i in result:
+            yield i
+
+    def process_spider_exception(self, response, exception, spider):
+        # Called when a spider or process_spider_input() method
+        # (from other spider middleware) raises an exception.
+
+        # Should return either None or an iterable of Response, dict
+        # or Item objects.
+        pass
+
+    def process_start_requests(self, start_requests, spider):
+        # Called with the start requests of the spider, and works
+        # similarly to the process_spider_output() method, except
+        # that it doesn’t have a response associated.
+
+        # Must return only requests (not items).
+        for r in start_requests:
+            yield r
+
+    def spider_opened(self, spider):
+        spider.logger.info('Spider opened: %s' % spider.name)
+
+
+class DiariodechiapasDownloaderMiddleware(object):
+    # Not all methods need to be defined. If a method is not defined,
+    # scrapy acts as if the downloader middleware does not modify the
+    # passed objects.
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # This method is used by Scrapy to create your spiders.
+        s = cls()
+        crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
+        return s
+
+    def process_request(self, request, spider):
+        # Called for each request that goes through the downloader
+        # middleware.
+
+        # Must either:
+        # - return None: continue processing this request
+        # - or return a Response object
+        # - or return a Request object
+        # - or raise IgnoreRequest: process_exception() methods of
+        #   installed downloader middleware will be called
+        return None
+
+    def process_response(self, request, response, spider):
+        # Called with the response returned from the downloader.
+
+        # Must either;
+        # - return a Response object
+        # - return a Request object
+        # - or raise IgnoreRequest
+        return response
+
+    def process_exception(self, request, exception, spider):
+        # Called when a download handler or a process_request()
+        # (from other downloader middleware) raises an exception.
+
+        # Must either:
+        # - return None: continue processing this exception
+        # - return a Response object: stops process_exception() chain
+        # - return a Request object: stops process_exception() chain
+        pass
+
+    def spider_opened(self, spider):
+        spider.logger.info('Spider opened: %s' % spider.name)
--- a/descarga_hacia_atras/diarioDeChiapas/diarioDeChiapas/pipelines.py
+++ b/descarga_hacia_atras/diarioDeChiapas/diarioDeChiapas/pipelines.py
+# -*- coding: utf-8 -*-
+
+# Define your item pipelines here
+#
+# Don't forget to add your pipeline to the ITEM_PIPELINES setting
+# See: https://doc.scrapy.org/en/latest/topics/item-pipeline.html
+
+import json
+from collections import OrderedDict
+
+
+class JsonWriterPipeline(object):
+
+    def __init__(self, filename):
+        self.filename = filename
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # Here you get whatever value was passed through the "filename" command line parameter
+        settings = crawler.settings
+        filename = settings.get('filename')
+
+        # Instantiate the pipeline with the file name
+        return cls(filename)
+
+    def open_spider(self, spider):
+        self.counter = 0
+        self.file = open(self.filename, 'w')
+        self.file.write("[")
+
+    def close_spider(self, spider):
+        self.file.write("]")
+        self.file.close()
+
+    def process_item(self, item, spider):
+        # print("this is my item", item)
+        row = []
+        try:
+            row.append(("date", item['date']))
+        except:
+            pass
+        try:
+            row.append(("topic", item['topic']))
+        except:
+            pass
+        try:
+            row.append(("title", item['title']))
+        except:
+            pass
+        try:
+            row.append(("author", item['author']))
+        except:
+            pass
+        try:
+            row.append(("location", item['location']))
+        except:
+            pass
+        try:
+            row.append(("text", item['text']))
+        except:
+            pass
+        try:
+            row.append(("url", item['url']))
+        except:
+            pass
+
+        line = OrderedDict(row)
+
+        self.counter += 1
+        if self.counter == 1:
+            self.file.write(json.dumps(line))
+        elif self.counter > 1:
+            self.file.write(",\n" + json.dumps(line))
+
+        return item
--- a/descarga_hacia_atras/diarioDeChiapas/diarioDeChiapas/settings.py
+++ b/descarga_hacia_atras/diarioDeChiapas/diarioDeChiapas/settings.py
+# -*- coding: utf-8 -*-
+
+# Scrapy settings for diarioDeChiapas project
+#
+# For simplicity, this file contains only settings considered important or
+# commonly used. You can find more settings consulting the documentation:
+#
+#     https://doc.scrapy.org/en/latest/topics/settings.html
+#     https://doc.scrapy.org/en/latest/topics/downloader-middleware.html
+#     https://doc.scrapy.org/en/latest/topics/spider-middleware.html
+
+BOT_NAME = 'diarioDeChiapas'
+
+SPIDER_MODULES = ['diarioDeChiapas.spiders']
+NEWSPIDER_MODULE = 'diarioDeChiapas.spiders'
+
+
+# Crawl responsibly by identifying yourself (and your website) on the user-agent
+#USER_AGENT = 'diarioDeChiapas (+http://www.yourdomain.com)'
+
+# Obey robots.txt rules
+# ROBOTSTXT_OBEY = True
+
+# Configure maximum concurrent requests performed by Scrapy (default: 16)
+#CONCURRENT_REQUESTS = 32
+
+# Configure a delay for requests for the same website (default: 0)
+# See https://doc.scrapy.org/en/latest/topics/settings.html#download-delay
+# See also autothrottle settings and docs
+DOWNLOAD_DELAY = 0.5
+# The download delay setting will honor only one of:
+#CONCURRENT_REQUESTS_PER_DOMAIN = 16
+#CONCURRENT_REQUESTS_PER_IP = 16
+
+# Disable cookies (enabled by default)
+COOKIES_ENABLED = False
+
+# Disable Telnet Console (enabled by default)
+#TELNETCONSOLE_ENABLED = False
+
+# Override the default request headers:
+#DEFAULT_REQUEST_HEADERS = {
+#   'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
+#   'Accept-Language': 'en',
+#}
+
+# Enable or disable spider middlewares
+# See https://doc.scrapy.org/en/latest/topics/spider-middleware.html
+#SPIDER_MIDDLEWARES = {
+#    'diarioDeChiapas.middlewares.DiariodechiapasSpiderMiddleware': 543,
+#}
+
+# Enable or disable downloader middlewares
+# See https://doc.scrapy.org/en/latest/topics/downloader-middleware.html
+#DOWNLOADER_MIDDLEWARES = {
+#    'diarioDeChiapas.middlewares.DiariodechiapasDownloaderMiddleware': 543,
+#}
+
+# Enable or disable extensions
+# See https://doc.scrapy.org/en/latest/topics/extensions.html
+#EXTENSIONS = {
+#    'scrapy.extensions.telnet.TelnetConsole': None,
+#}
+
+# Configure item pipelines
+# See https://doc.scrapy.org/en/latest/topics/item-pipeline.html
+ITEM_PIPELINES = {
+   'diarioDeChiapas.pipelines.JsonWriterPipeline': 300,
+}
+
+# Enable and configure the AutoThrottle extension (disabled by default)
+# See https://doc.scrapy.org/en/latest/topics/autothrottle.html
+#AUTOTHROTTLE_ENABLED = True
+# The initial download delay
+#AUTOTHROTTLE_START_DELAY = 5
+# The maximum download delay to be set in case of high latencies
+#AUTOTHROTTLE_MAX_DELAY = 60
+# The average number of requests Scrapy should be sending in parallel to
+# each remote server
+#AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0
+# Enable showing throttling stats for every response received:
+#AUTOTHROTTLE_DEBUG = False
+
+# Enable and configure HTTP caching (disabled by default)
+# See https://doc.scrapy.org/en/latest/topics/downloader-middleware.html#httpcache-middleware-settings
+#HTTPCACHE_ENABLED = True
+#HTTPCACHE_EXPIRATION_SECS = 0
+#HTTPCACHE_DIR = 'httpcache'
+#HTTPCACHE_IGNORE_HTTP_CODES = []
+#HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'
--- a/descarga_hacia_atras/diarioDeChiapas/diarioDeChiapas/spiders/__init__.py
+++ b/descarga_hacia_atras/diarioDeChiapas/diarioDeChiapas/spiders/__init__.py
+# This package will contain the spiders of your Scrapy project
+#
+# Please refer to the documentation for information on how to create and manage
+# your spiders.
--- a/descarga_hacia_atras/diarioDeChiapas/diarioDeChiapas/spiders/noticias.py
+++ b/descarga_hacia_atras/diarioDeChiapas/diarioDeChiapas/spiders/noticias.py
+# -*- coding: utf-8 -*-
+
+"""
+MEDIA:
+    Diario de Chiapas, Chiapas
+
+USAGE
+    $ cd diarioDeChiapas/
+    ------------------------------------------------------------------------------------------------------------
+    ## Get all the news from the most current to the oldest. It's necessary to use the parse_date_files.py file
+    for the news contained in noticias.json being splitted into files by date. ##
+    
+    $ scrapy crawl noticias --nolog -s filename=noticias.json
+    ------------------------------------------------------------------------------------------------------------
+    ## Get all the news from the most current to a specific date. ##
+    
+    $ scrapy crawl noticias --nolog -s filename=2018-08-30.json -a year=2018 -a month=8 -a day=30
+"""
+
+import scrapy, re, json
+from datetime import datetime, date
+from diarioDeChiapas.items import NoticiasItem
+
+
+TAG_RE = re.compile(r'<[^>]+>')
+def remove_tags(text):
+    return TAG_RE.sub('', text)
+
+
+
+class ImportantData(scrapy.Item):
+    """
+    Useful data for the flow of the implementation
+    """
+    to_next_page = scrapy.Field()
+    is_last_link = scrapy.Field()
+    news_section = scrapy.Field()
+    return_url   = scrapy.Field()
+
+
+
+class QuotesSpider(scrapy.Spider):
+    """
+    Basic Scrapy Spider class
+    """
+    name = "noticias"
+
+    def start_requests(self):
+        year  = getattr(self, "year", None)
+        month = getattr(self, "month", None)
+        day   = getattr(self, "day", None)
+
+        if year is not None and month is not None and day is not None:
+            self.stopDate = date(int(year), int(month), int(day))
+        else:
+            self.stopDate = None
+
+        baseURL = "http://www.diariodechiapas.com/landing/"
+
+        section_list = ["editorial", "portada", "metropoli", "region", "la-roja",
+                       "deportes", "boga", "ae", "trascendio"]
+        # section_list = ["editorial"]
+
+        if self.stopDate is None:
+            for s in section_list:
+                yield scrapy.Request(url=baseURL + s, callback=self.parse)
+
+        else:
+            for s in section_list:
+                flow_info = ImportantData()
+                flow_info['to_next_page'] = False
+                
+                request = scrapy.Request(url=baseURL + s, callback=self.parse_with_stop_date)
+                request.meta['item'] = flow_info
+                
+                yield request
+
+
+
+    def parse(self, response):
+        link_list = response.xpath('//section[@class="page__content"]').css('section.post').xpath('./a[@class="post__link"]/@href').extract()
+        section   = response.xpath('//section[@class="wrapper"]/h1').extract_first()
+        if section is not None : section = remove_tags(section)
+
+        for link in link_list:
+            flow_info = ImportantData()
+            flow_info['news_section'] = section
+
+            request = scrapy.Request(url=link, callback=self.parse_item)
+            request.meta['item'] = flow_info
+
+            yield request
+
+        next_page = response.css('div.wp-pagenavi').css('a.nextpostslink').css('::attr(href)').extract_first()
+        if next_page is not None:
+            yield scrapy.Request(url=next_page, callback=self.parse)
+
+
+
+    def parse_with_stop_date(self, response):
+        flow_info = response.meta['item']
+
+        if not flow_info['to_next_page']:
+            link_list = response.xpath('//section[@class="page__content"]').css('section.post').xpath('./a[@class="post__link"]/@href').extract()
+            section   = response.xpath('//section[@class="wrapper"]/h1').extract_first()
+            if section is not None : section = remove_tags(section)
+
+            for link in link_list:
+                flow_info = ImportantData()
+                flow_info['news_section'] = section
+                flow_info['return_url'] = response.url
+                
+                if link == link_list[-1] : flow_info['is_last_link'] = True
+                else                     : flow_info['is_last_link'] = False
+                
+                request = scrapy.Request(url=link, callback=self.parse_item_with_stop_date)
+                request.meta['item'] = flow_info
+                
+                yield request
+
+        else:
+            next_page = response.css('div.wp-pagenavi').css('a.nextpostslink').css('::attr(href)').extract_first()
+            if next_page is not None:
+                flow_info['to_next_page'] = False
+                
+                request = scrapy.Request(url=next_page, callback=self.parse_with_stop_date)
+                request.meta['item'] = flow_info
+                
+                yield request
+
+
+
+    def parse_item(self, response):
+        flow_info = response.meta['item']
+        item = NoticiasItem()
+        text = ''
+
+        title = response.xpath('//section[@class="single__content"]/h1').extract_first()
+        if title is not None : title = remove_tags(title)
+
+        for p in response.xpath('//section[@class="single__content"]').css('p').extract():
+            text += remove_tags(p) + "\n"
+
+        ## News item info ##
+        item['date']  = response.xpath('//meta[@property="article:published_time"]/@content').extract_first()
+        item['topic'] = flow_info['news_section']
+        item['title'] = title
+        item['text']  = text.strip()
+        item['url']   = response.url
+
+        yield item
+
+
+
+    def parse_item_with_stop_date(self, response):
+        news_date = response.xpath('//meta[@property="article:published_time"]/@content').extract_first()
+        news_date = news_date[:news_date.find('T')]
+        news_date = datetime.strptime(news_date, '%Y-%m-%d').date()
+
+        if news_date >= self.stopDate:
+            flow_info = response.meta['item']
+            item = NoticiasItem()
+            text = ''
+
+            title = response.xpath('//section[@class="single__content"]/h1').extract_first()
+            if title is not None : title = remove_tags(title)
+
+            for p in response.xpath('//section[@class="single__content"]').css('p').extract():
+                text += remove_tags(p) + "\n"
+
+            ## News item info ##
+            item['date']  = response.xpath('//meta[@property="article:published_time"]/@content').extract_first()
+            item['topic'] = flow_info['news_section']
+            item['title'] = title
+            item['text']  = text.strip()
+            item['url']   = response.url
+
+            yield item
+
+            if flow_info['is_last_link']:
+                flow_info['to_next_page'] = True
+                
+                request = scrapy.Request(url=flow_info['return_url'], callback=self.parse_with_stop_date, dont_filter=True)
+                request.meta['item'] = flow_info
+                
+                yield request
--- a/descarga_hacia_atras/diarioDeChiapas/scrapy.cfg
+++ b/descarga_hacia_atras/diarioDeChiapas/scrapy.cfg
+# Automatically created by: scrapy startproject
+#
+# For more information about the [deploy] section see:
+# https://scrapyd.readthedocs.io/en/latest/deploy.html
+
+[settings]
+default = diarioDeChiapas.settings
+
+[deploy]
+#url = http://localhost:6800/
+project = diarioDeChiapas
--- a/descarga_hacia_atras/diarioIndependiente/diarioIndependiente/__init__.py
+++ b/descarga_hacia_atras/diarioIndependiente/diarioIndependiente/__init__.py
--- a/descarga_hacia_atras/diarioIndependiente/diarioIndependiente/items.py
+++ b/descarga_hacia_atras/diarioIndependiente/diarioIndependiente/items.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your scraped items
+#
+# See documentation in:
+# https://doc.scrapy.org/en/latest/topics/items.html
+
+import scrapy
+
+
+class NoticiasItem(scrapy.Item):
+    # define the fields for your item here like:
+    # name = scrapy.Field()
+    title = scrapy.Field()
+    text = scrapy.Field()
+    date = scrapy.Field()
+    location = scrapy.Field()
+    author = scrapy.Field()
+    topic = scrapy.Field()
+    url = scrapy.Field()
--- a/descarga_hacia_atras/diarioIndependiente/diarioIndependiente/middlewares.py
+++ b/descarga_hacia_atras/diarioIndependiente/diarioIndependiente/middlewares.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your spider middleware
+#
+# See documentation in:
+# https://doc.scrapy.org/en/latest/topics/spider-middleware.html
+
+from scrapy import signals
+
+
+class DiarioindependienteSpiderMiddleware(object):
+    # Not all methods need to be defined. If a method is not defined,
+    # scrapy acts as if the spider middleware does not modify the
+    # passed objects.
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # This method is used by Scrapy to create your spiders.
+        s = cls()
+        crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
+        return s
+
+    def process_spider_input(self, response, spider):
+        # Called for each response that goes through the spider
+        # middleware and into the spider.
+
+        # Should return None or raise an exception.
+        return None
+
+    def process_spider_output(self, response, result, spider):
+        # Called with the results returned from the Spider, after
+        # it has processed the response.
+
+        # Must return an iterable of Request, dict or Item objects.
+        for i in result:
+            yield i
+
+    def process_spider_exception(self, response, exception, spider):
+        # Called when a spider or process_spider_input() method
+        # (from other spider middleware) raises an exception.
+
+        # Should return either None or an iterable of Response, dict
+        # or Item objects.
+        pass
+
+    def process_start_requests(self, start_requests, spider):
+        # Called with the start requests of the spider, and works
+        # similarly to the process_spider_output() method, except
+        # that it doesn’t have a response associated.
+
+        # Must return only requests (not items).
+        for r in start_requests:
+            yield r
+
+    def spider_opened(self, spider):
+        spider.logger.info('Spider opened: %s' % spider.name)
+
+
+class DiarioindependienteDownloaderMiddleware(object):
+    # Not all methods need to be defined. If a method is not defined,
+    # scrapy acts as if the downloader middleware does not modify the
+    # passed objects.
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # This method is used by Scrapy to create your spiders.
+        s = cls()
+        crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
+        return s
+
+    def process_request(self, request, spider):
+        # Called for each request that goes through the downloader
+        # middleware.
+
+        # Must either:
+        # - return None: continue processing this request
+        # - or return a Response object
+        # - or return a Request object
+        # - or raise IgnoreRequest: process_exception() methods of
+        #   installed downloader middleware will be called
+        return None
+
+    def process_response(self, request, response, spider):
+        # Called with the response returned from the downloader.
+
+        # Must either;
+        # - return a Response object
+        # - return a Request object
+        # - or raise IgnoreRequest
+        return response
+
+    def process_exception(self, request, exception, spider):
+        # Called when a download handler or a process_request()
+        # (from other downloader middleware) raises an exception.
+
+        # Must either:
+        # - return None: continue processing this exception
+        # - return a Response object: stops process_exception() chain
+        # - return a Request object: stops process_exception() chain
+        pass
+
+    def spider_opened(self, spider):
+        spider.logger.info('Spider opened: %s' % spider.name)
--- a/descarga_hacia_atras/diarioIndependiente/diarioIndependiente/pipelines.py
+++ b/descarga_hacia_atras/diarioIndependiente/diarioIndependiente/pipelines.py
+# -*- coding: utf-8 -*-
+
+# Define your item pipelines here
+#
+# Don't forget to add your pipeline to the ITEM_PIPELINES setting
+# See: https://doc.scrapy.org/en/latest/topics/item-pipeline.html
+
+import json
+from collections import OrderedDict
+
+
+class JsonWriterPipeline(object):
+
+    def __init__(self, filename):
+        self.filename = filename
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # Here you get whatever value was passed through the "filename" command line parameter
+        settings = crawler.settings
+        filename = settings.get('filename')
+
+        # Instantiate the pipeline with the file name
+        return cls(filename)
+
+    def open_spider(self, spider):
+        self.counter = 0
+        self.file = open(self.filename, 'w')
+        self.file.write("[")
+
+    def close_spider(self, spider):
+        self.file.write("]")
+        self.file.close()
+
+    def process_item(self, item, spider):
+        # print("this is my item", item)
+        row = []
+        try:
+            row.append(("date", item['date']))
+        except:
+            pass
+        try:
+            row.append(("topic", item['topic']))
+        except:
+            pass
+        try:
+            row.append(("title", item['title']))
+        except:
+            pass
+        try:
+            row.append(("author", item['author']))
+        except:
+            pass
+        try:
+            row.append(("location", item['location']))
+        except:
+            pass
+        try:
+            row.append(("text", item['text']))
+        except:
+            pass
+        try:
+            row.append(("url", item['url']))
+        except:
+            pass
+
+        line = OrderedDict(row)
+
+        self.counter += 1
+        if self.counter == 1:
+            self.file.write(json.dumps(line))
+        elif self.counter > 1:
+            self.file.write(",\n" + json.dumps(line))
+
+        return item
--- a/descarga_hacia_atras/diarioIndependiente/diarioIndependiente/settings.py
+++ b/descarga_hacia_atras/diarioIndependiente/diarioIndependiente/settings.py
+# -*- coding: utf-8 -*-
+
+# Scrapy settings for diarioIndependiente project
+#
+# For simplicity, this file contains only settings considered important or
+# commonly used. You can find more settings consulting the documentation:
+#
+#     https://doc.scrapy.org/en/latest/topics/settings.html
+#     https://doc.scrapy.org/en/latest/topics/downloader-middleware.html
+#     https://doc.scrapy.org/en/latest/topics/spider-middleware.html
+
+BOT_NAME = 'diarioIndependiente'
+
+SPIDER_MODULES = ['diarioIndependiente.spiders']
+NEWSPIDER_MODULE = 'diarioIndependiente.spiders'
+
+
+# Crawl responsibly by identifying yourself (and your website) on the user-agent
+#USER_AGENT = 'diarioIndependiente (+http://www.yourdomain.com)'
+
+# Obey robots.txt rules
+# ROBOTSTXT_OBEY = True
+
+# Configure maximum concurrent requests performed by Scrapy (default: 16)
+#CONCURRENT_REQUESTS = 32
+
+# Configure a delay for requests for the same website (default: 0)
+# See https://doc.scrapy.org/en/latest/topics/settings.html#download-delay
+# See also autothrottle settings and docs
+DOWNLOAD_DELAY = 0.5
+# The download delay setting will honor only one of:
+#CONCURRENT_REQUESTS_PER_DOMAIN = 16
+#CONCURRENT_REQUESTS_PER_IP = 16
+
+# Disable cookies (enabled by default)
+COOKIES_ENABLED = False
+
+# Disable Telnet Console (enabled by default)
+#TELNETCONSOLE_ENABLED = False
+
+# Override the default request headers:
+#DEFAULT_REQUEST_HEADERS = {
+#   'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
+#   'Accept-Language': 'en',
+#}
+
+# Enable or disable spider middlewares
+# See https://doc.scrapy.org/en/latest/topics/spider-middleware.html
+#SPIDER_MIDDLEWARES = {
+#    'diarioIndependiente.middlewares.DiarioindependienteSpiderMiddleware': 543,
+#}
+
+# Enable or disable downloader middlewares
+# See https://doc.scrapy.org/en/latest/topics/downloader-middleware.html
+#DOWNLOADER_MIDDLEWARES = {
+#    'diarioIndependiente.middlewares.DiarioindependienteDownloaderMiddleware': 543,
+#}
+
+# Enable or disable extensions
+# See https://doc.scrapy.org/en/latest/topics/extensions.html
+#EXTENSIONS = {
+#    'scrapy.extensions.telnet.TelnetConsole': None,
+#}
+
+# Configure item pipelines
+# See https://doc.scrapy.org/en/latest/topics/item-pipeline.html
+ITEM_PIPELINES = {
+   'diarioIndependiente.pipelines.JsonWriterPipeline': 300,
+}
+
+# Enable and configure the AutoThrottle extension (disabled by default)
+# See https://doc.scrapy.org/en/latest/topics/autothrottle.html
+#AUTOTHROTTLE_ENABLED = True
+# The initial download delay
+#AUTOTHROTTLE_START_DELAY = 5
+# The maximum download delay to be set in case of high latencies
+#AUTOTHROTTLE_MAX_DELAY = 60
+# The average number of requests Scrapy should be sending in parallel to
+# each remote server
+#AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0
+# Enable showing throttling stats for every response received:
+#AUTOTHROTTLE_DEBUG = False
+
+# Enable and configure HTTP caching (disabled by default)
+# See https://doc.scrapy.org/en/latest/topics/downloader-middleware.html#httpcache-middleware-settings
+#HTTPCACHE_ENABLED = True
+#HTTPCACHE_EXPIRATION_SECS = 0
+#HTTPCACHE_DIR = 'httpcache'
+#HTTPCACHE_IGNORE_HTTP_CODES = []
+#HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'
--- a/descarga_hacia_atras/diarioIndependiente/diarioIndependiente/spiders/__init__.py
+++ b/descarga_hacia_atras/diarioIndependiente/diarioIndependiente/spiders/__init__.py
+# This package will contain the spiders of your Scrapy project
+#
+# Please refer to the documentation for information on how to create and manage
+# your spiders.
--- a/descarga_hacia_atras/diarioIndependiente/diarioIndependiente/spiders/noticias.py
+++ b/descarga_hacia_atras/diarioIndependiente/diarioIndependiente/spiders/noticias.py
+# -*- coding: utf-8 -*-
+
+"""
+MEDIA:
+    Diario El Independiente, Baja California Sur
+
+USAGE:
+    $ cd elIndependiente/
+    ------------------------------------------------------------------------------------------------------------
+    ## Get all the news from the most current to the oldest. It's necessary to use the parse_date_files.py file
+    for the news contained in noticias.json being splitted into files by date. ##
+    
+    $ scrapy crawl noticias --nolog -s filename=noticias.json
+    ------------------------------------------------------------------------------------------------------------
+    ## Get all the news from the most current to a specific date. ##
+    
+    $ scrapy crawl noticias --nolog -s filename=2018-08-10.json -a year=2018 -a month=8 -a day=10
+"""
+
+import scrapy, re, json
+from datetime import datetime, date
+from diarioIndependiente.items import NoticiasItem
+
+
+TAG_RE = re.compile(r'<[^>]+>')
+def remove_tags(text):
+    return TAG_RE.sub('', text)
+
+
+
+class ImportantFlowData(scrapy.Item):
+    """
+    Useful data for the flow of the implementation
+    """
+    to_next_page = scrapy.Field()
+    is_last_link = scrapy.Field()
+    return_url   = scrapy.Field()
+
+
+
+class QuotesSpider(scrapy.Spider):
+    """
+    Basic Scrapy Spider class
+    """
+    name = "noticias"
+
+
+    def start_requests(self):
+        year  = getattr(self, "year", None)
+        month = getattr(self, "month", None)
+        day   = getattr(self, "day", None)
+
+        if year is not None and month is not None and day is not None:
+            self.stop_date = date(int(year), int(month), int(day))
+            base_url = "https://www.diarioelindependiente.mx/" + year + "/" + month + "/"
+
+        else:
+            self.stop_date = None
+            section_list = ["la-paz", "los-cabos", "policiaca", "deportes", "cultura", "nacional",
+                            "internacional", "opinion", "espectaculos", "tecnologia"]
+            
+            base_url = "https://www.diarioelindependiente.mx/"        
+
+        
+        if self.stop_date is None:
+            for s in section_list:
+                yield scrapy.Request(url=base_url + s, callback=self.parse)
+        
+        else:
+            flow_info = ImportantFlowData()
+            flow_info['to_next_page'] = False
+            
+            request = scrapy.Request(url=base_url, callback=self.parse_with_stop_date)
+            request.meta['item'] = flow_info
+            yield request
+
+
+
+    def parse(self, response):
+        yield scrapy.Request(url=response.url, callback=self.parse_page, dont_filter=True)
+
+        pagination = response.css('div.paginacion').xpath('./ul/li/a/@href').extract()
+        if len(pagination) > 0:
+            pagination = pagination[-2]
+            pages = int(pagination[pagination.rfind('=') + 1:])
+
+            for page in xrange(1, pages):
+                yield scrapy.Request(url=response.url + "?page=" + str(page + 1), callback=self.parse_page)
+
+
+
+    def parse_page(self, response):
+        link_list = response.xpath('//div[@id="colNoticias"]').css('article.card__article').xpath('./h2/a/@href').extract()
+
+        for link in link_list:
+            yield scrapy.Request(url=link, callback=self.parse_item)
+
+
+
+    def parse_with_stop_date(self, response):
+        flow_info = response.meta['item']
+
+        if not flow_info['to_next_page']:
+            link_list = response.xpath('//div[@id="colNoticias"]').css('article.card__article').xpath('./h2/a/@href').extract()
+
+            for link in link_list:
+                flow_info = ImportantFlowData()
+                flow_info['return_url'] = response.url
+
+                if link == link_list[-1] : flow_info['is_last_link'] = True
+                else                     : flow_info['is_last_link'] = False
+
+                request = scrapy.Request(url=link, callback=self.parse_item_with_stop_date)
+                request.meta['item'] = flow_info
+                
+                yield request
+
+        else:
+            next_page = response.css('div.paginacion').xpath('./ul/li/a[@rel="next"]/@href').extract_first()
+
+            if next_page is not None:
+                flow_info['to_next_page'] = False
+
+                request = scrapy.Request(url=next_page, callback=self.parse_with_stop_date)
+                request.meta['item'] = flow_info
+                
+                yield request
+
+
+
+    def parse_item(self, response):
+        item = NoticiasItem()
+        text = ''
+
+        news_date = response.xpath('//meta[@name="date"]/@content').extract_first()
+
+        try:
+            topic = response.xpath('//span[@class="badge"]').extract_first()
+        except:
+            topic = None
+
+        for p in response.css('div.cuerpo_noticia').css('p').extract():
+                text += remove_tags(p) + "\n"
+
+        ## News item info ##
+        item['date']  = datetime.strptime(news_date, '%Y-%m-%d').isoformat("T")
+        item['title'] = remove_tags(response.css('h1.colorRojo').extract_first())
+        item['topic'] = remove_tags(topic)
+        item['text']  = text.strip()
+        item['url']   = response.url
+
+        yield item
+
+
+
+    def parse_item_with_stop_date(self, response):
+        news_date = response.xpath('//meta[@name="date"]/@content').extract_first()
+        news_date = datetime.strptime(news_date, '%Y-%m-%d').date()
+
+        if news_date >= self.stop_date:
+            flow_info = response.meta['item']
+            item = NoticiasItem()
+            text = ''
+
+            news_date = datetime.strptime(news_date.isoformat(), '%Y-%m-%d').isoformat("T")
+
+            title = response.css('h1.colorRojo').extract_first()
+            if title is not None : title = remove_tags(title)
+
+            topic = response.xpath('//span[@class="badge"]').extract_first()
+            if topic is not None : topic = remove_tags(topic)
+
+            for p in response.css('div.cuerpo_noticia').css('p').extract():
+                text += remove_tags(p) + "\n"
+
+            ## News item info ##
+            item['date']  = news_date
+            item['title'] = title
+            item['topic'] = topic
+            item['text']  = text.strip()
+            item['url']   = response.url
+
+            yield item
+
+            if flow_info['is_last_link']:
+                flow_info['to_next_page'] = True
+                
+                request = scrapy.Request(url=flow_info['return_url'], callback=self.parse_with_stop_date, dont_filter=True)
+                request.meta['item'] = flow_info
+                
+                yield request
--- a/descarga_hacia_atras/diarioIndependiente/scrapy.cfg
+++ b/descarga_hacia_atras/diarioIndependiente/scrapy.cfg
+# Automatically created by: scrapy startproject
+#
+# For more information about the [deploy] section see:
+# https://scrapyd.readthedocs.io/en/latest/deploy.html
+
+[settings]
+default = diarioIndependiente.settings
+
+[deploy]
+#url = http://localhost:6800/
+project = diarioIndependiente
--- a/descarga_hacia_atras/diarioYucatan/diarioYucatan/__init__.py
+++ b/descarga_hacia_atras/diarioYucatan/diarioYucatan/__init__.py
--- a/descarga_hacia_atras/diarioYucatan/diarioYucatan/items.py
+++ b/descarga_hacia_atras/diarioYucatan/diarioYucatan/items.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your scraped items
+#
+# See documentation in:
+# http://doc.scrapy.org/en/latest/topics/items.html
+
+import scrapy
+
+
+class NoticiasItem(scrapy.Item):
+    # define the fields for your item here like:
+    # name = scrapy.Field()
+    title = scrapy.Field()
+    text = scrapy.Field()
+    date = scrapy.Field()
+    location = scrapy.Field()
+    author = scrapy.Field()
+    topic = scrapy.Field()
+    url = scrapy.Field()
--- a/descarga_hacia_atras/diarioYucatan/diarioYucatan/middlewares.py
+++ b/descarga_hacia_atras/diarioYucatan/diarioYucatan/middlewares.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your spider middleware
+#
+# See documentation in:
+# http://doc.scrapy.org/en/latest/topics/spider-middleware.html
+
+from scrapy import signals
+
+
+class DiarioyucatanSpiderMiddleware(object):
+    # Not all methods need to be defined. If a method is not defined,
+    # scrapy acts as if the spider middleware does not modify the
+    # passed objects.
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # This method is used by Scrapy to create your spiders.
+        s = cls()
+        crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
+        return s
+
+    def process_spider_input(response, spider):
+        # Called for each response that goes through the spider
+        # middleware and into the spider.
+
+        # Should return None or raise an exception.
+        return None
+
+    def process_spider_output(response, result, spider):
+        # Called with the results returned from the Spider, after
+        # it has processed the response.
+
+        # Must return an iterable of Request, dict or Item objects.
+        for i in result:
+            yield i
+
+    def process_spider_exception(response, exception, spider):
+        # Called when a spider or process_spider_input() method
+        # (from other spider middleware) raises an exception.
+
+        # Should return either None or an iterable of Response, dict
+        # or Item objects.
+        pass
+
+    def process_start_requests(start_requests, spider):
+        # Called with the start requests of the spider, and works
+        # similarly to the process_spider_output() method, except
+        # that it doesn’t have a response associated.
+
+        # Must return only requests (not items).
+        for r in start_requests:
+            yield r
+
+    def spider_opened(self, spider):
+        spider.logger.info('Spider opened: %s' % spider.name)
--- a/descarga_hacia_atras/diarioYucatan/diarioYucatan/pipelines.py
+++ b/descarga_hacia_atras/diarioYucatan/diarioYucatan/pipelines.py
+# -*- coding: utf-8 -*-
+
+# Define your item pipelines here
+#
+# Don't forget to add your pipeline to the ITEM_PIPELINES setting
+# See: http://doc.scrapy.org/en/latest/topics/item-pipeline.html
+
+import json
+from collections import OrderedDict
+
+
+class JsonWriterPipeline(object):
+
+    def __init__(self, filename):
+        self.filename = filename
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # Here you get whatever value was passed through the "filename" command line parameter
+        settings = crawler.settings
+        filename = settings.get('filename')
+
+        # Instantiate the pipeline with the file name
+        return cls(filename)
+
+    def open_spider(self, spider):
+        self.counter = 0
+        self.file = open(self.filename, 'w')
+        self.file.write("[")
+
+    def close_spider(self, spider):
+        self.file.write("]")
+        self.file.close()
+
+    def process_item(self, item, spider):
+        # print("this is my item", item)
+        row = []
+        try:
+            row.append(("date", item['date']))
+        except:
+            pass
+        try:
+            row.append(("topic", item['topic']))
+        except:
+            pass
+        try:
+            row.append(("title", item['title']))
+        except:
+            pass
+        try:
+            row.append(("author", item['author']))
+        except:
+            pass
+        try:
+            row.append(("location", item['location']))
+        except:
+            pass
+        try:
+            row.append(("text", item['text']))
+        except:
+            pass
+        try:
+            row.append(("url", item['url']))
+        except:
+            pass
+
+        line = OrderedDict(row)
+
+        self.counter += 1
+        if self.counter == 1:
+            self.file.write(json.dumps(line))
+        elif self.counter > 1:
+            self.file.write(",\n" + json.dumps(line))
+
+        return item
--- a/descarga_hacia_atras/diarioYucatan/diarioYucatan/settings.py
+++ b/descarga_hacia_atras/diarioYucatan/diarioYucatan/settings.py
+# -*- coding: utf-8 -*-
+
+# Scrapy settings for diarioYucatan project
+#
+# For simplicity, this file contains only settings considered important or
+# commonly used. You can find more settings consulting the documentation:
+#
+#     http://doc.scrapy.org/en/latest/topics/settings.html
+#     http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html
+#     http://scrapy.readthedocs.org/en/latest/topics/spider-middleware.html
+
+BOT_NAME = 'diarioYucatan'
+
+SPIDER_MODULES = ['diarioYucatan.spiders']
+NEWSPIDER_MODULE = 'diarioYucatan.spiders'
+
+
+# Crawl responsibly by identifying yourself (and your website) on the user-agent
+#USER_AGENT = 'diarioYucatan (+http://www.yourdomain.com)'
+
+# Obey robots.txt rules
+# ROBOTSTXT_OBEY = True
+
+# Configure maximum concurrent requests performed by Scrapy (default: 16)
+#CONCURRENT_REQUESTS = 32
+
+# Configure a delay for requests for the same website (default: 0)
+# See http://scrapy.readthedocs.org/en/latest/topics/settings.html#download-delay
+# See also autothrottle settings and docs
+DOWNLOAD_DELAY = 0.5
+# The download delay setting will honor only one of:
+#CONCURRENT_REQUESTS_PER_DOMAIN = 16
+#CONCURRENT_REQUESTS_PER_IP = 16
+
+# Disable cookies (enabled by default)
+COOKIES_ENABLED = False
+
+# Disable Telnet Console (enabled by default)
+#TELNETCONSOLE_ENABLED = False
+
+# Override the default request headers:
+#DEFAULT_REQUEST_HEADERS = {
+#   'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
+#   'Accept-Language': 'en',
+#}
+
+# Enable or disable spider middlewares
+# See http://scrapy.readthedocs.org/en/latest/topics/spider-middleware.html
+#SPIDER_MIDDLEWARES = {
+#    'diarioYucatan.middlewares.DiarioyucatanSpiderMiddleware': 543,
+#}
+
+# Enable or disable downloader middlewares
+# See http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html
+#DOWNLOADER_MIDDLEWARES = {
+#    'diarioYucatan.middlewares.MyCustomDownloaderMiddleware': 543,
+#}
+
+# Enable or disable extensions
+# See http://scrapy.readthedocs.org/en/latest/topics/extensions.html
+#EXTENSIONS = {
+#    'scrapy.extensions.telnet.TelnetConsole': None,
+#}
+
+# Configure item pipelines
+# See http://scrapy.readthedocs.org/en/latest/topics/item-pipeline.html
+ITEM_PIPELINES = {
+   'diarioYucatan.pipelines.JsonWriterPipeline': 300,
+}
+
+# Enable and configure the AutoThrottle extension (disabled by default)
+# See http://doc.scrapy.org/en/latest/topics/autothrottle.html
+#AUTOTHROTTLE_ENABLED = True
+# The initial download delay
+#AUTOTHROTTLE_START_DELAY = 5
+# The maximum download delay to be set in case of high latencies
+#AUTOTHROTTLE_MAX_DELAY = 60
+# The average number of requests Scrapy should be sending in parallel to
+# each remote server
+#AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0
+# Enable showing throttling stats for every response received:
+#AUTOTHROTTLE_DEBUG = False
+
+# Enable and configure HTTP caching (disabled by default)
+# See http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html#httpcache-middleware-settings
+#HTTPCACHE_ENABLED = True
+#HTTPCACHE_EXPIRATION_SECS = 0
+#HTTPCACHE_DIR = 'httpcache'
+#HTTPCACHE_IGNORE_HTTP_CODES = []
+#HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'
--- a/descarga_hacia_atras/diarioYucatan/diarioYucatan/spiders/__init__.py
+++ b/descarga_hacia_atras/diarioYucatan/diarioYucatan/spiders/__init__.py
+# This package will contain the spiders of your Scrapy project
+#
+# Please refer to the documentation for information on how to create and manage
+# your spiders.
--- a/descarga_hacia_atras/diarioYucatan/diarioYucatan/spiders/noticias.py
+++ b/descarga_hacia_atras/diarioYucatan/diarioYucatan/spiders/noticias.py
+# -*- coding: utf-8 -*-
+import scrapy, re
+from diarioYucatan.items import NoticiasItem
+
+# from datetime import datetime, date, timedelta
+# from scrapy.spidermiddlewares.httperror import HttpError
+
+"""
+MEDIO:
+Diario de Yucatán, Yuc.
+Esta version descarga todas las noticias contenidas en la pagina, sin necesidad
+de una fecha especifica.
+USO:
+scrapy crawl noticias --nolog -s filename=noticias.json
+"""
+
+TAG_RE = re.compile(r'<[^>]+>')
+def remove_tags(text):
+    return TAG_RE.sub('', text)
+
+
+class QuotesSpider(scrapy.Spider):
+    name = "noticias"
+
+    def start_requests(self):
+        section_list = ['merida', 'yucatan', 'mexico', 'internacional', 'deportes', 'mexico/quintana-roo',
+                        'espectaculos', 'imagen', 'economia', 'tecnologia', 'salud', 'editorial', 'multimedia']
+        # section_list = ['yucatan', 'salud', 'editorial', 'imagen',
+        #                 'merida', 'merida/clima', 'merida/gobierno', 'merida/policia', 'merida/politica',
+        #                 'mexico', 'mexico/quintana-roo', 'mexico/cdmx', 'mexico/economia', 'mexico/campeche',
+        #                 'internacional', 'internacional/asia', 'internacional/europa', 'internacional/africa',
+        #                 'internacional/america', 'internacional/oceania',
+        #                 'deportes', 'deportes/futbol', 'deportes/nfl',
+        #                 'espectaculos', 'espectaculos/cine', 'espectaculos/farandula', 'espectaculos/musica',
+        #                 'espectaculos/tv-y-series',
+        #                 'tecnologia', 'tecnologia/redes-sociales', 'tecnologia/innovaciones',
+        #                 'multimedia', 'multimedia/fotos', 'multimedia/videos']
+
+        self.globalLinkSet = set()
+        self.baseURL = "http://www.yucatan.com.mx/seccion/"
+        self.parsing_month = {'enero': 1, 'febrero': 2, 'marzo': 3, 'abril': 4, 'mayo': 5, 'junio': 6, 'julio': 7,
+                              'agosto': 8, 'septiembre': 9, 'octubre': 10, 'noviembre': 11, 'diciembre': 12}
+
+        for s in section_list:
+            yield scrapy.Request(url=self.baseURL + s, callback=self.parse)
+
+
+    def parse(self, response):
+        pathList = ['//*[@class="g1-column"]/div/div/article',
+                    '//*[@class="g1-collection g1-collection-columns-2"]/div/ul/li/article']
+
+        for path in pathList:
+            for entry in response.xpath(path):
+                link = entry.css('h3').css('a::attr(href)').extract_first()
+
+                if not link in self.globalLinkSet:
+                    self.globalLinkSet.add(link)
+                    item = NoticiasItem()
+
+                    item['topic'] = remove_tags(response.xpath('//h2[@class="g1-delta g1-delta-2nd resaltartitulo"]').extract_first())
+                    request = scrapy.Request(url=link, callback=self.parse_item)
+
+                    request.meta['item'] = item
+                    yield request
+
+
+    def parse_item(self, response):
+        item = response.meta['item']
+        text = ''
+
+        item['date'] = response.xpath('//time[@class="entry-date"]/@datetime').extract_first() + "-06:00"
+        item['title'] = remove_tags(response.xpath('//h1[@class="g1-mega g1-mega-1st entry-title"]').extract_first())
+
+        for p in response.xpath('//*[@itemprop="articleBody"]/p').extract():
+            text += remove_tags(p) + "\n"
+
+        item['text'] = text
+        item['url'] = response.url
+        # print item['title']
+        yield item
+
--- a/descarga_hacia_atras/diarioYucatan/scrapy.cfg
+++ b/descarga_hacia_atras/diarioYucatan/scrapy.cfg
+# Automatically created by: scrapy startproject
+#
+# For more information about the [deploy] section see:
+# https://scrapyd.readthedocs.org/en/latest/deploy.html
+
+[settings]
+default = diarioYucatan.settings
+
+[deploy]
+#url = http://localhost:6800/
+project = diarioYucatan
--- a/descarga_hacia_atras/elFinanciero/elFinanciero/2019-01-24.json
+++ b/descarga_hacia_atras/elFinanciero/elFinanciero/2019-01-24.json
+[]
\ No newline at end of file
--- a/descarga_hacia_atras/elFinanciero/elFinanciero/__init__.py
+++ b/descarga_hacia_atras/elFinanciero/elFinanciero/__init__.py
--- a/descarga_hacia_atras/elFinanciero/elFinanciero/items.py
+++ b/descarga_hacia_atras/elFinanciero/elFinanciero/items.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your scraped items
+#
+# See documentation in:
+# http://doc.scrapy.org/en/latest/topics/items.html
+
+import scrapy
+
+
+class NoticiasItem(scrapy.Item):
+    # define the fields for your item here like:
+    # name = scrapy.Field()
+    title = scrapy.Field()
+    text = scrapy.Field()
+    date = scrapy.Field()
+    location = scrapy.Field()
+    author = scrapy.Field()
+    topic = scrapy.Field()
+    url = scrapy.Field()
--- a/descarga_hacia_atras/elFinanciero/elFinanciero/middlewares.py
+++ b/descarga_hacia_atras/elFinanciero/elFinanciero/middlewares.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your spider middleware
+#
+# See documentation in:
+# http://doc.scrapy.org/en/latest/topics/spider-middleware.html
+
+from scrapy import signals
+
+
+class ElfinancieroSpiderMiddleware(object):
+    # Not all methods need to be defined. If a method is not defined,
+    # scrapy acts as if the spider middleware does not modify the
+    # passed objects.
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # This method is used by Scrapy to create your spiders.
+        s = cls()
+        crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
+        return s
+
+    def process_spider_input(response, spider):
+        # Called for each response that goes through the spider
+        # middleware and into the spider.
+
+        # Should return None or raise an exception.
+        return None
+
+    def process_spider_output(response, result, spider):
+        # Called with the results returned from the Spider, after
+        # it has processed the response.
+
+        # Must return an iterable of Request, dict or Item objects.
+        for i in result:
+            yield i
+
+    def process_spider_exception(response, exception, spider):
+        # Called when a spider or process_spider_input() method
+        # (from other spider middleware) raises an exception.
+
+        # Should return either None or an iterable of Response, dict
+        # or Item objects.
+        pass
+
+    def process_start_requests(start_requests, spider):
+        # Called with the start requests of the spider, and works
+        # similarly to the process_spider_output() method, except
+        # that it doesn’t have a response associated.
+
+        # Must return only requests (not items).
+        for r in start_requests:
+            yield r
+
+    def spider_opened(self, spider):
+        spider.logger.info('Spider opened: %s' % spider.name)
--- a/descarga_hacia_atras/elFinanciero/elFinanciero/pipelines.py
+++ b/descarga_hacia_atras/elFinanciero/elFinanciero/pipelines.py
+# -*- coding: utf-8 -*-
+
+# Define your item pipelines here
+#
+# Don't forget to add your pipeline to the ITEM_PIPELINES setting
+# See: http://doc.scrapy.org/en/latest/topics/item-pipeline.html
+
+import json
+from collections import OrderedDict
+
+
+class JsonWriterPipeline(object):
+
+    def __init__(self, filename):
+        self.filename = filename
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # Here you get whatever value was passed through the "filename" command line parameter
+        settings = crawler.settings
+        filename = settings.get('filename')
+
+        # Instantiate the pipeline with the file name
+        return cls(filename)
+
+    def open_spider(self, spider):
+        self.counter = 0
+        self.file = open(self.filename, 'w')
+        self.file.write("[")
+
+    def close_spider(self, spider):
+        self.file.write("]")
+        self.file.close()
+
+    def process_item(self, item, spider):
+        # print("this is my item", item)
+        row = []
+        try:
+            row.append(("date", item['date']))
+        except:
+            pass
+        try:
+            row.append(("topic", item['topic']))
+        except:
+            pass
+        try:
+            row.append(("title", item['title']))
+        except:
+            pass
+        try:
+            row.append(("author", item['author']))
+        except:
+            pass
+        try:
+            row.append(("location", item['location']))
+        except:
+            pass
+        try:
+            row.append(("text", item['text']))
+        except:
+            pass
+        try:
+            row.append(("url", item['url']))
+        except:
+            pass
+
+        line = OrderedDict(row)
+
+        self.counter += 1
+        if self.counter == 1:
+            self.file.write(json.dumps(line))
+        elif self.counter > 1:
+            self.file.write(",\n" + json.dumps(line))
+
+        return item
--- a/descarga_hacia_atras/elFinanciero/elFinanciero/settings.py
+++ b/descarga_hacia_atras/elFinanciero/elFinanciero/settings.py
+# -*- coding: utf-8 -*-
+
+# Scrapy settings for elFinanciero project
+#
+# For simplicity, this file contains only settings considered important or
+# commonly used. You can find more settings consulting the documentation:
+#
+#     http://doc.scrapy.org/en/latest/topics/settings.html
+#     http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html
+#     http://scrapy.readthedocs.org/en/latest/topics/spider-middleware.html
+
+BOT_NAME = 'elFinanciero'
+
+SPIDER_MODULES = ['elFinanciero.spiders']
+NEWSPIDER_MODULE = 'elFinanciero.spiders'
+
+
+# Crawl responsibly by identifying yourself (and your website) on the user-agent
+#USER_AGENT = 'elFinanciero (+http://www.yourdomain.com)'
+
+# Obey robots.txt rules
+# ROBOTSTXT_OBEY = True
+
+# Configure maximum concurrent requests performed by Scrapy (default: 16)
+#CONCURRENT_REQUESTS = 32
+
+# Configure a delay for requests for the same website (default: 0)
+# See http://scrapy.readthedocs.org/en/latest/topics/settings.html#download-delay
+# See also autothrottle settings and docs
+DOWNLOAD_DELAY = 0.5
+# The download delay setting will honor only one of:
+#CONCURRENT_REQUESTS_PER_DOMAIN = 16
+#CONCURRENT_REQUESTS_PER_IP = 16
+
+# Disable cookies (enabled by default)
+COOKIES_ENABLED = False
+
+# Disable Telnet Console (enabled by default)
+#TELNETCONSOLE_ENABLED = False
+
+# Override the default request headers:
+#DEFAULT_REQUEST_HEADERS = {
+#   'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
+#   'Accept-Language': 'en',
+#}
+
+# Enable or disable spider middlewares
+# See http://scrapy.readthedocs.org/en/latest/topics/spider-middleware.html
+#SPIDER_MIDDLEWARES = {
+#    'elFinanciero.middlewares.ElfinancieroSpiderMiddleware': 543,
+#}
+
+# Enable or disable downloader middlewares
+# See http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html
+#DOWNLOADER_MIDDLEWARES = {
+#    'elFinanciero.middlewares.MyCustomDownloaderMiddleware': 543,
+#}
+
+# Enable or disable extensions
+# See http://scrapy.readthedocs.org/en/latest/topics/extensions.html
+#EXTENSIONS = {
+#    'scrapy.extensions.telnet.TelnetConsole': None,
+#}
+
+# Configure item pipelines
+# See http://scrapy.readthedocs.org/en/latest/topics/item-pipeline.html
+ITEM_PIPELINES = {
+   'elFinanciero.pipelines.JsonWriterPipeline': 300,
+}
+
+# Enable and configure the AutoThrottle extension (disabled by default)
+# See http://doc.scrapy.org/en/latest/topics/autothrottle.html
+#AUTOTHROTTLE_ENABLED = True
+# The initial download delay
+#AUTOTHROTTLE_START_DELAY = 5
+# The maximum download delay to be set in case of high latencies
+#AUTOTHROTTLE_MAX_DELAY = 60
+# The average number of requests Scrapy should be sending in parallel to
+# each remote server
+#AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0
+# Enable showing throttling stats for every response received:
+#AUTOTHROTTLE_DEBUG = False
+
+# Enable and configure HTTP caching (disabled by default)
+# See http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html#httpcache-middleware-settings
+#HTTPCACHE_ENABLED = True
+#HTTPCACHE_EXPIRATION_SECS = 0
+#HTTPCACHE_DIR = 'httpcache'
+#HTTPCACHE_IGNORE_HTTP_CODES = []
+#HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'
--- a/descarga_hacia_atras/elFinanciero/elFinanciero/spiders/.noticias.py.swp
+++ b/descarga_hacia_atras/elFinanciero/elFinanciero/spiders/.noticias.py.swp
--- a/descarga_hacia_atras/elFinanciero/elFinanciero/spiders/__init__.py
+++ b/descarga_hacia_atras/elFinanciero/elFinanciero/spiders/__init__.py
+# This package will contain the spiders of your Scrapy project
+#
+# Please refer to the documentation for information on how to create and manage
+# your spiders.
--- a/descarga_hacia_atras/elFinanciero/elFinanciero/spiders/noticias.py
+++ b/descarga_hacia_atras/elFinanciero/elFinanciero/spiders/noticias.py
+# -*- coding: utf-8 -*-
+import scrapy, re, json
+from elFinanciero.items import NoticiasItem
+from collections import OrderedDict
+from datetime import datetime, date, timedelta, tzinfo
+
+"""
+MEDIO:
+El Financiero, CDMX
+
+DESCARGA HACIA ATRÁS:
+Este crawler no descarga las noticias de un día específico, sino que descarga las todas las noticias desde
+la fecha más reciente hasta la fecha indicada con los parámetros 'year', 'month', 'day'  
+
+USO:
+scrapy crawl noticias --nolog -s filename=2018-02-06.json -a year=2018 -a month=2 -a day=6
+"""
+
+TAG_RE = re.compile(r'<[^>]+>')
+def remove_tags(text):
+    return TAG_RE.sub('', text)
+
+# LOC_RE = re.compile(r'\n.+?,? ?.+? ?\. ?- ?')
+# G_RE = re.compile(r' ?- ?')
+# EM_RE = re.compile(r'((Email|Correo electr.{1,3}nico|Comentarios?):\s)?[\w.-]+@[\w-]+(\.[a-zA-Z]{2,6}){1,2}\s?')
+# TW_RE = re.compile(r'M.{1,3}s de la P.{1,3}lvora en Twitter: @[\w.%+-]+.', re.I)
+# TW2_RE = re.compile(r'((\| )?Twitter:\s+)?(@[\w.%+-]+.)?', re.I)
+# TAG2_RE = re.compile(r'\ntransition_[^\]]+\]')
+# TAG3_RE = re.compile(r'\[[^\]]+[\]\n]')
+TIME = re.compile(r'\d{1,2}:\d{2} ?[ap]m')
+PUB = re.compile(r'"publishedAt":.*?,')
+
+
+class ImportantData(scrapy.Item):
+    section = scrapy.Field()
+    url1 = scrapy.Field()
+    url2 = scrapy.Field()
+    page = scrapy.Field()
+    res = scrapy.Field()
+
+
+class SectionData(scrapy.Item):
+    section = scrapy.Field()
+
+
+class UTC(tzinfo):
+	"""clase para el 'time zone' (zona horaria)"""
+
+	def utcoffset(self, dt):
+		# zona horaria para aguascalientes (centro de méxico): utc-6
+		return timedelta(hours=-6)
+
+	def tzname(self, dt):
+		# nombre de la zona horaria
+		return 'UTC-6'
+
+
+class QuotesSpider(scrapy.Spider):
+    name = "noticias"
+    newsSet = set()
+
+    def start_requests(self):
+        self.tz = UTC()
+        # year = getattr(self, "year", None)
+        # month = getattr(self, "month", None)
+        # day = getattr(self, "day", None)
+        # self.currentDate = date(int(year), int(month), int(day))
+        self.currentDate = datetime.now().date()
+        # self.currentDate = date(2018, 2, 23)
+
+        self.date_parser = {'enero': 1,      'febrero': 2,  'marzo': 3,      'abril': 4,
+                            'mayo': 5,       'junio': 6,    'julio': 7,      'agosto': 8,
+                            'septiembre': 9, 'octubre': 10, 'noviembre': 11, 'diciembre': 12}
+
+        sectionList = ["economia", "empresas", "nacional", "culturas",
+                       "deportes", "mundo", "bajio", "tech", "ciencia"]
+
+        self.baseURL = "http://www.elfinanciero.com.mx/"
+
+        """
+        Ejemplo de URL para las noticias de días anteriores para la sección Economía:
+        http://api.elfinanciero.com.mx/public/search/typed/?_format=json&json={%22search%22:%22*%22,%22categoriesslug%22:%22economia%22}&type=page&page=2&size=10
+        """
+        self.uri_base = "http://api.elfinanciero.com.mx/public/search/typed/?_format=json&json={%22search%22:%22*%22,%22categoriesslug%22:%22"
+        self.uri_page = "%22}&type=page&page="
+        self.uri_complement = "&size=10"
+
+	print(self.uri_base+self.uri_page+self.uri_complement)
+        for s in sectionList:
+            yield scrapy.Request(url=self.baseURL + s, callback=self.parse)
+
+
+    def parse(self, response):
+	print(response.url)
+        searchData = ImportantData()
+
+        CONTINUE_SEARCHING = True
+        section = response.url[response.url.rfind("/") + 1:]
+
+        for link in response.css('div.is-multiline').css('div.column-box').xpath('./a/@href').extract():
+            if link.find("/") == 0:
+                link = link[1:]
+            yield scrapy.Request(url=self.baseURL + link, callback=self.parse_item)
+
+        newsLinkList = response.xpath('//div[@class="column feed"]/a/@href').extract()
+        newsDateList = response.xpath('//div[@class="column feed"]').css('p.date-time::text').extract()
+        postDict = OrderedDict(zip(newsLinkList, newsDateList))
+
+        for uri in postDict.keys():
+            dt = postDict[uri]
+            res = TIME.match(dt)
+            if res:
+                postDate = datetime.now().date()
+            else:
+                postDate = datetime.strptime(dt, "%d/%m/%Y").date()
+
+            if postDate >= self.currentDate:
+                if uri.find("/") == 0:
+                    uri = uri[1:]
+                yield scrapy.Request(url=self.baseURL + uri, callback=self.parse_item)
+
+            else:
+                CONTINUE_SEARCHING = False
+                break
+
+        if CONTINUE_SEARCHING:
+            page = 2
+            url = self.uri_base + section + self.uri_page + str(page) + self.uri_complement
+            searchData['section'] = section
+            searchData['page'] = page
+            request = scrapy.Request(url=url, callback=self.continue_searching, dont_filter=True)
+            request.meta['item'] = searchData
+            yield request
+
+
+    def continue_searching(self, response):
+        CONTINUE_SEARCHING = True
+        searchData = response.meta['item']
+        REG_EXPR = re.compile(r'"' + re.escape(searchData['section']) + r'\\/.*?"')
+
+        lList = REG_EXPR.findall(response.body)
+        pList = PUB.findall(response.body)
+        linkList = [l.replace("\\", '').replace('"', '') for l in lList]
+        isodateList = [d[d.find(":")+1:].replace('"', '').replace(",", '') for d in pList]
+        postDict = OrderedDict(zip(linkList, [iso[:iso.find("T")] for iso in isodateList]))
+
+        for uri in postDict.keys():
+            dt = postDict[uri]
+            res = TIME.match(dt)
+            if res:
+                postDate = datetime.now().date()
+            else:
+                postDate = datetime.strptime(dt, "%Y-%m-%d").date()
+
+            if postDate >= self.currentDate:
+                if uri.find("/") == 0:
+                    uri = uri[1:]
+                yield scrapy.Request(url=self.baseURL + uri, callback=self.parse_item)
+
+            else:
+                CONTINUE_SEARCHING = False
+                break
+
+        if CONTINUE_SEARCHING:
+            searchData['page'] += 1
+            url = self.uri_base + searchData['section'] + self.uri_page + str(searchData['page']) + self.uri_complement
+            request = scrapy.Request(url=url, callback=self.continue_searching)
+            request.meta['item'] = searchData
+            yield request
+
+
+    def parse_item(self, response):
+        if not response.url in self.newsSet:
+            self.newsSet.add(response.url)
+            item = NoticiasItem()
+            text = ''
+
+            res = remove_tags(response.xpath('//script[@type="application/ld+json"]').extract_first())
+            resDict = json.loads(res)
+            dt = resDict['datePublished']
+            d, t = dt.split()
+            d = map(int, d.split("-"))
+            t = map(int, t.split(":"))
+            dat = date(d[0], d[1], d[2])
+
+            if dat >= self.currentDate:
+                item['date'] = datetime(d[0], d[1], d[2], t[0], t[1], t[2], tzinfo=self.tz).isoformat("T")
+
+                item['title'] = remove_tags(response.css('div.column').css('div.column').css('h1').extract_first()).strip()
+
+                topic = response.xpath('//div[@class="section-line"]').extract_first()
+                if topic is not None:
+                    item['topic'] = remove_tags(topic)
+                else:
+                    item['topic'] = None
+
+                author = response.xpath('//div[@class="note-author"]/a').extract_first()
+                if author is not None:
+                    item['author'] = remove_tags(author)
+
+                for p in response.css('div.content').css('p').extract():
+                    text += remove_tags(p) + '\n'
+
+                # result = LOC_RE.search(text)
+                # if result:
+                #     m = result.group(0)
+                #     location = G_RE.sub('', m).strip()
+                #     if len(location) <= 35:
+                #         item['location'] = location
+                #         text = text[text.find(m)+len(m):]
+
+                # text = EM_RE.sub('', text)
+                # text = TW_RE.sub('', text)
+                # text = TW2_RE.sub('', text)
+                # text = TAG2_RE.sub("\n", text)
+                # text = TAG3_RE.sub('', text)
+                item['text'] = text.strip()
+
+                item['url'] = response.url
+
+                yield item
--- a/descarga_hacia_atras/elFinanciero/scrapy.cfg
+++ b/descarga_hacia_atras/elFinanciero/scrapy.cfg
+# Automatically created by: scrapy startproject
+#
+# For more information about the [deploy] section see:
+# https://scrapyd.readthedocs.org/en/latest/deploy.html
+
+[settings]
+default = elFinanciero.settings
+
+[deploy]
+#url = http://localhost:6800/
+project = elFinanciero
--- a/descarga_hacia_atras/foraneos/amandala/amandala/__init__.py
+++ b/descarga_hacia_atras/foraneos/amandala/amandala/__init__.py
--- a/descarga_hacia_atras/foraneos/amandala/amandala/items.py
+++ b/descarga_hacia_atras/foraneos/amandala/amandala/items.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your scraped items
+#
+# See documentation in:
+# http://doc.scrapy.org/en/latest/topics/items.html
+
+import scrapy
+
+
+class NoticiasItem(scrapy.Item):
+    # define the fields for your item here like:
+    # name = scrapy.Field()
+    title = scrapy.Field()
+    text = scrapy.Field()
+    date = scrapy.Field()
+    location = scrapy.Field()
+    author = scrapy.Field()
+    topic = scrapy.Field()
+    url = scrapy.Field()
--- a/descarga_hacia_atras/foraneos/amandala/amandala/middlewares.py
+++ b/descarga_hacia_atras/foraneos/amandala/amandala/middlewares.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your spider middleware
+#
+# See documentation in:
+# http://doc.scrapy.org/en/latest/topics/spider-middleware.html
+
+from scrapy import signals
+
+
+class AmandalaSpiderMiddleware(object):
+    # Not all methods need to be defined. If a method is not defined,
+    # scrapy acts as if the spider middleware does not modify the
+    # passed objects.
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # This method is used by Scrapy to create your spiders.
+        s = cls()
+        crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
+        return s
+
+    def process_spider_input(response, spider):
+        # Called for each response that goes through the spider
+        # middleware and into the spider.
+
+        # Should return None or raise an exception.
+        return None
+
+    def process_spider_output(response, result, spider):
+        # Called with the results returned from the Spider, after
+        # it has processed the response.
+
+        # Must return an iterable of Request, dict or Item objects.
+        for i in result:
+            yield i
+
+    def process_spider_exception(response, exception, spider):
+        # Called when a spider or process_spider_input() method
+        # (from other spider middleware) raises an exception.
+
+        # Should return either None or an iterable of Response, dict
+        # or Item objects.
+        pass
+
+    def process_start_requests(start_requests, spider):
+        # Called with the start requests of the spider, and works
+        # similarly to the process_spider_output() method, except
+        # that it doesn’t have a response associated.
+
+        # Must return only requests (not items).
+        for r in start_requests:
+            yield r
+
+    def spider_opened(self, spider):
+        spider.logger.info('Spider opened: %s' % spider.name)
--- a/descarga_hacia_atras/foraneos/amandala/amandala/pipelines.py
+++ b/descarga_hacia_atras/foraneos/amandala/amandala/pipelines.py
+# -*- coding: utf-8 -*-
+
+# Define your item pipelines here
+#
+# Don't forget to add your pipeline to the ITEM_PIPELINES setting
+# See: http://doc.scrapy.org/en/latest/topics/item-pipeline.html
+
+import json
+from collections import OrderedDict
+
+
+class JsonWriterPipeline(object):
+
+    def __init__(self, filename):
+        self.filename = filename
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # Here you get whatever value was passed through the "filename" command line parameter
+        settings = crawler.settings
+        filename = settings.get('filename')
+
+        # Instantiate the pipeline with the file name
+        return cls(filename)
+
+    def open_spider(self, spider):
+        self.counter = 0
+        self.file = open(self.filename, 'w')
+        self.file.write("[")
+
+    def close_spider(self, spider):
+        self.file.write("]")
+        self.file.close()
+
+    def process_item(self, item, spider):
+        # print("this is my item", item)
+        row = []
+        try:
+            row.append(("date", item['date']))
+        except:
+            pass
+        try:
+            row.append(("topic", item['topic']))
+        except:
+            pass
+        try:
+            row.append(("title", item['title']))
+        except:
+            pass
+        try:
+            row.append(("author", item['author']))
+        except:
+            pass
+        try:
+            row.append(("location", item['location']))
+        except:
+            pass
+        try:
+            row.append(("text", item['text']))
+        except:
+            pass
+        try:
+            row.append(("url", item['url']))
+        except:
+            pass
+
+        line = OrderedDict(row)
+
+        self.counter += 1
+        if self.counter == 1:
+            self.file.write(json.dumps(line))
+        elif self.counter > 1:
+            self.file.write(",\n" + json.dumps(line))
+
+        return item
--- a/descarga_hacia_atras/foraneos/amandala/amandala/settings.py
+++ b/descarga_hacia_atras/foraneos/amandala/amandala/settings.py
+# -*- coding: utf-8 -*-
+
+# Scrapy settings for amandala project
+#
+# For simplicity, this file contains only settings considered important or
+# commonly used. You can find more settings consulting the documentation:
+#
+#     http://doc.scrapy.org/en/latest/topics/settings.html
+#     http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html
+#     http://scrapy.readthedocs.org/en/latest/topics/spider-middleware.html
+
+BOT_NAME = 'amandala'
+
+SPIDER_MODULES = ['amandala.spiders']
+NEWSPIDER_MODULE = 'amandala.spiders'
+
+
+# Crawl responsibly by identifying yourself (and your website) on the user-agent
+#USER_AGENT = 'amandala (+http://www.yourdomain.com)'
+
+# Obey robots.txt rules
+# ROBOTSTXT_OBEY = True
+
+# Configure maximum concurrent requests performed by Scrapy (default: 16)
+#CONCURRENT_REQUESTS = 32
+
+# Configure a delay for requests for the same website (default: 0)
+# See http://scrapy.readthedocs.org/en/latest/topics/settings.html#download-delay
+# See also autothrottle settings and docs
+DOWNLOAD_DELAY = 0.5
+# The download delay setting will honor only one of:
+#CONCURRENT_REQUESTS_PER_DOMAIN = 16
+#CONCURRENT_REQUESTS_PER_IP = 16
+
+# Disable cookies (enabled by default)
+COOKIES_ENABLED = False
+
+# Disable Telnet Console (enabled by default)
+#TELNETCONSOLE_ENABLED = False
+
+# Override the default request headers:
+#DEFAULT_REQUEST_HEADERS = {
+#   'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
+#   'Accept-Language': 'en',
+#}
+
+# Enable or disable spider middlewares
+# See http://scrapy.readthedocs.org/en/latest/topics/spider-middleware.html
+#SPIDER_MIDDLEWARES = {
+#    'amandala.middlewares.AmandalaSpiderMiddleware': 543,
+#}
+
+# Enable or disable downloader middlewares
+# See http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html
+#DOWNLOADER_MIDDLEWARES = {
+#    'amandala.middlewares.MyCustomDownloaderMiddleware': 543,
+#}
+
+# Enable or disable extensions
+# See http://scrapy.readthedocs.org/en/latest/topics/extensions.html
+#EXTENSIONS = {
+#    'scrapy.extensions.telnet.TelnetConsole': None,
+#}
+
+# Configure item pipelines
+# See http://scrapy.readthedocs.org/en/latest/topics/item-pipeline.html
+ITEM_PIPELINES = {
+   'amandala.pipelines.JsonWriterPipeline': 300,
+}
+
+# Enable and configure the AutoThrottle extension (disabled by default)
+# See http://doc.scrapy.org/en/latest/topics/autothrottle.html
+#AUTOTHROTTLE_ENABLED = True
+# The initial download delay
+#AUTOTHROTTLE_START_DELAY = 5
+# The maximum download delay to be set in case of high latencies
+#AUTOTHROTTLE_MAX_DELAY = 60
+# The average number of requests Scrapy should be sending in parallel to
+# each remote server
+#AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0
+# Enable showing throttling stats for every response received:
+#AUTOTHROTTLE_DEBUG = False
+
+# Enable and configure HTTP caching (disabled by default)
+# See http://scrapy.readthedocs.org/en/latest/topics/downloader-middleware.html#httpcache-middleware-settings
+#HTTPCACHE_ENABLED = True
+#HTTPCACHE_EXPIRATION_SECS = 0
+#HTTPCACHE_DIR = 'httpcache'
+#HTTPCACHE_IGNORE_HTTP_CODES = []
+#HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'
--- a/descarga_hacia_atras/foraneos/amandala/amandala/spiders/__init__.py
+++ b/descarga_hacia_atras/foraneos/amandala/amandala/spiders/__init__.py
+# This package will contain the spiders of your Scrapy project
+#
+# Please refer to the documentation for information on how to create and manage
+# your spiders.
--- a/descarga_hacia_atras/foraneos/amandala/amandala/spiders/noticias.py
+++ b/descarga_hacia_atras/foraneos/amandala/amandala/spiders/noticias.py
+# -*- coding: utf-8 -*-
+import scrapy, re, json
+from datetime import datetime, date
+from amandala.items import NoticiasItem
+
+"""
+MEDIO:
+Amandala, Belice
+USO:
+// Si se quiere obtener todas las noticias desde las más actuales hasta las más antiguas. //
+scrapy crawl noticias --nolog -s filename=noticias.json
+-------------------------------------------------------------------------------------------------
+// Si se quiere obtener todas las noticias desde las más actuales hasta una fecha específica. //
+scrapy crawl noticias --nolog -s filename=noticias.json -a year=2018 -a month=3 -a day=5
+-------------------------------------------------------------------------------------------------
+Después será necesario hacer uso del archivo parse_date_files.py para que las noticias contenidas
+en noticias.json sean separadas en archivos por fecha.
+"""
+
+TAG_RE = re.compile(r'<[^>]+>')
+def remove_tags(text):
+    return TAG_RE.sub('', text)
+
+DAT_RE = re.compile(r'\d{4}\/\d{2}\/\d{2}')
+
+
+class ImportantData(scrapy.Item):
+    CONTINUE_SEARCHING = scrapy.Field()
+    LAST_LINK = scrapy.Field()
+    url = scrapy.Field()
+
+
+class QuotesSpider(scrapy.Spider):
+    name = "noticias"
+
+    def start_requests(self):
+        year = getattr(self, "year", None)
+        month = getattr(self, "month", None)
+        day = getattr(self, "day", None)
+
+        if year is not None and month is not None and day is not None:
+            self.stopDate = date(int(year), int(month), int(day))
+        else:
+            self.stopDate = None
+
+        baseURL = "http://amandala.com.bz/news/category/"
+
+        sectionList = ["headline", "highlights", "general", "features",
+                       "sports", "letters", "editorial", "publisher"]
+        # sectionList = ["headline"]
+
+        if self.stopDate is None:
+            for s in sectionList:
+                yield scrapy.Request(url=baseURL + s, callback=self.parse)
+
+        else:
+            for s in sectionList:
+                info = ImportantData()
+                info['CONTINUE_SEARCHING'] = False
+                request = scrapy.Request(url=baseURL + s, callback=self.parse_with_stop_date)
+                request.meta['item'] = info
+                yield request
+
+
+    def parse(self, response):
+        linkList = response.xpath('//div[@id="list_categories"]').css('div.content').css('h3').css('a::attr(href)').extract()
+
+        for link in linkList:
+            yield scrapy.Request(url=link, callback=self.parse_item)
+
+        nextPage = response.xpath('//div[@id="entries"]').css('div.old_entries').css('a::attr(href)').extract_first()
+        if nextPage is not None:
+            yield scrapy.Request(url=nextPage, callback=self.parse)
+
+
+    def parse_with_stop_date(self, response):
+        searchData = response.meta['item']
+        CONTINUE_SEARCHING = searchData['CONTINUE_SEARCHING']
+
+        if not CONTINUE_SEARCHING:
+            linkList = response.xpath('//div[@id="list_categories"]').css('div.content').css('h3').css('a::attr(href)').extract()
+
+            for link in linkList:
+                info = ImportantData()
+                info['url'] = response.url
+                if link == linkList[-1]: info['LAST_LINK'] = True
+                else: info['LAST_LINK'] = False
+                reqst = scrapy.Request(url=link, callback=self.parse_item_with_stop_date)
+                reqst.meta['item'] = info
+                yield reqst
+
+        else:
+            nextPage = response.xpath('//div[@id="entries"]').css('div.old_entries').css('a::attr(href)').extract_first()
+            if nextPage is not None:
+                searchData['CONTINUE_SEARCHING'] = False
+                request = scrapy.Request(url=nextPage, callback=self.parse_with_stop_date)
+                request.meta['item'] = searchData
+                yield request
+
+
+    def parse_item(self, response):
+        item = NoticiasItem()
+        text = ''
+
+        d = response.xpath('//meta[@property="article:published_time"]/@content').extract_first()
+        item['date'] = datetime.strptime(d, '%Y-%m-%d').isoformat("T")
+        item['title'] = remove_tags(response.xpath('//div[@class="active"]/h1/a').extract_first())
+
+        try:
+            topic = response.css('div.date').css('span.date').css('a::text').extract()[0]
+        except:
+            topic = None
+        item['topic'] = topic
+
+        for p in response.css('div.content').css('p').extract():
+            text += remove_tags(p) + "\n"
+
+        item['text'] = text.strip()
+
+        item['url'] = response.url
+
+        yield item
+
+
+    def parse_item_with_stop_date(self, response):
+        d = response.xpath('//meta[@property="article:published_time"]/@content').extract_first()
+        dt = datetime.strptime(d, '%Y-%m-%d').date()
+
+        if dt >= self.stopDate:
+            info = response.meta['item']
+            item = NoticiasItem()
+            text = ''
+
+            item['date'] = datetime.strptime(d, '%Y-%m-%d').isoformat("T")
+            item['title'] = remove_tags(response.xpath('//div[@class="active"]/h1/a').extract_first())
+
+            try:
+                topic = response.css('div.date').css('span.date').css('a::text').extract()[0]
+            except:
+                topic = None
+            item['topic'] = topic
+
+            for p in response.css('div.content').css('p').extract():
+                text += remove_tags(p) + "\n"
+
+            item['text'] = text.strip()
+
+            item['url'] = response.url
+
+            yield item
+
+            if info['LAST_LINK']:
+                info['CONTINUE_SEARCHING'] = True
+                request = scrapy.Request(url=info['url'], callback=self.parse_with_stop_date, dont_filter=True)
+                request.meta['item'] = info
+                yield request
--- a/descarga_hacia_atras/foraneos/amandala/scrapy.cfg
+++ b/descarga_hacia_atras/foraneos/amandala/scrapy.cfg
+# Automatically created by: scrapy startproject
+#
+# For more information about the [deploy] section see:
+# https://scrapyd.readthedocs.org/en/latest/deploy.html
+
+[settings]
+default = amandala.settings
+
+[deploy]
+#url = http://localhost:6800/
+project = amandala
--- a/descarga_hacia_atras/foraneos/heraldoHn/heraldoHn/__init__.py
+++ b/descarga_hacia_atras/foraneos/heraldoHn/heraldoHn/__init__.py
--- a/descarga_hacia_atras/foraneos/heraldoHn/heraldoHn/items.py
+++ b/descarga_hacia_atras/foraneos/heraldoHn/heraldoHn/items.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your scraped items
+#
+# See documentation in:
+# http://doc.scrapy.org/en/latest/topics/items.html
+
+import scrapy
+
+
+class NoticiasItem(scrapy.Item):
+    # define the fields for your item here like:
+    # name = scrapy.Field()
+    title = scrapy.Field()
+    text = scrapy.Field()
+    date = scrapy.Field()
+    location = scrapy.Field()
+    author = scrapy.Field()
+    topic = scrapy.Field()
+    url = scrapy.Field()
--- a/descarga_hacia_atras/foraneos/heraldoHn/heraldoHn/middlewares.py
+++ b/descarga_hacia_atras/foraneos/heraldoHn/heraldoHn/middlewares.py
+# -*- coding: utf-8 -*-
+
+# Define here the models for your spider middleware
+#
+# See documentation in:
+# https://doc.scrapy.org/en/latest/topics/spider-middleware.html
+
+from scrapy import signals
+
+
+class HeraldohnSpiderMiddleware(object):
+    # Not all methods need to be defined. If a method is not defined,
+    # scrapy acts as if the spider middleware does not modify the
+    # passed objects.
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # This method is used by Scrapy to create your spiders.
+        s = cls()
+        crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
+        return s
+
+    def process_spider_input(self, response, spider):
+        # Called for each response that goes through the spider
+        # middleware and into the spider.
+
+        # Should return None or raise an exception.
+        return None
+
+    def process_spider_output(self, response, result, spider):
+        # Called with the results returned from the Spider, after
+        # it has processed the response.
+
+        # Must return an iterable of Request, dict or Item objects.
+        for i in result:
+            yield i
+
+    def process_spider_exception(self, response, exception, spider):
+        # Called when a spider or process_spider_input() method
+        # (from other spider middleware) raises an exception.
+
+        # Should return either None or an iterable of Response, dict
+        # or Item objects.
+        pass
+
+    def process_start_requests(self, start_requests, spider):
+        # Called with the start requests of the spider, and works
+        # similarly to the process_spider_output() method, except
+        # that it doesn’t have a response associated.
+
+        # Must return only requests (not items).
+        for r in start_requests:
+            yield r
+
+    def spider_opened(self, spider):
+        spider.logger.info('Spider opened: %s' % spider.name)
+
+
+class HeraldohnDownloaderMiddleware(object):
+    # Not all methods need to be defined. If a method is not defined,
+    # scrapy acts as if the downloader middleware does not modify the
+    # passed objects.
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # This method is used by Scrapy to create your spiders.
+        s = cls()
+        crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
+        return s
+
+    def process_request(self, request, spider):
+        # Called for each request that goes through the downloader
+        # middleware.
+
+        # Must either:
+        # - return None: continue processing this request
+        # - or return a Response object
+        # - or return a Request object
+        # - or raise IgnoreRequest: process_exception() methods of
+        #   installed downloader middleware will be called
+        return None
+
+    def process_response(self, request, response, spider):
+        # Called with the response returned from the downloader.
+
+        # Must either;
+        # - return a Response object
+        # - return a Request object
+        # - or raise IgnoreRequest
+        return response
+
+    def process_exception(self, request, exception, spider):
+        # Called when a download handler or a process_request()
+        # (from other downloader middleware) raises an exception.
+
+        # Must either:
+        # - return None: continue processing this exception
+        # - return a Response object: stops process_exception() chain
+        # - return a Request object: stops process_exception() chain
+        pass
+
+    def spider_opened(self, spider):
+        spider.logger.info('Spider opened: %s' % spider.name)
--- a/descarga_hacia_atras/foraneos/heraldoHn/heraldoHn/pipelines.py
+++ b/descarga_hacia_atras/foraneos/heraldoHn/heraldoHn/pipelines.py
+# -*- coding: utf-8 -*-
+
+# Define your item pipelines here
+#
+# Don't forget to add your pipeline to the ITEM_PIPELINES setting
+# See: http://doc.scrapy.org/en/latest/topics/item-pipeline.html
+
+import json
+from collections import OrderedDict
+
+
+class JsonWriterPipeline(object):
+
+    def __init__(self, filename):
+        self.filename = filename
+
+    @classmethod
+    def from_crawler(cls, crawler):
+        # Here you get whatever value was passed through the "filename" command line parameter
+        settings = crawler.settings
+        filename = settings.get('filename')
+
+        # Instantiate the pipeline with the file name
+        return cls(filename)
+
+    def open_spider(self, spider):
+        self.counter = 0
+        self.file = open(self.filename, 'w')
+        self.file.write("[")
+
+    def close_spider(self, spider):
+        self.file.write("]")
+        self.file.close()
+
+    def process_item(self, item, spider):
+        # print("this is my item", item)
+        row = []
+        try:
+            row.append(("date", item['date']))
+        except:
+            pass
+        try:
+            row.append(("topic", item['topic']))
+        except:
+            pass
+        try:
+            row.append(("title", item['title']))
+        except:
+            pass
+        try:
+            row.append(("author", item['author']))
+        except:
+            pass
+        try:
+            row.append(("location", item['location']))
+        except:
+            pass
+        try:
+            row.append(("text", item['text']))
+        except:
+            pass
+        try:
+            row.append(("url", item['url']))
+        except:
+            pass
+
+        line = OrderedDict(row)
+
+        self.counter += 1
+        if self.counter == 1:
+            self.file.write(json.dumps(line))
+        elif self.counter > 1:
+            self.file.write(",\n" + json.dumps(line))
+
+        return item
--- a/descarga_hacia_atras/foraneos/heraldoHn/heraldoHn/settings.py
+++ b/descarga_hacia_atras/foraneos/heraldoHn/heraldoHn/settings.py
+# -*- coding: utf-8 -*-
+
+# Scrapy settings for heraldoHn project
+#
+# For simplicity, this file contains only settings considered important or
+# commonly used. You can find more settings consulting the documentation:
+#
+#     https://doc.scrapy.org/en/latest/topics/settings.html
+#     https://doc.scrapy.org/en/latest/topics/downloader-middleware.html
+#     https://doc.scrapy.org/en/latest/topics/spider-middleware.html
+
+BOT_NAME = 'heraldoHn'
+
+SPIDER_MODULES = ['heraldoHn.spiders']
+NEWSPIDER_MODULE = 'heraldoHn.spiders'
+
+
+# Crawl responsibly by identifying yourself (and your website) on the user-agent
+#USER_AGENT = 'heraldoHn (+http://www.yourdomain.com)'
+
+# Obey robots.txt rules
+# ROBOTSTXT_OBEY = True
+
+# Configure maximum concurrent requests performed by Scrapy (default: 16)
+#CONCURRENT_REQUESTS = 32
+
+# Configure a delay for requests for the same website (default: 0)
+# See https://doc.scrapy.org/en/latest/topics/settings.html#download-delay
+# See also autothrottle settings and docs
+DOWNLOAD_DELAY = 0.5
+# The download delay setting will honor only one of:
+#CONCURRENT_REQUESTS_PER_DOMAIN = 16
+#CONCURRENT_REQUESTS_PER_IP = 16
+
+# Disable cookies (enabled by default)
+COOKIES_ENABLED = False
+
+# Disable Telnet Console (enabled by default)
+#TELNETCONSOLE_ENABLED = False
+
+# Override the default request headers:
+#DEFAULT_REQUEST_HEADERS = {
+#   'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
+#   'Accept-Language': 'en',
+#}
+
+# Enable or disable spider middlewares
+# See https://doc.scrapy.org/en/latest/topics/spider-middleware.html
+#SPIDER_MIDDLEWARES = {
+#    'heraldoHn.middlewares.HeraldohnSpiderMiddleware': 543,
+#}
+
+# Enable or disable downloader middlewares
+# See https://doc.scrapy.org/en/latest/topics/downloader-middleware.html
+#DOWNLOADER_MIDDLEWARES = {
+#    'heraldoHn.middlewares.HeraldohnDownloaderMiddleware': 543,
+#}
+
+# Enable or disable extensions
+# See https://doc.scrapy.org/en/latest/topics/extensions.html
+#EXTENSIONS = {
+#    'scrapy.extensions.telnet.TelnetConsole': None,
+#}
+
+# Configure item pipelines
+# See https://doc.scrapy.org/en/latest/topics/item-pipeline.html
+ITEM_PIPELINES = {
+   'heraldoHn.pipelines.JsonWriterPipeline': 300,
+}
+
+# Enable and configure the AutoThrottle extension (disabled by default)
+# See https://doc.scrapy.org/en/latest/topics/autothrottle.html
+#AUTOTHROTTLE_ENABLED = True
+# The initial download delay
+#AUTOTHROTTLE_START_DELAY = 5
+# The maximum download delay to be set in case of high latencies
+#AUTOTHROTTLE_MAX_DELAY = 60
+# The average number of requests Scrapy should be sending in parallel to
+# each remote server
+#AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0
+# Enable showing throttling stats for every response received:
+#AUTOTHROTTLE_DEBUG = False
+
+# Enable and configure HTTP caching (disabled by default)
+# See https://doc.scrapy.org/en/latest/topics/downloader-middleware.html#httpcache-middleware-settings
+#HTTPCACHE_ENABLED = True
+#HTTPCACHE_EXPIRATION_SECS = 0
+#HTTPCACHE_DIR = 'httpcache'
+#HTTPCACHE_IGNORE_HTTP_CODES = []
+#HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'
--- a/descarga_hacia_atras/foraneos/heraldoHn/heraldoHn/spiders/__init__.py
+++ b/descarga_hacia_atras/foraneos/heraldoHn/heraldoHn/spiders/__init__.py
+# This package will contain the spiders of your Scrapy project
+#
+# Please refer to the documentation for information on how to create and manage
+# your spiders.
--- a/descarga_hacia_atras/foraneos/heraldoHn/heraldoHn/spiders/noticias.py
+++ b/descarga_hacia_atras/foraneos/heraldoHn/heraldoHn/spiders/noticias.py
--- a/descarga_hacia_atras/foraneos/heraldoHn/news.json
+++ b/descarga_hacia_atras/foraneos/heraldoHn/news.json
--- a/descarga_hacia_atras/foraneos/heraldoHn/scrapy.cfg
+++ b/descarga_hacia_atras/foraneos/heraldoHn/scrapy.cfg
--- a/descarga_hacia_atras/foraneos/prensaGrafica/prensaGrafica/__init__.py
+++ b/descarga_hacia_atras/foraneos/prensaGrafica/prensaGrafica/__init__.py
--- a/descarga_hacia_atras/foraneos/prensaGrafica/prensaGrafica/items.py
+++ b/descarga_hacia_atras/foraneos/prensaGrafica/prensaGrafica/items.py
--- a/descarga_hacia_atras/foraneos/prensaGrafica/prensaGrafica/middlewares.py
+++ b/descarga_hacia_atras/foraneos/prensaGrafica/prensaGrafica/middlewares.py
--- a/descarga_hacia_atras/foraneos/prensaGrafica/prensaGrafica/pipelines.py
+++ b/descarga_hacia_atras/foraneos/prensaGrafica/prensaGrafica/pipelines.py
--- a/descarga_hacia_atras/foraneos/prensaGrafica/prensaGrafica/settings.py
+++ b/descarga_hacia_atras/foraneos/prensaGrafica/prensaGrafica/settings.py
--- a/descarga_hacia_atras/foraneos/prensaGrafica/prensaGrafica/spiders/__init__.py
+++ b/descarga_hacia_atras/foraneos/prensaGrafica/prensaGrafica/spiders/__init__.py
--- a/descarga_hacia_atras/foraneos/prensaGrafica/prensaGrafica/spiders/noticias.py
+++ b/descarga_hacia_atras/foraneos/prensaGrafica/prensaGrafica/spiders/noticias.py
--- a/descarga_hacia_atras/foraneos/prensaGrafica/scrapy.cfg
+++ b/descarga_hacia_atras/foraneos/prensaGrafica/scrapy.cfg
--- a/descarga_hacia_atras/foraneos/prensaHn/prensaHn/__init__.py
+++ b/descarga_hacia_atras/foraneos/prensaHn/prensaHn/__init__.py
--- a/descarga_hacia_atras/foraneos/prensaHn/prensaHn/items.py
+++ b/descarga_hacia_atras/foraneos/prensaHn/prensaHn/items.py
--- a/descarga_hacia_atras/foraneos/prensaHn/prensaHn/middlewares.py
+++ b/descarga_hacia_atras/foraneos/prensaHn/prensaHn/middlewares.py
--- a/descarga_hacia_atras/foraneos/prensaHn/prensaHn/pipelines.py
+++ b/descarga_hacia_atras/foraneos/prensaHn/prensaHn/pipelines.py
--- a/descarga_hacia_atras/foraneos/prensaHn/prensaHn/settings.py
+++ b/descarga_hacia_atras/foraneos/prensaHn/prensaHn/settings.py
--- a/descarga_hacia_atras/foraneos/prensaHn/prensaHn/spiders/__init__.py
+++ b/descarga_hacia_atras/foraneos/prensaHn/prensaHn/spiders/__init__.py
--- a/descarga_hacia_atras/foraneos/prensaHn/prensaHn/spiders/noticias.py
+++ b/descarga_hacia_atras/foraneos/prensaHn/prensaHn/spiders/noticias.py
--- a/descarga_hacia_atras/foraneos/prensaHn/scrapy.cfg
+++ b/descarga_hacia_atras/foraneos/prensaHn/scrapy.cfg
--- a/descarga_hacia_atras/heraldoChihuahua/heraldoChihuahua/__init__.py
+++ b/descarga_hacia_atras/heraldoChihuahua/heraldoChihuahua/__init__.py
--- a/descarga_hacia_atras/heraldoChihuahua/heraldoChihuahua/items.py
+++ b/descarga_hacia_atras/heraldoChihuahua/heraldoChihuahua/items.py
--- a/descarga_hacia_atras/heraldoChihuahua/heraldoChihuahua/middlewares.py
+++ b/descarga_hacia_atras/heraldoChihuahua/heraldoChihuahua/middlewares.py
--- a/descarga_hacia_atras/heraldoChihuahua/heraldoChihuahua/pipelines.py
+++ b/descarga_hacia_atras/heraldoChihuahua/heraldoChihuahua/pipelines.py
--- a/descarga_hacia_atras/heraldoChihuahua/heraldoChihuahua/settings.py
+++ b/descarga_hacia_atras/heraldoChihuahua/heraldoChihuahua/settings.py
--- a/descarga_hacia_atras/heraldoChihuahua/heraldoChihuahua/spiders/__init__.py
+++ b/descarga_hacia_atras/heraldoChihuahua/heraldoChihuahua/spiders/__init__.py
--- a/descarga_hacia_atras/heraldoChihuahua/heraldoChihuahua/spiders/noticias.py
+++ b/descarga_hacia_atras/heraldoChihuahua/heraldoChihuahua/spiders/noticias.py
--- a/descarga_hacia_atras/heraldoChihuahua/scrapy.cfg
+++ b/descarga_hacia_atras/heraldoChihuahua/scrapy.cfg
--- a/descarga_hacia_atras/laJornadaBC/laJornadaBC/__init__.py
+++ b/descarga_hacia_atras/laJornadaBC/laJornadaBC/__init__.py
--- a/descarga_hacia_atras/laJornadaBC/laJornadaBC/items.py
+++ b/descarga_hacia_atras/laJornadaBC/laJornadaBC/items.py
--- a/descarga_hacia_atras/laJornadaBC/laJornadaBC/middlewares.py
+++ b/descarga_hacia_atras/laJornadaBC/laJornadaBC/middlewares.py
--- a/descarga_hacia_atras/laJornadaBC/laJornadaBC/pipelines.py
+++ b/descarga_hacia_atras/laJornadaBC/laJornadaBC/pipelines.py
--- a/descarga_hacia_atras/laJornadaBC/laJornadaBC/settings.py
+++ b/descarga_hacia_atras/laJornadaBC/laJornadaBC/settings.py
--- a/descarga_hacia_atras/laJornadaBC/laJornadaBC/spiders/__init__.py
+++ b/descarga_hacia_atras/laJornadaBC/laJornadaBC/spiders/__init__.py
--- a/descarga_hacia_atras/laJornadaBC/laJornadaBC/spiders/noticias.py
+++ b/descarga_hacia_atras/laJornadaBC/laJornadaBC/spiders/noticias.py
--- a/descarga_hacia_atras/laJornadaBC/news.json
+++ b/descarga_hacia_atras/laJornadaBC/news.json
--- a/descarga_hacia_atras/laJornadaBC/scrapy.cfg
+++ b/descarga_hacia_atras/laJornadaBC/scrapy.cfg
--- a/descarga_hacia_atras/laJornadaMaya/laJornadaMaya/__init__.py
+++ b/descarga_hacia_atras/laJornadaMaya/laJornadaMaya/__init__.py
--- a/descarga_hacia_atras/laJornadaMaya/laJornadaMaya/items.py
+++ b/descarga_hacia_atras/laJornadaMaya/laJornadaMaya/items.py
--- a/descarga_hacia_atras/laJornadaMaya/laJornadaMaya/middlewares.py
+++ b/descarga_hacia_atras/laJornadaMaya/laJornadaMaya/middlewares.py
--- a/descarga_hacia_atras/laJornadaMaya/laJornadaMaya/pipelines.py
+++ b/descarga_hacia_atras/laJornadaMaya/laJornadaMaya/pipelines.py
--- a/descarga_hacia_atras/laJornadaMaya/laJornadaMaya/settings.py
+++ b/descarga_hacia_atras/laJornadaMaya/laJornadaMaya/settings.py
--- a/descarga_hacia_atras/laJornadaMaya/laJornadaMaya/spiders/__init__.py
+++ b/descarga_hacia_atras/laJornadaMaya/laJornadaMaya/spiders/__init__.py
--- a/descarga_hacia_atras/laJornadaMaya/laJornadaMaya/spiders/noticias.py
+++ b/descarga_hacia_atras/laJornadaMaya/laJornadaMaya/spiders/noticias.py
--- a/descarga_hacia_atras/laJornadaMaya/scrapy.cfg
+++ b/descarga_hacia_atras/laJornadaMaya/scrapy.cfg
--- a/descarga_hacia_atras/solDelCentro/scrapy.cfg
+++ b/descarga_hacia_atras/solDelCentro/scrapy.cfg
--- a/descarga_hacia_atras/solDelCentro/solDelCentro/__init__.py
+++ b/descarga_hacia_atras/solDelCentro/solDelCentro/__init__.py
--- a/descarga_hacia_atras/solDelCentro/solDelCentro/items.py
+++ b/descarga_hacia_atras/solDelCentro/solDelCentro/items.py
--- a/descarga_hacia_atras/solDelCentro/solDelCentro/middlewares.py
+++ b/descarga_hacia_atras/solDelCentro/solDelCentro/middlewares.py
--- a/descarga_hacia_atras/solDelCentro/solDelCentro/pipelines.py
+++ b/descarga_hacia_atras/solDelCentro/solDelCentro/pipelines.py
--- a/descarga_hacia_atras/solDelCentro/solDelCentro/settings.py
+++ b/descarga_hacia_atras/solDelCentro/solDelCentro/settings.py
--- a/descarga_hacia_atras/solDelCentro/solDelCentro/spiders/__init__.py
+++ b/descarga_hacia_atras/solDelCentro/solDelCentro/spiders/__init__.py
--- a/descarga_hacia_atras/solDelCentro/solDelCentro/spiders/noticias.py
+++ b/descarga_hacia_atras/solDelCentro/solDelCentro/spiders/noticias.py
--- a/descarga_hacia_atras/tintaFresca/scrapy.cfg
+++ b/descarga_hacia_atras/tintaFresca/scrapy.cfg
--- a/descarga_hacia_atras/tintaFresca/tintaFresca/__init__.py
+++ b/descarga_hacia_atras/tintaFresca/tintaFresca/__init__.py
--- a/descarga_hacia_atras/tintaFresca/tintaFresca/items.py
+++ b/descarga_hacia_atras/tintaFresca/tintaFresca/items.py
--- a/descarga_hacia_atras/tintaFresca/tintaFresca/middlewares.py
+++ b/descarga_hacia_atras/tintaFresca/tintaFresca/middlewares.py
--- a/descarga_hacia_atras/tintaFresca/tintaFresca/pipelines.py
+++ b/descarga_hacia_atras/tintaFresca/tintaFresca/pipelines.py
--- a/descarga_hacia_atras/tintaFresca/tintaFresca/settings.py
+++ b/descarga_hacia_atras/tintaFresca/tintaFresca/settings.py
--- a/descarga_hacia_atras/tintaFresca/tintaFresca/spiders/__init__.py
+++ b/descarga_hacia_atras/tintaFresca/tintaFresca/spiders/__init__.py
--- a/descarga_hacia_atras/tintaFresca/tintaFresca/spiders/noticias.py
+++ b/descarga_hacia_atras/tintaFresca/tintaFresca/spiders/noticias.py
--- a/descarga_hacia_atras/yucatanAlMinuto/scrapy.cfg
+++ b/descarga_hacia_atras/yucatanAlMinuto/scrapy.cfg
--- a/descarga_hacia_atras/yucatanAlMinuto/yucatanAlMinuto/__init__.py
+++ b/descarga_hacia_atras/yucatanAlMinuto/yucatanAlMinuto/__init__.py
--- a/descarga_hacia_atras/yucatanAlMinuto/yucatanAlMinuto/items.py
+++ b/descarga_hacia_atras/yucatanAlMinuto/yucatanAlMinuto/items.py
--- a/descarga_hacia_atras/yucatanAlMinuto/yucatanAlMinuto/pipelines.py
+++ b/descarga_hacia_atras/yucatanAlMinuto/yucatanAlMinuto/pipelines.py
--- a/descarga_hacia_atras/yucatanAlMinuto/yucatanAlMinuto/settings.py
+++ b/descarga_hacia_atras/yucatanAlMinuto/yucatanAlMinuto/settings.py
--- a/descarga_hacia_atras/yucatanAlMinuto/yucatanAlMinuto/spiders/__init__.py
+++ b/descarga_hacia_atras/yucatanAlMinuto/yucatanAlMinuto/spiders/__init__.py
--- a/descarga_hacia_atras/yucatanAlMinuto/yucatanAlMinuto/spiders/noticias.py
+++ b/descarga_hacia_atras/yucatanAlMinuto/yucatanAlMinuto/spiders/noticias.py
--- a/descarga_hacia_atras/yucatanAlMinuto2/scrapy.cfg
+++ b/descarga_hacia_atras/yucatanAlMinuto2/scrapy.cfg
--- a/descarga_hacia_atras/yucatanAlMinuto2/yucatanAlMinuto2/__init__.py
+++ b/descarga_hacia_atras/yucatanAlMinuto2/yucatanAlMinuto2/__init__.py
--- a/descarga_hacia_atras/yucatanAlMinuto2/yucatanAlMinuto2/items.py
+++ b/descarga_hacia_atras/yucatanAlMinuto2/yucatanAlMinuto2/items.py
--- a/descarga_hacia_atras/yucatanAlMinuto2/yucatanAlMinuto2/middlewares.py
+++ b/descarga_hacia_atras/yucatanAlMinuto2/yucatanAlMinuto2/middlewares.py
--- a/descarga_hacia_atras/yucatanAlMinuto2/yucatanAlMinuto2/pipelines.py
+++ b/descarga_hacia_atras/yucatanAlMinuto2/yucatanAlMinuto2/pipelines.py
--- a/descarga_hacia_atras/yucatanAlMinuto2/yucatanAlMinuto2/settings.py
+++ b/descarga_hacia_atras/yucatanAlMinuto2/yucatanAlMinuto2/settings.py
--- a/descarga_hacia_atras/yucatanAlMinuto2/yucatanAlMinuto2/spiders/__init__.py
+++ b/descarga_hacia_atras/yucatanAlMinuto2/yucatanAlMinuto2/spiders/__init__.py
--- a/descarga_hacia_atras/yucatanAlMinuto2/yucatanAlMinuto2/spiders/noticias.py
+++ b/descarga_hacia_atras/yucatanAlMinuto2/yucatanAlMinuto2/spiders/noticias.py
--- a/descarga_por_dia/alChile/alChile/__init__.py
+++ b/descarga_por_dia/alChile/alChile/__init__.py
--- a/descarga_por_dia/alChile/alChile/items.py
+++ b/descarga_por_dia/alChile/alChile/items.py
--- a/descarga_por_dia/alChile/alChile/middlewares.py
+++ b/descarga_por_dia/alChile/alChile/middlewares.py
--- a/descarga_por_dia/alChile/alChile/pipelines.py
+++ b/descarga_por_dia/alChile/alChile/pipelines.py
--- a/descarga_por_dia/alChile/alChile/settings.py
+++ b/descarga_por_dia/alChile/alChile/settings.py
--- a/descarga_por_dia/alChile/alChile/spiders/__init__.py
+++ b/descarga_por_dia/alChile/alChile/spiders/__init__.py
--- a/descarga_por_dia/alChile/alChile/spiders/noticias.py
+++ b/descarga_por_dia/alChile/alChile/spiders/noticias.py
--- a/descarga_por_dia/alChile/scrapy.cfg
+++ b/descarga_por_dia/alChile/scrapy.cfg
--- a/descarga_por_dia/campecheHoy/campecheHoy/__init__.py
+++ b/descarga_por_dia/campecheHoy/campecheHoy/__init__.py
--- a/descarga_por_dia/campecheHoy/campecheHoy/items.py
+++ b/descarga_por_dia/campecheHoy/campecheHoy/items.py
--- a/descarga_por_dia/campecheHoy/campecheHoy/middlewares.py
+++ b/descarga_por_dia/campecheHoy/campecheHoy/middlewares.py
--- a/descarga_por_dia/campecheHoy/campecheHoy/pipelines.py
+++ b/descarga_por_dia/campecheHoy/campecheHoy/pipelines.py
--- a/descarga_por_dia/campecheHoy/campecheHoy/settings.py
+++ b/descarga_por_dia/campecheHoy/campecheHoy/settings.py
--- a/descarga_por_dia/campecheHoy/campecheHoy/spiders/__init__.py
+++ b/descarga_por_dia/campecheHoy/campecheHoy/spiders/__init__.py
--- a/descarga_por_dia/campecheHoy/campecheHoy/spiders/noticias.py
+++ b/descarga_por_dia/campecheHoy/campecheHoy/spiders/noticias.py
--- a/descarga_por_dia/campecheHoy/scrapy.cfg
+++ b/descarga_por_dia/campecheHoy/scrapy.cfg
--- a/descarga_por_dia/chiapasHoy/2019-09-17.json
+++ b/descarga_por_dia/chiapasHoy/2019-09-17.json
--- a/descarga_por_dia/chiapasHoy/chiapasHoy/__init__.py
+++ b/descarga_por_dia/chiapasHoy/chiapasHoy/__init__.py
--- a/descarga_por_dia/chiapasHoy/chiapasHoy/items.py
+++ b/descarga_por_dia/chiapasHoy/chiapasHoy/items.py
--- a/descarga_por_dia/chiapasHoy/chiapasHoy/middlewares.py
+++ b/descarga_por_dia/chiapasHoy/chiapasHoy/middlewares.py
--- a/descarga_por_dia/chiapasHoy/chiapasHoy/pipelines.py
+++ b/descarga_por_dia/chiapasHoy/chiapasHoy/pipelines.py
--- a/descarga_por_dia/chiapasHoy/chiapasHoy/settings.py
+++ b/descarga_por_dia/chiapasHoy/chiapasHoy/settings.py
--- a/descarga_por_dia/chiapasHoy/chiapasHoy/spiders/__init__.py
+++ b/descarga_por_dia/chiapasHoy/chiapasHoy/spiders/__init__.py
--- a/descarga_por_dia/chiapasHoy/chiapasHoy/spiders/noticias.py
+++ b/descarga_por_dia/chiapasHoy/chiapasHoy/spiders/noticias.py
--- a/descarga_por_dia/chiapasHoy/scrapy.cfg
+++ b/descarga_por_dia/chiapasHoy/scrapy.cfg
--- a/descarga_por_dia/cuartoPoder/cuartoPoder/__init__.py
+++ b/descarga_por_dia/cuartoPoder/cuartoPoder/__init__.py
--- a/descarga_por_dia/cuartoPoder/cuartoPoder/items.py
+++ b/descarga_por_dia/cuartoPoder/cuartoPoder/items.py
--- a/descarga_por_dia/cuartoPoder/cuartoPoder/middlewares.py
+++ b/descarga_por_dia/cuartoPoder/cuartoPoder/middlewares.py
--- a/descarga_por_dia/cuartoPoder/cuartoPoder/pipelines.py
+++ b/descarga_por_dia/cuartoPoder/cuartoPoder/pipelines.py
--- a/descarga_por_dia/cuartoPoder/cuartoPoder/settings.py
+++ b/descarga_por_dia/cuartoPoder/cuartoPoder/settings.py
--- a/descarga_por_dia/cuartoPoder/cuartoPoder/spiders/__init__.py
+++ b/descarga_por_dia/cuartoPoder/cuartoPoder/spiders/__init__.py
--- a/descarga_por_dia/cuartoPoder/cuartoPoder/spiders/noticias.py
+++ b/descarga_por_dia/cuartoPoder/cuartoPoder/spiders/noticias.py
--- a/descarga_por_dia/cuartoPoder/scrapy.cfg
+++ b/descarga_por_dia/cuartoPoder/scrapy.cfg
--- a/descarga_por_dia/desdeElBalcon/desdeElBalcon/__init__.py
+++ b/descarga_por_dia/desdeElBalcon/desdeElBalcon/__init__.py
--- a/descarga_por_dia/desdeElBalcon/desdeElBalcon/items.py
+++ b/descarga_por_dia/desdeElBalcon/desdeElBalcon/items.py
--- a/descarga_por_dia/desdeElBalcon/desdeElBalcon/middlewares.py
+++ b/descarga_por_dia/desdeElBalcon/desdeElBalcon/middlewares.py
--- a/descarga_por_dia/desdeElBalcon/desdeElBalcon/pipelines.py
+++ b/descarga_por_dia/desdeElBalcon/desdeElBalcon/pipelines.py
--- a/descarga_por_dia/desdeElBalcon/desdeElBalcon/settings.py
+++ b/descarga_por_dia/desdeElBalcon/desdeElBalcon/settings.py
--- a/descarga_por_dia/desdeElBalcon/desdeElBalcon/spiders/__init__.py
+++ b/descarga_por_dia/desdeElBalcon/desdeElBalcon/spiders/__init__.py
--- a/descarga_por_dia/desdeElBalcon/desdeElBalcon/spiders/noticias.py
+++ b/descarga_por_dia/desdeElBalcon/desdeElBalcon/spiders/noticias.py
--- a/descarga_por_dia/desdeElBalcon/scrapy.cfg
+++ b/descarga_por_dia/desdeElBalcon/scrapy.cfg
--- a/descarga_por_dia/despertarOaxaca/despertarOaxaca/__init__.py
+++ b/descarga_por_dia/despertarOaxaca/despertarOaxaca/__init__.py
--- a/descarga_por_dia/despertarOaxaca/despertarOaxaca/items.py
+++ b/descarga_por_dia/despertarOaxaca/despertarOaxaca/items.py
--- a/descarga_por_dia/despertarOaxaca/despertarOaxaca/middlewares.py
+++ b/descarga_por_dia/despertarOaxaca/despertarOaxaca/middlewares.py
--- a/descarga_por_dia/despertarOaxaca/despertarOaxaca/pipelines.py
+++ b/descarga_por_dia/despertarOaxaca/despertarOaxaca/pipelines.py
--- a/descarga_por_dia/despertarOaxaca/despertarOaxaca/settings.py
+++ b/descarga_por_dia/despertarOaxaca/despertarOaxaca/settings.py
--- a/descarga_por_dia/despertarOaxaca/despertarOaxaca/spiders/__init__.py
+++ b/descarga_por_dia/despertarOaxaca/despertarOaxaca/spiders/__init__.py
--- a/descarga_por_dia/despertarOaxaca/despertarOaxaca/spiders/noticias.py
+++ b/descarga_por_dia/despertarOaxaca/despertarOaxaca/spiders/noticias.py
--- a/descarga_por_dia/despertarOaxaca/scrapy.cfg
+++ b/descarga_por_dia/despertarOaxaca/scrapy.cfg
--- a/descarga_por_dia/diarioPuntual/diarioPuntual/__init__.py
+++ b/descarga_por_dia/diarioPuntual/diarioPuntual/__init__.py
--- a/descarga_por_dia/diarioPuntual/diarioPuntual/items.py
+++ b/descarga_por_dia/diarioPuntual/diarioPuntual/items.py
--- a/descarga_por_dia/diarioPuntual/diarioPuntual/middlewares.py
+++ b/descarga_por_dia/diarioPuntual/diarioPuntual/middlewares.py
--- a/descarga_por_dia/diarioPuntual/diarioPuntual/pipelines.py
+++ b/descarga_por_dia/diarioPuntual/diarioPuntual/pipelines.py
--- a/descarga_por_dia/diarioPuntual/diarioPuntual/settings.py
+++ b/descarga_por_dia/diarioPuntual/diarioPuntual/settings.py
--- a/descarga_por_dia/diarioPuntual/diarioPuntual/spiders/__init__.py
+++ b/descarga_por_dia/diarioPuntual/diarioPuntual/spiders/__init__.py
--- a/descarga_por_dia/diarioPuntual/diarioPuntual/spiders/noticias.py
+++ b/descarga_por_dia/diarioPuntual/diarioPuntual/spiders/noticias.py
--- a/descarga_por_dia/diarioPuntual/scrapy.cfg
+++ b/descarga_por_dia/diarioPuntual/scrapy.cfg
--- a/descarga_por_dia/diarioYaqui/diarioYaqui/__init__.py
+++ b/descarga_por_dia/diarioYaqui/diarioYaqui/__init__.py
--- a/descarga_por_dia/diarioYaqui/diarioYaqui/items.py
+++ b/descarga_por_dia/diarioYaqui/diarioYaqui/items.py
--- a/descarga_por_dia/diarioYaqui/diarioYaqui/middlewares.py
+++ b/descarga_por_dia/diarioYaqui/diarioYaqui/middlewares.py
--- a/descarga_por_dia/diarioYaqui/diarioYaqui/pipelines.py
+++ b/descarga_por_dia/diarioYaqui/diarioYaqui/pipelines.py
--- a/descarga_por_dia/diarioYaqui/diarioYaqui/settings.py
+++ b/descarga_por_dia/diarioYaqui/diarioYaqui/settings.py
--- a/descarga_por_dia/diarioYaqui/diarioYaqui/spiders/__init__.py
+++ b/descarga_por_dia/diarioYaqui/diarioYaqui/spiders/__init__.py
--- a/descarga_por_dia/diarioYaqui/diarioYaqui/spiders/noticias.py
+++ b/descarga_por_dia/diarioYaqui/diarioYaqui/spiders/noticias.py
--- a/descarga_por_dia/diarioYaqui/scrapy.cfg
+++ b/descarga_por_dia/diarioYaqui/scrapy.cfg
--- a/descarga_por_dia/edoMexDia/edoMexDia/__init__.py
+++ b/descarga_por_dia/edoMexDia/edoMexDia/__init__.py
--- a/descarga_por_dia/edoMexDia/edoMexDia/items.py
+++ b/descarga_por_dia/edoMexDia/edoMexDia/items.py
--- a/descarga_por_dia/edoMexDia/edoMexDia/middlewares.py
+++ b/descarga_por_dia/edoMexDia/edoMexDia/middlewares.py
--- a/descarga_por_dia/edoMexDia/edoMexDia/pipelines.py
+++ b/descarga_por_dia/edoMexDia/edoMexDia/pipelines.py
--- a/descarga_por_dia/edoMexDia/edoMexDia/settings.py
+++ b/descarga_por_dia/edoMexDia/edoMexDia/settings.py
--- a/descarga_por_dia/edoMexDia/edoMexDia/spiders/__init__.py
+++ b/descarga_por_dia/edoMexDia/edoMexDia/spiders/__init__.py
--- a/descarga_por_dia/edoMexDia/edoMexDia/spiders/noticias.py
+++ b/descarga_por_dia/edoMexDia/edoMexDia/spiders/noticias.py
--- a/descarga_por_dia/edoMexDia/scrapy.cfg
+++ b/descarga_por_dia/edoMexDia/scrapy.cfg
--- a/descarga_por_dia/elComentario/elComentario/__init__.py
+++ b/descarga_por_dia/elComentario/elComentario/__init__.py
--- a/descarga_por_dia/elComentario/elComentario/items.py
+++ b/descarga_por_dia/elComentario/elComentario/items.py
--- a/descarga_por_dia/elComentario/elComentario/middlewares.py
+++ b/descarga_por_dia/elComentario/elComentario/middlewares.py
--- a/descarga_por_dia/elComentario/elComentario/pipelines.py
+++ b/descarga_por_dia/elComentario/elComentario/pipelines.py
--- a/descarga_por_dia/elComentario/elComentario/settings.py
+++ b/descarga_por_dia/elComentario/elComentario/settings.py
--- a/descarga_por_dia/elComentario/elComentario/spiders/__init__.py
+++ b/descarga_por_dia/elComentario/elComentario/spiders/__init__.py
--- a/descarga_por_dia/elComentario/elComentario/spiders/noticias.py
+++ b/descarga_por_dia/elComentario/elComentario/spiders/noticias.py
--- a/descarga_por_dia/elComentario/scrapy.cfg
+++ b/descarga_por_dia/elComentario/scrapy.cfg
--- a/descarga_por_dia/elFinanciero/elFinanciero/__init__.py
+++ b/descarga_por_dia/elFinanciero/elFinanciero/__init__.py
--- a/descarga_por_dia/elFinanciero/elFinanciero/items.py
+++ b/descarga_por_dia/elFinanciero/elFinanciero/items.py
--- a/descarga_por_dia/elFinanciero/elFinanciero/middlewares.py
+++ b/descarga_por_dia/elFinanciero/elFinanciero/middlewares.py
--- a/descarga_por_dia/elFinanciero/elFinanciero/pipelines.py
+++ b/descarga_por_dia/elFinanciero/elFinanciero/pipelines.py
--- a/descarga_por_dia/elFinanciero/elFinanciero/settings.py
+++ b/descarga_por_dia/elFinanciero/elFinanciero/settings.py
--- a/descarga_por_dia/elFinanciero/elFinanciero/spiders/.noticias.py.swp
+++ b/descarga_por_dia/elFinanciero/elFinanciero/spiders/.noticias.py.swp
--- a/descarga_por_dia/elFinanciero/elFinanciero/spiders/__init__.py
+++ b/descarga_por_dia/elFinanciero/elFinanciero/spiders/__init__.py
--- a/descarga_por_dia/elFinanciero/elFinanciero/spiders/noticias.py
+++ b/descarga_por_dia/elFinanciero/elFinanciero/spiders/noticias.py
--- a/descarga_por_dia/elFinanciero/scrapy.cfg
+++ b/descarga_por_dia/elFinanciero/scrapy.cfg
--- a/descarga_por_dia/elIndependiente/elIndependiente/__init__.py
+++ b/descarga_por_dia/elIndependiente/elIndependiente/__init__.py
--- a/descarga_por_dia/elIndependiente/elIndependiente/items.py
+++ b/descarga_por_dia/elIndependiente/elIndependiente/items.py
--- a/descarga_por_dia/elIndependiente/elIndependiente/middlewares.py
+++ b/descarga_por_dia/elIndependiente/elIndependiente/middlewares.py
--- a/descarga_por_dia/elIndependiente/elIndependiente/pipelines.py
+++ b/descarga_por_dia/elIndependiente/elIndependiente/pipelines.py
--- a/descarga_por_dia/elIndependiente/elIndependiente/settings.py
+++ b/descarga_por_dia/elIndependiente/elIndependiente/settings.py
--- a/descarga_por_dia/elIndependiente/elIndependiente/spiders/__init__.py
+++ b/descarga_por_dia/elIndependiente/elIndependiente/spiders/__init__.py
--- a/descarga_por_dia/elIndependiente/elIndependiente/spiders/noticias.py
+++ b/descarga_por_dia/elIndependiente/elIndependiente/spiders/noticias.py
--- a/descarga_por_dia/elIndependiente/scrapy.cfg
+++ b/descarga_por_dia/elIndependiente/scrapy.cfg
--- a/descarga_por_dia/elSur/elSur/__init__.py
+++ b/descarga_por_dia/elSur/elSur/__init__.py
--- a/descarga_por_dia/elSur/elSur/items.py
+++ b/descarga_por_dia/elSur/elSur/items.py
--- a/descarga_por_dia/elSur/elSur/middlewares.py
+++ b/descarga_por_dia/elSur/elSur/middlewares.py
--- a/descarga_por_dia/elSur/elSur/pipelines.py
+++ b/descarga_por_dia/elSur/elSur/pipelines.py
--- a/descarga_por_dia/elSur/elSur/settings.py
+++ b/descarga_por_dia/elSur/elSur/settings.py
--- a/descarga_por_dia/elSur/elSur/spiders/__init__.py
+++ b/descarga_por_dia/elSur/elSur/spiders/__init__.py
--- a/descarga_por_dia/elSur/elSur/spiders/noticias.bk
+++ b/descarga_por_dia/elSur/elSur/spiders/noticias.bk
--- a/descarga_por_dia/elSur/elSur/spiders/noticias.py
+++ b/descarga_por_dia/elSur/elSur/spiders/noticias.py
--- a/descarga_por_dia/elSur/out_test.json
+++ b/descarga_por_dia/elSur/out_test.json
--- a/descarga_por_dia/elSur/scrapy.cfg
+++ b/descarga_por_dia/elSur/scrapy.cfg
--- a/descarga_por_dia/elValle/elValle/__init__.py
+++ b/descarga_por_dia/elValle/elValle/__init__.py
--- a/descarga_por_dia/elValle/elValle/items.py
+++ b/descarga_por_dia/elValle/elValle/items.py
--- a/descarga_por_dia/elValle/elValle/middlewares.py
+++ b/descarga_por_dia/elValle/elValle/middlewares.py
--- a/descarga_por_dia/elValle/elValle/pipelines.py
+++ b/descarga_por_dia/elValle/elValle/pipelines.py
--- a/descarga_por_dia/elValle/elValle/settings.py
+++ b/descarga_por_dia/elValle/elValle/settings.py
--- a/descarga_por_dia/elValle/elValle/spiders/__init__.py
+++ b/descarga_por_dia/elValle/elValle/spiders/__init__.py
--- a/descarga_por_dia/elValle/elValle/spiders/noticias.py
+++ b/descarga_por_dia/elValle/elValle/spiders/noticias.py
--- a/descarga_por_dia/elValle/scrapy.cfg
+++ b/descarga_por_dia/elValle/scrapy.cfg
--- a/descarga_por_dia/expresoChiapas/expresoChiapas/__init__.py
+++ b/descarga_por_dia/expresoChiapas/expresoChiapas/__init__.py
--- a/descarga_por_dia/expresoChiapas/expresoChiapas/items.py
+++ b/descarga_por_dia/expresoChiapas/expresoChiapas/items.py
--- a/descarga_por_dia/expresoChiapas/expresoChiapas/middlewares.py
+++ b/descarga_por_dia/expresoChiapas/expresoChiapas/middlewares.py
--- a/descarga_por_dia/expresoChiapas/expresoChiapas/pipelines.py
+++ b/descarga_por_dia/expresoChiapas/expresoChiapas/pipelines.py
--- a/descarga_por_dia/expresoChiapas/expresoChiapas/settings.py
+++ b/descarga_por_dia/expresoChiapas/expresoChiapas/settings.py
--- a/descarga_por_dia/expresoChiapas/expresoChiapas/spiders/__init__.py
+++ b/descarga_por_dia/expresoChiapas/expresoChiapas/spiders/__init__.py
--- a/descarga_por_dia/expresoChiapas/expresoChiapas/spiders/noticias.py
+++ b/descarga_por_dia/expresoChiapas/expresoChiapas/spiders/noticias.py
--- a/descarga_por_dia/expresoChiapas/scrapy.cfg
+++ b/descarga_por_dia/expresoChiapas/scrapy.cfg
--- a/descarga_por_dia/foraneos/diarioCoLatino/diarioCoLatino/__init__.py
+++ b/descarga_por_dia/foraneos/diarioCoLatino/diarioCoLatino/__init__.py
--- a/descarga_por_dia/foraneos/diarioCoLatino/diarioCoLatino/items.py
+++ b/descarga_por_dia/foraneos/diarioCoLatino/diarioCoLatino/items.py
--- a/descarga_por_dia/foraneos/diarioCoLatino/diarioCoLatino/middlewares.py
+++ b/descarga_por_dia/foraneos/diarioCoLatino/diarioCoLatino/middlewares.py
--- a/descarga_por_dia/foraneos/diarioCoLatino/diarioCoLatino/pipelines.py
+++ b/descarga_por_dia/foraneos/diarioCoLatino/diarioCoLatino/pipelines.py
--- a/descarga_por_dia/foraneos/diarioCoLatino/diarioCoLatino/settings.py
+++ b/descarga_por_dia/foraneos/diarioCoLatino/diarioCoLatino/settings.py
--- a/descarga_por_dia/foraneos/diarioCoLatino/diarioCoLatino/spiders/__init__.py
+++ b/descarga_por_dia/foraneos/diarioCoLatino/diarioCoLatino/spiders/__init__.py
--- a/descarga_por_dia/foraneos/diarioCoLatino/diarioCoLatino/spiders/noticias.py
+++ b/descarga_por_dia/foraneos/diarioCoLatino/diarioCoLatino/spiders/noticias.py
--- a/descarga_por_dia/foraneos/diarioCoLatino/scrapy.cfg
+++ b/descarga_por_dia/foraneos/diarioCoLatino/scrapy.cfg
--- a/descarga_por_dia/foraneos/sanPedroSun/sanPedroSun/__init__.py
+++ b/descarga_por_dia/foraneos/sanPedroSun/sanPedroSun/__init__.py
--- a/descarga_por_dia/foraneos/sanPedroSun/sanPedroSun/items.py
+++ b/descarga_por_dia/foraneos/sanPedroSun/sanPedroSun/items.py
--- a/descarga_por_dia/foraneos/sanPedroSun/sanPedroSun/middlewares.py
+++ b/descarga_por_dia/foraneos/sanPedroSun/sanPedroSun/middlewares.py
--- a/descarga_por_dia/foraneos/sanPedroSun/sanPedroSun/pipelines.py
+++ b/descarga_por_dia/foraneos/sanPedroSun/sanPedroSun/pipelines.py
--- a/descarga_por_dia/foraneos/sanPedroSun/sanPedroSun/settings.py
+++ b/descarga_por_dia/foraneos/sanPedroSun/sanPedroSun/settings.py
--- a/descarga_por_dia/foraneos/sanPedroSun/sanPedroSun/spiders/__init__.py
+++ b/descarga_por_dia/foraneos/sanPedroSun/sanPedroSun/spiders/__init__.py
--- a/descarga_por_dia/foraneos/sanPedroSun/sanPedroSun/spiders/noticias.py
+++ b/descarga_por_dia/foraneos/sanPedroSun/sanPedroSun/spiders/noticias.py
--- a/descarga_por_dia/foraneos/sanPedroSun/scrapy.cfg
+++ b/descarga_por_dia/foraneos/sanPedroSun/scrapy.cfg
--- a/descarga_por_dia/foraneos/tiempoDigitalHn/scrapy.cfg
+++ b/descarga_por_dia/foraneos/tiempoDigitalHn/scrapy.cfg
--- a/descarga_por_dia/foraneos/tiempoDigitalHn/tiempoDigitalHn/__init__.py
+++ b/descarga_por_dia/foraneos/tiempoDigitalHn/tiempoDigitalHn/__init__.py
--- a/descarga_por_dia/foraneos/tiempoDigitalHn/tiempoDigitalHn/items.py
+++ b/descarga_por_dia/foraneos/tiempoDigitalHn/tiempoDigitalHn/items.py
--- a/descarga_por_dia/foraneos/tiempoDigitalHn/tiempoDigitalHn/middlewares.py
+++ b/descarga_por_dia/foraneos/tiempoDigitalHn/tiempoDigitalHn/middlewares.py
--- a/descarga_por_dia/foraneos/tiempoDigitalHn/tiempoDigitalHn/pipelines.py
+++ b/descarga_por_dia/foraneos/tiempoDigitalHn/tiempoDigitalHn/pipelines.py
--- a/descarga_por_dia/foraneos/tiempoDigitalHn/tiempoDigitalHn/settings.py
+++ b/descarga_por_dia/foraneos/tiempoDigitalHn/tiempoDigitalHn/settings.py
--- a/descarga_por_dia/foraneos/tiempoDigitalHn/tiempoDigitalHn/spiders/__init__.py
+++ b/descarga_por_dia/foraneos/tiempoDigitalHn/tiempoDigitalHn/spiders/__init__.py
--- a/descarga_por_dia/foraneos/tiempoDigitalHn/tiempoDigitalHn/spiders/noticias.py
+++ b/descarga_por_dia/foraneos/tiempoDigitalHn/tiempoDigitalHn/spiders/noticias.py
--- a/descarga_por_dia/foraneos/tribunaHn/scrapy.cfg
+++ b/descarga_por_dia/foraneos/tribunaHn/scrapy.cfg
--- a/descarga_por_dia/foraneos/tribunaHn/tribunaHn/__init__.py
+++ b/descarga_por_dia/foraneos/tribunaHn/tribunaHn/__init__.py
--- a/descarga_por_dia/foraneos/tribunaHn/tribunaHn/items.py
+++ b/descarga_por_dia/foraneos/tribunaHn/tribunaHn/items.py
--- a/descarga_por_dia/foraneos/tribunaHn/tribunaHn/middlewares.py
+++ b/descarga_por_dia/foraneos/tribunaHn/tribunaHn/middlewares.py
--- a/descarga_por_dia/foraneos/tribunaHn/tribunaHn/pipelines.py
+++ b/descarga_por_dia/foraneos/tribunaHn/tribunaHn/pipelines.py
--- a/descarga_por_dia/foraneos/tribunaHn/tribunaHn/settings.py
+++ b/descarga_por_dia/foraneos/tribunaHn/tribunaHn/settings.py
--- a/descarga_por_dia/foraneos/tribunaHn/tribunaHn/spiders/__init__.py
+++ b/descarga_por_dia/foraneos/tribunaHn/tribunaHn/spiders/__init__.py
--- a/descarga_por_dia/foraneos/tribunaHn/tribunaHn/spiders/noticias.py
+++ b/descarga_por_dia/foraneos/tribunaHn/tribunaHn/spiders/noticias.py
--- a/descarga_por_dia/grilloPorteno/grilloPorteno/__init__.py
+++ b/descarga_por_dia/grilloPorteno/grilloPorteno/__init__.py
--- a/descarga_por_dia/grilloPorteno/grilloPorteno/items.py
+++ b/descarga_por_dia/grilloPorteno/grilloPorteno/items.py
--- a/descarga_por_dia/grilloPorteno/grilloPorteno/middlewares.py
+++ b/descarga_por_dia/grilloPorteno/grilloPorteno/middlewares.py
--- a/descarga_por_dia/grilloPorteno/grilloPorteno/pipelines.py
+++ b/descarga_por_dia/grilloPorteno/grilloPorteno/pipelines.py
--- a/descarga_por_dia/grilloPorteno/grilloPorteno/settings.py
+++ b/descarga_por_dia/grilloPorteno/grilloPorteno/settings.py
--- a/descarga_por_dia/grilloPorteno/grilloPorteno/spiders/__init__.py
+++ b/descarga_por_dia/grilloPorteno/grilloPorteno/spiders/__init__.py
--- a/descarga_por_dia/grilloPorteno/grilloPorteno/spiders/noticias.py
+++ b/descarga_por_dia/grilloPorteno/grilloPorteno/spiders/noticias.py
--- a/descarga_por_dia/grilloPorteno/scrapy.cfg
+++ b/descarga_por_dia/grilloPorteno/scrapy.cfg
--- a/descarga_por_dia/heraldoAgs/heraldoAgs/__init__.py
+++ b/descarga_por_dia/heraldoAgs/heraldoAgs/__init__.py
--- a/descarga_por_dia/heraldoAgs/heraldoAgs/items.py
+++ b/descarga_por_dia/heraldoAgs/heraldoAgs/items.py
--- a/descarga_por_dia/heraldoAgs/heraldoAgs/middlewares.py
+++ b/descarga_por_dia/heraldoAgs/heraldoAgs/middlewares.py
--- a/descarga_por_dia/heraldoAgs/heraldoAgs/pipelines.py
+++ b/descarga_por_dia/heraldoAgs/heraldoAgs/pipelines.py
--- a/descarga_por_dia/heraldoAgs/heraldoAgs/settings.py
+++ b/descarga_por_dia/heraldoAgs/heraldoAgs/settings.py
--- a/descarga_por_dia/heraldoAgs/heraldoAgs/spiders/__init__.py
+++ b/descarga_por_dia/heraldoAgs/heraldoAgs/spiders/__init__.py
--- a/descarga_por_dia/heraldoAgs/heraldoAgs/spiders/noticias.py
+++ b/descarga_por_dia/heraldoAgs/heraldoAgs/spiders/noticias.py
--- a/descarga_por_dia/heraldoAgs/scrapy.cfg
+++ b/descarga_por_dia/heraldoAgs/scrapy.cfg
--- a/descarga_por_dia/heraldoLeon/heraldoLeon/__init__.py
+++ b/descarga_por_dia/heraldoLeon/heraldoLeon/__init__.py
--- a/descarga_por_dia/heraldoLeon/heraldoLeon/items.py
+++ b/descarga_por_dia/heraldoLeon/heraldoLeon/items.py
--- a/descarga_por_dia/heraldoLeon/heraldoLeon/middlewares.py
+++ b/descarga_por_dia/heraldoLeon/heraldoLeon/middlewares.py
--- a/descarga_por_dia/heraldoLeon/heraldoLeon/pipelines.py
+++ b/descarga_por_dia/heraldoLeon/heraldoLeon/pipelines.py
--- a/descarga_por_dia/heraldoLeon/heraldoLeon/settings.py
+++ b/descarga_por_dia/heraldoLeon/heraldoLeon/settings.py
--- a/descarga_por_dia/heraldoLeon/heraldoLeon/spiders/__init__.py
+++ b/descarga_por_dia/heraldoLeon/heraldoLeon/spiders/__init__.py
--- a/descarga_por_dia/heraldoLeon/heraldoLeon/spiders/noticias.py
+++ b/descarga_por_dia/heraldoLeon/heraldoLeon/spiders/noticias.py
--- a/descarga_por_dia/heraldoLeon/scrapy.cfg
+++ b/descarga_por_dia/heraldoLeon/scrapy.cfg
--- a/descarga_por_dia/laJornada/laJornada/__init__.py
+++ b/descarga_por_dia/laJornada/laJornada/__init__.py
--- a/descarga_por_dia/laJornada/laJornada/items.py
+++ b/descarga_por_dia/laJornada/laJornada/items.py
--- a/descarga_por_dia/laJornada/laJornada/middlewares.py
+++ b/descarga_por_dia/laJornada/laJornada/middlewares.py
--- a/descarga_por_dia/laJornada/laJornada/pipelines.py
+++ b/descarga_por_dia/laJornada/laJornada/pipelines.py
--- a/descarga_por_dia/laJornada/laJornada/settings.py
+++ b/descarga_por_dia/laJornada/laJornada/settings.py
--- a/descarga_por_dia/laJornada/laJornada/spiders/__init__.py
+++ b/descarga_por_dia/laJornada/laJornada/spiders/__init__.py
--- a/descarga_por_dia/laJornada/laJornada/spiders/noticias.py
+++ b/descarga_por_dia/laJornada/laJornada/spiders/noticias.py
--- a/descarga_por_dia/laJornada/out_test.json
+++ b/descarga_por_dia/laJornada/out_test.json
--- a/descarga_por_dia/laJornada/scrapy.cfg
+++ b/descarga_por_dia/laJornada/scrapy.cfg
--- a/descarga_por_dia/laJornadaAgs/laJornadaAgs/__init__.py
+++ b/descarga_por_dia/laJornadaAgs/laJornadaAgs/__init__.py
--- a/descarga_por_dia/laJornadaAgs/laJornadaAgs/items.py
+++ b/descarga_por_dia/laJornadaAgs/laJornadaAgs/items.py
--- a/descarga_por_dia/laJornadaAgs/laJornadaAgs/middlewares.py
+++ b/descarga_por_dia/laJornadaAgs/laJornadaAgs/middlewares.py
--- a/descarga_por_dia/laJornadaAgs/laJornadaAgs/pipelines.py
+++ b/descarga_por_dia/laJornadaAgs/laJornadaAgs/pipelines.py
--- a/descarga_por_dia/laJornadaAgs/laJornadaAgs/settings.py
+++ b/descarga_por_dia/laJornadaAgs/laJornadaAgs/settings.py
--- a/descarga_por_dia/laJornadaAgs/laJornadaAgs/spiders/__init__.py
+++ b/descarga_por_dia/laJornadaAgs/laJornadaAgs/spiders/__init__.py
--- a/descarga_por_dia/laJornadaAgs/laJornadaAgs/spiders/noticias.py
+++ b/descarga_por_dia/laJornadaAgs/laJornadaAgs/spiders/noticias.py
--- a/descarga_por_dia/laJornadaAgs/scrapy.cfg
+++ b/descarga_por_dia/laJornadaAgs/scrapy.cfg
--- a/descarga_por_dia/laJornadaGro/laJornadaGro/__init__.py
+++ b/descarga_por_dia/laJornadaGro/laJornadaGro/__init__.py
--- a/descarga_por_dia/laJornadaGro/laJornadaGro/items.py
+++ b/descarga_por_dia/laJornadaGro/laJornadaGro/items.py
--- a/descarga_por_dia/laJornadaGro/laJornadaGro/middlewares.py
+++ b/descarga_por_dia/laJornadaGro/laJornadaGro/middlewares.py
--- a/descarga_por_dia/laJornadaGro/laJornadaGro/pipelines.py
+++ b/descarga_por_dia/laJornadaGro/laJornadaGro/pipelines.py
--- a/descarga_por_dia/laJornadaGro/laJornadaGro/settings.py
+++ b/descarga_por_dia/laJornadaGro/laJornadaGro/settings.py
--- a/descarga_por_dia/laJornadaGro/laJornadaGro/spiders/__init__.py
+++ b/descarga_por_dia/laJornadaGro/laJornadaGro/spiders/__init__.py
--- a/descarga_por_dia/laJornadaGro/laJornadaGro/spiders/noticias.py
+++ b/descarga_por_dia/laJornadaGro/laJornadaGro/spiders/noticias.py
--- a/descarga_por_dia/laJornadaGro/scrapy.cfg
+++ b/descarga_por_dia/laJornadaGro/scrapy.cfg
--- a/descarga_por_dia/laJornadaGroAntiguo/laJornadaGroAntiguo/__init__.py
+++ b/descarga_por_dia/laJornadaGroAntiguo/laJornadaGroAntiguo/__init__.py
--- a/descarga_por_dia/laJornadaGroAntiguo/laJornadaGroAntiguo/items.py
+++ b/descarga_por_dia/laJornadaGroAntiguo/laJornadaGroAntiguo/items.py
--- a/descarga_por_dia/laJornadaGroAntiguo/laJornadaGroAntiguo/middlewares.py
+++ b/descarga_por_dia/laJornadaGroAntiguo/laJornadaGroAntiguo/middlewares.py
--- a/descarga_por_dia/laJornadaGroAntiguo/laJornadaGroAntiguo/pipelines.py
+++ b/descarga_por_dia/laJornadaGroAntiguo/laJornadaGroAntiguo/pipelines.py
--- a/descarga_por_dia/laJornadaGroAntiguo/laJornadaGroAntiguo/settings.py
+++ b/descarga_por_dia/laJornadaGroAntiguo/laJornadaGroAntiguo/settings.py
--- a/descarga_por_dia/laJornadaGroAntiguo/laJornadaGroAntiguo/spiders/__init__.py
+++ b/descarga_por_dia/laJornadaGroAntiguo/laJornadaGroAntiguo/spiders/__init__.py
--- a/descarga_por_dia/laJornadaGroAntiguo/laJornadaGroAntiguo/spiders/noticias.py
+++ b/descarga_por_dia/laJornadaGroAntiguo/laJornadaGroAntiguo/spiders/noticias.py
--- a/descarga_por_dia/laJornadaGroAntiguo/scrapy.cfg
+++ b/descarga_por_dia/laJornadaGroAntiguo/scrapy.cfg
--- a/descarga_por_dia/laJornadaOte/laJornadaOte/__init__.py
+++ b/descarga_por_dia/laJornadaOte/laJornadaOte/__init__.py
--- a/descarga_por_dia/laJornadaOte/laJornadaOte/items.py
+++ b/descarga_por_dia/laJornadaOte/laJornadaOte/items.py
--- a/descarga_por_dia/laJornadaOte/laJornadaOte/middlewares.py
+++ b/descarga_por_dia/laJornadaOte/laJornadaOte/middlewares.py
--- a/descarga_por_dia/laJornadaOte/laJornadaOte/pipelines.py
+++ b/descarga_por_dia/laJornadaOte/laJornadaOte/pipelines.py
--- a/descarga_por_dia/laJornadaOte/laJornadaOte/settings.py
+++ b/descarga_por_dia/laJornadaOte/laJornadaOte/settings.py
--- a/descarga_por_dia/laJornadaOte/laJornadaOte/spiders/__init__.py
+++ b/descarga_por_dia/laJornadaOte/laJornadaOte/spiders/__init__.py
--- a/descarga_por_dia/laJornadaOte/laJornadaOte/spiders/noticias.py
+++ b/descarga_por_dia/laJornadaOte/laJornadaOte/spiders/noticias.py
--- a/descarga_por_dia/laJornadaOte/scrapy.cfg
+++ b/descarga_por_dia/laJornadaOte/scrapy.cfg
--- a/descarga_por_dia/laJornadaSanLuis/laJornadaSanLuis/__init__.py
+++ b/descarga_por_dia/laJornadaSanLuis/laJornadaSanLuis/__init__.py
--- a/descarga_por_dia/laJornadaSanLuis/laJornadaSanLuis/items.py
+++ b/descarga_por_dia/laJornadaSanLuis/laJornadaSanLuis/items.py
--- a/descarga_por_dia/laJornadaSanLuis/laJornadaSanLuis/middlewares.py
+++ b/descarga_por_dia/laJornadaSanLuis/laJornadaSanLuis/middlewares.py
--- a/descarga_por_dia/laJornadaSanLuis/laJornadaSanLuis/pipelines.py
+++ b/descarga_por_dia/laJornadaSanLuis/laJornadaSanLuis/pipelines.py
--- a/descarga_por_dia/laJornadaSanLuis/laJornadaSanLuis/settings.py
+++ b/descarga_por_dia/laJornadaSanLuis/laJornadaSanLuis/settings.py
--- a/descarga_por_dia/laJornadaSanLuis/laJornadaSanLuis/spiders/__init__.py
+++ b/descarga_por_dia/laJornadaSanLuis/laJornadaSanLuis/spiders/__init__.py
--- a/descarga_por_dia/laJornadaSanLuis/laJornadaSanLuis/spiders/noticias.py
+++ b/descarga_por_dia/laJornadaSanLuis/laJornadaSanLuis/spiders/noticias.py
--- a/descarga_por_dia/laJornadaSanLuis/scrapy.cfg
+++ b/descarga_por_dia/laJornadaSanLuis/scrapy.cfg
--- a/descarga_por_dia/laJornadaVer/laJornadaVer/__init__.py
+++ b/descarga_por_dia/laJornadaVer/laJornadaVer/__init__.py
--- a/descarga_por_dia/laJornadaVer/laJornadaVer/items.py
+++ b/descarga_por_dia/laJornadaVer/laJornadaVer/items.py
--- a/descarga_por_dia/laJornadaVer/laJornadaVer/middlewares.py
+++ b/descarga_por_dia/laJornadaVer/laJornadaVer/middlewares.py
--- a/descarga_por_dia/laJornadaVer/laJornadaVer/pipelines.py
+++ b/descarga_por_dia/laJornadaVer/laJornadaVer/pipelines.py
--- a/descarga_por_dia/laJornadaVer/laJornadaVer/settings.py
+++ b/descarga_por_dia/laJornadaVer/laJornadaVer/settings.py
--- a/descarga_por_dia/laJornadaVer/laJornadaVer/spiders/__init__.py
+++ b/descarga_por_dia/laJornadaVer/laJornadaVer/spiders/__init__.py
--- a/descarga_por_dia/laJornadaVer/laJornadaVer/spiders/noticias.py
+++ b/descarga_por_dia/laJornadaVer/laJornadaVer/spiders/noticias.py
--- a/descarga_por_dia/laJornadaVer/scrapy.cfg
+++ b/descarga_por_dia/laJornadaVer/scrapy.cfg
--- a/descarga_por_dia/laJornadaZac/laJornadaZac/__init__.py
+++ b/descarga_por_dia/laJornadaZac/laJornadaZac/__init__.py
--- a/descarga_por_dia/laJornadaZac/laJornadaZac/items.py
+++ b/descarga_por_dia/laJornadaZac/laJornadaZac/items.py
--- a/descarga_por_dia/laJornadaZac/laJornadaZac/middlewares.py
+++ b/descarga_por_dia/laJornadaZac/laJornadaZac/middlewares.py
--- a/descarga_por_dia/laJornadaZac/laJornadaZac/pipelines.py
+++ b/descarga_por_dia/laJornadaZac/laJornadaZac/pipelines.py
--- a/descarga_por_dia/laJornadaZac/laJornadaZac/settings.py
+++ b/descarga_por_dia/laJornadaZac/laJornadaZac/settings.py
--- a/descarga_por_dia/laJornadaZac/laJornadaZac/spiders/__init__.py
+++ b/descarga_por_dia/laJornadaZac/laJornadaZac/spiders/__init__.py
--- a/descarga_por_dia/laJornadaZac/laJornadaZac/spiders/noticias.py
+++ b/descarga_por_dia/laJornadaZac/laJornadaZac/spiders/noticias.py
--- a/descarga_por_dia/laJornadaZac/scrapy.cfg
+++ b/descarga_por_dia/laJornadaZac/scrapy.cfg
--- a/descarga_por_dia/laRazon/laRazon/__init__.py
+++ b/descarga_por_dia/laRazon/laRazon/__init__.py
--- a/descarga_por_dia/laRazon/laRazon/items.py
+++ b/descarga_por_dia/laRazon/laRazon/items.py
--- a/descarga_por_dia/laRazon/laRazon/middlewares.py
+++ b/descarga_por_dia/laRazon/laRazon/middlewares.py
--- a/descarga_por_dia/laRazon/laRazon/pipelines.py
+++ b/descarga_por_dia/laRazon/laRazon/pipelines.py
--- a/descarga_por_dia/laRazon/laRazon/settings.py
+++ b/descarga_por_dia/laRazon/laRazon/settings.py
--- a/descarga_por_dia/laRazon/laRazon/spiders/__init__.py
+++ b/descarga_por_dia/laRazon/laRazon/spiders/__init__.py
--- a/descarga_por_dia/laRazon/laRazon/spiders/noticias.py
+++ b/descarga_por_dia/laRazon/laRazon/spiders/noticias.py
--- a/descarga_por_dia/laRazon/scrapy.cfg
+++ b/descarga_por_dia/laRazon/scrapy.cfg
--- a/descarga_por_dia/laVerdadYuc/laVerdadYuc/__init__.py
+++ b/descarga_por_dia/laVerdadYuc/laVerdadYuc/__init__.py
--- a/descarga_por_dia/laVerdadYuc/laVerdadYuc/items.py
+++ b/descarga_por_dia/laVerdadYuc/laVerdadYuc/items.py
--- a/descarga_por_dia/laVerdadYuc/laVerdadYuc/middlewares.py
+++ b/descarga_por_dia/laVerdadYuc/laVerdadYuc/middlewares.py
--- a/descarga_por_dia/laVerdadYuc/laVerdadYuc/pipelines.py
+++ b/descarga_por_dia/laVerdadYuc/laVerdadYuc/pipelines.py
--- a/descarga_por_dia/laVerdadYuc/laVerdadYuc/settings.py
+++ b/descarga_por_dia/laVerdadYuc/laVerdadYuc/settings.py
--- a/descarga_por_dia/laVerdadYuc/laVerdadYuc/spiders/__init__.py
+++ b/descarga_por_dia/laVerdadYuc/laVerdadYuc/spiders/__init__.py
--- a/descarga_por_dia/laVerdadYuc/laVerdadYuc/spiders/noticias.py
+++ b/descarga_por_dia/laVerdadYuc/laVerdadYuc/spiders/noticias.py
--- a/descarga_por_dia/laVerdadYuc/scrapy.cfg
+++ b/descarga_por_dia/laVerdadYuc/scrapy.cfg
--- a/descarga_por_dia/lectorMX/lectorMX/__init__.py
+++ b/descarga_por_dia/lectorMX/lectorMX/__init__.py
--- a/descarga_por_dia/lectorMX/lectorMX/items.py
+++ b/descarga_por_dia/lectorMX/lectorMX/items.py
--- a/descarga_por_dia/lectorMX/lectorMX/middlewares.py
+++ b/descarga_por_dia/lectorMX/lectorMX/middlewares.py
--- a/descarga_por_dia/lectorMX/lectorMX/pipelines.py
+++ b/descarga_por_dia/lectorMX/lectorMX/pipelines.py
--- a/descarga_por_dia/lectorMX/lectorMX/settings.py
+++ b/descarga_por_dia/lectorMX/lectorMX/settings.py
--- a/descarga_por_dia/lectorMX/lectorMX/spiders/__init__.py
+++ b/descarga_por_dia/lectorMX/lectorMX/spiders/__init__.py
--- a/descarga_por_dia/lectorMX/lectorMX/spiders/noticias.py
+++ b/descarga_por_dia/lectorMX/lectorMX/spiders/noticias.py
--- a/descarga_por_dia/lectorMX/scrapy.cfg
+++ b/descarga_por_dia/lectorMX/scrapy.cfg
--- a/descarga_por_dia/marca/marca/__init__.py
+++ b/descarga_por_dia/marca/marca/__init__.py
--- a/descarga_por_dia/marca/marca/items.py
+++ b/descarga_por_dia/marca/marca/items.py
--- a/descarga_por_dia/marca/marca/middlewares.py
+++ b/descarga_por_dia/marca/marca/middlewares.py
--- a/descarga_por_dia/marca/marca/pipelines.py
+++ b/descarga_por_dia/marca/marca/pipelines.py
--- a/descarga_por_dia/marca/marca/settings.py
+++ b/descarga_por_dia/marca/marca/settings.py
--- a/descarga_por_dia/marca/marca/spiders/__init__.py
+++ b/descarga_por_dia/marca/marca/spiders/__init__.py
--- a/descarga_por_dia/marca/marca/spiders/noticias.py
+++ b/descarga_por_dia/marca/marca/spiders/noticias.py
--- a/descarga_por_dia/marca/scrapy.cfg
+++ b/descarga_por_dia/marca/scrapy.cfg
--- a/descarga_por_dia/miPuntoDeVista/miPuntoDeVista/__init__.py
+++ b/descarga_por_dia/miPuntoDeVista/miPuntoDeVista/__init__.py
--- a/descarga_por_dia/miPuntoDeVista/miPuntoDeVista/items.py
+++ b/descarga_por_dia/miPuntoDeVista/miPuntoDeVista/items.py
--- a/descarga_por_dia/miPuntoDeVista/miPuntoDeVista/middlewares.py
+++ b/descarga_por_dia/miPuntoDeVista/miPuntoDeVista/middlewares.py
--- a/descarga_por_dia/miPuntoDeVista/miPuntoDeVista/pipelines.py
+++ b/descarga_por_dia/miPuntoDeVista/miPuntoDeVista/pipelines.py
--- a/descarga_por_dia/miPuntoDeVista/miPuntoDeVista/settings.py
+++ b/descarga_por_dia/miPuntoDeVista/miPuntoDeVista/settings.py
--- a/descarga_por_dia/miPuntoDeVista/miPuntoDeVista/spiders/__init__.py
+++ b/descarga_por_dia/miPuntoDeVista/miPuntoDeVista/spiders/__init__.py
--- a/descarga_por_dia/miPuntoDeVista/miPuntoDeVista/spiders/noticias.py
+++ b/descarga_por_dia/miPuntoDeVista/miPuntoDeVista/spiders/noticias.py
--- a/descarga_por_dia/miPuntoDeVista/scrapy.cfg
+++ b/descarga_por_dia/miPuntoDeVista/scrapy.cfg
--- a/descarga_por_dia/noticiasBahia/noticiasBahia/__init__.py
+++ b/descarga_por_dia/noticiasBahia/noticiasBahia/__init__.py
--- a/descarga_por_dia/noticiasBahia/noticiasBahia/items.py
+++ b/descarga_por_dia/noticiasBahia/noticiasBahia/items.py
--- a/descarga_por_dia/noticiasBahia/noticiasBahia/middlewares.py
+++ b/descarga_por_dia/noticiasBahia/noticiasBahia/middlewares.py
--- a/descarga_por_dia/noticiasBahia/noticiasBahia/pipelines.py
+++ b/descarga_por_dia/noticiasBahia/noticiasBahia/pipelines.py
--- a/descarga_por_dia/noticiasBahia/noticiasBahia/settings.py
+++ b/descarga_por_dia/noticiasBahia/noticiasBahia/settings.py
--- a/descarga_por_dia/noticiasBahia/noticiasBahia/spiders/__init__.py
+++ b/descarga_por_dia/noticiasBahia/noticiasBahia/spiders/__init__.py
--- a/descarga_por_dia/noticiasBahia/noticiasBahia/spiders/noticias.py
+++ b/descarga_por_dia/noticiasBahia/noticiasBahia/spiders/noticias.py
--- a/descarga_por_dia/noticiasBahia/scrapy.cfg
+++ b/descarga_por_dia/noticiasBahia/scrapy.cfg
--- a/descarga_por_dia/noticieroLinea/noticieroLinea/__init__.py
+++ b/descarga_por_dia/noticieroLinea/noticieroLinea/__init__.py
--- a/descarga_por_dia/noticieroLinea/noticieroLinea/items.py
+++ b/descarga_por_dia/noticieroLinea/noticieroLinea/items.py
--- a/descarga_por_dia/noticieroLinea/noticieroLinea/middlewares.py
+++ b/descarga_por_dia/noticieroLinea/noticieroLinea/middlewares.py
--- a/descarga_por_dia/noticieroLinea/noticieroLinea/pipelines.py
+++ b/descarga_por_dia/noticieroLinea/noticieroLinea/pipelines.py
--- a/descarga_por_dia/noticieroLinea/noticieroLinea/settings.py
+++ b/descarga_por_dia/noticieroLinea/noticieroLinea/settings.py
--- a/descarga_por_dia/noticieroLinea/noticieroLinea/spiders/__init__.py
+++ b/descarga_por_dia/noticieroLinea/noticieroLinea/spiders/__init__.py
--- a/descarga_por_dia/noticieroLinea/noticieroLinea/spiders/noticias.py
+++ b/descarga_por_dia/noticieroLinea/noticieroLinea/spiders/noticias.py
--- a/descarga_por_dia/noticieroLinea/out_test.json
+++ b/descarga_por_dia/noticieroLinea/out_test.json
--- a/descarga_por_dia/noticieroLinea/scrapy.cfg
+++ b/descarga_por_dia/noticieroLinea/scrapy.cfg
--- a/descarga_por_dia/notirivas/notirivas/__init__.py
+++ b/descarga_por_dia/notirivas/notirivas/__init__.py
--- a/descarga_por_dia/notirivas/notirivas/items.py
+++ b/descarga_por_dia/notirivas/notirivas/items.py
--- a/descarga_por_dia/notirivas/notirivas/middlewares.py
+++ b/descarga_por_dia/notirivas/notirivas/middlewares.py
--- a/descarga_por_dia/notirivas/notirivas/pipelines.py
+++ b/descarga_por_dia/notirivas/notirivas/pipelines.py
--- a/descarga_por_dia/notirivas/notirivas/settings.py
+++ b/descarga_por_dia/notirivas/notirivas/settings.py
--- a/descarga_por_dia/notirivas/notirivas/spiders/__init__.py
+++ b/descarga_por_dia/notirivas/notirivas/spiders/__init__.py
--- a/descarga_por_dia/notirivas/notirivas/spiders/noticias.py
+++ b/descarga_por_dia/notirivas/notirivas/spiders/noticias.py
--- a/descarga_por_dia/notirivas/scrapy.cfg
+++ b/descarga_por_dia/notirivas/scrapy.cfg
--- a/descarga_por_dia/notisureste/notisureste/__init__.py
+++ b/descarga_por_dia/notisureste/notisureste/__init__.py
--- a/descarga_por_dia/notisureste/notisureste/items.py
+++ b/descarga_por_dia/notisureste/notisureste/items.py
--- a/descarga_por_dia/notisureste/notisureste/middlewares.py
+++ b/descarga_por_dia/notisureste/notisureste/middlewares.py
--- a/descarga_por_dia/notisureste/notisureste/pipelines.py
+++ b/descarga_por_dia/notisureste/notisureste/pipelines.py
--- a/descarga_por_dia/notisureste/notisureste/settings.py
+++ b/descarga_por_dia/notisureste/notisureste/settings.py
--- a/descarga_por_dia/notisureste/notisureste/spiders/__init__.py
+++ b/descarga_por_dia/notisureste/notisureste/spiders/__init__.py
--- a/descarga_por_dia/notisureste/notisureste/spiders/noticias.py
+++ b/descarga_por_dia/notisureste/notisureste/spiders/noticias.py
--- a/descarga_por_dia/notisureste/scrapy.cfg
+++ b/descarga_por_dia/notisureste/scrapy.cfg
--- a/descarga_por_dia/opinionPuebla/2019-09-19.json
+++ b/descarga_por_dia/opinionPuebla/2019-09-19.json
--- a/descarga_por_dia/opinionPuebla/opinionPuebla/__init__.py
+++ b/descarga_por_dia/opinionPuebla/opinionPuebla/__init__.py
--- a/descarga_por_dia/opinionPuebla/opinionPuebla/items.py
+++ b/descarga_por_dia/opinionPuebla/opinionPuebla/items.py
--- a/descarga_por_dia/opinionPuebla/opinionPuebla/middlewares.py
+++ b/descarga_por_dia/opinionPuebla/opinionPuebla/middlewares.py
--- a/descarga_por_dia/opinionPuebla/opinionPuebla/pipelines.py
+++ b/descarga_por_dia/opinionPuebla/opinionPuebla/pipelines.py
--- a/descarga_por_dia/opinionPuebla/opinionPuebla/settings.py
+++ b/descarga_por_dia/opinionPuebla/opinionPuebla/settings.py
--- a/descarga_por_dia/opinionPuebla/opinionPuebla/spiders/__init__.py
+++ b/descarga_por_dia/opinionPuebla/opinionPuebla/spiders/__init__.py
--- a/descarga_por_dia/opinionPuebla/opinionPuebla/spiders/noticias.py
+++ b/descarga_por_dia/opinionPuebla/opinionPuebla/spiders/noticias.py
--- a/descarga_por_dia/opinionPuebla/scrapy.cfg
+++ b/descarga_por_dia/opinionPuebla/scrapy.cfg
--- a/descarga_por_dia/periodicoCorreo/periodicoCorreo/__init__.py
+++ b/descarga_por_dia/periodicoCorreo/periodicoCorreo/__init__.py
--- a/descarga_por_dia/periodicoCorreo/periodicoCorreo/items.py
+++ b/descarga_por_dia/periodicoCorreo/periodicoCorreo/items.py
--- a/descarga_por_dia/periodicoCorreo/periodicoCorreo/middlewares.py
+++ b/descarga_por_dia/periodicoCorreo/periodicoCorreo/middlewares.py
--- a/descarga_por_dia/periodicoCorreo/periodicoCorreo/pipelines.py
+++ b/descarga_por_dia/periodicoCorreo/periodicoCorreo/pipelines.py
--- a/descarga_por_dia/periodicoCorreo/periodicoCorreo/settings.py
+++ b/descarga_por_dia/periodicoCorreo/periodicoCorreo/settings.py
--- a/descarga_por_dia/periodicoCorreo/periodicoCorreo/spiders/__init__.py
+++ b/descarga_por_dia/periodicoCorreo/periodicoCorreo/spiders/__init__.py
--- a/descarga_por_dia/periodicoCorreo/periodicoCorreo/spiders/noticias.py
+++ b/descarga_por_dia/periodicoCorreo/periodicoCorreo/spiders/noticias.py
--- a/descarga_por_dia/periodicoCorreo/scrapy.cfg
+++ b/descarga_por_dia/periodicoCorreo/scrapy.cfg
--- a/descarga_por_dia/periodicoEnfoque/periodicoEnfoque/__init__.py
+++ b/descarga_por_dia/periodicoEnfoque/periodicoEnfoque/__init__.py
--- a/descarga_por_dia/periodicoEnfoque/periodicoEnfoque/items.py
+++ b/descarga_por_dia/periodicoEnfoque/periodicoEnfoque/items.py
--- a/descarga_por_dia/periodicoEnfoque/periodicoEnfoque/middlewares.py
+++ b/descarga_por_dia/periodicoEnfoque/periodicoEnfoque/middlewares.py
--- a/descarga_por_dia/periodicoEnfoque/periodicoEnfoque/pipelines.py
+++ b/descarga_por_dia/periodicoEnfoque/periodicoEnfoque/pipelines.py
--- a/descarga_por_dia/periodicoEnfoque/periodicoEnfoque/settings.py
+++ b/descarga_por_dia/periodicoEnfoque/periodicoEnfoque/settings.py
--- a/descarga_por_dia/periodicoEnfoque/periodicoEnfoque/spiders/__init__.py
+++ b/descarga_por_dia/periodicoEnfoque/periodicoEnfoque/spiders/__init__.py
--- a/descarga_por_dia/periodicoEnfoque/periodicoEnfoque/spiders/noticias.py
+++ b/descarga_por_dia/periodicoEnfoque/periodicoEnfoque/spiders/noticias.py
--- a/descarga_por_dia/periodicoEnfoque/scrapy.cfg
+++ b/descarga_por_dia/periodicoEnfoque/scrapy.cfg
--- a/descarga_por_dia/periodicoExpress/periodicoExpress/__init__.py
+++ b/descarga_por_dia/periodicoExpress/periodicoExpress/__init__.py
--- a/descarga_por_dia/periodicoExpress/periodicoExpress/items.py
+++ b/descarga_por_dia/periodicoExpress/periodicoExpress/items.py
--- a/descarga_por_dia/periodicoExpress/periodicoExpress/middlewares.py
+++ b/descarga_por_dia/periodicoExpress/periodicoExpress/middlewares.py
--- a/descarga_por_dia/periodicoExpress/periodicoExpress/pipelines.py
+++ b/descarga_por_dia/periodicoExpress/periodicoExpress/pipelines.py
--- a/descarga_por_dia/periodicoExpress/periodicoExpress/settings.py
+++ b/descarga_por_dia/periodicoExpress/periodicoExpress/settings.py
--- a/descarga_por_dia/periodicoExpress/periodicoExpress/spiders/__init__.py
+++ b/descarga_por_dia/periodicoExpress/periodicoExpress/spiders/__init__.py
--- a/descarga_por_dia/periodicoExpress/periodicoExpress/spiders/noticias.py
+++ b/descarga_por_dia/periodicoExpress/periodicoExpress/spiders/noticias.py
--- a/descarga_por_dia/periodicoExpress/scrapy.cfg
+++ b/descarga_por_dia/periodicoExpress/scrapy.cfg
--- a/descarga_por_dia/periodicoVictoria/periodicoVictoria/__init__.py
+++ b/descarga_por_dia/periodicoVictoria/periodicoVictoria/__init__.py
--- a/descarga_por_dia/periodicoVictoria/periodicoVictoria/items.py
+++ b/descarga_por_dia/periodicoVictoria/periodicoVictoria/items.py
--- a/descarga_por_dia/periodicoVictoria/periodicoVictoria/middlewares.py
+++ b/descarga_por_dia/periodicoVictoria/periodicoVictoria/middlewares.py
--- a/descarga_por_dia/periodicoVictoria/periodicoVictoria/pipelines.py
+++ b/descarga_por_dia/periodicoVictoria/periodicoVictoria/pipelines.py
--- a/descarga_por_dia/periodicoVictoria/periodicoVictoria/settings.py
+++ b/descarga_por_dia/periodicoVictoria/periodicoVictoria/settings.py
--- a/descarga_por_dia/periodicoVictoria/periodicoVictoria/spiders/__init__.py
+++ b/descarga_por_dia/periodicoVictoria/periodicoVictoria/spiders/__init__.py
--- a/descarga_por_dia/periodicoVictoria/periodicoVictoria/spiders/noticias.py
+++ b/descarga_por_dia/periodicoVictoria/periodicoVictoria/spiders/noticias.py
--- a/descarga_por_dia/periodicoVictoria/scrapy.cfg
+++ b/descarga_por_dia/periodicoVictoria/scrapy.cfg
--- a/descarga_por_dia/porEsto/porEsto/__init__.py
+++ b/descarga_por_dia/porEsto/porEsto/__init__.py
--- a/descarga_por_dia/porEsto/porEsto/items.py
+++ b/descarga_por_dia/porEsto/porEsto/items.py
--- a/descarga_por_dia/porEsto/porEsto/middlewares.py
+++ b/descarga_por_dia/porEsto/porEsto/middlewares.py
--- a/descarga_por_dia/porEsto/porEsto/pipelines.py
+++ b/descarga_por_dia/porEsto/porEsto/pipelines.py
--- a/descarga_por_dia/porEsto/porEsto/settings.py
+++ b/descarga_por_dia/porEsto/porEsto/settings.py
--- a/descarga_por_dia/porEsto/porEsto/spiders/__init__.py
+++ b/descarga_por_dia/porEsto/porEsto/spiders/__init__.py
--- a/descarga_por_dia/porEsto/porEsto/spiders/noticias.py
+++ b/descarga_por_dia/porEsto/porEsto/spiders/noticias.py
--- a/descarga_por_dia/porEsto/scrapy.cfg
+++ b/descarga_por_dia/porEsto/scrapy.cfg
--- a/descarga_por_dia/puntoMedio/puntoMedio/__init__.py
+++ b/descarga_por_dia/puntoMedio/puntoMedio/__init__.py
--- a/descarga_por_dia/puntoMedio/puntoMedio/items.py
+++ b/descarga_por_dia/puntoMedio/puntoMedio/items.py
--- a/descarga_por_dia/puntoMedio/puntoMedio/middlewares.py
+++ b/descarga_por_dia/puntoMedio/puntoMedio/middlewares.py
--- a/descarga_por_dia/puntoMedio/puntoMedio/pipelines.py
+++ b/descarga_por_dia/puntoMedio/puntoMedio/pipelines.py
--- a/descarga_por_dia/puntoMedio/puntoMedio/settings.py
+++ b/descarga_por_dia/puntoMedio/puntoMedio/settings.py
--- a/descarga_por_dia/puntoMedio/puntoMedio/spiders/__init__.py
+++ b/descarga_por_dia/puntoMedio/puntoMedio/spiders/__init__.py
--- a/descarga_por_dia/puntoMedio/puntoMedio/spiders/noticias.py
+++ b/descarga_por_dia/puntoMedio/puntoMedio/spiders/noticias.py
--- a/descarga_por_dia/puntoMedio/scrapy.cfg
+++ b/descarga_por_dia/puntoMedio/scrapy.cfg
--- a/descarga_por_dia/redCrucero/redCrucero/__init__.py
+++ b/descarga_por_dia/redCrucero/redCrucero/__init__.py
--- a/descarga_por_dia/redCrucero/redCrucero/items.py
+++ b/descarga_por_dia/redCrucero/redCrucero/items.py
--- a/descarga_por_dia/redCrucero/redCrucero/middlewares.py
+++ b/descarga_por_dia/redCrucero/redCrucero/middlewares.py
--- a/descarga_por_dia/redCrucero/redCrucero/pipelines.py
+++ b/descarga_por_dia/redCrucero/redCrucero/pipelines.py
--- a/descarga_por_dia/redCrucero/redCrucero/settings.py
+++ b/descarga_por_dia/redCrucero/redCrucero/settings.py
--- a/descarga_por_dia/redCrucero/redCrucero/spiders/__init__.py
+++ b/descarga_por_dia/redCrucero/redCrucero/spiders/__init__.py
--- a/descarga_por_dia/redCrucero/redCrucero/spiders/noticias.py
+++ b/descarga_por_dia/redCrucero/redCrucero/spiders/noticias.py
--- a/descarga_por_dia/redCrucero/scrapy.cfg
+++ b/descarga_por_dia/redCrucero/scrapy.cfg
--- a/descarga_por_dia/sintesis/scrapy.cfg
+++ b/descarga_por_dia/sintesis/scrapy.cfg
--- a/descarga_por_dia/sintesis/sintesis/__init__.py
+++ b/descarga_por_dia/sintesis/sintesis/__init__.py
--- a/descarga_por_dia/sintesis/sintesis/items.py
+++ b/descarga_por_dia/sintesis/sintesis/items.py
--- a/descarga_por_dia/sintesis/sintesis/middlewares.py
+++ b/descarga_por_dia/sintesis/sintesis/middlewares.py
--- a/descarga_por_dia/sintesis/sintesis/pipelines.py
+++ b/descarga_por_dia/sintesis/sintesis/pipelines.py
--- a/descarga_por_dia/sintesis/sintesis/settings.py
+++ b/descarga_por_dia/sintesis/sintesis/settings.py
--- a/descarga_por_dia/sintesis/sintesis/spiders/__init__.py
+++ b/descarga_por_dia/sintesis/sintesis/spiders/__init__.py
--- a/descarga_por_dia/sintesis/sintesis/spiders/noticias.py
+++ b/descarga_por_dia/sintesis/sintesis/spiders/noticias.py
--- a/descarga_por_dia/sona893/scrapy.cfg
+++ b/descarga_por_dia/sona893/scrapy.cfg
--- a/descarga_por_dia/sona893/sona893/__init__.py
+++ b/descarga_por_dia/sona893/sona893/__init__.py
--- a/descarga_por_dia/sona893/sona893/items.py
+++ b/descarga_por_dia/sona893/sona893/items.py
--- a/descarga_por_dia/sona893/sona893/middlewares.py
+++ b/descarga_por_dia/sona893/sona893/middlewares.py
--- a/descarga_por_dia/sona893/sona893/pipelines.py
+++ b/descarga_por_dia/sona893/sona893/pipelines.py
--- a/descarga_por_dia/sona893/sona893/settings.py
+++ b/descarga_por_dia/sona893/sona893/settings.py
--- a/descarga_por_dia/sona893/sona893/spiders/__init__.py
+++ b/descarga_por_dia/sona893/sona893/spiders/__init__.py
--- a/descarga_por_dia/sona893/sona893/spiders/noticias.py
+++ b/descarga_por_dia/sona893/sona893/spiders/noticias.py
--- a/descarga_por_dia/surDeCampeche/2019-09-19.json
+++ b/descarga_por_dia/surDeCampeche/2019-09-19.json
--- a/descarga_por_dia/surDeCampeche/scrapy.cfg
+++ b/descarga_por_dia/surDeCampeche/scrapy.cfg
--- a/descarga_por_dia/surDeCampeche/surDeCampeche/__init__.py
+++ b/descarga_por_dia/surDeCampeche/surDeCampeche/__init__.py
--- a/descarga_por_dia/surDeCampeche/surDeCampeche/items.py
+++ b/descarga_por_dia/surDeCampeche/surDeCampeche/items.py
--- a/descarga_por_dia/surDeCampeche/surDeCampeche/middlewares.py
+++ b/descarga_por_dia/surDeCampeche/surDeCampeche/middlewares.py
--- a/descarga_por_dia/surDeCampeche/surDeCampeche/pipelines.py
+++ b/descarga_por_dia/surDeCampeche/surDeCampeche/pipelines.py
--- a/descarga_por_dia/surDeCampeche/surDeCampeche/settings.py
+++ b/descarga_por_dia/surDeCampeche/surDeCampeche/settings.py
--- a/descarga_por_dia/surDeCampeche/surDeCampeche/spiders/__init__.py
+++ b/descarga_por_dia/surDeCampeche/surDeCampeche/spiders/__init__.py
--- a/descarga_por_dia/surDeCampeche/surDeCampeche/spiders/noticias.py
+++ b/descarga_por_dia/surDeCampeche/surDeCampeche/spiders/noticias.py
--- a/descarga_por_dia/tribunaCabos/scrapy.cfg
+++ b/descarga_por_dia/tribunaCabos/scrapy.cfg
--- a/descarga_por_dia/tribunaCabos/tribunaCabos/__init__.py
+++ b/descarga_por_dia/tribunaCabos/tribunaCabos/__init__.py
--- a/descarga_por_dia/tribunaCabos/tribunaCabos/items.py
+++ b/descarga_por_dia/tribunaCabos/tribunaCabos/items.py
--- a/descarga_por_dia/tribunaCabos/tribunaCabos/middlewares.py
+++ b/descarga_por_dia/tribunaCabos/tribunaCabos/middlewares.py
--- a/descarga_por_dia/tribunaCabos/tribunaCabos/pipelines.py
+++ b/descarga_por_dia/tribunaCabos/tribunaCabos/pipelines.py
--- a/descarga_por_dia/tribunaCabos/tribunaCabos/settings.py
+++ b/descarga_por_dia/tribunaCabos/tribunaCabos/settings.py
--- a/descarga_por_dia/tribunaCabos/tribunaCabos/spiders/__init__.py
+++ b/descarga_por_dia/tribunaCabos/tribunaCabos/spiders/__init__.py
--- a/descarga_por_dia/tribunaCabos/tribunaCabos/spiders/noticias.py
+++ b/descarga_por_dia/tribunaCabos/tribunaCabos/spiders/noticias.py
--- a/descarga_por_dia/tribunaCampeche/scrapy.cfg
+++ b/descarga_por_dia/tribunaCampeche/scrapy.cfg
--- a/descarga_por_dia/tribunaCampeche/tribunaCampeche/__init__.py
+++ b/descarga_por_dia/tribunaCampeche/tribunaCampeche/__init__.py
--- a/descarga_por_dia/tribunaCampeche/tribunaCampeche/items.py
+++ b/descarga_por_dia/tribunaCampeche/tribunaCampeche/items.py
--- a/descarga_por_dia/tribunaCampeche/tribunaCampeche/middlewares.py
+++ b/descarga_por_dia/tribunaCampeche/tribunaCampeche/middlewares.py
--- a/descarga_por_dia/tribunaCampeche/tribunaCampeche/pipelines.py
+++ b/descarga_por_dia/tribunaCampeche/tribunaCampeche/pipelines.py
--- a/descarga_por_dia/tribunaCampeche/tribunaCampeche/settings.py
+++ b/descarga_por_dia/tribunaCampeche/tribunaCampeche/settings.py
--- a/descarga_por_dia/tribunaCampeche/tribunaCampeche/spiders/__init__.py
+++ b/descarga_por_dia/tribunaCampeche/tribunaCampeche/spiders/__init__.py
--- a/descarga_por_dia/tribunaCampeche/tribunaCampeche/spiders/noticias.py
+++ b/descarga_por_dia/tribunaCampeche/tribunaCampeche/spiders/noticias.py
--- a/descarga_por_dia/unoMasUno/scrapy.cfg
+++ b/descarga_por_dia/unoMasUno/scrapy.cfg
--- a/descarga_por_dia/unoMasUno/unoMasUno/__init__.py
+++ b/descarga_por_dia/unoMasUno/unoMasUno/__init__.py
--- a/descarga_por_dia/unoMasUno/unoMasUno/items.py
+++ b/descarga_por_dia/unoMasUno/unoMasUno/items.py
--- a/descarga_por_dia/unoMasUno/unoMasUno/middlewares.py
+++ b/descarga_por_dia/unoMasUno/unoMasUno/middlewares.py
--- a/descarga_por_dia/unoMasUno/unoMasUno/pipelines.py
+++ b/descarga_por_dia/unoMasUno/unoMasUno/pipelines.py
--- a/descarga_por_dia/unoMasUno/unoMasUno/settings.py
+++ b/descarga_por_dia/unoMasUno/unoMasUno/settings.py
--- a/descarga_por_dia/unoMasUno/unoMasUno/spiders/__init__.py
+++ b/descarga_por_dia/unoMasUno/unoMasUno/spiders/__init__.py
--- a/descarga_por_dia/unoMasUno/unoMasUno/spiders/noticias.py
+++ b/descarga_por_dia/unoMasUno/unoMasUno/spiders/noticias.py
--- a/descarga_por_dia/yucatanALaMano/scrapy.cfg
+++ b/descarga_por_dia/yucatanALaMano/scrapy.cfg
--- a/descarga_por_dia/yucatanALaMano/yucatanALaMano/__init__.py
+++ b/descarga_por_dia/yucatanALaMano/yucatanALaMano/__init__.py
--- a/descarga_por_dia/yucatanALaMano/yucatanALaMano/items.py
+++ b/descarga_por_dia/yucatanALaMano/yucatanALaMano/items.py
--- a/descarga_por_dia/yucatanALaMano/yucatanALaMano/middlewares.py
+++ b/descarga_por_dia/yucatanALaMano/yucatanALaMano/middlewares.py
--- a/descarga_por_dia/yucatanALaMano/yucatanALaMano/pipelines.py
+++ b/descarga_por_dia/yucatanALaMano/yucatanALaMano/pipelines.py
--- a/descarga_por_dia/yucatanALaMano/yucatanALaMano/settings.py
+++ b/descarga_por_dia/yucatanALaMano/yucatanALaMano/settings.py
--- a/descarga_por_dia/yucatanALaMano/yucatanALaMano/spiders/__init__.py
+++ b/descarga_por_dia/yucatanALaMano/yucatanALaMano/spiders/__init__.py
--- a/descarga_por_dia/yucatanALaMano/yucatanALaMano/spiders/noticias.py
+++ b/descarga_por_dia/yucatanALaMano/yucatanALaMano/spiders/noticias.py
--- a/descarga_por_dia/yucatanEnCorto/scrapy.cfg
+++ b/descarga_por_dia/yucatanEnCorto/scrapy.cfg
--- a/descarga_por_dia/yucatanEnCorto/yucatanEnCorto/__init__.py
+++ b/descarga_por_dia/yucatanEnCorto/yucatanEnCorto/__init__.py
--- a/descarga_por_dia/yucatanEnCorto/yucatanEnCorto/items.py
+++ b/descarga_por_dia/yucatanEnCorto/yucatanEnCorto/items.py
--- a/descarga_por_dia/yucatanEnCorto/yucatanEnCorto/middlewares.py
+++ b/descarga_por_dia/yucatanEnCorto/yucatanEnCorto/middlewares.py
--- a/descarga_por_dia/yucatanEnCorto/yucatanEnCorto/pipelines.py
+++ b/descarga_por_dia/yucatanEnCorto/yucatanEnCorto/pipelines.py
--- a/descarga_por_dia/yucatanEnCorto/yucatanEnCorto/settings.py
+++ b/descarga_por_dia/yucatanEnCorto/yucatanEnCorto/settings.py
--- a/descarga_por_dia/yucatanEnCorto/yucatanEnCorto/spiders/__init__.py
+++ b/descarga_por_dia/yucatanEnCorto/yucatanEnCorto/spiders/__init__.py
--- a/descarga_por_dia/yucatanEnCorto/yucatanEnCorto/spiders/noticias.py
+++ b/descarga_por_dia/yucatanEnCorto/yucatanEnCorto/spiders/noticias.py
--- a/descarga_por_mes/proceso/proceso/__init__.py
+++ b/descarga_por_mes/proceso/proceso/__init__.py
--- a/descarga_por_mes/proceso/proceso/items.py
+++ b/descarga_por_mes/proceso/proceso/items.py
--- a/descarga_por_mes/proceso/proceso/middlewares.py
+++ b/descarga_por_mes/proceso/proceso/middlewares.py
--- a/descarga_por_mes/proceso/proceso/pipelines.py
+++ b/descarga_por_mes/proceso/proceso/pipelines.py
--- a/descarga_por_mes/proceso/proceso/settings.py
+++ b/descarga_por_mes/proceso/proceso/settings.py
--- a/descarga_por_mes/proceso/proceso/spiders/__init__.py
+++ b/descarga_por_mes/proceso/proceso/spiders/__init__.py
--- a/descarga_por_mes/proceso/proceso/spiders/noticias.py
+++ b/descarga_por_mes/proceso/proceso/spiders/noticias.py
--- a/descarga_por_mes/proceso/scrapy.cfg
+++ b/descarga_por_mes/proceso/scrapy.cfg
--- a/descarga_por_mes/proceso_org/proceso/__init__.py
+++ b/descarga_por_mes/proceso_org/proceso/__init__.py
--- a/descarga_por_mes/proceso_org/proceso/items.py
+++ b/descarga_por_mes/proceso_org/proceso/items.py
--- a/descarga_por_mes/proceso_org/proceso/middlewares.py
+++ b/descarga_por_mes/proceso_org/proceso/middlewares.py
--- a/descarga_por_mes/proceso_org/proceso/pipelines.py
+++ b/descarga_por_mes/proceso_org/proceso/pipelines.py
--- a/descarga_por_mes/proceso_org/proceso/settings.py
+++ b/descarga_por_mes/proceso_org/proceso/settings.py
--- a/descarga_por_mes/proceso_org/proceso/settings_org.py
+++ b/descarga_por_mes/proceso_org/proceso/settings_org.py
--- a/descarga_por_mes/proceso_org/proceso/spiders/__init__.py
+++ b/descarga_por_mes/proceso_org/proceso/spiders/__init__.py
--- a/descarga_por_mes/proceso_org/proceso/spiders/noticias.py
+++ b/descarga_por_mes/proceso_org/proceso/spiders/noticias.py
--- a/descarga_por_mes/proceso_org/proceso/spiders/noticias_org.py
+++ b/descarga_por_mes/proceso_org/proceso/spiders/noticias_org.py
--- a/descarga_por_mes/proceso_org/scrapy.cfg
+++ b/descarga_por_mes/proceso_org/scrapy.cfg
--- a/descarga_por_rss/elFinanciero/elFinanciero/__init__.py
+++ b/descarga_por_rss/elFinanciero/elFinanciero/__init__.py
--- a/descarga_por_rss/elFinanciero/elFinanciero/items.py
+++ b/descarga_por_rss/elFinanciero/elFinanciero/items.py
--- a/descarga_por_rss/elFinanciero/elFinanciero/middlewares.py
+++ b/descarga_por_rss/elFinanciero/elFinanciero/middlewares.py
--- a/descarga_por_rss/elFinanciero/elFinanciero/pipelines.py
+++ b/descarga_por_rss/elFinanciero/elFinanciero/pipelines.py
--- a/descarga_por_rss/elFinanciero/elFinanciero/settings.py
+++ b/descarga_por_rss/elFinanciero/elFinanciero/settings.py
--- a/descarga_por_rss/elFinanciero/elFinanciero/spiders/__init__.py
+++ b/descarga_por_rss/elFinanciero/elFinanciero/spiders/__init__.py
--- a/descarga_por_rss/elFinanciero/elFinanciero/spiders/noticias.py
+++ b/descarga_por_rss/elFinanciero/elFinanciero/spiders/noticias.py
--- a/descarga_por_rss/elFinanciero/scrapy.cfg
+++ b/descarga_por_rss/elFinanciero/scrapy.cfg
--- a/descarga_por_rss/elUniversal/elUniversal/__init__.py
+++ b/descarga_por_rss/elUniversal/elUniversal/__init__.py
--- a/descarga_por_rss/elUniversal/elUniversal/items.py
+++ b/descarga_por_rss/elUniversal/elUniversal/items.py
--- a/descarga_por_rss/elUniversal/elUniversal/middlewares.py
+++ b/descarga_por_rss/elUniversal/elUniversal/middlewares.py
--- a/descarga_por_rss/elUniversal/elUniversal/pipelines.py
+++ b/descarga_por_rss/elUniversal/elUniversal/pipelines.py
--- a/descarga_por_rss/elUniversal/elUniversal/settings.py
+++ b/descarga_por_rss/elUniversal/elUniversal/settings.py
--- a/descarga_por_rss/elUniversal/elUniversal/spiders/__init__.py
+++ b/descarga_por_rss/elUniversal/elUniversal/spiders/__init__.py
--- a/descarga_por_rss/elUniversal/elUniversal/spiders/noticias.py
+++ b/descarga_por_rss/elUniversal/elUniversal/spiders/noticias.py
--- a/descarga_por_rss/elUniversal/scrapy.cfg
+++ b/descarga_por_rss/elUniversal/scrapy.cfg
--- a/descarga_por_rss/solDeMex/scrapy.cfg
+++ b/descarga_por_rss/solDeMex/scrapy.cfg
--- a/descarga_por_rss/solDeMex/solDeMex/__init__.py
+++ b/descarga_por_rss/solDeMex/solDeMex/__init__.py
--- a/descarga_por_rss/solDeMex/solDeMex/items.py
+++ b/descarga_por_rss/solDeMex/solDeMex/items.py
--- a/descarga_por_rss/solDeMex/solDeMex/middlewares.py
+++ b/descarga_por_rss/solDeMex/solDeMex/middlewares.py
--- a/descarga_por_rss/solDeMex/solDeMex/pipelines.py
+++ b/descarga_por_rss/solDeMex/solDeMex/pipelines.py
--- a/descarga_por_rss/solDeMex/solDeMex/settings.py
+++ b/descarga_por_rss/solDeMex/solDeMex/settings.py
--- a/descarga_por_rss/solDeMex/solDeMex/spiders/__init__.py
+++ b/descarga_por_rss/solDeMex/solDeMex/spiders/__init__.py
--- a/descarga_por_rss/solDeMex/solDeMex/spiders/noticias.py
+++ b/descarga_por_rss/solDeMex/solDeMex/spiders/noticias.py
--- a/especs_sitio_proceso.txt
+++ b/especs_sitio_proceso.txt
--- a/parse_date_files.py
+++ b/parse_date_files.py
--- a/parse_date_files2.py
+++ b/parse_date_files2.py
--- a/spiders/daily/BROKEN/alChile/alChile/__init__.py
+++ b/spiders/daily/BROKEN/alChile/alChile/__init__.py
--- a/spiders/daily/BROKEN/alChile/alChile/items.py
+++ b/spiders/daily/BROKEN/alChile/alChile/items.py
--- a/spiders/daily/BROKEN/alChile/alChile/middlewares.py
+++ b/spiders/daily/BROKEN/alChile/alChile/middlewares.py
--- a/spiders/daily/BROKEN/alChile/alChile/pipelines.py
+++ b/spiders/daily/BROKEN/alChile/alChile/pipelines.py
--- a/spiders/daily/BROKEN/alChile/alChile/settings.py
+++ b/spiders/daily/BROKEN/alChile/alChile/settings.py
--- a/spiders/daily/BROKEN/alChile/alChile/spiders/__init__.py
+++ b/spiders/daily/BROKEN/alChile/alChile/spiders/__init__.py
--- a/spiders/daily/BROKEN/alChile/alChile/spiders/noticias.py
+++ b/spiders/daily/BROKEN/alChile/alChile/spiders/noticias.py
--- a/spiders/daily/BROKEN/alChile/scrapy.cfg
+++ b/spiders/daily/BROKEN/alChile/scrapy.cfg
--- a/spiders/daily/BROKEN/campecheHoy/campecheHoy/__init__.py
+++ b/spiders/daily/BROKEN/campecheHoy/campecheHoy/__init__.py
--- a/spiders/daily/BROKEN/campecheHoy/campecheHoy/items.py
+++ b/spiders/daily/BROKEN/campecheHoy/campecheHoy/items.py
--- a/spiders/daily/BROKEN/campecheHoy/campecheHoy/middlewares.py
+++ b/spiders/daily/BROKEN/campecheHoy/campecheHoy/middlewares.py
--- a/spiders/daily/BROKEN/campecheHoy/campecheHoy/pipelines.py
+++ b/spiders/daily/BROKEN/campecheHoy/campecheHoy/pipelines.py
--- a/spiders/daily/BROKEN/campecheHoy/campecheHoy/settings.py
+++ b/spiders/daily/BROKEN/campecheHoy/campecheHoy/settings.py
--- a/spiders/daily/BROKEN/campecheHoy/campecheHoy/spiders/__init__.py
+++ b/spiders/daily/BROKEN/campecheHoy/campecheHoy/spiders/__init__.py
--- a/spiders/daily/BROKEN/campecheHoy/campecheHoy/spiders/noticias.py
+++ b/spiders/daily/BROKEN/campecheHoy/campecheHoy/spiders/noticias.py
--- a/spiders/daily/BROKEN/campecheHoy/scrapy.cfg
+++ b/spiders/daily/BROKEN/campecheHoy/scrapy.cfg
--- a/spiders/daily/BROKEN/chiapasHoy/chiapasHoy/__init__.py
+++ b/spiders/daily/BROKEN/chiapasHoy/chiapasHoy/__init__.py
--- a/spiders/daily/BROKEN/chiapasHoy/chiapasHoy/items.py
+++ b/spiders/daily/BROKEN/chiapasHoy/chiapasHoy/items.py
--- a/spiders/daily/BROKEN/chiapasHoy/chiapasHoy/middlewares.py
+++ b/spiders/daily/BROKEN/chiapasHoy/chiapasHoy/middlewares.py
--- a/spiders/daily/BROKEN/chiapasHoy/chiapasHoy/pipelines.py
+++ b/spiders/daily/BROKEN/chiapasHoy/chiapasHoy/pipelines.py
--- a/spiders/daily/BROKEN/chiapasHoy/chiapasHoy/settings.py
+++ b/spiders/daily/BROKEN/chiapasHoy/chiapasHoy/settings.py
--- a/spiders/daily/BROKEN/chiapasHoy/chiapasHoy/spiders/__init__.py
+++ b/spiders/daily/BROKEN/chiapasHoy/chiapasHoy/spiders/__init__.py
--- a/spiders/daily/BROKEN/chiapasHoy/chiapasHoy/spiders/noticias.py
+++ b/spiders/daily/BROKEN/chiapasHoy/chiapasHoy/spiders/noticias.py
--- a/spiders/daily/BROKEN/chiapasHoy/scrapy.cfg
+++ b/spiders/daily/BROKEN/chiapasHoy/scrapy.cfg
--- a/spiders/daily/BROKEN/laRazon/laRazon/__init__.py
+++ b/spiders/daily/BROKEN/laRazon/laRazon/__init__.py
--- a/spiders/daily/BROKEN/laRazon/laRazon/items.py
+++ b/spiders/daily/BROKEN/laRazon/laRazon/items.py
--- a/spiders/daily/BROKEN/laRazon/laRazon/middlewares.py
+++ b/spiders/daily/BROKEN/laRazon/laRazon/middlewares.py
--- a/spiders/daily/BROKEN/laRazon/laRazon/pipelines.py
+++ b/spiders/daily/BROKEN/laRazon/laRazon/pipelines.py
--- a/spiders/daily/BROKEN/laRazon/laRazon/settings.py
+++ b/spiders/daily/BROKEN/laRazon/laRazon/settings.py
--- a/spiders/daily/BROKEN/laRazon/laRazon/spiders/__init__.py
+++ b/spiders/daily/BROKEN/laRazon/laRazon/spiders/__init__.py
--- a/spiders/daily/BROKEN/laRazon/laRazon/spiders/noticias.py
+++ b/spiders/daily/BROKEN/laRazon/laRazon/spiders/noticias.py
--- a/spiders/daily/BROKEN/laRazon/scrapy.cfg
+++ b/spiders/daily/BROKEN/laRazon/scrapy.cfg
--- a/spiders/daily/BROKEN/porEsto/porEsto/__init__.py
+++ b/spiders/daily/BROKEN/porEsto/porEsto/__init__.py
--- a/spiders/daily/BROKEN/porEsto/porEsto/items.py
+++ b/spiders/daily/BROKEN/porEsto/porEsto/items.py
--- a/spiders/daily/BROKEN/porEsto/porEsto/middlewares.py
+++ b/spiders/daily/BROKEN/porEsto/porEsto/middlewares.py
--- a/spiders/daily/BROKEN/porEsto/porEsto/pipelines.py
+++ b/spiders/daily/BROKEN/porEsto/porEsto/pipelines.py
--- a/spiders/daily/BROKEN/porEsto/porEsto/settings.py
+++ b/spiders/daily/BROKEN/porEsto/porEsto/settings.py
--- a/spiders/daily/BROKEN/porEsto/porEsto/spiders/__init__.py
+++ b/spiders/daily/BROKEN/porEsto/porEsto/spiders/__init__.py
--- a/spiders/daily/BROKEN/porEsto/porEsto/spiders/noticias.py
+++ b/spiders/daily/BROKEN/porEsto/porEsto/spiders/noticias.py
--- a/spiders/daily/BROKEN/porEsto/scrapy.cfg
+++ b/spiders/daily/BROKEN/porEsto/scrapy.cfg
--- a/spiders/daily/BROKEN/sintesis/scrapy.cfg
+++ b/spiders/daily/BROKEN/sintesis/scrapy.cfg
--- a/spiders/daily/BROKEN/sintesis/sintesis/__init__.py
+++ b/spiders/daily/BROKEN/sintesis/sintesis/__init__.py
--- a/spiders/daily/BROKEN/sintesis/sintesis/items.py
+++ b/spiders/daily/BROKEN/sintesis/sintesis/items.py
--- a/spiders/daily/BROKEN/sintesis/sintesis/middlewares.py
+++ b/spiders/daily/BROKEN/sintesis/sintesis/middlewares.py
--- a/spiders/daily/BROKEN/sintesis/sintesis/pipelines.py
+++ b/spiders/daily/BROKEN/sintesis/sintesis/pipelines.py
--- a/spiders/daily/BROKEN/sintesis/sintesis/settings.py
+++ b/spiders/daily/BROKEN/sintesis/sintesis/settings.py
--- a/spiders/daily/BROKEN/sintesis/sintesis/spiders/__init__.py
+++ b/spiders/daily/BROKEN/sintesis/sintesis/spiders/__init__.py
--- a/spiders/daily/BROKEN/sintesis/sintesis/spiders/noticias.py
+++ b/spiders/daily/BROKEN/sintesis/sintesis/spiders/noticias.py
--- a/spiders/daily/BROKEN/unoMasUno/scrapy.cfg
+++ b/spiders/daily/BROKEN/unoMasUno/scrapy.cfg
--- a/spiders/daily/BROKEN/unoMasUno/unoMasUno/__init__.py
+++ b/spiders/daily/BROKEN/unoMasUno/unoMasUno/__init__.py
--- a/spiders/daily/BROKEN/unoMasUno/unoMasUno/items.py
+++ b/spiders/daily/BROKEN/unoMasUno/unoMasUno/items.py
--- a/spiders/daily/BROKEN/unoMasUno/unoMasUno/middlewares.py
+++ b/spiders/daily/BROKEN/unoMasUno/unoMasUno/middlewares.py
--- a/spiders/daily/BROKEN/unoMasUno/unoMasUno/pipelines.py
+++ b/spiders/daily/BROKEN/unoMasUno/unoMasUno/pipelines.py
--- a/spiders/daily/BROKEN/unoMasUno/unoMasUno/settings.py
+++ b/spiders/daily/BROKEN/unoMasUno/unoMasUno/settings.py
--- a/spiders/daily/BROKEN/unoMasUno/unoMasUno/spiders/__init__.py
+++ b/spiders/daily/BROKEN/unoMasUno/unoMasUno/spiders/__init__.py
--- a/spiders/daily/BROKEN/unoMasUno/unoMasUno/spiders/noticias.py
+++ b/spiders/daily/BROKEN/unoMasUno/unoMasUno/spiders/noticias.py
--- a/spiders/daily/DEPRECIATED/despertarOaxaca/2017-03-22.json
+++ b/spiders/daily/DEPRECIATED/despertarOaxaca/2017-03-22.json
--- a/spiders/daily/DEPRECIATED/despertarOaxaca/despertarOaxaca/__init__.py
+++ b/spiders/daily/DEPRECIATED/despertarOaxaca/despertarOaxaca/__init__.py
--- a/spiders/daily/DEPRECIATED/despertarOaxaca/despertarOaxaca/items.py
+++ b/spiders/daily/DEPRECIATED/despertarOaxaca/despertarOaxaca/items.py
--- a/spiders/daily/DEPRECIATED/despertarOaxaca/despertarOaxaca/middlewares.py
+++ b/spiders/daily/DEPRECIATED/despertarOaxaca/despertarOaxaca/middlewares.py
--- a/spiders/daily/DEPRECIATED/despertarOaxaca/despertarOaxaca/pipelines.py
+++ b/spiders/daily/DEPRECIATED/despertarOaxaca/despertarOaxaca/pipelines.py
--- a/spiders/daily/DEPRECIATED/despertarOaxaca/despertarOaxaca/settings.py
+++ b/spiders/daily/DEPRECIATED/despertarOaxaca/despertarOaxaca/settings.py
--- a/spiders/daily/DEPRECIATED/despertarOaxaca/despertarOaxaca/spiders/__init__.py
+++ b/spiders/daily/DEPRECIATED/despertarOaxaca/despertarOaxaca/spiders/__init__.py
--- a/spiders/daily/DEPRECIATED/despertarOaxaca/despertarOaxaca/spiders/noticias.py
+++ b/spiders/daily/DEPRECIATED/despertarOaxaca/despertarOaxaca/spiders/noticias.py
--- a/spiders/daily/DEPRECIATED/despertarOaxaca/scrapy.cfg
+++ b/spiders/daily/DEPRECIATED/despertarOaxaca/scrapy.cfg
--- a/spiders/daily/DEPRECIATED/diarioCoLatino/2017-03-22.json
+++ b/spiders/daily/DEPRECIATED/diarioCoLatino/2017-03-22.json
--- a/spiders/daily/DEPRECIATED/diarioCoLatino/diarioCoLatino/__init__.py
+++ b/spiders/daily/DEPRECIATED/diarioCoLatino/diarioCoLatino/__init__.py
--- a/spiders/daily/DEPRECIATED/diarioCoLatino/diarioCoLatino/items.py
+++ b/spiders/daily/DEPRECIATED/diarioCoLatino/diarioCoLatino/items.py
--- a/spiders/daily/DEPRECIATED/diarioCoLatino/diarioCoLatino/middlewares.py
+++ b/spiders/daily/DEPRECIATED/diarioCoLatino/diarioCoLatino/middlewares.py
--- a/spiders/daily/DEPRECIATED/diarioCoLatino/diarioCoLatino/pipelines.py
+++ b/spiders/daily/DEPRECIATED/diarioCoLatino/diarioCoLatino/pipelines.py
--- a/spiders/daily/DEPRECIATED/diarioCoLatino/diarioCoLatino/settings.py
+++ b/spiders/daily/DEPRECIATED/diarioCoLatino/diarioCoLatino/settings.py
--- a/spiders/daily/DEPRECIATED/diarioCoLatino/diarioCoLatino/spiders/__init__.py
+++ b/spiders/daily/DEPRECIATED/diarioCoLatino/diarioCoLatino/spiders/__init__.py
--- a/spiders/daily/DEPRECIATED/diarioCoLatino/diarioCoLatino/spiders/noticias.py
+++ b/spiders/daily/DEPRECIATED/diarioCoLatino/diarioCoLatino/spiders/noticias.py
--- a/spiders/daily/DEPRECIATED/diarioCoLatino/scrapy.cfg
+++ b/spiders/daily/DEPRECIATED/diarioCoLatino/scrapy.cfg
--- a/spiders/daily/DEPRECIATED/edoMexDia_/2021-03-22.json
+++ b/spiders/daily/DEPRECIATED/edoMexDia_/2021-03-22.json
--- a/spiders/daily/DEPRECIATED/edoMexDia_/edoMexDia/__init__.py
+++ b/spiders/daily/DEPRECIATED/edoMexDia_/edoMexDia/__init__.py
--- a/spiders/daily/DEPRECIATED/edoMexDia_/edoMexDia/items.py
+++ b/spiders/daily/DEPRECIATED/edoMexDia_/edoMexDia/items.py
--- a/spiders/daily/DEPRECIATED/edoMexDia_/edoMexDia/middlewares.py
+++ b/spiders/daily/DEPRECIATED/edoMexDia_/edoMexDia/middlewares.py
--- a/spiders/daily/DEPRECIATED/edoMexDia_/edoMexDia/pipelines.py
+++ b/spiders/daily/DEPRECIATED/edoMexDia_/edoMexDia/pipelines.py
--- a/spiders/daily/DEPRECIATED/edoMexDia_/edoMexDia/settings.py
+++ b/spiders/daily/DEPRECIATED/edoMexDia_/edoMexDia/settings.py
--- a/spiders/daily/DEPRECIATED/edoMexDia_/edoMexDia/spiders/__init__.py
+++ b/spiders/daily/DEPRECIATED/edoMexDia_/edoMexDia/spiders/__init__.py
--- a/spiders/daily/DEPRECIATED/edoMexDia_/edoMexDia/spiders/noticias.py
+++ b/spiders/daily/DEPRECIATED/edoMexDia_/edoMexDia/spiders/noticias.py
--- a/spiders/daily/DEPRECIATED/edoMexDia_/scrapy.cfg
+++ b/spiders/daily/DEPRECIATED/edoMexDia_/scrapy.cfg
--- a/spiders/daily/DEPRECIATED/heraldoAgs_/heraldoAgs/__init__.py
+++ b/spiders/daily/DEPRECIATED/heraldoAgs_/heraldoAgs/__init__.py
--- a/spiders/daily/DEPRECIATED/heraldoAgs_/heraldoAgs/items.py
+++ b/spiders/daily/DEPRECIATED/heraldoAgs_/heraldoAgs/items.py
--- a/spiders/daily/DEPRECIATED/heraldoAgs_/heraldoAgs/middlewares.py
+++ b/spiders/daily/DEPRECIATED/heraldoAgs_/heraldoAgs/middlewares.py
--- a/spiders/daily/DEPRECIATED/heraldoAgs_/heraldoAgs/pipelines.py
+++ b/spiders/daily/DEPRECIATED/heraldoAgs_/heraldoAgs/pipelines.py
--- a/spiders/daily/DEPRECIATED/heraldoAgs_/heraldoAgs/settings.py
+++ b/spiders/daily/DEPRECIATED/heraldoAgs_/heraldoAgs/settings.py
--- a/spiders/daily/DEPRECIATED/heraldoAgs_/heraldoAgs/spiders/__init__.py
+++ b/spiders/daily/DEPRECIATED/heraldoAgs_/heraldoAgs/spiders/__init__.py
--- a/spiders/daily/DEPRECIATED/heraldoAgs_/heraldoAgs/spiders/noticias.py
+++ b/spiders/daily/DEPRECIATED/heraldoAgs_/heraldoAgs/spiders/noticias.py
--- a/spiders/daily/DEPRECIATED/heraldoAgs_/scrapy.cfg
+++ b/spiders/daily/DEPRECIATED/heraldoAgs_/scrapy.cfg
--- a/spiders/daily/diarioCoLatino/diarioCoLatino/__init__.py
+++ b/spiders/daily/diarioCoLatino/diarioCoLatino/__init__.py
--- a/spiders/daily/diarioCoLatino/diarioCoLatino/items.py
+++ b/spiders/daily/diarioCoLatino/diarioCoLatino/items.py
--- a/spiders/daily/diarioCoLatino/diarioCoLatino/middlewares.py
+++ b/spiders/daily/diarioCoLatino/diarioCoLatino/middlewares.py
--- a/spiders/daily/diarioCoLatino/diarioCoLatino/pipelines.py
+++ b/spiders/daily/diarioCoLatino/diarioCoLatino/pipelines.py
--- a/spiders/daily/diarioCoLatino/diarioCoLatino/settings.py
+++ b/spiders/daily/diarioCoLatino/diarioCoLatino/settings.py
--- a/spiders/daily/diarioCoLatino/diarioCoLatino/spiders/__init__.py
+++ b/spiders/daily/diarioCoLatino/diarioCoLatino/spiders/__init__.py
--- a/spiders/daily/diarioCoLatino/diarioCoLatino/spiders/noticias.py
+++ b/spiders/daily/diarioCoLatino/diarioCoLatino/spiders/noticias.py
--- a/spiders/daily/diarioCoLatino/scrapy.cfg
+++ b/spiders/daily/diarioCoLatino/scrapy.cfg
--- a/spiders/daily/diarioPuntual/2018-09-05.json
+++ b/spiders/daily/diarioPuntual/2018-09-05.json
--- a/spiders/daily/diarioPuntual/diarioPuntual/spiders/noticias.py
+++ b/spiders/daily/diarioPuntual/diarioPuntual/spiders/noticias.py
--- a/spiders/daily/noticias.py
+++ b/spiders/daily/noticias.py
--- a/spiders/daily/sanPedroSun/sanPedroSun/__init__.py
+++ b/spiders/daily/sanPedroSun/sanPedroSun/__init__.py
--- a/spiders/daily/sanPedroSun/sanPedroSun/items.py
+++ b/spiders/daily/sanPedroSun/sanPedroSun/items.py
--- a/spiders/daily/sanPedroSun/sanPedroSun/middlewares.py
+++ b/spiders/daily/sanPedroSun/sanPedroSun/middlewares.py
--- a/spiders/daily/sanPedroSun/sanPedroSun/pipelines.py
+++ b/spiders/daily/sanPedroSun/sanPedroSun/pipelines.py
--- a/spiders/daily/sanPedroSun/sanPedroSun/settings.py
+++ b/spiders/daily/sanPedroSun/sanPedroSun/settings.py
--- a/spiders/daily/sanPedroSun/sanPedroSun/spiders/__init__.py
+++ b/spiders/daily/sanPedroSun/sanPedroSun/spiders/__init__.py
--- a/spiders/daily/sanPedroSun/sanPedroSun/spiders/noticias.py
+++ b/spiders/daily/sanPedroSun/sanPedroSun/spiders/noticias.py
--- a/spiders/daily/sanPedroSun/scrapy.cfg
+++ b/spiders/daily/sanPedroSun/scrapy.cfg
--- a/spiders/daily/tiempoDigitalHn/scrapy.cfg
+++ b/spiders/daily/tiempoDigitalHn/scrapy.cfg
--- a/spiders/daily/tiempoDigitalHn/tiempoDigitalHn/__init__.py
+++ b/spiders/daily/tiempoDigitalHn/tiempoDigitalHn/__init__.py
--- a/spiders/daily/tiempoDigitalHn/tiempoDigitalHn/items.py
+++ b/spiders/daily/tiempoDigitalHn/tiempoDigitalHn/items.py
--- a/spiders/daily/tiempoDigitalHn/tiempoDigitalHn/middlewares.py
+++ b/spiders/daily/tiempoDigitalHn/tiempoDigitalHn/middlewares.py
--- a/spiders/daily/tiempoDigitalHn/tiempoDigitalHn/pipelines.py
+++ b/spiders/daily/tiempoDigitalHn/tiempoDigitalHn/pipelines.py
--- a/spiders/daily/tiempoDigitalHn/tiempoDigitalHn/settings.py
+++ b/spiders/daily/tiempoDigitalHn/tiempoDigitalHn/settings.py
--- a/spiders/daily/tiempoDigitalHn/tiempoDigitalHn/spiders/__init__.py
+++ b/spiders/daily/tiempoDigitalHn/tiempoDigitalHn/spiders/__init__.py
--- a/spiders/daily/tiempoDigitalHn/tiempoDigitalHn/spiders/noticias.py
+++ b/spiders/daily/tiempoDigitalHn/tiempoDigitalHn/spiders/noticias.py
--- a/spiders/daily/tribunaHn/scrapy.cfg
+++ b/spiders/daily/tribunaHn/scrapy.cfg
--- a/spiders/daily/tribunaHn/tribunaHn/__init__.py
+++ b/spiders/daily/tribunaHn/tribunaHn/__init__.py
--- a/spiders/daily/tribunaHn/tribunaHn/items.py
+++ b/spiders/daily/tribunaHn/tribunaHn/items.py
--- a/spiders/daily/tribunaHn/tribunaHn/middlewares.py
+++ b/spiders/daily/tribunaHn/tribunaHn/middlewares.py
--- a/spiders/daily/tribunaHn/tribunaHn/pipelines.py
+++ b/spiders/daily/tribunaHn/tribunaHn/pipelines.py
--- a/spiders/daily/tribunaHn/tribunaHn/settings.py
+++ b/spiders/daily/tribunaHn/tribunaHn/settings.py
--- a/spiders/daily/tribunaHn/tribunaHn/spiders/__init__.py
+++ b/spiders/daily/tribunaHn/tribunaHn/spiders/__init__.py
--- a/spiders/daily/tribunaHn/tribunaHn/spiders/noticias.py
+++ b/spiders/daily/tribunaHn/tribunaHn/spiders/noticias.py
--- a/spiders/desdeElBalcon/2017-03-22.json
+++ b/spiders/desdeElBalcon/2017-03-22.json
--- a/spiders/desdeElBalcon/desdeElBalcon/__init__.py
+++ b/spiders/desdeElBalcon/desdeElBalcon/__init__.py
--- a/spiders/desdeElBalcon/desdeElBalcon/items.py
+++ b/spiders/desdeElBalcon/desdeElBalcon/items.py
--- a/spiders/desdeElBalcon/desdeElBalcon/middlewares.py
+++ b/spiders/desdeElBalcon/desdeElBalcon/middlewares.py
--- a/spiders/desdeElBalcon/desdeElBalcon/pipelines.py
+++ b/spiders/desdeElBalcon/desdeElBalcon/pipelines.py
--- a/spiders/desdeElBalcon/desdeElBalcon/settings.py
+++ b/spiders/desdeElBalcon/desdeElBalcon/settings.py
--- a/spiders/desdeElBalcon/desdeElBalcon/spiders/__init__.py
+++ b/spiders/desdeElBalcon/desdeElBalcon/spiders/__init__.py
--- a/spiders/desdeElBalcon/desdeElBalcon/spiders/noticias.py
+++ b/spiders/desdeElBalcon/desdeElBalcon/spiders/noticias.py
--- a/spiders/desdeElBalcon/scrapy.cfg
+++ b/spiders/desdeElBalcon/scrapy.cfg