Commit 555d79dd authored by Mario Chirinos's avatar Mario Chirinos

marca

parent b8895f2f
...@@ -19,12 +19,12 @@ class NoticiasSpider(scrapy.Spider): ...@@ -19,12 +19,12 @@ class NoticiasSpider(scrapy.Spider):
section_list = ["politica", "mundo", "capital", "ciencias", "cultura", "deportes", "economia", "sociedad", "estados", "espectaculos", "opinion"] section_list = ["politica", "mundo", "capital", "ciencias", "cultura", "deportes", "economia", "sociedad", "estados", "espectaculos", "opinion"]
#----------------------------------------------------------------------- #-----------------------------------------------------------------------
def start_requests(self): def start_requests(self):
year = getattr(self, "year", None) self.year = getattr(self, "year", None)
month = getattr(self, "month", None) self.month = getattr(self, "month", None)
day = getattr(self, "day", None) self.day = getattr(self, "day", None)
self.date = year + "-" + month.zfill(2) + "-" + self.day.zfill(2) self.date = self.year + "-" + self.month.zfill(2) + "-" + self.day.zfill(2)
self.baseURL = "https://www.jornada.com.mx/" + year + "/" + month.zfill(2) + "/" + self.day.zfill(2) + "/" self.baseURL = "https://www.jornada.com.mx/" + self.year + "/" + self.month.zfill(2) + "/" + self.day.zfill(2) + "/"
yield scrapy.Request(url=self.baseURL, callback=self.parseSectionList) yield scrapy.Request(url=self.baseURL, callback=self.parseSectionList)
#----------------------------------------------------------------------- #-----------------------------------------------------------------------
def parseSectionList(self, response): def parseSectionList(self, response):
......
[
{"date": "2024-12-18T08:14:14-06:00", "title": "Frente frío 15 aumentará probabilidad de lluvias en Oaxaca", "author": "marca", "topic": ["del día"], "text": "Oaxaca, Oax.- La Coordinación Estatal de Protección Civil y Gestión de Riesgos (CEPCyGR) informa que el frente frío número 15 detuvo su paso, momentáneamente, sobre el norte de México; e indicó que se espera que este reanude su avance hacia el sureste el día jueves, al recibir nuevas aportaciones de aire frío por una vaguada superior, evento que puede ocasionar lluvias intensas y tormentas.\nDe acuerdo al pronóstico del tiempo emitido por la Comisión Nacional del Agua (Conagua), se prevé que durante la tarde de este miércoles, los vientos se fijen al norte del país, incrementando su intensidad los días jueves y viernes, cuando la masa de aire frío que lo impulsa se acerque al centro del Golfo de México.\nSe espera aumento en la nubosidad y probabilidad de lluvias asociadas con nieblas densas en la parte norte del territorio oaxaqueño a partir del amanecer del día jueves. \n(Video reporte del clima @conagua_clima) El frente frío no. 15 se desplazará sobre el norte y noreste de México, un canal de baja presión causará precipitaciones en el oriente del país. Preven lluvias puntuales fuertes en zonas de #Oaxaca; vientos de componente “Norte”, con… pic.twitter.com/SSEj8y3dwm\nLAS TEMPERATURAS PARA ESTE MIÉRCOLES SON LAS SIGUIENTES:\nSe exhorta a la población atender las recomendaciones de Protección Civil y Capitanías de Puerto, así como a mantenerse informada de las condiciones meteorológicas a través de los medios y redes sociales oficiales: Facebook @CEPCYGRGobOax y en X @CEPCyGR_GobOax.\n", "url": "https://www.diariomarca.com.mx/2024/12/frente-frio-15-aumentara-probabilidad-de-lluvias-en-oaxaca/"},
{"date": "2024-12-18T09:31:20-06:00", "title": "¿Lo sabías? datos que debes de conocer sobre las esferas navideñas", "author": "marca", "topic": ["del día"], "text": "Por: Ivet Mendoza.\n", "url": "https://www.diariomarca.com.mx/2024/12/lo-sabias-datos-que-debes-de-conocer-sobre-las-esferas-navidenas/"},
{"date": "2024-12-18T09:54:53-06:00", "title": "Reforma a la ley del Infonavit busca erradicar la corrupción y hacer vivienda social: Sheinbaum", "author": "marca", "topic": ["del día", "nacionales"], "text": "Ciudad de México.- La presidenta de México, Claudia Sheinbaum Pardo, explicó que el objetivo de la reforma de la Ley del Infonavit es erradicar la corrupción, asegurar que el uso de recursos de los trabajadores sea transparente y garantizar la construcción de vivienda social. \n“El fondo de la ley es una estructura que permita transparencia, que permita dirección, que permita control claro sobre los ahorros para que los trabajadores puedan tener la certeza de que no se están mal utilizando sus fondos; control, en el sentido de control público de transparencia. Más aparte que se puedan construir viviendas de interés social y que no solamente el Infonavit sea un fondo de ahorro que distribuya recursos a desarrolladores inmobiliarios, sino que sea un fondo de ahorro que permita que los trabajadores tengan vivienda que al final ese es el objetivo central del Infonavit, aseveró. \nEl director del Instituto del Fondo Nacional de la Vivienda para los Trabajadores (Infonavit), Octavio Romero Oropeza, informó que con la reforma se busca continuar con el incremento del salario mínimo, ya que de esta manera se incrementan los recursos del Fondo de Vivienda; además de que se equiparará la gobernabilidad de esta dependencia con la del Instituto Mexicano del Seguro Social (IMSS), manteniendo el sello tripartita, para lo cual se contempla: \nAseveró que, la empresa constructora del Infonavit es indispensable derivado de que en los últimos 10 años se ha reducido notablemente la construcción de vivienda, particularmente la de interés social con un valor promedio de 550 mil pesos.\nExplicó que, con la creación de la constructora del Infonavit se podrá reducir el tiempo y los costos de producción de vivienda, mediante la compra consolidada de los principales materiales de construcción; se le dará prioridad a la mano de obra en los estados, lo que coadyuvará al crecimiento regional y por ende a la economía de todos el país; y las viviendas estarán ubicadas en los centros de desarrollo urbanos, es decir contarán con todos los servicios agua, electricidad, transporte, salud, educación.\n– *Homologación de los órganos de gobierno*: de manera que, al igual que sucede en el IMSS, se *respeta el tripartismo paritario del Infonavit* (ejecutivo federal, trabajadores y empresarios); el *director general* como representante del Ejecutivo, *será nombrado y removido por la Presidenta de la República*; *se eliminan las Direcciones Sectoriales de trabajadores y empresarios*, que actualmente no tienen funciones sustantivas ni responsabilidades, pero si prerrogativas y percepciones económicas muy por encima del sueldo de la Presidenta y finalmente *se termina el esquema de pago por asistencia* a las sesiones de Asamblea, Consejo, Comités y Comisiones, ya que los asistentes, actualmente cobran entre 60 y 90 mil pesos por sesión.\n“Con la reforma no solo va a existir una responsabilidad directa, trazable y transparente en el manejo de los recursos, sino que se permitirá, – como hoy no sucede-, la fiscalización por parte de la Auditoría Superior de la Federación”, destacó el director general del Infonavit.\n“El fondo de la ley es una estructura que permita transparencia, que permita dirección, que permita control claro sobre los ahorros para que los trabajadores puedan tener la certeza de que no se están mal utilizando sus fondos”, precisó la presidenta Sheinbaum sobre la reforma a… pic.twitter.com/qtFw9YeEx9\n", "url": "https://www.diariomarca.com.mx/2024/12/reforma-a-la-ley-del-infonavit-busca-erradicar-la-corrupcion-y-hacer-vivienda-social-sheinbaum/"},
{"date": "2024-12-18T10:45:01-06:00", "title": "Celebran a la Virgen de la Soledad en Oaxaca", "author": "marca", "topic": ["cultura", "del día", "principal"], "text": "Por Agencia Quadratín / Fotos de Estación Foto\nEn Oaxaca, este miércoles se celebra la festividad de la Virgen de la Soledad, patrona de Oaxaca.\nEs una tradición que une y trasciende fervor religioso, historia y cultura.\nMiles de fieles acudieron desde la noche de este martes al santuario dedicado a esta imagen, considerado uno de los máximos exponentes del barroco novohispano en México.\nLa Virgen de la Soledad es venerada desde el siglo 16, cuando, según la tradición, un arriero encontró la imagen en una mula cargada con oro y cacao en la región.\nEsto fue interpretado como una señal divina para construirle un templo en Oaxaca, lo que marcó el inicio de su devoción.\nLa imagen representa a la Virgen María en su dolor tras la muerte de Cristo, un símbolo de fortaleza y esperanza.\nSe distingue por su manto bordado en oro y una corona de 600 gramos del mismo metal, adornada con perlas y piedras preciosas.\nSu santuario, construido entre 1682 y 1690, es patrimonio cultural de Oaxaca y centro de peregrinación.\nDurante la celebración, se realizarán misas, procesiones y la tradicional calenda, que incluyó música, fuegos artificiales y danzas regionales.\nLos fieles también participaron en actos de devoción personal, como el rezo del rosario y la ofrenda de fe.\nEsta festividad reafirmó la identidad cultural y religiosa de Oaxaca, destacando el papel de la Virgen de la Soledad como símbolo de unidad entre la espiritualidad.\nEL ULTRAJE A LA VIRGEN\nEl robo de la corona de la Virgen de la Soledad es uno de los episodios más impactantes en la historia de esta venerada imagen.\nOcurrió en la madrugada del 29 de marzo de 2003, cuando un grupo de delincuentes ingresó al Santuario de la Virgen de la Soledad, en la ciudad de Oaxaca, y sustrajo la corona original de la imagen, valorada en millones de pesos debido a su alto contenido de oro.\nLa corona, que había sido obsequiada a la Virgen en 1904 durante su coronación pontificia, tenía un gran valor no solo económico, sino también espiritual e histórico para los fieles y la comunidad. El hurto provocó consternación entre los oaxaqueños y devotos de todo el estado.\nEl caso generó un amplio operativo de búsqueda y una investigación que trascendió el ámbito local. Semanas después del robo, las autoridades lograron recuperar la corona en un cateo realizado en la Ciudad de México. Varios de los implicados fueron detenidos, aunque el incidente dejó una huella en la percepción de la sociedad.\nTras la recuperación, la corona fue devuelta al santuario con medidas de seguridad reforzadas, y se implementaron protocolos más estrictos para proteger tanto la imagen como sus ornamentos.\nEPICENTRO DE FE\nLa Basílica de la Soledad en Oaxaca es un ícono arquitectónico y religioso con profundo valor histórico, considerado uno de los máximos exponentes del barroco novohispano en México.\nSu construcción comenzó en 1682 bajo la supervisión del obispo Juan de Cervantes y Padilla, y se concluyó en 1690, marcando un hito en el desarrollo urbano.\nEl origen del santuario está vinculado a la veneración de la Virgen de la Soledad, cuya devoción comenzó en el siglo 16. Según la tradición, un arriero encontró la imagen en el lomo de una mula durante su trayecto por Oaxaca. La mula, agotada, se desplomó en el sitio donde actualmente se encuentra el templo, interpretándose como una señal divina para construir un lu.\nLa basílica, elevada a tal categoría por el Papa Pío 10 en 1909, destaca por su diseño arquitectónico singular. Presenta una planta en forma de cruz latina, una cúpula ornamentada y un imponente retablo principal de estilo churrigueresco. La cantera verde característica de la región marca su estructura, dotándola de una estética imponente que fusiona la devoción religiosa y la destreza artística de la época.\nEl recinto alberga la imagen de la Virgen de la Soledad, esculpida en madera y vestida con trajes bordados en oro. Su joyería, incluida su emblemática corona, refleja la riqueza y la fe de sus devotos a lo largo de los siglos. Además, su ubicación, en el centro histórico de Oaxaca, la convierte en un punto de referencia cultural, inscrito como Patrimonio Mundial po\nLa Basílica no solo es un centro de peregrinación y fe, sino también un testimonio vivo de la historia de Oaxaca. Sus muros resguardan relaciones de conquista, evangelización y resistencia, convirtiéndola en un símbolo de identidad y unidad para los oaxaqueños.\n", "url": "https://www.diariomarca.com.mx/2024/12/celebran-a-la-virgen-de-la-soledad-en-oaxaca/"},
{"date": "2024-12-18T10:56:01-06:00", "title": "Las variaciones climáticas aumentan el consumo de agua en las ciudades: UNAM", "author": "marca", "topic": ["del día", "nacionales"], "text": "Necesitamos crear conciencia de que es mayor la demanda que la oferta, señaló Víctor Orlando Magaña Rueda.\nLa provisión de suficiente agua potable para consumo doméstico en urbes nacionales como la Ciudad de México, Guadalajara y Monterrey es un reto creciente, revela un estudio del Instituto de Geografía (IGg) de la UNAM.\nAfecta el crecimiento de la población -la cual incrementa la demanda del líquido más rápido que la oferta-, el nivel de ingresos, la infraestructura hidráulica y, más recientemente, las variaciones climáticas, revela el artículo El clima cambiante y los consumos domésticos de agua en ciudades de México (revista Investigaciones Geográficas, IGg UNAM).\nEn ese estudio, Víctor Orlando Magaña Rueda, investigador de dicha entidad académica, y sus colegas Carlos Joel Ábrego Góngora, de la Facultad de Ingeniería de la Universidad Autónoma de Nuevo León, y Baldemar Méndez Antonio, de la Comisión del Agua del Estado de México, encontraron que en las metrópolis mexicanas el acceso al recurso hídrico es desigual, mientras que el clima también se manifiesta en el consumo, que se eleva en temporadas de calor.\nQueríamos saber si el calentamiento global llevaba a las personas a consumirla hoy en día más que antes, un asunto de la mayor importancia porque no es solo que quieran beber más o bañarse seguido, sino que somos mayor número de pobladores, y esto requeriría que su abasto creciera significativamente, explicó en entrevista Magaña Rueda.\nDe acuerdo con el experto, existen pocos datos sobre cuánta se usa de manera constante. “Sabemos que aumenta en temperaturas cálidas entre un 10 y 15 por ciento”.\n \nTecnologías domésticas\nDestacó que el país requiere mejor gestión del vital líquido, sobre todo en la agricultura. No existe planeación adecuada y se necesita estrategia coordinada y conciencia de todas las personas para aminorar los impactos por el alto uso.\n“Requerimos una cultura del agua que nos involucre a todos los ciudadanos y una conciencia clara de que, entre más usuarios seamos, existe mayor vulnerabilidad hacia ese recurso”, subrayó.\nPara abatir desde nuestros hogares el desperdicio, que es considerable, el especialista recomendó instalar tecnologías domésticas y accesibles de comprar, por ejemplo regaderas ahorradoras y sistemas para adaptar en inodoros y lavabos; son medidas que cada familia puede llevar a cabo.\nMagaña Rueda y sus pares encontraron en su investigación que el clima también es esencial en el consumo, pues el factor temperatura máxima es un modulador de la demanda y su efecto es detectable en los periodos más cálidos del año, previo al inicio de la temporada de lluvias de verano. Lo anterior hace pensar que la formación de islas de calor urbanas pudiera incrementarla y también los consumos.\nSin embargo, los científicos destacan en su artículo que en grandes ciudades de México estos gastos per cápita tienden a disminuir en décadas recientes, porque la provisión del recurso no aumenta al ritmo con que crece el número de usuarios.\nDe esta manera, el principal modulador climático de los consumos de agua es la sequía meteorológica, pues su ocurrencia da como resultado baja disponibilidad y, con frecuencia, sequía socioeconómica.\nPor lo tanto, una mejor gestión hídrica urbana debe incluir estrategias de uso de información climática en donde se priorice la provisión a las urbes, concluyó.\n", "url": "https://www.diariomarca.com.mx/2024/12/las-variaciones-climaticas-aumentan-el-consumo-de-agua-en-las-ciudades-unam/"},
{"date": "2024-02-02T16:47:59-06:00", "title": "Leucemia linfoblástica, principal tipo de cáncer en la infancia", "author": "marca", "topic": ["del día", "nacionales"], "text": "Los síntomas de alarma: fiebre recurrente, infecciones repetitivas, disminución de la actividad física, pérdida de apetito, palidez, hemorragias nasales o en encías, moretones, además de bolitas en cuello o ingle.\nOaxaca de Juárez, Oax., a 2 de febrero de 2024.- El diagnóstico oportuno y el apego al tratamiento son la clave para curar la leucemia linfoblástica, el tipo de cáncer más común que afecta a la población infantil, señaló la jefa de Hematología del Instituto Nacional de Pediatría (INP) de la Secretaría de Salud, Norma Candelaria López Santiago.\nInformó que, al no haber pruebas diagnósticas para detectar el cáncer infantil, es prioritario que madres y padres de familia o personas tutoras de menores conozcan los síntomas de alarma: fiebre recurrente, infecciones repetitivas con mala respuesta a los tratamientos, disminución de la actividad física, pérdida de apetito, palidez, hemorragias nasales o en encías, moretones o presencia de puntitos rojos (petequias), además de bolitas en cuello o ingle.\nEl documento Lineamientos 2023, cáncer en la infancia y la adolescencia, elaborado por el Centro Nacional para la Salud de la Infancia y la Adolescencia (Censia) https://bit.ly/3Sm55TF muestra que en 2021 se registraron mil 356 casos; de ellos, 48 por ciento fue por leucemias, y 52 por ciento por tumores sólidos.\nEn entrevista con motivo de Febrero, Mes Nacional para la Concientización, Prevención, Detección y Tratamiento Oportuno del Cáncer Infantil, López Santiago destacó que el INP cuenta con tratamientos innovadores y un equipo multidisciplinario que brinda atención integral; esto permite que prácticamente vivan igual que una persona sin cáncer.\nIndicó que cada año el INP atiende cerca de 150 pacientes nuevos con cáncer; de ellos, alrededor de 100 presentan leucemia linfoblástica.\nExplicó que el cáncer es el crecimiento anormal de células en un órgano sólido, tejido o en la sangre. “Una célula normal se modifica y empieza a tener un crecimiento no controlado y capaz de viajar a distancia, pero incapaz de tener la función normal”.\nMencionó que la patología oncológica más frecuente en la población pediátrica es la leucemia linfoblástica, seguida de tumores del sistema nervioso central, linfomas, retinoblastoma y sarcoma.\nEnfatizó que hasta el momento el mejor tratamiento para leucemia es la quimioterapia múltiple combinada, que consiste en utilizar una mezcla de medicamentos con diferentes mecanismos de acción para destruir las células dañinas.\nDestacó que este instituto también cuenta con tratamientos innovadores como la denominada terapia blanco y el trasplante de células progenitoras hematopoyéticas; ambos son utilizados para casos muy específicos de la enfermedad.\nRefirió que la terapia blanco consiste en dirigir los medicamentos a blancos moleculares que presentan las células tumorales; por ejemplo, en leucemia, la presencia de un cromosoma llamado Filadelfia, que es una alteración molecular que hace más agresiva la enfermedad. “Con esta terapia podemos atacar a ese cromosoma y esto hace que la quimioterapia sea más efectiva”.\nIndicó que el trasplante de células progenitoras hematopoyéticas se lleva a cabo cuando no existe buena respuesta al tratamiento inicial o cuando se presentan recaídas.\nResaltó que niños y niñas sin derechohabiencia atendidos en el INP tienen garantizados los tratamientos oncológicos gratuitos, como resultado de la política de gratuidad en atención médica y medicamentos que brinda el Gobierno de México.\nCabe mencionar que el documento los Lineamientos 2023, cáncer en la infancia y la adolescencia elaborado por Censia, presenta el panorama epidemiológico de esta enfermedad y las acciones que lleva a cabo el gobierno federal para avanzar en la detección oportuna y control del cáncer infantil y juvenil.\nEntre ellas destacan: tareas de promoción para la salud y comunicación educativa; capacitar al personal de salud de primer contacto en el reconocimiento temprano de signos y síntomas de sospecha, así como en referencia correcta y oportuna.\nTambién establece: promover la contratación de personal de salud especializado y/o capacitado exclusivo, involucrado en los procesos de detección, referencia, diagnóstico y tratamiento de cáncer; adquirir infraestructura y equipamiento para brindar atención eficiente y desarrollar la vinculación del sistema de referencia entre los diversos niveles de atención dentro de las entidades federativas para que los pacientes reciban trato de calidad que asegure la detección de casos de sospecha.\n", "url": "https://www.diariomarca.com.mx/2024/02/leucemia-linfoblastica-principal-tipo-de-cancer-en-la-infancia/"},
{"date": "2024-02-02T16:55:03-06:00", "title": "«Queremos inversión sustentable y con bienestar’’: Claudia Sheinbaum", "author": "marca", "topic": ["del día", "nacionales"], "text": "«México es hoy, no solo para Estados Unidos, incluso para Europa, y Asia, un lugar muy importante para invertir’’, destacó\nSan Luis Potosí, San Luis Potosí, a 02 de febrero de 2024.– ‘’Queremos inversión sustentable y con bienestar’’, aseguró Claudia Sheinbaum desde San Luis Potosí donde sostuvo un encuentro con medios de comunicación locales ante quienes puntualizó la importancia de que en los próximos años se aproveche la posición estratégica de la que hoy goza México en términos de comercio.\n‘’Estamos viviendo un momento especial en México con el comercio con Estados Unidos, nunca antes habíamos sido el primer socio comercial con Estados Unidos, hoy lo somos. (…) México es hoy, no solo para Estados Unidos, incluso para Europa, y Asia, un lugar muy importante para invertir, se le llama nearshoring, quiere decir que estamos cerca en este proceso comercial del mercado regional, antes se hablaba de la globalización, hoy se habla más de los mercados regionales, es un momento distinto’’, aseveró.\nAl respecto, destacó que una de las visiones más importantes para la Cuarta Transformación es garantizar que las inversiones que lleguen a México tengan como principal objetivo generar bienestar para las mexicanas y mexicanos, pero a su vez que esto se traduzca en inversión sustentable.\n‘’Lo que queremos es que tenga dos apellidos esta Inversión Extranjera Directa: uno, que sea inversión sustentable, es decir que afecte menos al medio ambiente y se tenga las condiciones para que si se va a usar agua no le quite agua para el consumo humano o al riego para la producción de alimentos, que no emita gases de efecto invernadero; y al mismo tiempo que genere bienestar’’, agregó.\nAnte la prensa local, acompañada de Manuel Velasco, Sheinbaum Pardo hizo énfasis en la importancia de seguir trabajando a favor de que la relación con otros países continúe fortaleciéndose para seguir generando mejores condiciones de vida para todos y todas.\n", "url": "https://www.diariomarca.com.mx/2024/02/queremos-inversion-sustentable-y-con-bienestar-claudia-sheinbaum/"},
{"date": "2024-02-02T17:27:12-06:00", "title": "Asesinan a balazos a tres personas en Juchitán", "author": "marca", "topic": ["del día", "seguridad"], "text": "Paramédicos de Bomberos acudieron al lugar para auxiliar a las personas, sin embargo, los masculinos se encontraban sin signos vitales.\nPor la Redacción\nOaxaca de Juárez, Oax., a 2 de febrero de 2024.- La mañana de este viernes, tres personas del sexo masculino fueron atacadas a balazos en la colonia Guadalupe, en Juchitán de Zaragoza en la región del Istmo de Tehuantepec.\nLos primeros reportes de la policía regional, indican que sobre la calle Mariano Montero, de la colonia Guadalupe se registró un ataque armado.\nPor lo anterior, tras recibir el reporte de la Comisaría Municipal, paramédicos de Bomberos de Juchitán arribaron al lugar para auxuliar a las personas, quienes fueron lesionadas por arma de fuego, sin embargo, los masculinos se encontraban sin signos vitales.\nSe contactó a Agentes del Ministerior Público para realizar las diligencias correspondientes.\nLas víctimas fueron identificadas como Fernando N.N, Óscar N.N  y José N.N, todos originarios de Juchitán.\n", "url": "https://www.diariomarca.com.mx/2024/02/asesinan-a-balazos-a-tres-personas-en-juchitan/"},
{"date": "2024-02-02T17:47:07-06:00", "title": "Determinan que las corridas de toros se podrán llevar a cabo en la Plaza México", "author": "marca", "topic": ["del día", "nacionales"], "text": "El recinto manifestó su inconformidad tras la suspensión provisional dictada tan solo dos días después del regreso a la actividad en la CDMX el pasado fin de semana\nCiudad de México, DF., a 2 de febrero de 2024.- Por unanimidad el Décimo tercer tribunal colegiado en Materia Administrativa del primer circuito revocó la suspensión provisional que se le había concedido a la organización “Todas y todos por amor a los toros”, por lo que se puede realizar corridas de toros en la Plaza de Toros México.\nEn un comunicado, la Plaza Toros informó que derivado de las acciones de defensa promovidas por la empresa en contra de la suspensión provisional, el recurso de queja fue resuelto de manera favorable y se reanudan los espectáculos taurinos.\n“Esta determinación está en línea con la resolución de la Segunda Sala de laSuprema Corte de Justicia de la Nación (SCJN), nuestro máximo tribunal del pasado 6 de diciembre”.\n“Estas resoluciones confirman que la voluntad de unos cuantos no puede imponerse a terceros anteponiéndose a las normas y derechos aplicables”, detalló laPlaza de Toros.\nLa empresa reiteró su compromiso con la defensa firme y decidida de las tradiciones.\nEsto luego que un Tribunal Federal admitió a trámite un recurso de queja interpuesta por la Plaza México, contra la suspensión provisional de corridas de toros.\n“Téngase por recibido el oficio del Juzgado Quinto de Distrito en Materia Administrativa en la Ciudad de México con el que se remite un recurso de queja, relativo al incidente de suspensión derivado del juicio de amparo indirecto”.\n“Por el que rinde su informe justificado… regístrese en el libro electrónico. Se admite a trámite el recurso de queja en tal virtud túrnense los presentes autos al magistrado Gaspar Paulín para la formulación del proyecto”, de acuerdo a una notificación en estrados electrónicos del Consejo de la Judicatura Federal (CJF).\nEl miércoles pasado, la jueza Quinta de Distrito en Materia Administrativa suspendió las corridas de toros en la Plaza México, que se había reanudado el domingo 28 de enero, debido a que la Suprema Corte de Justicia de la Nación (SCJN) revocó la suspensión.\nCon información de El Universal \n", "url": "https://www.diariomarca.com.mx/2024/02/determinan-que-las-corridas-de-toros-se-podran-llevar-a-cabo-en-la-plaza-mexico/"},
{"date": "2024-02-02T19:05:05-06:00", "title": "Se registra carambola en la carretera a Ixtlán km 175", "author": "marca", "topic": ["del día", "seguridad"], "text": "El percance vial dejó daños materiales y al menos 6 personas lesionadas.\nDe la Redacción\nOaxaca, Oax., 02 de febrero de 2024- La tarde de este viernes se registró una aparatosa carambola en la carretera federal 175, rumbo a Ixtlán, dejando como saldo al menos seis personas lesionadas.\nEn el accidente vial estuvieron involucrados un camión tipo torton, quien chocó contra un semáforo y lo derribó por completo; una urban salió del camino, quedando con daños materiales, otro vehículo más con daños menores y un taxi foráneo.\nAl lugar arribaron paramédicos de la Cruz Roja Mexicana para brindar los primeros auxilios a las personas lesionadas.\nLos cuerpos de emergencia reportaron seis personas con lesiones leves, quienes no ameritaron hospitalización.\nElementos de seguridad también acudieron a la zona del percance para realizar el retiro de las unidades y recabar las evidencias para el deslinde de responsabilidades.\n\n", "url": "https://www.diariomarca.com.mx/2024/02/se-registra-carambola-en-la-carretera-a-ixtlan-km-175/"},
{"date": "2024-02-02T19:45:03-06:00", "title": "Invertirá gobierno de Jara más de 22 mdp en San Francisco del Mar", "author": "marca", "topic": ["del día"], "text": "Con una inversión de 10 millones de pesos atenderá un camino que beneficiará a las agencias de El Vergel del Maíz, Puerto Grande y la Colonia Villanueva\nSan Francisco del Mar, Oax. 2 de febrero de 2024.- El Gobernador Salomón Jara Cruz visitó San Francisco del Mar en donde anunció la inversión de 22 millones 071 mil pesos en apoyo a la comunidad. \nAcompañado de la Presidenta Honoraria del Sistema para el Desarrollo Integral de la Familia (DIF) Oaxaca, Irma Bolaños Quijano, y en presencia del presidente municipal Pedro Enríquez Martínez, el Mandatario dijo que su Gobierno es para el pueblo y del pueblo, “por eso siempre estaremos donde están las carencias y necesidades”.\nJara Cruz reiteró su amor por Oaxaca y aseguró que por ello está comprometido en sacar a las comunidades adelante a través del trabajo en equipo entre las autoridades municipales y el pueblo; con un gobierno cercano a la gente, que trabaja con humildad y sencillez.\nEl municipio considerado de media marginación, perteneciente al distrito de Juchitán, fue testigo del desglose de acciones, programas y obras con los que diversas dependencias comenzarán a resarcir la deuda histórica que se tiene con los pueblos de Oaxaca.\nDestacaron que se atenderá un camino que beneficiará a las agencias de El Vergel del Maíz, Puerto Grande y la Colonia Villanueva, por mencionar algunas, con una inversión de 10 millones de pesos.\nEn Infraestructura Educativa, se informó que con recursos de 2023 se construyen dos aulas didácticas en la Primaria Leona Vicario con monto de 1 millón 280 mil pesos; mientras que este año, la misma escuela recibirá otra aula por 640 mil pesos y en la Primaria Vicente Guerrero se construirá una plaza cívica por 850 mil pesos.\nAsimismo, tanto en el Centro de Educación Inicial Indígena como en la Primaria Bilingüe 11 de Enero, la dependencia realizará aulas didácticas con inversión de 640 mil pesos cada una; mientras en el Instituto de Estudios de Bachillerato del Estado de Oaxaca (IEBO) entregará 30 computadoras, cinco lotes de mobiliario y un techado con 3 millones 100 mil pesos. Todas las obras mencionadas suman un total de 7 millones 800 mil pesos.\nEn cuestión de Patrimonio Cultural con inversión del 2023 iniciaron la reconstrucción del templo católico de San Francisco de Asís -que estuvo abandonado por seis años- con un monto de 7 millones 187 mil 378 pesos.\nEn su oportunidad la Presidenta Honoraria del Sistema DIF Oaxaca, Irma Bolaños Quijano, dio a conocer que a través del programa Comedores Populares para el Bienestar se destinó 579 mil 983 pesos; con Atención Alimentaria para Grupos Prioritarios, 193 mil 480 pesos; y con Comedores Escolares, 2 millones 568 mil 358 pesos, lo que suma una inversión de 3 millones 491 mil 116 pesos.\nDebido a que la pesca es una de las actividades más importantes en San Francisco del Mar, en 2023 la Secretaría de Fomento Agroalimentario y Desarrollo Rural (Sefader) apoyó con 35 mil 600 crías de tilapia para la laguna y para una granja acuícola. Para este año ayudará al sector pesquero de la población, conformado aproximadamente por 400 personas, con hasta 1 millón de pesos.\nFinanzas indicó que en 2023 depositó de manera directa y sin personas intermediarias la cantidad de 832 mil 309 pesos a las arcas del municipio, como parte de un Fondo Compensatorio.\nEducación  subrayó que en el 2023 invirtió 265 mil 852 pesos en el municipio con 33 escuelas y matrícula de 2 mil 036 estudiantes; y para este 2024 todas las instituciones educativas recibirán material de aseo, deportivo y oficina, además de que beneficiará a 12 escuelas con mobiliario digno con una inversión de 553 mil 357 pesos.\nSalud de Oaxaca, designó 703 mil 227 pesos para la compra de medicamentos para el centro de salud, al tiempo que la Secretaría de Interculturalidad, Pueblos y Comunidades Indígenas y Afromexicanas (SIPCIA) afirmó que benefició a mujeres emprendedoras y accionó el programa Fomentando Lenguas Indígenas.\n", "url": "https://www.diariomarca.com.mx/2024/02/invertira-gobierno-de-jara-mas-de-22-mdp-en-san-francisco-del-mar/"},
{"date": "2024-02-02T20:02:52-06:00", "title": "Año electoral permitirá a telefonistas reivindicar derechos laborales", "author": "marca", "topic": ["del día", "regiones"], "text": "Telefonistas buscan incidir en elecciones con agenda laboral y proyecto alternativo de nación\nPor Agencia IGAVEC\nHuajuapan de León, Oax., a 2 de febrero de 2024- Froylán Hernández Cruz, secretario general del Sindicato de Telefonistas de la República Mexicana (STRM), expuso que este 2024, al ser un año de elecciones, es una oportunidad para que los trabajadores de este sindicato puedan incidir en este proceso electivo nacional.\nAl respecto, refirió que la Unión Nacional de Trabajadores (UNT), el Frente Amplio Social Unitario (FASU) y el Encuentro Nacional de Dirigentes (ENADI), han diseñado una estrategia que consiste en elaborar una agenda laboral mediática en la cual se incluyen iniciativas como la eliminación del impuesto a prestaciones como el tiempo extra y la recuperación del poder adquisitivo de los salarios contractuales.\nHernández Cruz comentó que también se incluye la iniciativa para perfeccionar las leyes laborales vigentes simplificando los trámites para la toma de nota, así como el procedimiento para resolver las revisiones salariales y contractuales.\n“Además se considera necesario apoyar iniciativas del Ejecutivo Federal para que los salarios mínimos reciban siempre incrementos superiores a los de la inflación”, indicó.\nEl secretario general compartió que su proyecto considera la modificación de la Ley de Telecomunicaciones, Ciencia y Tecnología, con el propósito de recuperar la rectoría y control del estado sobre este estratégico sector.\nFinalmente, dijo  que el FASU y el ENADI han concluido con la actualización de su proyecto Alternativo de Nación, en el que sintetizan las principales reivindicaciones del movimiento social para resolver los graves problemas que aún afectan a México.\n", "url": "https://www.diariomarca.com.mx/2024/02/ano-electoral-permitira-a-telefonistas-reivindicar-derechos-laborales/"},
{"date": "2024-02-02T20:26:33-06:00", "title": "El guionista y director Carlos Muñoz teje historias desde diferentes plataformas", "author": "marca", "topic": ["cultura", "del día"], "text": "Ciudad de México, DF., a 2 de febrero de 2024.- Con una filmografía de aproximadamente una veintena de cortometrajes, el cineasta y comunicólogo Carlos Muñoz ha cimentado su carrera en diversos ámbitos del medio audiovisual como cineasta, director y fotógrafo, generando proyectos que han sido merecedores de premios y reconocimientos, permitiendo así su proyección a nivel internacional.\nCuenta en entrevista que su primer deseo vocacional fue ser pintor, pero nunca tomó clases, sin embargo, estuvo muy apegado a la literatura por recomendación de su papá, que tenía un amplio acervo; también el cine fue un gran compañero gracias a las tecnologías de los videocasetes, en aquel entonces en formato VHS, “así que entre la lectura por recomendaciones de mi papá y el cine en video, fue como me fui formando, despertándose también, en algún episodio de mi vida, el deseo de ser periodista”.\nPero los tiempos y la carrera de Comunicación por la Universidad Autónoma de San Luis Potosí (1995-1999) “que era lo que más se apegaba a lo que quería en muchos sentidos” le fueron guiando para hacer realidad un sueño que nació cuando era un adolescente e hizo sus pininos con cámaras de video.\nYa convencido de ser cineasta, Carlos ingresó al Centro Universitario de Estudios Cinematográficos de la Universidad Nacional Autónoma de México (2002-2009), y se tituló con su tesis fílmica Nación Apache, con la que ganó el Audence Award, en el Festival de Beijing FIL Academy. Esta también formó parte de la selección oficial del Festival de San Sebastián, y aunque le antecedieron Elle Mental (2007), Muñecón (2007), La Purísima (Imcine 2008), Nación Apache es la que le abre el camino a nivel internacional.\n“Nación apache es el filme que mejor me representa como persona y como profesional porque tuve total libertad en los temas, además fue un proyecto que nadie quiso apoyar, sin embargo, llegó muy lejos cuando se dio a conocer. Puedo decir que muchas cosas se juntaron en este proyecto por lo que surgió la magia. Por eso es tan importante y representa tanto para mí”.\nAsí es como Carlos Muñoz, especializado en dirección y guionismo, teje su historia desde su infancia dando vida a sus sueños y, con el paso del tiempo, también traza una amplia trayectoria dentro de la fotografía,\nparticipando en diferentes filmes, publicidad, proyectos editoriales y personales, además de su destacado trabajo dentro de la dirección.\nEn este abanico profesional que se fue extendiendo, Carlos cuenta que también ha tenido diversos proyectos en televisión, como editor, director en series de ficción, y director y cinefotógrafo en programas unitarios y series documentales.\nActualmente escribe el guion para su ópera prima de ficción. “Es un guion que me gusta y divierte mucho, es algo muy personal y con el que debo tener paciencia para que también se manifieste la magia, porque hay muchas cosas que de repente llegan, no te explicas cómo, pero llegan y ahí el tema es ser paciente, no soltar, no dejar”.\nSe trata de un largometraje que se centra en una comedia romántica vista desde las emociones masculinas, “creo que es un tema que falta tocarse mucho en el cine en general y hace falta decir lo que hay en los sentimientos de los hombres”.\nRespecto a sus proyectos y trabajos futuros, Carlos Muñoz señala que trabaja como director / fotógrafo para proyectos publicitarios, editoriales, videos musicales y de cine independiente.\n“Creo fervientemente que hay una cosa que no va a cambiar nunca y es la necesidad de los seres humanos de contar sus historias, de meternos a través de las experiencias de otras personas. En la medida que alguien tenga la capacidad de contar una historia, lo único que cambiará serán las plataformas y la forma tecnológica de hacerlo. Mientras haya imaginación seguiré siendo paciente y esperando que surja la magia”.\n", "url": "https://www.diariomarca.com.mx/2024/02/el-guionista-y-director-carlos-munoz-teje-historias-desde-diferentes-plataformas/"},
{"date": "2024-02-02T20:52:22-06:00", "title": "Afirma el FIOB, extinción del IMO dejará en el desamparo a migrantes", "author": "marca", "topic": ["del día", "regiones"], "text": "El FIOB señala que el decreto por el que se extingue el Instituto de  Atención Integral al  Migrante  Oaxaqueño es un desatino\nPor Agencia IGAVEC\nHuajuapan de León, Oax., a 2 de febrero de 2024.-  Como desatinado y en contra de lo que se predica tanto a nivel federal como estatal en pro de los migrantes, calificó el Frente Indígena de Organizaciones Binacionales (FIOB), el decreto por el que se extingue el Instituto de Atención Integral al Migrante Oaxaqueño, siendo lo más grave que no exista una propuesta alternativa que dé atención a los migrantes y a sus familias. \nEn este contexto, Horacio Camarillo Cruz, vicecoordinador general binacional del FIOB, expuso que es lamentable que el gobierno del estado haya determinado la extinción de este instituto, dejando solos a los migrantes de Oaxaca.\nAseguró que ahora los migrantes oaxaqueños no encontrarán en su propio estado a ninguna institución que los apoye. \n“Todas las remesas que envían los migrantes a sus poblaciones de originen y que generan economía ya no tendrán un apoyo jurídico que los proteja; este posicionamiento del gobernador no explica el motivo, solamente por decreto acabar con el instituto y lo más grave es que no se propone la creación de otro organismo que respalde a los migrantes”, indicó.\nAñadió que es lamentable y como organización reprueban este hecho, “porque afecta a miles de migrantes; nosotros como organización siempre hemos velado por los derechos de los migrantes tanto en México como en los Estados Unidos y sabemos la grave afectación que representa esta determinación gubernamental”.\nSeñaló que este decreto es un desacierto del gobierno estatal, “nosotros siempre hemos sido propositivos y por la vía conducente haremos llevar nuestro posicionamiento para que se construya alguna opción de apoyo,  contribuyendo con el estado; sin embargo, si el gobierno tiene la cerrazón, será la opinión pública quien lo juzgue. Esperamos que pronto se determine la creación de una Secretaría, así como un posicionamiento sobre si quedarán en el desamparo  nuestros hermanos migrantes”.\n", "url": "https://www.diariomarca.com.mx/2024/02/afirma-el-fiob-extincion-del-imo-dejara-en-el-desamparo-a-migrantes/"},
{"date": "2024-02-02T21:01:28-06:00", "title": "Hombre mata a mujer en Jalapa del Marqués y se quita la vida", "author": "marca", "topic": ["del día", "regiones"], "text": "Agencia Quadratín\nOaxaca, Oax., a 2 de febrero de 2024.- Un hombre asesinó a una mujer este viernes en Jalapa del Marqués y después se quitó la vida.\nEl feminicidio ocurrió este viernes en ese municipio del Istmo de Tehuantepec, en la agencia de Llano Grande.\nLa mujer, según testigos, estaba en su vivienda cuando el agresor, presuntamente su exmarido, llegó y le disparó.\nLa víctima, Patricia Z.R., fue trasladada a bordo de una ambulancia, donde murió al no resistir las heridas de bala.\nEn tanto, el individuo también se disparó y perdió la vida en el lugar del crimen.\n", "url": "https://www.diariomarca.com.mx/2024/02/hombre-mata-a-mujer-en-jalapa-del-marques-y-se-quita-la-vida/"}
]
\ No newline at end of file
# Define here the models for your scraped items
#
# See documentation in:
# https://docs.scrapy.org/en/latest/topics/items.html
import scrapy
class MarcaItem(scrapy.Item):
# define the fields for your item here like:
# name = scrapy.Field()
date = scrapy.Field()
title = scrapy.Field()
text = scrapy.Field()
location = scrapy.Field()
author = scrapy.Field()
topic = scrapy.Field()
url = scrapy.Field()
# Define here the models for your spider middleware
#
# See documentation in:
# https://docs.scrapy.org/en/latest/topics/spider-middleware.html
from scrapy import signals
# useful for handling different item types with a single interface
from itemadapter import is_item, ItemAdapter
class MarcaSpiderMiddleware:
# Not all methods need to be defined. If a method is not defined,
# scrapy acts as if the spider middleware does not modify the
# passed objects.
@classmethod
def from_crawler(cls, crawler):
# This method is used by Scrapy to create your spiders.
s = cls()
crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
return s
def process_spider_input(self, response, spider):
# Called for each response that goes through the spider
# middleware and into the spider.
# Should return None or raise an exception.
return None
def process_spider_output(self, response, result, spider):
# Called with the results returned from the Spider, after
# it has processed the response.
# Must return an iterable of Request, or item objects.
for i in result:
yield i
def process_spider_exception(self, response, exception, spider):
# Called when a spider or process_spider_input() method
# (from other spider middleware) raises an exception.
# Should return either None or an iterable of Request or item objects.
pass
def process_start_requests(self, start_requests, spider):
# Called with the start requests of the spider, and works
# similarly to the process_spider_output() method, except
# that it doesn’t have a response associated.
# Must return only requests (not items).
for r in start_requests:
yield r
def spider_opened(self, spider):
spider.logger.info('Spider opened: %s' % spider.name)
class MarcaDownloaderMiddleware:
# Not all methods need to be defined. If a method is not defined,
# scrapy acts as if the downloader middleware does not modify the
# passed objects.
@classmethod
def from_crawler(cls, crawler):
# This method is used by Scrapy to create your spiders.
s = cls()
crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
return s
def process_request(self, request, spider):
# Called for each request that goes through the downloader
# middleware.
# Must either:
# - return None: continue processing this request
# - or return a Response object
# - or return a Request object
# - or raise IgnoreRequest: process_exception() methods of
# installed downloader middleware will be called
return None
def process_response(self, request, response, spider):
# Called with the response returned from the downloader.
# Must either;
# - return a Response object
# - return a Request object
# - or raise IgnoreRequest
return response
def process_exception(self, request, exception, spider):
# Called when a download handler or a process_request()
# (from other downloader middleware) raises an exception.
# Must either:
# - return None: continue processing this exception
# - return a Response object: stops process_exception() chain
# - return a Request object: stops process_exception() chain
pass
def spider_opened(self, spider):
spider.logger.info('Spider opened: %s' % spider.name)
# Define your item pipelines here
#
# Don't forget to add your pipeline to the ITEM_PIPELINES setting
# See: https://docs.scrapy.org/en/latest/topics/item-pipeline.html
# useful for handling different item types with a single interface
from itemadapter import ItemAdapter
class MarcaPipeline:
def process_item(self, item, spider):
return item
# Scrapy settings for marca project
#
# For simplicity, this file contains only settings considered important or
# commonly used. You can find more settings consulting the documentation:
#
# https://docs.scrapy.org/en/latest/topics/settings.html
# https://docs.scrapy.org/en/latest/topics/downloader-middleware.html
# https://docs.scrapy.org/en/latest/topics/spider-middleware.html
BOT_NAME = 'marca'
SPIDER_MODULES = ['marca.spiders']
NEWSPIDER_MODULE = 'marca.spiders'
FEED_EXPORT_ENCODING="utf-8"
# Crawl responsibly by identifying yourself (and your website) on the user-agent
#USER_AGENT = 'marca (+http://www.yourdomain.com)'
# Obey robots.txt rules
ROBOTSTXT_OBEY = False
# Configure maximum concurrent requests performed by Scrapy (default: 16)
#CONCURRENT_REQUESTS = 32
# Configure a delay for requests for the same website (default: 0)
# See https://docs.scrapy.org/en/latest/topics/settings.html#download-delay
# See also autothrottle settings and docs
DOWNLOAD_DELAY = 0.25
# The download delay setting will honor only one of:
#CONCURRENT_REQUESTS_PER_DOMAIN = 16
#CONCURRENT_REQUESTS_PER_IP = 16
# Disable cookies (enabled by default)
#COOKIES_ENABLED = False
# Disable Telnet Console (enabled by default)
#TELNETCONSOLE_ENABLED = False
# Override the default request headers:
#DEFAULT_REQUEST_HEADERS = {
# 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
# 'Accept-Language': 'en',
#}
DEFAULT_REQUEST_HEADERS = {
# ... Other headers
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36',
}
# Enable or disable spider middlewares
# See https://docs.scrapy.org/en/latest/topics/spider-middleware.html
#SPIDER_MIDDLEWARES = {
# 'marca.middlewares.MarcaSpiderMiddleware': 543,
#}
# Enable or disable downloader middlewares
# See https://docs.scrapy.org/en/latest/topics/downloader-middleware.html
#DOWNLOADER_MIDDLEWARES = {
# 'marca.middlewares.MarcaDownloaderMiddleware': 543,
#}
# Enable or disable extensions
# See https://docs.scrapy.org/en/latest/topics/extensions.html
#EXTENSIONS = {
# 'scrapy.extensions.telnet.TelnetConsole': None,
#}
# Configure item pipelines
# See https://docs.scrapy.org/en/latest/topics/item-pipeline.html
#ITEM_PIPELINES = {
# 'marca.pipelines.MarcaPipeline': 300,
#}
# Enable and configure the AutoThrottle extension (disabled by default)
# See https://docs.scrapy.org/en/latest/topics/autothrottle.html
#AUTOTHROTTLE_ENABLED = True
# The initial download delay
#AUTOTHROTTLE_START_DELAY = 5
# The maximum download delay to be set in case of high latencies
#AUTOTHROTTLE_MAX_DELAY = 60
# The average number of requests Scrapy should be sending in parallel to
# each remote server
#AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0
# Enable showing throttling stats for every response received:
#AUTOTHROTTLE_DEBUG = False
# Enable and configure HTTP caching (disabled by default)
# See https://docs.scrapy.org/en/latest/topics/downloader-middleware.html#httpcache-middleware-settings
#HTTPCACHE_ENABLED = True
#HTTPCACHE_EXPIRATION_SECS = 0
#HTTPCACHE_DIR = 'httpcache'
#HTTPCACHE_IGNORE_HTTP_CODES = []
#HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'
# Set settings whose default value is deprecated to a future-proof value
REQUEST_FINGERPRINTER_IMPLEMENTATION = '2.7'
TWISTED_REACTOR = 'twisted.internet.asyncioreactor.AsyncioSelectorReactor'
# This package will contain the spiders of your Scrapy project
#
# Please refer to the documentation for information on how to create and manage
# your spiders.
"""
Spider for diariomarca.com.mx
Author: Mario Chirinos Coluga
Usage:scrapy crawl noticias --nolog -O 2017-04-23.json -a year=2017 -a month=4 -a day=23
"""
import scrapy
import re
from marca.items import MarcaItem
#-------------------------------------------------------------------------------
TAG_RE = re.compile(r'<[^>]+>')
def remove_tags(text):
return TAG_RE.sub('', text)
#-------------------------------------------------------------------------------
class NoticiasSpider(scrapy.Spider):
name = 'noticias'
allowed_domains = ['diariomarca.com.mx']
start_urls = ['http://diariomarca.com.mx/']
#-----------------------------------------------------------------------
def start_requests(self):
self.year = getattr(self, "year", None)
self.month = getattr(self, "month", None)
self.day = getattr(self, "day", None)
self.date = self.year + "-" + self.month.zfill(2) + "-" + self.day.zfill(2)
self.baseURL = "https://www.diariomarca.com.mx/" + self.year + "/" + self.month.zfill(2) + "/" + self.day.zfill(2) + "/"
yield scrapy.Request(url=self.baseURL, callback=self.parseList)
#-----------------------------------------------------------------------
def parseList(self, response):
print(response.url)
for i in response.xpath('//h3[contains(@class, "entry-title")]/a/@href').extract():
yield scrapy.Request(url=i, callback=self.parseItem)
# next_page = response.xpath('//a[@aria-label="next-page"]/@href').extract_first()
# print("nextPage", next_page)
# if next_page is not None:
# yield scrapy.Request(url=next_page, callback=self.parseList)
#-----------------------------------------------------------------------
def parseItem(self, response):
# print(response.url)
item = MarcaItem()
text = ''
for p in response.xpath('//div[@class="vc_column-inner"]//p').extract():
tt = remove_tags(p)+ "\n"
text+=tt
item['date'] = response.xpath('//time[contains(@class, "entry-date")]/@datetime').extract_first()
item['title'] = response.xpath('//h1[@class="tdb-title-text"]/text()').extract_first()
item['author'] = response.xpath('//a[@class="tdb-author-name"]/text()').extract_first()
item['topic'] = [i.lower() for i in response.xpath('//a[@class="tdb-entry-category"]/text()').extract()]
item['text'] = text
item['url'] = response.url
print(item["title"])
yield item
# Automatically created by: scrapy startproject
#
# For more information about the [deploy] section see:
# https://scrapyd.readthedocs.io/en/latest/deploy.html
[settings]
default = marca.settings
[deploy]
#url = http://localhost:6800/
project = marca
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment