Propers seminaris i activitats
Conferència Inaugural del Doctorat en Història Econòmica (2025-26)
Walter Scheidel (Stanford University)
"The economics of ancient Mediterranean slavery: prices, profits and productivity"
5 de febrer 2026
Sala de Graus
14:00 hores
Calendari dels cursos de formació d'estudiants de primer any 2025-2026
Doctorat en Història Economica – Universitat de Barcelona
Totes les sessions tindran lloc a la Sala de Reunions de l’Espai de Recerca en Economia (ERE), Facultat d’Economia i Empresa (Edifici 690, prop de l'entrada pel carrer JM Keynes)
Sessió 1 | 5 de novembre de 2025 (4:30 pm – 6:30 pm)
-
Marc Badia: “Aplicaciones prácticas en la investigación en historia económica”
Sessió 2 | 6 de novembre de 2025 (4:30 pm – 6:30 pm):
-
Sergi Lozano: “How to publish and disseminate a research article”
-
Alfonso Herranz: “Writing and publishing research articles in Economic History”
Sessió 3 | 7 de novembre de 2025 (4:30 pm – 6:30 pm):
-
Federico Tadei: “Tips and tricks of databases or how to choose the right data”
Sessió 4 | 26 de novembre de 2025 (3:30 pm – 5:30 pm)
-
Anna Carreras: “The work of the editorial board of a scientific journal: learning to publish by understanding the role of editors and reviewers”
Sessió 5 | 2 de desembre de 2025 (11:30 am – 1:00 pm, 2:30 pm – 4 pm)
-
Francesc Amat i Julio Martínez: “Research Plan Design”
Curs intensiu de web scraping
Doctorat en Història Econòmica
11 i 12 de novembre de 2025
Per registrar-se cal omplir el següent formulari
Dates i aules:
11 de novembre, 14:30h-16:30h (aula1031)
12 de novembre, 14:30h-16:30h (aula1030)
Professor: Dylan Pashley (Lund University, dylan.pashley@svet.lu.se)
11 de novembre, 14:30h-16:30h (aula1031)
12 de novembre, 14:30h-16:30h (aula1030)
Professor: Dylan Pashley (Lund University, dylan.pashley@svet.lu.se)
Programa
Mòdul I: Ethical and Regulatory Foundations
- The Contemporary Scraping Landscape: Operational challenges in an era of large-scale corporate data harvesting (LLMs) and pervasive access controls (CAPTCHAs).
- A European Framework for Ethical Inquiry: Analysing the legal dimensions of GDPR (personal data), the Database Directive (_sui generis_ rights), and the role of Terms of Service. Contrasting with the US-centric CFAA approach.
Mòdul II: Methodological Implementation in R
- Technical Foundations of HTTP and HTML Parsing: Deconstructing web architecture from a data retrieval perspective. Introduction to using browser developer tools.
- Practical Application with `rvest`: Implementing the core workflow of sending HTTP requests, parsing HTML structures, and extracting targeted content using CSS selectors.
- Embedding Ethical Practice by Design: Integrating the `polite` package to automate `robots.txt` adherence, request rate-limiting, and session management directly into the research pipeline.
Mòdul III: Advanced Challenges
- Navigating Data Access Barriers: Evaluating application programming interfaces (APIs) as a alternative to scraping, with practical examples.
- Scalable Data Collection: Designing algorithms for systematic pagination and multi-page data harvesting using iterative functions.
- Limitations of Static Scraping: An introduction to dynamic content rendered by JavaScript and an overview of advanced tools (e.g., `RSelenium`) for programmatic browser control.
Mòdul IV: From Data Curation to Scholarly Insight
- Post-Collection Data Wrangling and GDPR Compliance: Applying text processing and data cleaning techniques. Strategies for data minimisation and anonymisation post-scraping.
- Synthesis and Looking Ahead: Principles of methodological transparency, reproducibility, and responsible practice.
Requisits: Es pressuposa una familiaritat bàsica amb el llenguatge de programació R (s'ha enllaçat un document d'introducció a R sobre Rmd). Els participants haurien de tenir R i RStudio instal·lats als seus ordinadors personals. Si esteu més familiaritzats amb Python, també hi haurà una secció curta per a això, però només mostrant el codi antic.
Bibliografia (però no obligatòria) recomanada:
Wickham, et al. (2022). R for Data Science (2nd Edition), Chapter 24, https://r4ds.hadley.nz/webscraping
Brown, et al. (2024). Web Scraping for Research: Legal, Ethical, Institutional, and Scientific Considerations, https://arxiv.org/pdf/2410.23432v1
Hacker Noon article: A Guide on How to Legally Web Scrape EU Data, https://hackernoon.com/a-guide-on-how-to-legally-web-scrape-eu-data
Zimmer, M. (2018). Addressing Conceptual Gaps in Big Data Research Ethics: An Application of Contextual Integrity. Social Media + Society, 4(2).