Propers seminaris i activitats

Conferència Inaugural del Doctorat en Història Econòmica (2025-26)

Walter Scheidel (Stanford University)
"The economics of ancient Mediterranean slavery: prices, profits and productivity"
5 de febrer 2026
Sala de Graus
14:00 hores

Calendari dels cursos de formació d'estudiants de primer any 2025-2026

Doctorat en Història Economica – Universitat de Barcelona

Totes les sessions tindran lloc a la Sala de Reunions de l’Espai de Recerca en Economia (ERE), Facultat d’Economia i Empresa (Edifici 690, prop de l'entrada pel carrer JM Keynes)
 
Sessió 1 | 5 de novembre de 2025  (4:30 pm – 6:30 pm)
  • Marc Badia: “Aplicaciones prácticas en la investigación en historia económica”

Sessió 2  | 6 de novembre de 2025 (4:30 pm – 6:30 pm):
  • Sergi Lozano: “How to publish and disseminate a research article”
  • Alfonso Herranz: “Writing and publishing research articles in Economic History”

Sessió 3 | 7 de novembre de 2025  (4:30 pm – 6:30 pm):
  • Federico Tadei: “Tips and tricks of databases or how to choose the right data”

Sessió 4 | 26 de novembre de 2025 (3:30 pm – 5:30 pm)
  • Anna Carreras: “The work of the editorial board of a scientific journal: learning to publish by understanding the role of editors and reviewers”

Sessió 5 | 2 de desembre de 2025 (11:30 am – 1:00 pm, 2:30 pm – 4 pm)
  • Francesc Amat i Julio Martínez: “Research Plan Design”

 

Curs intensiu de web scraping

Doctorat en Història Econòmica
11 i 12 de novembre de 2025
Per registrar-se cal omplir el següent formulari
Dates i aules:
11 de novembre, 14:30h-16:30h (aula1031)
12 de novembre, 14:30h-16:30h (aula1030)

Professor: Dylan Pashley (Lund University, dylan.pashley@svet.lu.se)

Programa
Mòdul I: Ethical and Regulatory Foundations
  • The Contemporary Scraping Landscape: Operational challenges in an era of large-scale corporate data harvesting (LLMs) and pervasive access controls (CAPTCHAs).
  • A European Framework for Ethical Inquiry: Analysing the legal dimensions of GDPR (personal data), the Database Directive (_sui generis_ rights), and the role of Terms of Service. Contrasting with the US-centric CFAA approach.
Mòdul II: Methodological Implementation in R
  • Technical Foundations of HTTP and HTML Parsing: Deconstructing web architecture from a data retrieval perspective. Introduction to using browser developer tools.
  • Practical Application with `rvest`: Implementing the core workflow of sending HTTP requests, parsing HTML structures, and extracting targeted content using CSS selectors.
  • Embedding Ethical Practice by Design: Integrating the `polite` package to automate `robots.txt` adherence, request rate-limiting, and session management directly into the research pipeline.
Mòdul III: Advanced Challenges
  • Navigating Data Access Barriers: Evaluating application programming interfaces (APIs) as a alternative to scraping, with practical examples.
  • Scalable Data Collection: Designing algorithms for systematic pagination and multi-page data harvesting using iterative functions.
  • Limitations of Static Scraping: An introduction to dynamic content rendered by JavaScript and an overview of advanced tools (e.g., `RSelenium`) for programmatic browser control.
Mòdul IV: From Data Curation to Scholarly Insight
  • Post-Collection Data Wrangling and GDPR Compliance: Applying text processing and data cleaning techniques. Strategies for data minimisation and anonymisation post-scraping.
  • Synthesis and Looking Ahead: Principles of methodological transparency, reproducibility, and responsible practice.

Requisits: Es pressuposa una familiaritat bàsica amb el llenguatge de programació R (s'ha enllaçat un document d'introducció a R sobre Rmd). Els participants haurien de tenir R i RStudio instal·lats als seus ordinadors personals. Si esteu més familiaritzats amb Python, també hi haurà una secció curta per a això, però només mostrant el codi antic.

Bibliografia (però no obligatòria) recomanada:
Wickham, et al. (2022). R for Data Science (2nd Edition), Chapter 24, https://r4ds.hadley.nz/webscraping
Brown, et al. (2024). Web Scraping for Research: Legal, Ethical, Institutional, and Scientific Considerations, https://arxiv.org/pdf/2410.23432v1
Hacker Noon article: A Guide on How to Legally Web Scrape EU Data, https://hackernoon.com/a-guide-on-how-to-legally-web-scrape-eu-data
Zimmer, M. (2018). Addressing Conceptual Gaps in Big Data Research Ethics: An Application of Contextual Integrity. Social Media + Society, 4(2).