Trend Storici nella Rappresentanza di Genere

La rappresentanza femminile e' quadruplicata in otto decenni, passando da circa il 10% nel 1945 al 40.7% nel 2024. Tuttavia, il divario tra prima e ultima autrice (la 'leaky pipeline') rimane costante a circa 10 punti percentuali.

% Autrici donne per anno
Metodologia e formula
Cosa mostra: la percentuale di autrici donne per anno (1945-2024), calcolata per ciascun modello LLM selezionabile. Ogni coppia autore-articolo della tabella article_authors è collegata all'anno di pubblicazione tramite la tabella deduplicata pmid_year.
Formula: % F = COUNT(gender='f') / COUNT(gender IN ('m','f','other')) × 100
SELECT py.year, aa."[llm_column]", COUNT(*) FROM article_authors aa JOIN pmid_year py ON aa.pmid = py.pmid WHERE aa."[llm_column]" IS NOT NULL GROUP BY py.year, aa."[llm_column]"
Posizioni autoriali: prima vs ultima autrice
Metodologia e formula
Cosa mostra: la percentuale di donne per posizione autoriale (primo autore, ultimo autore, tutte le posizioni) nel tempo. Per ogni articolo, author_order = 1 è il primo autore, author_order = MAX è l'ultimo autore. Se un articolo ha un solo autore, è classificato come "solo".
Leaky pipeline: il gap tra primo e ultimo autore quantifica la dispersione di donne nelle posizioni senior.
SELECT aa.pmid, py.year, aa.author_order, aa."gender" FROM article_authors aa JOIN pmid_year py ON aa.pmid = py.pmid -- Grouped by pmid in Python to determine max_order per article -- Position = 'first' if order=1, 'last' if order=max, else 'middle' -- % female = COUNT(gender='f') / COUNT(gender IN ('m','f')) × 100