Trend Storici nella Rappresentanza di Genere
La rappresentanza femminile e' quadruplicata in otto decenni, passando da circa il 10% nel 1945 al 40.7% nel 2024. Tuttavia, il divario tra prima e ultima autrice (la 'leaky pipeline') rimane costante a circa 10 punti percentuali.
% Autrici donne per anno
Metodologia e formula
Cosa mostra: la percentuale di autrici donne per anno (1945-2024), calcolata per ciascun modello LLM selezionabile.
Ogni coppia autore-articolo della tabella
Formula:
article_authors è collegata all'anno di pubblicazione tramite la tabella deduplicata pmid_year.
Formula:
% F = COUNT(gender='f') / COUNT(gender IN ('m','f','other')) × 100
SELECT py.year, aa."[llm_column]", COUNT(*)
FROM article_authors aa
JOIN pmid_year py ON aa.pmid = py.pmid
WHERE aa."[llm_column]" IS NOT NULL
GROUP BY py.year, aa."[llm_column]"
Posizioni autoriali: prima vs ultima autrice
Metodologia e formula
Cosa mostra: la percentuale di donne per posizione autoriale (primo autore, ultimo autore, tutte le posizioni) nel tempo.
Per ogni articolo,
Leaky pipeline: il gap tra primo e ultimo autore quantifica la dispersione di donne nelle posizioni senior.
author_order = 1 è il primo autore, author_order = MAX è l'ultimo autore.
Se un articolo ha un solo autore, è classificato come "solo".
Leaky pipeline: il gap tra primo e ultimo autore quantifica la dispersione di donne nelle posizioni senior.
SELECT aa.pmid, py.year, aa.author_order, aa."gender"
FROM article_authors aa
JOIN pmid_year py ON aa.pmid = py.pmid
-- Grouped by pmid in Python to determine max_order per article
-- Position = 'first' if order=1, 'last' if order=max, else 'middle'
-- % female = COUNT(gender='f') / COUNT(gender IN ('m','f')) × 100