Pre-calcolo in corso... La prima esecuzione richiede diverse ore. Controlla i log del container.
Qualità della Classificazione di Genere
Questo sistema valuta la qualità delle classificazioni di genere basandosi sull'accordo tra i modelli LLM. Quando più modelli concordano su una classificazione, la confidenza aumenta. Man mano che nuovi modelli vengono aggiunti, il consensus si rafforza.
Totale classificati
-
Alta confidenza
-
Contestato
-
Modelli utilizzati
-
Distribuzione della confidenza
| Genere consensus | Unanime | Forte | Maggioranza | Contestato | Total |
|---|
Metodologia e formula
Come funziona: Per ogni riga autore-articolo, si leggono le classificazioni di TUTTI i modelli LLM disponibili.
Il "consensus" e' il genere scelto dalla maggioranza dei modelli.
Livelli di confidenza:
Livelli di confidenza:
- Unanime: tutti i modelli concordano (100%)
- Forte: almeno il 75% dei modelli concorda (es. 3 su 4)
- Maggioranza: piu' del 50% concorda ma sotto il 75%
- Contestato: parita' perfetta (50/50), nessun consensus chiaro
SELECT "gender", "ministral", "llama", "qwen"
FROM article_authors
-- For each row: count M votes vs F votes
-- consensus = majority gender
-- confidence = unanimous / strong / majority / contested
-- Scanned in chunks of 5M rows by id range
Affidabilità per modello (accordo con consensus)
| Model | Tasso di accordo | Agrees | Disagrees | % Male | % Female | Bias |
|---|
Metodologia e formula
Cosa mostra: per ogni modello, la percentuale di volte che concorda con il genere di consensus.
Il bias indica se un modello tende a classificare piu' maschi o femmine rispetto al consensus.
Formula:
Bias:
Formula:
affidabilita' = agrees / (agrees + disagrees) x 100
Bias:
(% male modello) - (% male consensus). Positivo = tende verso maschio, negativo = tende verso femmina.
Confidenza nel tempo
Metodologia e formula
Cosa mostra: come la distribuzione dei livelli di confidenza varia nel tempo.
Un aumento della percentuale "unanime" indica che i modelli concordano di piu' per quel periodo.