Pre-calcolo in corso... La prima esecuzione richiede diverse ore. Controlla i log del container.

Qualità della Classificazione di Genere

Questo sistema valuta la qualità delle classificazioni di genere basandosi sull'accordo tra i modelli LLM. Quando più modelli concordano su una classificazione, la confidenza aumenta. Man mano che nuovi modelli vengono aggiunti, il consensus si rafforza.

Totale classificati

Alta confidenza

Contestato

Modelli utilizzati

Distribuzione della confidenza

Genere consensus	Unanime	Forte	Maggioranza	Contestato	Total

Metodologia e formula

Come funziona: Per ogni riga autore-articolo, si leggono le classificazioni di TUTTI i modelli LLM disponibili. Il "consensus" e' il genere scelto dalla maggioranza dei modelli.
Livelli di confidenza:

Unanime: tutti i modelli concordano (100%)
Forte: almeno il 75% dei modelli concorda (es. 3 su 4)
Maggioranza: piu' del 50% concorda ma sotto il 75%
Contestato: parita' perfetta (50/50), nessun consensus chiaro

Man mano che nuovi modelli vengono aggiunti, il consensus diventa piu' robusto.

SELECT "gender", "ministral", "llama", "qwen" FROM article_authors -- For each row: count M votes vs F votes -- consensus = majority gender -- confidence = unanimous / strong / majority / contested -- Scanned in chunks of 5M rows by id range

Affidabilità per modello (accordo con consensus)

Model	Tasso di accordo	Agrees	Disagrees	% Male	% Female	Bias

Metodologia e formula

Cosa mostra: per ogni modello, la percentuale di volte che concorda con il genere di consensus. Il bias indica se un modello tende a classificare piu' maschi o femmine rispetto al consensus.
Formula: affidabilita' = agrees / (agrees + disagrees) x 100
Bias: (% male modello) - (% male consensus). Positivo = tende verso maschio, negativo = tende verso femmina.

Confidenza nel tempo

Metodologia e formula

Cosa mostra: come la distribuzione dei livelli di confidenza varia nel tempo. Un aumento della percentuale "unanime" indica che i modelli concordano di piu' per quel periodo.