Pre-calcolo in corso... La prima esecuzione richiede diverse ore. Controlla i log del container.

Qualità della Classificazione di Genere

Questo sistema valuta la qualità delle classificazioni di genere basandosi sull'accordo tra i modelli LLM. Quando più modelli concordano su una classificazione, la confidenza aumenta. Man mano che nuovi modelli vengono aggiunti, il consensus si rafforza.

Totale classificati
-
Alta confidenza
-
Contestato
-
Modelli utilizzati
-
Distribuzione della confidenza
Genere consensus Unanime Forte Maggioranza Contestato Total
Metodologia e formula
Come funziona: Per ogni riga autore-articolo, si leggono le classificazioni di TUTTI i modelli LLM disponibili. Il "consensus" e' il genere scelto dalla maggioranza dei modelli.
Livelli di confidenza:
  • Unanime: tutti i modelli concordano (100%)
  • Forte: almeno il 75% dei modelli concorda (es. 3 su 4)
  • Maggioranza: piu' del 50% concorda ma sotto il 75%
  • Contestato: parita' perfetta (50/50), nessun consensus chiaro
Man mano che nuovi modelli vengono aggiunti, il consensus diventa piu' robusto.
SELECT "gender", "ministral", "llama", "qwen" FROM article_authors -- For each row: count M votes vs F votes -- consensus = majority gender -- confidence = unanimous / strong / majority / contested -- Scanned in chunks of 5M rows by id range
Affidabilità per modello (accordo con consensus)
Model Tasso di accordo Agrees Disagrees % Male % Female Bias
Metodologia e formula
Cosa mostra: per ogni modello, la percentuale di volte che concorda con il genere di consensus. Il bias indica se un modello tende a classificare piu' maschi o femmine rispetto al consensus.
Formula: affidabilita' = agrees / (agrees + disagrees) x 100
Bias: (% male modello) - (% male consensus). Positivo = tende verso maschio, negativo = tende verso femmina.
Confidenza nel tempo
Metodologia e formula
Cosa mostra: come la distribuzione dei livelli di confidenza varia nel tempo. Un aumento della percentuale "unanime" indica che i modelli concordano di piu' per quel periodo.