Qual è l'accuratezza del modello MRP di PoliSim?

Il backtest su 14 collegi Camera del Lazio (politiche 2022) restituisce MAE 4,01 punti percentuali, RMSE 4,64 pp e winner accuracy 14/14. Out-of-sample su Lombardia 2023: RMSE 4,28 pp su 23 collegi. Il modello MRP supera la baseline OLS su tutti i dataset di validazione disponibili.

Quali dati usa PoliSim?

Esclusivamente dati pubblici istituzionali: Censimento ISTAT 2021 (71 milioni di osservazioni), risultati elettorali ufficiali Eligendo (Ministero dell'Interno), European Social Survey Round 11 (N=2.865), TRIPOL IT (N=1.231). Nessun dato proprietario, nessun dato personale.

Quali sono le limitazioni dichiarate di PoliSim?

Copertura CI90 al 39,2% invece del 90% nominale (causa: dataset di addestramento limitato), bias sistematico CDX di −3,33 pp, assenza di dati sondaggistici proprietari (modello ecologico), pesi del Message Optimizer expert-calibrated non ancora validati su A/B test. Tutte le limitazioni sono documentate nel white paper.

PoliSim è open source?

Sì. Il codice è pubblico su GitHub (AlCap27/polisim) con licenza AGPL v3. Il layer AI è sostituibile by design: qualsiasi LLM instruction-following può sostituire il provider corrente.

Metodologia

Open Civic Intelligence: simulazione elettorale, ottimizzazione del messaggio e analisi della propensione — con limitazioni dichiarate.

PoliSim documenta pubblicamente la propria metodologia completa. Il white paper tecnico copre l'intera architettura: lo swing model sui 221 collegi uninominali del Rosatellum, il modello MRP bayesiano con verosimiglianza Dirichlet-Multinomial, il Message Optimizer fondato sulla teoria del framing, il Cognitive Science Layer e il Modulo Propensione RFML. Ogni limitazione nota è dichiarata con la stessa prominenza dei risultati.

White Paper Tecnico v1.2 🇮🇹 Italiano

Metodologia e validazione completa — 9 sezioni, 22 riferimenti con DOI verificati — Giugno 2026

Scarica il PDF

Technical White Paper v1.2 🇬🇧 English

Full methodology and validation — 9 sections, 22 DOI-verified references — June 2026

Download PDF

Il contributo: MRP bayesiano su dati censuari italiani

Il cuore metodologico di PoliSim è un modello Multilevel Regression and Poststratification (Gelman & Little 1997; Park, Gelman & Bafumi 2004) implementato in PyMC con verosimiglianza Dirichlet-Multinomial, calibrato su 71 milioni di osservazioni del Censimento ISTAT 2021 aggregate a livello di collegio uninominale, con addestramento su 252 osservazioni collegio-elezione in 13 regioni.

A nostra conoscenza, non esiste letteratura pubblicata che applichi MRP con verosimiglianza Dirichlet-Multinomial a dati censuari italiani a livello di collegio uninominale con backtesting out-of-sample su elezioni reali. Le applicazioni MRP documentate riguardano prevalentemente il contesto statunitense e britannico, tipicamente con input sondaggistici individuali. L'applicazione ecologica su dati censuari aggregati italiani costituisce, ad oggi, un caso non documentato.

Metriche di validazione

Backtest sui 14 collegi Camera del Lazio, elezioni politiche 2022 (riferimento held-out):

4,01 pp

MAE quota CDX

4,64 pp

RMSE quota CDX

14/14

Winner accuracy

39,2%

CI90 — limite aperto

Confronto out-of-sample con baseline OLS (stessa matrice di progetto, stessi dati di addestramento):

Dataset	N collegi	RMSE OLS	RMSE MRP	Vantaggio MRP
Lombardia 2023	23	4,65 pp	4,28 pp	+0,37 pp
Lazio 2023	14	5,36 pp	5,08 pp	+0,28 pp
Emilia-Romagna 2024 ⚠	11	12,09 pp	10,36 pp	+1,73 pp
Liguria 2024 †	4	9,75 pp	8,45 pp	+1,30 pp
Media (4 dataset)	—	7,96 pp	7,04 pp	+0,92 pp

⚠ Emilia-Romagna outlier: RMSE CSX 15,7 pp — struttura competitiva locale divergente dal training set. † Liguria N=4: risultato indicativo, non statisticamente robusto. Il modello MRP supera la baseline OLS su tutti i dataset disponibili.

Architettura

Stage 1 — Swing Model

Eligendo 2022, 221 collegi uninominali, d'Hondt con soglia 3%, verifica doppia maggioranza

Stage 2 — MRP Bayesiano

PyMC, Dirichlet-Multinomial, 8 feature ISTAT, 252 osservazioni, effetti casuali regionali

Stage 3 — Message Optimizer

Framing Entman ×4, corpus valoriale dell'organizzazione, verificatore di ancoraggio fattuale

Cognitive Layer

5 framework cognitivi, core deterministico <50ms, evaluator AI separato opt-in

Modulo Propensione

RFML a 5 obiettivi, calibrazione territoriale ISTAT, elaborazione client-side GDPR

Limitazioni dichiarate

La credibilità scientifica richiede che i limiti siano dichiarati con la stessa prominenza dei risultati. Le limitazioni complete sono nella Sezione 6 del white paper. Le principali:

CI90 al 39,2% invece del 90% nominale. Gli intervalli credibili sono sotto-calibrati. Causa confermata: dataset di addestramento limitato (252 osservazioni), non specificazione dei prior — test con prior alternativi (HalfStudentT) non hanno prodotto miglioramenti. Le stime puntuali (MAP) sono gli output operativamente validi; gli intervalli non vanno usati per inferenza probabilistica.

Bias sistematico CDX di −3,33 pp. Concentrato nei collegi provinciali; causa identificata in feature occupazionali non ancora nel modello (dataset DCSC_CONDPROFOCCUP pianificato per la v5).

Modello ecologico. PoliSim stima da dati demografici e storici aggregati, non da sondaggi individuali geo-localizzati. È un calcolatore di scenari, non uno strumento predittivo autonomo.

Pesi Stage 3 e RFML expert-calibrated. Non ancora validati su A/B test reali. Un protocollo di validazione con 20 campagne partner e misurazione standardizzata degli esiti è in fase di reclutamento attivo.

Dati: esclusivamente fonti pubbliche istituzionali

Fonte	Contenuto	Ruolo
ISTAT Censimento 2021	71M osservazioni, 493k sezioni	Feature demografiche MRP
Eligendo OpenData (Min. Interno)	Risultati ufficiali, tutti i cicli	Baseline e validazione
ESS Round 11 (2023–24)	N=2.865 Italia, face-to-face	Profili psicografici Stage 3
TRIPOL IT (2021–22)	N=1.231, polarizzazione affettiva	Calibrazione valenza emotiva

Nessun dato proprietario. Nessun dato personale raccolto o processato. Il codice è pubblico su GitHub con licenza AGPL v3; il layer AI è sostituibile by design con qualsiasi LLM instruction-following.