Fonti dati
PoliSim usa esclusivamente fonti aperte e verificabili. Nessun dato privato viene raccolto dagli utenti.
| Fonte | Uso in PoliSim | Copertura | Riferimento |
|---|---|---|---|
| ITANES 2022 | Profili psicografici dei 5 segmenti. Scale valoriali, fiducia istituzionale, trigger comunicativi. DOI: 10.13130/RD_UNIMI/JV77WR | N=4.696 rispondenti, 326 variabili, panel ponderato post-elezioni politiche 2022 | DOI: 10.13130/RD_UNIMI/JV77WR · Vezzoni et al. 2023 |
| ISTAT Censimento Permanente 2021 | Variabili demografiche per sezione di censimento (39.609 sezioni Lazio). Laureati, istruzione, occupazione, stranieri, età. | Italia completa · livello sezione censimento · aggiornamento annuale | istat.it · Tracciato record ufficiale |
| Eligendo OpenData | Risultati elettorali storici per comune (Camera 2022, Regionali 2023, Senato 2022). Margini per collegio. | 147 collegi Camera · 74 Senato · 7.903 comuni | Ministero dell'Interno · eligendo.interno.gov.it |
| Shapefile collegi 2020 | Spatial join sezioni censimento → collegio uninominale (match rate 99.8%). | Camera + Senato · proiezione UTM32N (EPSG:32632) | Ministero dell'Interno · CAMERA_CollegiUNINOMINALI_2020.shp |
Segmenti psicografici — fonti empiriche
I 5 segmenti non sono costruiti su stereotipi o intuizioni teoriche. Sono derivati empiricamente da tre fonti survey complementari: ITANES 2022 (N=4.696, panel elettorale italiano, variabili valoriali e fiducia istituzionale), ESS Round 11 (N=2.865 rispondenti italiani, European Social Survey 2023-24, atteggiamenti verso immigrazione e democrazia) e TRIPOL IT (N=1.231, polarizzazione affettiva, indice WAPSV valori politici). Ogni profilo riflette le risposte reali di quel gruppo su variabili chiave.
- Sx-dx media 2.86/10
- % Laureati 19.8%
- Iscritti CGIL 54.4%
- Fiducia scienziati 93.5%
- Fiducia magistratura 67.4%
- Fiducia gov 33.0%
- Usa social 4.6 gg/sett
- Clima — molto preoc. 69.8%
- Sx-dx media 8.72/10
- Leader forte alta priorità
- Ordine/sicurezza trigger chiave
- TV e radio canale primario
- Europeismo tiepido
- Immigrazione massima resistenza
- Sx-dx media 5.16/10
- Fiducia partiti molto bassa
- Fiducia parlamento bassa
- Anti-casta trigger principale
- Astensione latente alta
- Responsabilità P9 leva chiave
- Sx-dx media 4.96/10
- Scala valoriale fluida
- Trasparenza priorità alta
- Segmento più mobile ↔
- Digitale nativo sì
- Anti-sistema residuo presente
- Sx-dx media 5.84/10
- Età < 30 anni
- Astensione storica sì
- Fiducia istituzioni bassa
- Trigger pace/clima principale
- Instagram/TikTok canale primario
Fonti: Vezzoni et al. (2023), ITANES Panel 2022, DOI: 10.13130/RD_UNIMI/JV77WR · ESS Round 11 (2023-24), European Social Survey, N=2.865 IT · TRIPOL IT (2021-22), N=1.231. Assegnazione segmenti su scala sx-dx, età e astensione storica. Distribuzione ponderata.
Percorso di sviluppo del modello — dalla PoC al MRP
PoliSim ha attraversato un percorso documentato di raffinamento metodologico. Ogni step è riproducibile dai dati aperti pubblicati.
MRP bayesiano — Architettura e risultati
Modello attivo: Dirichlet-Multinomial multi-coalizione con PyMC · freeze 29 aprile 2026.
Le equazioni del modello
Il modello predittivo di PoliSim è completamente riproducibile dai dati aperti. Di seguito le equazioni esplicite per ogni stage.
N=11 collegi Lazio · R²=0.618 · RMSE=3.91pp
X = [pct_laureati, pct_bassa_istruz, dim_media_famiglia, pct_under35, pct_occupati, pct_stranieri]
N=142 collegi · α=10 ottimizzato via LOO-CV · RMSE=6.54pp (flat) → 5.24pp (macro-area)
i = collegio, j = regione · uj ~ N(0, σ²u) effetto casuale regionale
N=142 collegi · 18 regioni · RMSE=4.44pp · R²=0.782
*** p<0.001 · * p<0.05 · ns = non significativo
polisim_nazionale.py, polisim_macroarea.py, polisim_mrp.pyRepo: github.com/AlCap27/polisim (privato · apertura pianificata)
Dati: ISTAT Censimento 2023 · Eligendo OpenData · ITANES 2022
Le equazioni del modello
Il modello è completamente riproducibile dai dati aperti. Equazioni esplicite per ogni stage di sviluppo.
N=11 collegi Lazio · R²=0.618 · RMSE=3.91pp
X = [pct_laureati, pct_bassa_istruz, dim_media_famiglia, pct_under35, pct_occupati, pct_stranieri]
N=142 collegi · α=10 ottimizzato via LOO-CV · RMSE=5.24pp (macro-area)
i = collegio, j = regione · uⱼ ~ N(0, σ²) effetto casuale regionale
N=142 · 18 regioni · RMSE=4.44pp · R²=0.782
*** p<0.001 · * p<0.05 · n.s. = non significativo
polisim_nazionale.py, polisim_macroarea.py, polisim_mrp.pyRepo: github.com/AlCap27/polisim (privato · apertura pianificata)
Dati: ISTAT Censimento 2023 · Eligendo OpenData · ITANES 2022
Le equazioni del modello
Il modello è completamente riproducibile dai dati aperti. Equazioni esplicite per ogni stage di sviluppo.
N=11 collegi Lazio · R²=0.618 · RMSE=3.91pp
X = [pct_laureati, pct_bassa_istruz, dim_media_famiglia, pct_under35, pct_occupati, pct_stranieri]
N=142 collegi · α=10 · RMSE=5.24pp (modelli macro-area)
i = collegio, j = regione · uⱼ ~ N(0, σ²ᵘ) effetto casuale regionale
N=142 · 18 regioni · RMSE=4.44pp · R²=0.782 · fitting: powell/nm/lbfgs
pct_bassa_istruz=−1.94 (n.s.) · dim_famiglia=−0.64 (n.s.) · pct_under35=−0.98 (n.s.)
*** p<0.001 · * p<0.05 · n.s. = non significativo
polisim_nazionale.py, polisim_macroarea.py, polisim_mrp.pyRepo: github.com/AlCap27/polisim (privato · apertura pianificata)
Dati: ISTAT Censimento 2023 · Eligendo OpenData · ITANES 2022
Flusso di analisi multistep · Vedi le PoC →
Roadmap pubblica degli sviluppi pianificati. Ogni funzionalità è dichiarata con stato di avanzamento e riferimento metodologico.
Simulazione Camera e Senato con margini reali per collegio. 5 segmenti psicografici derivati empiricamente da ITANES 2022 (N=4.696). Message optimizer su 3 verticali (partiti, ONG e istituzioni pilota).
Ridge regression · Random Forest · ITANES 2022 · Eligendo · ISTAT 2021
Modello attivo: statsmodels MixedLM con random intercept per regione. RMSE=4.44pp, R²=0.782 su 142 collegi Camera. Serie storiche 2018-2024 (10 elezioni, 8.056 comuni) integrate come prior.
Gelman & Little 1997 · Wang et al. IJF 2021 · statsmodels MixedLM · Eligendo storico
Integrazione LightRAG (ispirato al wiki-memory model di A. Karpathy) per costruire una memoria a lungo termine dei profili per collegio — tendenze storiche elezione per elezione, coalizioni locali, outlier strutturali. Il modello impara da ogni ciclo elettorale.
LightRAG · Karpathy wiki-memory architecture · Eligendo storico 2006-2022
Implementazione shapefile per swing model a livello di singolo collegio. Upload di dataset proprietari (sondaggi interni, exit poll, social listening) con strumento di anonimizzazione GDPR integrato.
CAMERA_CollegiUNINOMINALI_2020.shp · GDPR Art. 4.5, 89, 25 · Data Shield
Limitazioni dichiarate al freeze
Tre limitazioni documentate al momento del freeze (29 aprile 2026). Non compromettono la validità del modello per uso previsionale — rappresentano la frontiera di sviluppo attiva.
I tassi occupazionali nelle 54 celle demografiche sono derivati da medie regionali, non da microdati comunali. Impatto stimato: ±0.3-0.5pp sull'RMSE. Il prossimo rilascio utilizzerà i tassi reali per comune dal Censimento Permanente ISTAT 2021.
Le regioni del Nord sono sovrarappresentate nelle elezioni regionali disponibili (2021-2025). Le stime per il Mezzogiorno si basano principalmente sulle politiche 2022. Le prossime regionali del Sud aggiorneranno automaticamente il modello.
Le stime riflettono il comportamento elettorale osservato fino all'ultimo aggiornamento del training set. La simulazione per l'utente è in tempo reale; il ritraining richiede circa 30 minuti dopo ogni nuova elezione regionale disponibile.