Analisi dei dati

L'analisi dei dati è un processo fondamentale per comprendere le informazioni contenute in grandi quantità di dati strutturati. Attraverso strumenti avanzati, è possibile identificare modelli, rilevare anomalie e valutare la qualità dei dati in modo efficiente.
La funzionalità di analisi dei dati in EasySheet Pro consente l'analisi automatica dei set di dati in Excel, generando un report dettagliato sulla qualità dei dati e identificando potenziali problemi.

Note
I risultati dipendono dalla qualità dei dati.
Se il set di dati contiene molti valori mancanti, incongruenze o errori di formattazione, l'analisi potrebbe essere imprecisa. Si consiglia di pulire e verificare i dati prima di eseguire l'analisi.

Questa funzionalità è utile per:

Caratteristiche principali

Riconoscimento automatico del tipo di dati
Il modulo identifica automaticamente se una colonna contiene valori numerici, testuali o di data. Tuttavia, se il set di dati ha una formattazione incoerente, potrebbe verificarsi una classificazione errata.
Si consiglia di rivedere i risultati per assicurarsi che le colonne siano state classificate correttamente.

Identificazione dei valori anomali in base al metodo IQR
I valori anomali nei dati numerici vengono identificati utilizzando l'intervallo interquartile (IQR). Questo metodo è efficace per rilevare anomalie, ma non è infallibile.
Se i dati sono ampiamente distribuiti o contengono valori estremi legittimi, alcuni punti dati validi possono essere classificati come valori anomali.

Calcolo del punteggio di qualità dei dati
Il modulo assegna un punteggio di qualità (%) a ciascuna colonna in base a:

Un punteggio basso indica che la colonna necessita di una revisione approfondita.

Possibili falsi positivi nel rilevamento delle anomalie Alcuni modelli di dati possono attivare falsi avvisi di problemi (ad esempio, una colonna con ID numerici univoci può essere contrassegnata per troppi valori anomali).
Si consiglia di rivedere manualmente gli avvisi prima di correggere o rimuovere i dati.

Impatto sulle prestazioni con set di dati di grandi dimensioni
Per set di dati molto grandi (>100.000 righe), l'analisi potrebbe richiedere più tempo. Per ottimizzare le prestazioni, si consiglia di: Eseguire l'analisi su un sottoinsieme di dati prima di elaborare l'intero set di dati.
Chiudere altre cartelle di lavoro per ridurre il carico di lavoro di Excel.
Abilitare il calcolo manuale in Excel per velocizzare l'elaborazione.

Limitazioni nell'analisi delle date
Il modulo tenta di rilevare lacune temporali e anomalie nei dati di tipo data, ma non riesce a distinguere tra normali assenze ed errori nei dati (ad esempio, una settimana mancante in un set di dati settimanale potrebbe essere contrassegnata erroneamente come un problema).

Linee guida per l'interpretazione della mappa di calore della qualità
Il modulo genera una mappa di calore con una barra visiva che rappresenta il punteggio di qualità della colonna.
Riferimenti colore: