Teoria dell’informazione nella scienza della Terra e dello spazio

Di Joshua Garland ed Elizabeth Bradley

Originariamente apparso su Siam News il 1 ° ottobre 2018 . Ripubblicato con autorizzazione.

I recenti progressi nella teoria dell’informazione, insieme a grandi miglioramenti nell’estensione e nella risoluzione dei dati delle serie temporali relative alla scienza della Terra e dello spazio, possono aiutare a rispondere ad alcune delle più grandi domande che l’umanità deve affrontare. Tali sviluppi consentono la nostra comprensione delle dinamiche dei cambiamenti climatici improvvisi e ci consentono di valutare la prevedibilità delle tempeste geomagnetiche.

Fino a tempi relativamente recenti, i set di dati della serie con sufficiente precisione, lunghezza e risoluzione temporale per supportare l’analisi teorica dell’informazione erano difficili da trovare in alcune aree di Scienze della Terra e dello spazio. Anche la replicabilità è un problema importante. Perforare un nucleo di tre chilometri attraverso una calotta di ghiaccio e analizzare ogni centimetro in uno spettrografo è una proposta costosa, così come il lancio di un veicolo spaziale per campionare le condizioni su Plutone. Tuttavia, i recenti sviluppi nelle tecniche di laboratorio hanno migliorato la risoluzione del campionamento delle carote di ghiaccio di un ordine di grandezza e il numero di satelliti che osservano il sistema solare è aumentato notevolmente. Sono disponibili anche altri set di dati geoscienze lunghi e ad alta risoluzione. Questi progressi offrono una serie di interessanti opportunità per la comunità della matematica applicata per dare contributi significativi ai campi della scienza della Terra e dello spazio utilizzando la teoria dell’informazione.

Ad esempio, nel 2005, Tom March, Sandra Chapman e Richard Dendy hanno applicato informazioni reciproche – una misura di quanto una variabile casuale rivela su un’altra – alle osservazioni effettuate dalla sonda spaziale Wind della NASA per tracciare gli effetti del vento solare in punti diversi sulla Terra (vedi Figura 1) [6]. Gli scienziati hanno anche utilizzato altri membri della famiglia delle misure di entropia nucleate dal lavoro di Claude Shannon nelle scienze della Terra e dello spazio. Tuttavia, persistono alcune sfide associate. Ad esempio, il calcolo del tasso di entropia di Shannon da una serie temporale a valori reali richiede la simbolizzazione 1 dei dati, una procedura fragile di fronte al rumore e suscettibile di risultati distorti. Entropia di permutazione [1] elude questi problemi con l’analisi ordinale – conversione della sequenza di valori reali in permutazioni ordinate per valore – per simbolizzare i dati. I ricercatori hanno utilizzato sia l’entropia di Shannon binata che l’entropia di permutazione per esplorare la prevedibilità di diversi eventi di cambiamento climatico catturati nei record proxy di El Niño-Oscillazione meridionale derivati ​​dai dati sedimentari della Laguna Pallcacocha [8].

Le tecniche di entropia di permutazione sono particolarmente utili nello studio dei dati delle carote di ghiaccio. Ad esempio, il nucleo di divisione WAIS (West Antarctic Ice Sheet) di 3.300 metri cattura campioni climatici degli ultimi 68.000 anni. La Figura 2 mostra l’entropia di permutazione ponderata (WPE) – una variante di una tecnica che utilizza una normalizzazione per de-enfatizzare gli effetti del rumore [3] – calcolata in finestre scorrevoli di 500 anni su una traccia di isotopi d’acqua da quel record. Il grande salto nel WPE tra cinque e otto kiloyear (ka) inizialmente era sconcertante. Le registrazioni di laboratorio hanno risolto il mistero, dimostrando che uno strumento più vecchio – utilizzato per analizzare quel segmento del nucleo – introduceva rumore nei dati, un effetto che non era visivamente evidente nei dati 𝛿𝐷δD stessi. I valori anomali che sono quasi invisibili nei dati grezzi lasciano anche segni chiari nel WPE, sotto forma di onde quadre larghe quanto la finestra di calcolo (questo è visibile a circa 17, 26 e 47 ka nella Figura 2). Oltre a rilevare problemi di dati, l’analisi teorica dell’informazione può anche portare ad affascinanti conoscenze scientifiche . Ad esempio, i modelli nei valori WPE rivelano possibili firme di riscaldamento geotermico alla base del nucleo e sembrano essere strettamente correlati con l’accumulo [5]. Un’altra osservazione di interesse è l’assenza di qualsiasi firma dei grandi e improvvisi eventi Dansgaard-Oeschger – che hanno punteggiato l’ultimo periodo glaciale – nella traccia WPE [2], suggerendo che questi eventi potrebbero non rappresentare significative cambiamenti nella meccanica dell’informazione del sistema climatico [4, 5].

Le linee temporali dei set di dati della Terra e delle scienze spaziali sono spesso irregolari e le osservazioni tendono ad aggregarsi in modi strani. Ad esempio, le carote di ghiaccio vengono campionate a intervalli uniformemente distanziati in profondità , ma distanziati in modo non lineare (e non uniforme) nel tempo perché gli strati superiori del nucleo comprimono gli strati inferiori. Infatti, molteplici fattori influenzano queste tempistiche; lo spessore degli strati del nucleo di ghiaccio dipende dal tasso di accumulo annuale, la diffusione mescola i dati degli isotopi attraverso il ghiaccio nel tempo e nello spazio e alcune sezioni di dati scompaiono del tutto tra la calotta glaciale e il laboratorio. Le velocità dei dati dei sensori variano notevolmente durante le lunghe missioni spaziali come New Horizons a causa di problemi hardware, scelte di allocazione di potenza e occlusioni di nuvole che influiscono sui satelliti per l’osservazione della Terra.

Tali irregolarità nella sequenza temporale rappresentano un problema per qualsiasi calcolo basato sulla velocità, teorico dell’informazione o altro. Per aggirarli, uniformare le tempistiche e colmare le lacune, gli scienziati utilizzano metodi che vanno dall’interpolazione lineare a modelli fisici complessi. Queste strategie possono avere effetti profondi e fino ad ora inesplorati sul contenuto informativo dei segnali. La comprensione di queste ramificazioni è un problema matematico interessante, in quanto possono causare correlazioni e regolarità spurie a breve termine che alterano i risultati. Ad esempio, le “rampe” introdotte dall’interpolazione lineare creano permutazioni artificiali che sono ripetitive e completamente prevedibili, il che riduce l’entropia di permutazione. Poiché l’interpolazione gioca un ruolo sempre più importante quando ci si addentra in un nucleo di ghiaccio, questo effetto dipende dalla profondità. Anche le tempistiche nelle carote di sedimenti, dove il materiale può essere trasportato dalle correnti e bioturbato dagli organismi marini, possono essere problematiche. L’interpolazione viene utilizzata regolarmente anche in queste situazioni, generalmente senza considerare le sue ripercussioni sui dati. La matematica necessaria per comprendere l’impatto di questo tipo di preelaborazione dei dati sul contenuto delle informazioni è ancora in fase di sviluppo, sebbene i ricercatori abbiano compiuto alcuni progressi recenti nell’area generale dei dati campionati in modo irregolare [7, 9].

Il problema scientificamente critico dei test di significatività è anche un problema quando si lavora con set di dati come il record degli isotopi dell’acqua dal WAIS Divide o la temperatura del vento solare su Plutone, che sono costosi da raccogliere e quasi impossibili da replicare. La verifica della significatività o la quantificazione dell’incertezza con un solo set di dati è quasi impossibile. Ma anche questo sta cambiando; il nuovo nucleo di ghiaccio del Polo Sud fornisce dati replicati in pochi segmenti, una serie di nuovi progetti di perforazione di carote di ghiaccio sono in corso in tutto il mondo e i recenti progressi tecnologici possono migliorare notevolmente i dati delle serie temporali relativi alla Terra e al sistema solare.

Una domanda chiave su qualsiasi evento è se si tratta di una parte naturale prevista del sistema associato – ad esempio, cambiamenti nell’insolazione solare stagionale in un punto della Terra – o inaspettata e casuale, come l’impatto di un grande asteroide o di un espulsione di massa coronale. La teoria dell’informazione ha il potere di rispondere a queste e ad altre importanti domande sulla scienza della Terra e dello spazio, e la risoluzione e l’estensione dei dati delle serie temporali stanno migliorando al punto da supportare queste analisi. Questi sviluppi stanno suscitando un crescente interesse in quest’area da parte delle comunità di geoscienze e matematica applicata.

1 Conversione dei punteggi degli esami numerici in voti in lettere utilizzando una serie di contenitori.

Riferimenti
[1] Bandt, C., & amp; Pompe, B. (2002). Entropia di permutazione: una misura di complessità naturale per le serie temporali. Phys. Rev. Lett., 88 (17), 174102.
[2] Dansgaard, W., Johnsen, SJ, Clausen, HB, Dahl-Jensen, D., Gundestrup, NS, Hammer, CU, & amp; Bond, G. (1993). Prove di instabilità generale del clima passato da un record di carote di ghiaccio di 250 kyr. Nature, 364 (6434), 218–220.
[3] Fadlallah, B., Chen, B., Keil, A., & amp; Príncipe, J. (2013). Entropia di permutazione ponderata: una misura di complessità per serie temporali che incorpora informazioni sull’ampiezza. Phys. Rev. E, 87 (2), 022911.
[4] Garland, J., Jones, T.R., Bradley, E., James, R.G., & amp; Bianco, J.W.C. (2016). Un primo passo verso la quantificazione della produzione di informazioni sul clima negli ultimi 68.000 anni. In International Symposium on Intelligent Data Analysis 2016. Advances in Intelligent Data Analysis XV (pagg. 343–355). Stoccolma, Svezia.
[5] Garland, J., Jones, T.R., Bradley, E., Neuder, M., & amp; Bianco, J.W.C. (2018). Produzione di entropia climatica registrata in un profondo nucleo di ghiaccio antartico. Preprint, arXiv: 1806.10936 .
[6] March, T.K., Chapman, S.C., & amp; Dendy, R.O. (2005). Informazioni reciproche tra indici geomagnetici e vento solare visto dal vento: implicazioni per le stime del tempo di propagazione. Geophys. Ris. Lett., 32 (4).
[7] McCullough, M., Sakellariou, K., Stemler, T., & amp; Piccolo, M. (2016). Conteggio di modelli vietati in serie temporali campionate in modo irregolare. I. gli effetti di sottocampionamento, esaurimento casuale e jitter temporale. Caos: Inter. Jour. Nonlin. Sci., 26 (12), 123103.
[8] Saco, P.M., Carpi, L.C., Figliola, A., Serrano, E., & amp; Rosso, O.A. (2010). Analisi entropica della dinamica di El Niño / Southern Oscillation durante l’Olocene. Phys. A: Stat. Mech. Appl., 389 (21), 5022–5027.
[9] Sakellariou, K., McCullough, M., Stemler, T., & amp; Piccolo, M. (2016). Conteggio di modelli vietati in serie temporali campionate in modo irregolare. ii. affidabilità in presenza di campionamenti molto irregolari. Caos: Inter. J. Nonlin. Sci., 26 (12), 123104.