LA SMART CITY

Raccogliere, aggregare, analizzare dati


Una componente essenziale per la smart city è la rete di trasmissione dati: questa rete deve essere affidabile, permettere comunicazioni a lungo raggio con bassi consumi e prevedere l'installazione di sensori senza manutenzione, ove possibile alimentati con batterie a lunga durata. E' poi consigliabile l'utilizzo di Internet per fornire ai dati (e alle informazioni ricavate da essi) la massima diffusione possibile verso il pubblico. Un tale sistema di raccolta, elaborazione e distribuzione viene definito "infrastruttura IoT" (Internet of Things system). I sistemi IoT sono capaci di raccogliere e aggregare dati da molteplici fonti, generando informazione di valore; essi necessitano delle seguenti componenti (ordinate, qui di seguito, partendo dalla raccolta dei dati e arrivando alla elaborazione finale ad alto livello):

1) un numero piuttosto elevato di sensori (denominati endpoints o nodi) istallati presso i punti di interesse e alimentati preferibilmente a batteria: tali dispositivi devono essere contraddistinti da affidabilità (intesa sia come bassa probabilità di guasto che come ridotta deviazione dalle caratteristiche dichiarate), basso costo unitario, basso consumo in ogni condizione climatica e di operatività. I sensori devono essere capaci di fornire un flusso di dati (anche composito come, ad esempio, la targa di un veicolo e la sua posizione in coordinate geografiche) nel quale ogni elemento è associato ad una stringa temporale che ne identifica l’istante di origine (di rilevazione); inoltre, i sensori devono essere in grado di fornire, direttamente o indirettamente, questi dati ad una rete LAN o WAN tramite un’interfaccia wireless a corto o a lungo raggio, gestita secondo determinati standard (5G, LoRa, Bluetooth 5, ZigBee, ecc.). Infine, i sensori devono essere in grado di trasmettere non solo continuativamente ma, per esempio, anche solo in corrispondenza di certi eventi (la presenza di un veicolo in un parcheggio o meno) inviando una breve stringa di dati e poi ritornando in stato quiescente, in modo da ottimizzare il consumo energetico;

2) uno o, in genere, più elementi di edge-computing, ovvero dispositivi in grado di effettuare la connessione tra i sensori che ne necessitano e la rete LAN o WAN. Tali dispositivi sono divisi in due categorie (far-edge e near-edge) ma, in questa sede, è sufficiente dire che si tratta, in sintesi, di router gateways che fanno da tramite tra l’insieme dei sensori (ad esempio sensori LoRa) e una rete Ethernet (e poi Internet), gestendo le problematiche associate (ad esempio, filtraggio, caching e compressione dati);

3) un certo numero di server interconnessi (cloud) capaci di aggregare i dati provenienti da vari elementi di edge-computing e/o da vari sensori, in modo da offrire servizi completi (ad esempio, un cloud potrebbe aggregare dati di temperatura, pressione, umidità, velocità e direzione del vento, provenienti da moltissimi sensori situati in aree distanti tra loro, elaborarli in base ad algoritmi di machine learning e presentare delle previsioni del tempo su scala locale, oppure un altro cloud potrebbe aggregare i dati provenienti da vari sensori su uno stesso modello di macchina utensile istallato in diverse industrie allo scopo di fornire servizi di manutenzione predittiva). I dati da analizzare possono essere suddivisi, in generale, in dati strutturati, ovvero una forma di dati predicibile (ad esempio, numeri, date, ecc.), dati non strutturati, come dati video o segnali di altro tipo, caratterizzati da una elevata varianza e randomicità e infine da dati semi strutturati (per esempio feed di Twitter) che hanno delle caratteristiche intermedie rispetto ai primi due tipi.

In certe situazioni, i dati devono poter essere interpretati ed analizzati in tempo reale, mentre in altre possono essere archiviati e utilizzati in seguito; è chiaro che la prima soluzione è quella che richiede più potenza di elaborazione e quindi comporta dei costi più elevati. La soluzione più efficiente dal punto di vista dell'utilizzo delle risorse computazionali, quando si ha a che fare con alti volumi di dati, è utilizzare, se possibile, l’elaborazione a posteriori o “batch”. Questo è utile anche quando i dati devono essere correlati con dati storici. I cloud possono essere in grado di impostare dinamicamente il livello dei due tipi di elaborazione, in modo da bilanciare i livelli di flusso dati e latenza (architettura LAMBDA). È utile, a questo punto, elencare una serie di funzioni analitiche basiche di elaborazione dei dati, al fine di meglio comprendere le potenzialità di un tale sistema:

a) pre-processamento: questo include il filtraggio degli eventi che risultano di piccolo interesse (in modo da diminuire la mole dei dati), l'estrazione di caratteristiche particolari, la trasformazione dei dati stessi in forme più adatte, e l'aggiunta di attributi come per esempio i tag;

b) gestione degli errori: una grande quantità di sensori può generare una grande quantità di dati erronei o mancanti o, ancora, di dati che sono fuori sequenza temporale (ad esempio, i dati di tracking di un veicolo possono interrompersi se questo entra in un garage sotterraneo). Il sistema deve quindi possedere dei parametri di analisi in modo da riuscire ad eliminare autonomamente la maggior parte di questi errori;

c) aggregazione di dati simili: quando due o più sensori che inviano dati compositi (ad esempio, dati di posizionamento) si trovano a trasmettere dati praticamente identici, il sistema deve essere in grado di accorpare gli stessi dati. Per esempio, si pensi ad un telefono cellulare o ad un collo dotato di sistema di tracciamento che si trova a bordo di un veicolo che dispone anch'esso di un sistema di tracciamento: sarebbe inutile memorizzare entrambi i dati di posizionamento finché il cellulare o il collo resta sul veicolo;

d) comunicazione “in senso inverso”: alcune funzioni devono permettere l'invio di informazioni in senso inverso, cioè dal cloud al sensore o attuatore, in modo da poter effettuare un'azione fisica in loco sulla base di una o più rilevazioni ricevute;

e) gestione allarmi: una delle più efficaci funzioni di elaborazione dei dati è il generare un allarme se vengono superate certe condizioni limite (ad esempio, se la temperatura supera un certo valore o cade al di fuori di un certo intervallo).

Abbiamo già detto che l'aggregazione dei dati e la loro elaborazione costituiscono una caratteristica fondamentale dell’IoT; i modelli definiti formalmente e gli algoritmi di deep learning (basati su reti neurali a più strati) possono utilizzare dati acquisiti in tempo reale o residenti su database, in modo da generare informazione derivata di notevole valore: ad esempio, una rete di rilevazione dei dati ambientali come ACN può fornire input in tempo reale per la redistribuzione automatica del traffico, aggregando i dati sul traffico stesso e sui livelli di inquinamento, mediante segnaletica e semafori "intelligenti". Un possibile utilizzo a posteriori di tali dati può essere utile in fase di progettazione urbanistica e pianificazione del trasporto pubblico. L'adozione di standard riconosciuti è fondamentale, in quanto permette l'interoperabilità tra apparati IoT prodotti e/o gestiti da diversi soggetti sullo stesso territorio; in questo senso, una rete come ACN può integrare i propri dati con quelli prodotti da una rete IoT di sensori meteorologici, per esempio per ricavare informazioni sulla mobilità degli inquinanti in base al vento. Considerando invece un sistema di riconoscimento immagini per sorveglianza su persone, questo dovrebbe essere abbastanza evoluto da poter essere predisposto per riconoscere un allagamento stradale o un incendio, permettendo un intervento tempestivo da parte delle autorità cittadine. Le interfacce utente rese disponibili on site tramite dispositivi mobili e presso la centrale di monitoraggio, presenterebbero i dati sia sotto forma di grandezze dirette, sia di grandezze derivate dai modelli, in modo da facilitare il lavoro dei decisori umani. L’analisi dei dati storici può essere di notevole aiuto per ridurre il costo delle manutenzioni e delle polizze assicurative degli stakeholder (privati e pubblici) implicati. Infine, bisogna tener presente che i dati possono prevedere anche le impressioni degli utenti del sistema, quindi frasi scritte su Twitter o su altri social network, oppure riportati da interfacce per i tecnici di manutenzione o da questionari di soddisfazione utente circa il servizio prestato e/o i miglioramenti che il sistema porta alla vita della comunità.

Fatte queste premesse, passiamo dunque a delineare, in dettaglio, le componenti e le funzioni di un possibile sistema IoT:
1) sensori: si sceglie il protocollo di strato fisico Lora (e corrispondente protocollo di strato MAC LoRaWan) che è adatto per comunicazioni a lungo raggio. Inoltre il protocollo dispone di un controllo adattivo della potenza di emissione, in modo da ottimizzare l'inquinamento elettromagnetico. La tecnica di modulazione è derivata dalla Chirp Spread Spectrum (CSS) con bande di frequenza di 868 MHz (Europa), 915 MHz (USA) e 433 MHz (Asia). Il LoRa offre una portata dell’ordine dei 15 km circa in linea d’aria, che scende a circa 2-5 km in ambiente urbano; se a questo uniamo il fatto che la trasmissione nel campo della internet of things avviene solo durante piccoli intervalli in corrispondenza di eventi chiave e che il protocollo LoRa ha delle caratteristiche di consumi particolarmente bassi, riusciamo ad ottenere durate delle batterie dei sensori che arrivano a qualche anno (le durate reali dipendono ovviamente dal tipo di sensore implementato). Per contro, il bit rate (5 kbps max) è notevolmente inferiore a quello del Wi-Fi 802.11 o dei protocolli per reti cellulari e così anche il payload (222 bytes max), ma questi fatti, se da un lato rendono il sistema inadatto a trasmettere, ad esempio, stream video, dall'altro non inficiano assolutamente il tipo di utilizzo legato alla IoT. Di fatto, il LoRa risulta essere oggi la migliore tecnologia radio per sensori alimentati a batterie. Va specificato che una rete di questo tipo può garantire la copertura del territorio con un numero di stazioni base (gateway) da 5 a 10 volte inferiore rispetto ad una rete cellulare. Questo risulta in un costo inferiore rispetto alle classiche reti cellulari 4G.

continua......