Estrarre dark data nel CAD per costruire digital twin
Come un'azienda di sviluppo di software di ingegneria ha affrontato una delle sfide principali delle iniziative di conversione da CAD a GIS.
CONDIVISIONE
CATEGORIA: Ingegneria aziendale
Questo articolo, scritto dall'autore Gavin Schrock, è stato originariamente pubblicato su GoGeomatics
10 novembre 2023
In teoria, raccogliere funzionalità dai disegni tecnici per popolare e aumentare il GIS dovrebbe essere una proposta abbastanza semplice. Tuttavia, la realtà è che questo è raramente facile da eseguire. Le linee e i simboli dei disegni CAD, differenziati per livelli (o strati) e celle (o blocchi), non dovrebbero essere trasferiti senza problemi in uno schema GIS se sono rappresentati in un quadro di riferimento spaziale relazionale? Spesso si dice che il diavolo si nasconde nei dettagli, ma nel caso del vecchio CAD il diavolo può risiedere nell'incapacità di riconoscere i dettagli.
"Il problema degli standard CAD è che non sempre vengono rispettati rigorosamente. Inoltre, si evolvono", ha affermato Mark Stefanchuk, Chief Technology Officer presso Phocaz Inc. "Ad esempio, prima del 2000 i livelli erano numerati e successivamente questo si è evoluto in nomi di livello. I progettisti hanno la tendenza, soprattutto quando hanno fretta, a non utilizzare gli standard CAD. Ci siamo imbattuti in situazioni in cui rilasciano le celle nei loro elementi di base, come linee, cerchi, riquadri di testo, ecc., oppure le raggruppano insieme e perdiamo l'attribuzione che preferiremmo mantenere".
Ci sono disconnessioni con studi di progettazione appaltati, progetti finanziati che richiedono standard diversi e l'evoluzione della saggezza convenzionale sugli schemi di denominazione di livelli/celle. Ad esempio, alcuni studi di ingegneria hanno ampliato gli standard per distinguere tra caratteristiche di progettazione pura e as-built (o documenti di disegno). "Quindi, se dobbiamo, ancora una volta, evolvere gli standard CAD, dobbiamo sviluppare un mezzo per passare da ciò che esisteva anni fa a ciò che esiste oggi, a ciò che vogliamo in futuro", ha affermato Stefanchuk. “Ciò accade praticamente in qualsiasi organizzazione – alcune hanno controlli migliori sui propri standard rispetto ad altre. Certamente, ad esempio, nei casi dei clienti del dipartimento dei trasporti, vediamo anomalie, da progetto a progetto, persone che disintegrano o fanno esplodere cellule”.
Dati oscuri
"Quando si parla di migrazione CAD-GIS, spesso ci si chiede perché lavorare con i dati legacy", ha affermato Mary A. Ramsey, socio fondatore e CEO di Phocaz Inc.
Il nostro pensiero, e quello dei nostri clienti, è che chiunque abbia dati legacy ha investito in modo sostanziale, anche milioni di dollari, per ottenere quei dati in primo luogo". Può essere un investimento enorme, nel corso di decenni di creazione di documenti CAD; ha senso almeno cercare di ricavare il più possibile da quei documenti.
"Nel caso dei dipartimenti dei trasporti (DOT), si tratta di denaro dei contribuenti. È stato fatto un investimento sostanziale in questi asset digitali, ora è necessario trarne maggiori frutti. Quindi, assolutamente, inizia ad analizzare i dati che ci sono. Ciò che non può essere estratto automaticamente, ad esempio dal livello e dal nome della cella, è definito "dato oscuro" (dark data). Eppure è il disegno, come geometria: immagina il valore che ci sarebbe se potesse essere estratto completamente”. I dati oscuri nelle infrastrutture sono un tema ricorrente. Nel contesto dell'infrastruttura, i dati oscuri si riferiscono a dati altrimenti preziosi non facilmente accessibili a causa dell’evoluzione delle convenzioni sui dati, della mancanza di aderenza agli standard, dell’eccessivo affidamento alla conoscenza istituzionale, della scarsa gestione dei dati. L’intelligenza artificiale sta consentendo nuovi modi per estrarli. E questo è esattamente l’approccio adottato da Phocaz per estrarre dati oscuri dall’archivio CAD dei clienti del settore dei trasporti.
Un’altra domanda è: “Perché non mappatura mobile e droni?” La mappatura mobile e l’acquisizione di dati tramite droni si sono evolute splendidamente negli ultimi anni. Si sono fatti progressi nell'esattezza, nell'accuratezza del posizionamento, nell'automazione del riconoscimento delle caratteristiche e nelle operazioni sul campo semplificate. Ma la realtà è che acquisire decine di migliaia di chilometri di corridoi autostradali costerebbe molti milioni e, anche così, queste tecnologie non potrebbero acquisirne tutte le caratteristiche. I costi irrecuperabili di decenni di progettazione CAD e di disegni record si distinguono come una risorsa potenzialmente conveniente da estrarre per popolare/aumentare sostanzialmente un GIS aziendale (che si sta evolvendo in digital twin).
Miglioramento della produttività
"Abbiamo fondato Phocaz per fornire servizi di sviluppo di software principalmente per il settore della progettazione assistita da computer", ha affermato Ramsey. “In particolare per gli utenti dell'ingegneria civile: Civil 3D, Bentley MicroStation e OpenRoads (ovviamente, all'epoca sarebbe stato InRoads), ecc. Fondamentalmente stavamo sviluppando e mantenendo componenti aggiuntivi per i nostri clienti che vengono eseguiti su quelle piattaforme e prodotti di base. Continuiamo a svolgere questo tipo di lavoro oggi, molto lavoro per i DOT in questo ambito e anche per altri clienti delle infrastrutture".
Phocaz ha presentato la sua soluzione da CAD a GIS quando un cliente di lunga data, il Dipartimento dei Trasporti della Georgia (GDOT), si è rivolto alla società con questa richiesta: è possibile raccogliere dati da un file CAD, automatizzare l'estrazione e inserirli nel nostro GIS aziendale? Questa è stata la genesi di CLIP, il "CAD Level Integration Process" (processo di integrazione a livello CAD), come lo ha definito il GDOT. Phocaz ha innanzitutto identificato gli strumenti esistenti, alcuni anche all'interno dell'ambiente CAD, progettati a tale scopo. "Abbiamo scoperto abbastanza rapidamente che questi processi erano un po' lenti e non sarebbero stati pratici considerando l'enormità dell'archivio CAD che il dipartimento dei trasporti desiderava estrarre. Per non parlare di come gestire la produzione e dell’enorme quantità di dati che un’impresa del genere produrrebbe."
La soluzione doveva essere scalabile per soddisfare le esigenze del GDOT e di altri importanti clienti di infrastrutture. "Ad esempio, il GDOT gestisce 80.000 miglia della corsia centrale e rotte di aiuti federali", ha affermato Stefanchuk. "Ciò rappresenta circa un terzo delle autostrade dello stato: probabilmente è più vicino a 250.000 miglia di corsie nello stato". La Georgia non è la sola ad avere l’opportunità (e la sfida) di “estrarre” così tanti chilometri di file CAD autostradali. Dai un'occhiata ai totali delle miglia di corsia per ciascuno dei 50 stati. Phocaz ha iniziato a sviluppare algoritmi basati sull'intelligenza artificiale, ha adottato un approccio di digital twin e si è rivolta a ProjectWise di Bentley Systems per la produzione e la gestione dei dati.
L'auto robotica virtuale
All'inizio, invece, l'idea era quella di scansionare semplicemente i disegni CAD alla ricerca dei frutti più bassi delle caratteristiche riconoscibili dai nomi dei livelli e delle celle. Ma ha funzionato meglio semplicemente "guidare le corsie digitali" una volta ed estrarre in modo completo le caratteristiche.
L'idea era che l'intelligenza artificiale esaminasse il disegno procedendo lungo le corsie e acquisendo le caratteristiche man mano che procedeva. È quasi come guidare ogni corsia con un veicolo dotato di mappatura mobile LiDAR/Imaging (ma a una frazione del costo). Ma prima che l’auto di intelligenza artificiale possa iniziare il suo viaggio, deve esistere un ambiente spaziale coerente. Fortunatamente, come osserva Stefanchuk, l'approccio progettuale in CAD è stato quello di lavorare su un modello, inserire i riferimenti e tagliarne fogli. Quindi, in quasi tutti i casi, il disegno è pronto per “guidare”. Nel caso dei clienti del DOT che lavorano in un ambiente DGN (MicroStation), è qui che la scelta di Bentley ProjectWise si è rivelata particolarmente adatta alla gestione dei disegni, dell'avanzamento dell'estrazione e dei dati risultanti.
Applicazioni future
Quindi, se dobbiamo, ancora una volta, evolvere gli standard CAD, dobbiamo sviluppare un mezzo per passare da ciò che esisteva anni fa a ciò che esiste oggi, a ciò che vogliamo in futuro.
—Mark Stefanchuk
ProjectWise è una suite di gestione dei progetti di Bentley Systems, che può fungere da hub per i dati in più discipline e formati, per l'intero ciclo di vita del progetto e consente di lavorare in un ambiente di digital twin. Poiché molti dei clienti del settore dei trasporti lavorano principalmente in un ambiente di Bentley (ad esempio DGN e MicroStation e i relativi pacchetti software di progettazione), era logico gestire i progetti CLIP in questa suite.
"L'auto CLIP, o auto robot, come la chiamavamo noi, è in realtà uno strumento di visualizzazione in riunioni per noi, per capire cosa sta succedendo con i nostri algoritmi", ha affermato Stefanchuk. "L'utente finale non lo vedrà mai." Anche se devo dire che è stato divertente vedere l'auto robot rappresentata in una dimostrazione. "Ciò che vogliono, in ultima analisi, è la grafica centrale delle caratteristiche all'interno dell'ambiente GIS e le proprietà ad esso assegnate."
Per scoprire quali sono queste proprietà in qualsiasi punto lungo l'autostrada, Phocaz ha sviluppato uno strumento in grado di cercare e trovare tali caratteristiche. L'intelligenza artificiale viene addestrata sui vari aspetti spaziali delle caratteristiche, come la segnaletica orizzontale delle corsie ciclabili (che può variare molto anche da un distretto all'altro) e applica altre regole, come la distanza da guardare per coprire la larghezza standard della corsia. "Abbiamo dovuto concettualizzare e visualizzare ciò che volevamo che gli algoritmi facessero", ha detto Stefanchuk. "Abbiamo pensato a una strada tortuosa che attraversa la campagna, a come l'avremmo guidata nel mondo fisico e a cosa potevamo vedere fuori dai finestrini anteriori e laterali. Poi, come insegnare all'IA a "viaggiare" lungo le corsie CAD raggruppate e imparare da ciò che avrebbe potuto vedere".
"Ci sono un paio di ambiti in cui l'auto CLIP/robot è effettivamente un vantaggio", ha detto Stefanchuk. "Uno di questi è che non dobbiamo raccogliere tutti i dati in una volta, dobbiamo solo raccogliere ciò che vediamo in quel momento, prendere decisioni in merito, metterlo via finché non siamo pronti a riferire in merito e quindi continuare a spostarsi lungo l'autostrada. Quando ci imbattiamo in qualcosa come una segnaletica orizzontale, possiamo utilizzare alcuni modelli di intelligenza artificiale visiva per capire cosa rappresenta quella segnaletica orizzontale".
"Ciò che abbiamo imparato dal progetto CLIP è che possiamo iniziare con un simbolo, come una freccia che gira a destra o a sinistra, e possiamo insegnare a un'intelligenza artificiale a rilevarlo", ha affermato Stefanchuk. “Possiamo però prendere altre decisioni in base a ciò che possiamo dedurre da ciò, ad esempio su che tipo di corsia sto guidando. Stiamo guidando su una corsia di svolta a destra, una corsia di attraversamento, una corsia di svolta a sinistra, una corsia di inversione a U e così via."
Phocaz non si è concentrato solo sulla segnaletica orizzontale. Utilizzando lo stesso approccio utilizzato per la segnaletica orizzontale, l'azienda è in grado di creare un modello di apprendimento automatico per ogni cella di qualsiasi libreria di celle. "Il nostro cervello di IA è un modello di machine learning (MLM)", ha affermato Stefanchuk. "Il nostro software, un'applicazione separata da CLIP (chiamata Phorz AI), guiderà l'utente attraverso la creazione del proprio MLM a partire da una o più celle (simboli) come una freccia di svolta, una corsia ciclabile, un vialetto, un canale sotterraneo, ecc. Il MLM creato dall'utente può quindi essere applicato per rilevare questi oggetti in qualsiasi modello per un iTwin (digital twin). L'idea era che potessimo rendere abbastanza semplice per chiunque la creazione di un MLM in grado di rilevare le funzionalità in un progetto CAD. Nel caso di CLIP per il GDOT, si tratta di un MLM che abbiamo formato in modo che non debbano eseguire questo passaggio". Per i progetti di altri clienti, viene creato un modello principale, ma è aperto a qualsiasi utente per aumentare e formare l'intelligenza artificiale, poiché celle e simboli possono variare da città a città, da contea a contea, ecc.
Phocaz è stata recentemente premiata come finalista nella categoria Ingegneria aziendale all'evento annuale Year in Infrastructure e Going Digital Awards, tenutosi a Singapore, dall'11 al 12 ottobre 2023. Allo stesso evento, nel discorso di Julien Moutte, VP of Technology di Bentley Systems, è stato mostrato CLIP che estrae le frecce di svolta a sinistra dai disegni autostradali CAD. "Il GDOT ha sempre creduto che i disegni CAD potessero essere una ricca fonte di dati di asset", ha affermato Moutte. "Per accedere a tali dati, però, era necessario raccogliere manualmente progetti e disegni, migliaia di essi, e quindi ispezionare visivamente ciascun asset, il che avrebbe richiesto innumerevoli ore. Per illuminare i dati oscuri, Phocaz ha utilizzato ProjectWise powered by iTwin per creare digital twin che possono essere analizzati in modo più efficiente utilizzando l'IA con il rilevamento delle caratteristiche e la referenziazione spaziale. Phocaz è andato anche oltre, utilizzando una nuova tecnica di intelligenza artificiale per colmare le lacune tra i modelli. Ha creato un agente di intelligenza artificiale che può guidare virtualmente lungo le corsie del digital twin rilevando le linee centrali. Con l'automazione dell'intelligenza artificiale, il processo di estrazione dei dati non è più proibitivo in termini di tempo o costi per i clienti.
Applicazioni future
"CLIP è un flusso di lavoro unico che abbiamo sviluppato per risolvere questo problema per i nostri clienti nel settore dei trasporti", ha affermato Ramsey. "Siamo in grado di iniziare con il contesto del prerequisito con cui stiamo lavorando: le strade. Quindi, non saremmo necessariamente in grado di applicarlo prontamente, ad esempio, all'architettura. Tuttavia, una volta compreso il contesto, possiamo iniziare a pensare a come raccogliere i dati da questo tipo di progetti".
A quali applicazioni per l'infrastruttura potrebbe adattarsi questo approccio? Mi vengono subito in mente le società di servizi pubblici. Esistono reti di trasmissione e distribuzione e, nel caso delle reti di telefonia e di comunicazione, esistono elementi di connettività basati su regole che potrebbero aiutare a perfezionare ulteriormente l'analisi sia delle caratteristiche lineari che dei tipi di pertinenze. Per i servizi pubblici del sottosuolo, l'automazione dell'estrazione delle caratteristiche CAD potrebbe essere preziosa, considerando quanto sia poco pratico localizzare fisicamente tutte le caratteristiche. Non è escluso che ci possa essere qualche successo, utilizzando questo tipo di soluzione, per l’estrazione di caratteristiche dai disegni tecnici scansionati. Tuttavia, ci sono sfide di riferimento spaziale (scala e posizionamento) e di qualità/completezza della conversione da dati raster a dati vettoriali (sebbene anche in questo caso ci siano stati molti progressi grazie all'utilizzo dell'intelligenza artificiale).
Mentre i comuni, le aziende di servizi pubblici e i campus cercano di costruire dei digital twin, il costo dell’acquisizione di dati fisici completi e degli inventari rappresenta un ostacolo per un’adozione più ampia. Tuttavia, pochi elementi sono stati costruiti senza un qualche tipo di disegno di progettazione e, almeno per quelli degli ultimi quattro decenni, ci sono probabilmente disegni CAD che potrebbero essere estratti in questo modo. Nei milioni di file CAD in circolazione si nasconde un'enorme quantità di dati oscuri. È ora di farne un uso migliore.