Modelul de date INSPIRE și transformarea datelor sursă

Când vine vorba de organizarea și partajarea datelor de mediu și geografice în Europa, există un set specific de reguli de urmat. O parte cheie a acestui set este Modelul de Date INSPIRE.

Modelul de Date INSPIRE reprezintă un șablon pentru structurarea datelor geospațiale astfel încât toată lumea să folosească același format. Acest lucru ușurează partajarea și utilizarea datelor între diferite țări și organizații. Detaliile tehnice privind modul de structurare a acestor date sunt conturate în documentațiile și Ghidurile de specificații tehnice INSPIRE care definesc fișierele de schemă XML ca mod implicit în care datele geospațiale ar trebui să fie structurate. Schemele XML sunt ca șabloanele care arată cum să organizezi datele într-un mod consistent. Puteți găsi aceste șabloane pentru toate cele 34 de tipuri de teme de date spațiale la adresa https://inspire.ec.europa.eu/schemas/.

Transformarea datelor existente într-un format care se potrivește acestor șabloane implică câțiva pași cheie:

1. Analizarea datelor deținute: Acest lucru înseamnă analiza datelor existente pentru a înțelege formatul și modul în care sunt organizate.

2. Transformarea datelor: Acesta este partea tehnică în care datele sunt remodelate pentru a se potrivi standardelor INSPIRE. Este ca și cum ai traduce o carte într-o limbă nouă, unde datele originale sunt cartea, standardele INSPIRE sunt noua limbă, iar procesul de traducere este împărțit în trei părți:

  • Identificarea formatului original al datelor tale (datele sursă),
  • Stabilirea modului în care ar trebui să arate la final (modelul de destinație),
  • Și decizia privind modul de a trece de la original la formatul final (funcțiile de transformare ETL).

3. Crearea și armonizarea seturilor de date: Odată ce datele sunt transformate, acestea sunt stocate într-un format numit GML (Geography Markup Language), care este un format XML proiectat special pentru datele geografice. Acest lucru face ca datele să fie ușor de utilizat și partajat.

4. Crearea metadatelor: Metadatele sunt ca un rezumat care explică despre ce sunt datele, cum au fost create și alte detalii importante. Pentru INSPIRE, există reguli specifice despre ce trebuie să includă aceste metadate.

Înțelegerea serviciilor de căutare/descoperire pentru date spațiale

Serviciile de descoperire sunt ca motoarele de căutare ale lumii geospațiale, concepute pentru a te ajuta să găsești seturi specifice de date și servicii spațiale. Gândește-te la ele ca la un Google specializat pentru hărți și informații geografice, unde căutarea se bazează pe rezumate detaliate ale fiecărui set de date sau serviciu.

Iată o explicație mai simplă a ceea ce fac serviciile de descoperire:

1. Căutare de date și servicii: Poți căuta seturi de date și servicii spațiale folosind detalii specifice menționate în metadatele lor, care sunt ca niște cărți de identitate pentru date și descriu ce este acea dată, cine a creat-o și alte detalii esențiale.

2. Protocol standardizat de căutare: Modul în care funcționează aceste căutări se bazează pe un set de reguli definite de Open Geospatial Consortium (OGC). Acest grup stabilește modul în care ar trebui să funcționeze serviciile de căutare, asigurându-se că ele funcționează fără probleme precum alte servicii web pe care le folosim în fiecare zi. Regulile sunt stabilite într-un standard numit Catalogue Service for the Web (CSW), ce poate fi accesat online la adresa https://www.opengeospatial.org/standards/cat.

Standardul CSW presupune următoarele:

  • Înțelegerea a ceea ce oferă serverul: Permite interogarea serverului pentru a obține o listă a tipului de informații pe care îl poate livra, precum și modul în care diversele sale funcționalități pot fi accesate (GetCapabilities);
  • Obținerea detaliilor despre formate: Permite interogarea serverului pentru a obține descrierea formatului în care informațiile despre seturile de date și serviciile pot fi oferite (DescribeRecord);
  • Aflarea tipurilor de căutări pe care le poți efectua: Permite interogarea serverului pentru a obține lista de valori pentru fiecare dintre parametrii corespunzători diferitelor interogări (GetDomain);
  • Obținerea datelor după ID: Permite obținerea unui set de metadate corespunzător unui identificator unic cunoscut de către utilizator, într-un format predefinit (GetRecordById);
  • Căutarea folosind filtre: Permite descoperirea metadatelor stocate de către server prin căutarea pe baza a diferite filtre și descărcarea acestora în diferite formate standard (GetRecords);
  • Încorporarea metadatelor externe: Permite importul de metadate publicate de un serviciu terț de căutare care respectă specificațiile standardului (Harvest);
  • Administrarea metadatelor: Permite adăugarea, modificare sau ștergerea unor seturi de metadate publicate de către server (Transaction).

Rezultatele acestor acțiuni sunt furnizate în fișiere XML, care sunt practic documente digitale ce conțin toate informațiile detaliate despre seturile de date și servicii. Aceste fișiere pot fi utilizate de aplicațiile software pentru procesare ulterioară sau pot fi afișate într-un mod mai prietenos pentru utilizator, pentru o înțelegere ușoară. Acest sistem permite, de asemenea, organizarea metadatelor în categorii (precum teme de date sau extindere geografică), facilitând astfel găsirea seturilor de date și serviciilor care se potrivesc criteriilor specifice.

Utilizarea serviciilor de vizualizare

Să presupunem că ai o hartă sau o colecție de date despre diferite locuri și vrei să vezi aceste informații vizual pe un calculator sau dispozitiv mobil. Aici intervin „Serviciile de Vizualizare”. Aceste servicii îți permit să faci mai mult decât să te uiți la o hartă statică. Ele îți permit să interacționezi cu ea. Poți să faci zoom in pentru a vedea mai multe detalii, să faci zoom out pentru a obține o imagine de ansamblu mai mare, să te deplasezi pentru a explora diferite zone, sau chiar să suprapui diferite tipuri de informații unele peste altele. În plus, acestea pot să arate legenda care explică simbolurile de pe hartă și să ofere detalii despre datele pe care le observi.

Regulile pentru modul în care aceste servicii funcționează sunt stabilite de OGC. Aceștia au un set specific de reguli grupate sub standardul Web Map Service (WMS). Acestea pot fi descărcate de la adresa http://www.opengeospatial.org/standards/wms.

Iată ce acoperă standardele WMS:

  • Aflarea a ceea ce este disponibil: Poți întreba serviciul ce tipuri de hărți și date are. (GetCapabilities)
  • Vizualizarea hărții: Poți solicita afișarea unei hărți sau a unui set de date specific. (GetMap)
  • Aflarea mai multor informații despre ceea ce vezi: Dacă ești curios în legătură cu o anumită parte a hărții sau un set de date, poți obține informații mai detaliate despre aceasta. (GetFeatureInfo)

Serviciile WMS expun datele geospațiale sub formă de hărți georeferențiate, în format digital (raster: PNG, GIF, JPEG sau vector: SVG). Acestea pot fi vizualizate sau interogate în diferite contexte. Prin utilizarea formatelor vectoriale sau a celor raster ce suportă transparență (GIF, PNG) este posibilă combinarea mai multor seturi de date pentru a forma o singură hartă.

Obținerea de rezultate maxime din serviciile de descărcare

Dacă ai nevoie de date specifice, cum ar fi traseul drumurilor sau limitele lacurilor, direct pe calculatorul tău sau în aplicații online, „Serviciile de Descărcare” sunt foarte utile. Aceste servicii îți permit să obții copii ale datelor de care ai nevoie și, dacă este posibil, să le utilizezi imediat, fără nicio etapă intermediară.

Magia din spatele acestei capacități este posibilă prin intermediul standardului Web Feature Service (WFS). Acesta este ca un oficiu poștal super-specific pentru datele sistemului informatic geografic. Dar, spre deosebire de verișorul său, serviciul de hărți web (WMS), care îți trimite o imagine de hartă (sub formă de imagine PNG sau JPG) pe care o poți vedea dar nu o poți modifica, WFS îți permite să descarci și să interacționezi cu geometriile și atributele straturilor care alcătuiesc harta. Acest lucru înseamnă că poți analiza aceste date în detaliu sau să fie integrate în alte proiecte.

Standardul WFS este stabilit de OGC. Acesta definește operațiuni pentru interfețele web pentru interogarea și editarea elementelor geografice vectoriale, cum ar fi traseele drumurilor sau limitele lacurilor, și poate fi accesate la adresa http://www.opengeospatial.org/standards/wfs.

Iată ce presupune standardul WFS:

  • Găsește ce este disponibil: Poți solicita serviciului să enumere toate tipurile de date geografice pe care le are. (GetCapabilities)
  • Informații despre date: Poți obține descrieri detaliate ale fiecărui element/strat, cum ar fi ce atribute are un drum sau o limită a unui lac. (DescribeFeatureType)
  • Caută date specifice: Poți căuta doar datele de care ai nevoie, folosind filtre pentru a-ți restrânge căutarea. (GetFeature)

Pentru ca datele să se potrivească regulilor Directivei INSPIRE, ele trebuie să fie formatate într-un mod specific, folosind fișiere text/XML în formatul GML, conform specificației 3.2.1 a acestui standard de date. Acest lucru asigură că datele pe care le descarci pot fi utilizate fără probleme în aplicațiile GIS și îndeplinesc standardele Uniunii Europene pentru partajarea informațiilor spațiale.

Înțelegerea Metadatelor INSPIRE

După tot efortul depus pentru a obține setul de date exact așa cum se dorea, pentru a-l transforma conform standardelor specifice și pentru a-l face disponibil online, mai există un pas important: asigurarea că ceilalți pot găsi și înțelege ceea ce ai făcut. Aici intră în joc Metadatele INSPIRE. Este ca și cum ai crea un catalog detaliat pentru setul tău de date, asigurându-te că poate fi descoperit și utilizat ușor în cadrul rețelei europene de resurse.

Metadatele INSPIRE sunt un set de descrieri detaliate despre setul tău de date, create conform unor linii directoare specifice (standardele ISO 19115 și INSPIRE). Aceste descrieri sunt elaborate în format XML, făcând informația ușor de citit de către mașini și larg accesibilă. Crearea metadatelor poate părea simplă, dar este o sarcină rezervată pentru finalul procesului de implementare a setului de date. Motivul? Multe detalii necesare în metadate, cum ar fi detalii despre forma finală a setului de date și modul în care este accesat, pot fi stabilite doar după ce setul de date este complet pregătit și publicat.

Pentru fiecare set de date transformat pentru a se alinia cu standardele INSPIRE, va trebui să generezi cel puțin trei fișiere XML de metadate. În plus, va trebui să ajustezi documentele GetCapabilities ale serviciilor de vizualizare (WMS) și descărcare (WFS) pentru a include linkuri către aceste fișiere de metadate:

  • Un URL pentru cererea GetCapabilities a WMS;
  • Un URL pentru cererea GetCapabilities a WFS.

Fișierele de metadate se conectează la serviciile web-GIS prin două instanțe de „Resource Locator”, fiecare conținând URL-uri pentru cererile GetCapabilities ale WMS și WFS. Metadatele pentru serviciile WMS și WFS ar trebui să se lege înapoi la metadatele setului de date, pentru o rețea fără cusur a informațiilor.

Iată cum funcționează:

Legarea serviciilor la seturile de date:

  • Instanțele CoupledResource sunt referințe specifice folosite pentru a conecta metadatele serviciilor de vizualizare (WMS) și descărcare (WFS) înapoi la fișierul de metadate al setului de date. Ele acționează ca niște poduri, asigurându-se că utilizatorii care navighează de la un serviciu pot urmări/ajunge la metadatele originale ale setului de date.
    • Pentru WMS, un link indică către fișierul XML de metadate al setului de date.
    • Pentru WFS, un link similar se conectează la aceleași metadate ale setului de date, oferind coerență și navigabilitate între serviciile și seturile de date.

Răspunsuri îmbunătățite ale serviciului:

  • Secțiunile ExtendedCapabilities din GetCapabilities sunt incluse atunci când un serviciu (WMS sau WFS) răspunde unei cereri GetCapabilities. Acestea sunt secțiuni speciale în cadrul răspunsului XML care oferă URL-uri către:
    • Fișierul de metadate al setului de date, care oferă un link direct către metadatele detaliate ale setului de date în cauză.
    • Fișierul de metadate al serviciului în sine, care se conectează la o descriere detaliată a serviciului, fie că este vorba de vizualizare (WMS) sau descărcare (WFS).

Acest linkuri și referințe nu este doar pentru spectacol. Aceste fișiere de metadate conțin multe detalii, de la cine deține datele și cum pot fi contactați până la o istorie concisă a creării setului de date și caracteristicile cheie. Ele includ chiar și cuvinte cheie specifice pentru a facilita căutarea acestor date în geoportalul INSPIRE.

Deși completarea metadatelor ar putea părea ca și cum ai completa un formular online comprehensiv, adevărata provocare constă în urmarea tuturor specificațiilor INSPIRE. Nu este doar despre introducerea datelor, ci și despre asigurarea că se aliniază cu un set larg de standarde concepute pentru a face datele spațiale universal accesibile și utilizabile. Există numeroase editoare de metadate care ajută la crearea fișierelor XML, dar când vine vorba de implementarea tuturor constrângerilor și recomandărilor specificate în INSPIRE, asistența lipsește.

Validarea datelor, serviciilor și metadatelor

Asigurarea că totul este conform, are o importanță la fel de mare decât s-ar crede. Atunci când se lucrează conform directivei INSPIRE, validarea este foarte, foarte importantă. Instituțiile trebuie să analizeze îndeaproape datele lor geospațiale, serviciile pe care le oferă și metadatele pentru a se asigura că totul respectă standardele INSPIRE. Acest lucru nu este doar o sarcină unică, ci un pas continuu pentru a ne asigura că toate datele sunt precise, fiabile și pot fi ușor utilizate în diferite sisteme și granițe.

Comisia Europeană pune la dispoziție un instrument special conceput exact pentru acest scop. Acționează ca un inspector virtual, ajutând instituțiile să verifice conformitatea cu criteriile stabilite. Poate că lipsește informație sau poate ceva nu este formatat corect. Oricare ar fi problema, validarea ajută la identificarea a ceea ce trebuie corectat. Instrumentul poate fi accesat la adresa https://inspire.ec.europa.eu/validator/home/index.html.

Autor

Florin Iosub este Lider de Echipă și Arhitect de Soluții GIS la compania Essensys Software, membru în bordul Asociației geo-spatial.org, reprezentanța locală în România a OSGeo și membru în cadrul OSGeo. Cu peste 15 ani de experiență profesională în domeniul GIS, dobândiți ca rezultat al participării la implementarea numeroaselor proiecte, el este foarte bine familiarizat cu cele mai bune practici și tehnologiile GIS de ultimă generație în toate domeniile conexe. În același timp, este foarte hotărât să promoveze valorile și principiile FOSS4G și implicat în diverse inițiative de voluntariat.