6.7. Θεματικά αποθετήρια δεδομένων

Με βάση κοινοτικές οδηγίες και ανακοινώσεις, έχει προταθεί σε ευρωπαϊκό επίπεδο η δημιουργία ενός «κοινού χώρου δεδομένων» στην Ε.Ε., βασισμένου στην αρχή της κοινής χρήσης των δεδομένων μεταξύ επιχειρήσεων καθώς και μεταξύ των επιχειρήσεων και του Δημόσιου Τομέα. Παράλληλα, επισημαίνεται πως η ανοικτή διάθεση, επαναχρησιμοποίηση και μέγιστη επαναχρησιμοποίηση των δεδομένων του Δημόσιου Τομέα αποτελεί σημαντικό καταλύτη για τον ψηφιακό μετασχηματισμό, εξασφαλίζοντας, μεταξύ άλλων, ότι οι επιχειρήσεις θα έχουν την απαραίτητη πρώτη ύλη, ώστε να αναπτύξουν υπηρεσίες προστιθέμενης αξίας.

Στο πνεύμα αυτό, δεδομένα που προέρχονται από συστήματα: αισθητήρων από έξυπνες πόλεις και έξυπνα κτίρια, συστήματα συγκοινωνιών και δημόσιων μεταφορών, λειτουργίας οδικού δικτύου, αισθητήρων και μετρητών από παρόχους υπηρεσιών κοινής ωφέλειας και τηλεπικοινωνιών, ψηφιακούς πόρους πολιτισμικής κληρονομιάς, στοιχεία παραβατικότητας καθώς και δεδομένα ερευνητικών εργασιών, θα παρέχονται σε μηχαναγνώσιμη μορφή μέσω προτυποποιημένων προγραμματιστικών διεπαφών, τροφοδοτώντας την ευρηματικότητα και τη δημιουργικότητα των επιχειρήσεων για την ανάπτυξη νέων υπηρεσιών και προϊόντων.

Στο πλαίσιο των ανωτέρω, πέρα από τη νομοθέτηση σε εθνικό επίπεδο, σύμφωνα και με τις ευρωπαϊκές οδηγίες και ανακοινώσεις, θα αναπτυχθούν δράσεις σε όλους τους τομείς άσκησης πολιτικής (αγροτικής ανάπτυξης, μεταφορών, ενέργειας, περιβάλλοντος κ.ά.) για την επεξεργασία δεδομένων από καινοτόμες εφαρμογές και συστήματα αισθητήρων, φορητές προσωπικές συσκευές και κινητά τηλέφωνα.

Είναι προφανές πως σε κάθε τομέα από τους προαναφερόμενους ήδη υπάρχουν και λειτουργούν πληροφοριακά συστήματα, βάσεις δεδομένων και αποθετήρια περιεχομένου, φιλοξενούμενα από ποικίλες υποδομές και υποστηριζόμενα από αρμόδιες οργανωτικές δομές. Στην παρούσα κατάσταση τα παραγωγικά συστήματα και το προσωπικό λειτουργίας τους είναι προσανατολισμένα στην υποστήριξη συγκεκριμένων επιχειρησιακών στόχων και ρόλων. Παράλληλα, τα παραγόμενα δεδομένα υπηρετούν συγκεκριμένες επιχειρησιακές διαδικασίες και στις περισσότερες περιπτώσεις δεν εξασφαλίζεται από τους φορείς η περαιτέρω αξιοποίηση και διάθεση της πληροφορίας ως ανοικτά δεδομένα.

Για την αποτελεσματική υλοποίηση αυτής της σημαντικής παρέμβασης, τα θεματικά αποθετήρια θα ενταχθούν σε ενιαίο σχήμα διακυβέρνησης, που θα εξειδικεύεται ανά τομέα με στόχο τη συγκέντρωση, επεξεργασία και διάθεση δεδομένων σε τρίτους. Βασική μέριμνα του σχήματος διακυβέρνησης των θεματικών αποθετηρίων αποτελεί η διασφάλιση των κατάλληλων υπολογιστικών πόρων, εργαλείων και μεθόδων καθώς και του κατάλληλου επιστημονικού δυναμικού για τη λειτουργία τους.

Για να υποστηριχθεί τεχνικά η συγκέντρωση και η διάθεση δεδομένων, θα αξιοποιούνται αρχικά οι υφιστάμενοι υπολογιστικοί πόροι του τομέα με σκοπό τη σταδιακή μεταφορά των δεδομένων σε κεντρικές υποδομές αποθετηρίων, όπου θα πληρούνται όλες οι απαιτήσεις ασφαλούς και μακράς διατήρησης των δεδομένων αυτών.

Μέσω των θεματικών αποθετηρίων προβλέπεται η δημιουργία αξίας μέσω της βελτίωσης της λήψης αποφάσεων από τη Δημόσια Διοίκηση καθώς και της καλύτερης διοικητικής εξυπηρέτησης του πολίτη. Παράλληλα, προβλέπεται η δημιουργία αξίας από την ανάπτυξη εφαρμογών τεχνητής νοημοσύνης με ποικίλες εφαρμογές σε διάφορους άξονες πολιτικής καθώς και από την παροχή δεδομένων για την ενίσχυση της έρευνας και της εκπαίδευσης. Πρωτίστως όμως προβλέπεται η ουσιαστική ενίσχυση των επιχειρήσεων και ειδικότερα των νεοφυών επιχειρήσεων καινοτομίας, καθιστώντας βιώσιμα τα επιχειρηματικά σχέδια ανάπτυξης που βασίζονται στην αξιοποίηση δεδομένων και δημιουργώντας παράλληλα επιχειρηματικά οικοσυστήματα και συνέργειες με πολλαπλασιαστικά οφέλη για την κοινωνία και την ανάπτυξη.

Πιο ειδικά και ενδεικτικά, παρακάτω περιγράφονται μία σειρά από πρώτες διαδικτυακές υπηρεσίες για την ανοικτή διάθεση και την περαιτέρω χρήση εγγράφων, ανωνυμοποιημένων πληροφοριών και δεδομένων του δημόσιου τομέα, κατά την έννοια του άρθρου 3 του ν 3979/2011, από τα εξής μητρώα:

  • Μητρώο Πολιτών
  • Μητρώο Φορολογουμένων
  • Μητρώο Ταυτοτήτων
  • Μητρώο Διαβατηρίων
  • Μητρώο Αδειών Διαμονής για πολίτες τρίτων χωρών
  • Μητρώο ΑΜΚΑ-ΕΜΑΕΣ
  • Μητρώο Κοινωνικής Ασφάλισης – Ε.Φ.Κ.Α.
  • Γενικό Εμπορικό Μητρώο (Γ.Ε.ΜΗ.)
  • Εθνικό Ποινικό Μητρώο
  • Μητρώο Ανέργων
  • Μητρώο Δημοσίων Υπαλλήλων
  • Μητρώο Μαθητών
  • Μητρώο Φοιτητών
  • Μητρώο Αδειών Κυκλοφορίας Αυτοκινήτων
  • των πληροφοριακών συστημάτων του φορέα Ελληνικό Κτηματολόγιο
  • και το σύστημα «ΕΡΓΑΝΗ».

 

Τα ανωνυμοποιημένα στοιχεία θα παρέχονται ανοιχτά προς όλους τους πολίτες μέσω Διεπαφής Προγραμματισμού Εφαρμογών (ΑΡΙ) και στο σύνολό τους θα αποτίθενται από τον αρμόδιο φορέα στον κεντρικό κατάλογο των δημόσιων δεδομένων (data.gov.gr). Σκοπός της διάθεσης ανοικτών δεδομένων είναι η βελτίωση της διαφάνειας και της αποτελεσματικότητας των υπηρεσιών που παρέχονται στους πολίτες.

Όσα στοιχεία δημοσιευθούν ως ανοιχτά δεδομένα στον κεντρικό κατάλογο των δημόσιων δεδομένων (data.gov.gr) θα πρέπει να πιστοποιηθούν με τα διεθνώς αναγνωρισμένα πρότυπα του Ινστιτούτου Ανοιχτών Δεδομένων (Open Data certificates https://certificates.theodi.org/en/ με ελάχιστο επίπεδο Silver).

Οι προγραμματιστικές διεπαφές (APIs) που αφορούν απευθείας επικοινωνία πολιτών με τις ψηφιακές υπηρεσίες μέσω Web Browser ή εφαρμογής (App), θα ακολουθούν με όσο το δυνατόν πληρέστερο και αποδοτικότερο τρόπο το αρχιτεκτονικό μοτίβο client-server και τις αρχές του αρχιτεκτονικού στυλ REST (Representational State Transfer). Κάθε υπηρεσία θα είναι προσβάσιμη μέσω έκθεσης των URIs (Uniform Resource Identifiers) που αντιστοιχούν σε διαθέσιμους πόρους (resources) του συστήματος. Οι κλήσεις θα γίνονται χρησιμοποιώντας το πρωτόκολλο HTTP ενώ τα δεδομένα που θα ανταλλάσσονται στις αιτήσεις και στις απαντήσεις θα ακολουθούν τον μορφότυπο JSON (JavaScript Object Notation).

Για τις περιπτώσεις που χρησιμοποιούνται ροές δεδομένων (Data streams) π.χ. για περιπτώσεις ανακοίνωσης μεταβολών ή συμβάντων, οι γραμμογραφήσεις (schemata) θα ακολουθούν το μορφότυπο JSON όπου θα περιέχεται και το σύνολο των αναγκαίων μεταδεδομένων. Για τη διευκόλυνση της συνεχούς εξέλιξης των γραμμογραφήσεων και για εξοικονόμηση δικτυακών πόρων, θα υφίσταται i) διάταξη εγγραφής και τροποποίησης των γραμμογραφήσεων (schema registry) και ii) δυαδική κωδικοποίηση (binary encoding) των γραμμογραφήσεων με κατάλληλο πρότυπο ανοιχτό πρωτόκολλο, ώστε να επιτρέπεται 1) η συνύπαρξη σε συμπιεσμένη δυαδική μορφή τόσο του σχήματος όσο και των δεδομένων σε κάθε επικοινωνούμενο μήνυμα (record) και 2) η σταδιακή προσαρμογή σε αναγκαίες μελλοντικές αλλαγές των γραμμογραφήσεων.

Κατά τη δημιουργία διαδικτυακών υπηρεσιών ανοικτών δεδομένων, η διάθεση δεδομένων προσωπικού χαρακτήρα πραγματοποιείται είτε σύμφωνα με την κείμενη νομοθεσία είτε μετά από ρητή συγκατάθεση του υποκειμένου των δεδομένων. Απαγορεύεται η διάθεση ευαίσθητων προσωπικών δεδομένων από τα οποία είναι δυνατή η ταυτοποίηση του ατόμου. Όσα στοιχεία δημοσιευθούν ως ανοιχτά δεδομένα στον κεντρικό κατάλογο των δημόσιων δεδομένων (data.gov.gr) δε θα περιλαμβάνουν ευαίσθητα προσωπικά δεδομένα.

Η διάθεση των διαδικτυακών υπηρεσιών ανοικτών δεδομένων υλοποιείται σε συνεργασία με τους αρμόδιους φορείς υπό την καθοδήγηση και την τεχνική υποστήριξη του Ε.Δ.Υ.Τ.Ε. Α.Ε. και του Κέντρου Διαλειτουργικότητας (ΚΕ.Δ.) της Γ.Γ.Π.Σ.Δ.Δ., σύμφωνα με το ισχύον Πλαίσιο Ασφάλειας Πληροφοριακών Συστημάτων της Γ.Γ.Π.Σ.Δ.Δ. του Υπουργείου Ψηφιακής Διακυβέρνησης και τις διατάξεις περί προστασίας δεδομένων προσωπικού χαρακτήρα.  Το Ε.Δ.Υ.Τ.Ε. Α.Ε. δύναται να ορίζει τα ακριβή στοιχεία, καθώς και να προσθέτει ή να αφαιρεί στοιχεία που θα διατίθενται ως ανοιχτά δεδομένα από τα κεντρικά μητρώα σε συνεργασία με τους αρμόδιους φορείς.

  • 17 Δεκεμβρίου 2020, 14:52 | Σημαιοφοριδης Ζησης

    Σχετικά με τις ήδη υπάρχουσες υποδομές οι οποίες έχουν αναπτυχθεί και οι οποίες όπως αναφέρεται θα συνεχίσουν να αναπτύσσονται με έμφαση στον τομέα της διαλειτουργικότητας,θα πρέπει να διευκρινιστεί σε ποιο επίπεδο ενοποιούνται κάτω από το ενιαίο σχήμα διακυβέρνησης (API, OAI-PMH, κάποιος άλλος τύπος διασύνδεσης. κ.ά);
    Επι παραδείγματι υπάρχουν σύγχρονες υποδομές ερευνητικών δεδομένων που έχουν αναπτυχθεί από τον Σύνδεσμο Ελληνικών Ακαδημαϊκών Βιβλιοθηκών (ΣΕΑΒ) οι οποίες θα μπορούσαν δυνητικά να ενταχθούν στο ενιαίο σχήμα.

  • 17 Δεκεμβρίου 2020, 00:47 | ΕΥΘΥΜΗΣ ΒΑΪΟΠΟΥΛΟΣ

    Συνεχής ενημέρωση των συνόλων δεδομένων στα αποθετήρια

    Τα ανοικτά δεδομένα δε μπορεί να παραμένουν στατικά. Θα πρέπει περιοδικά να ενημερώνονται και να εμπλουτίζονται με τα πλέον πρόσφατα δεδομένα, ώστε είναι εφικτή η συνεχής βελτίωση και επικαιροποίηση των αναλύσεων που στηρίζονται σε αυτά.

    Η διαρκής ενημέρωση των δεδομένων αφορά και τα δεδομένα Δημοσίου Σκοπού αλλά και τα δεδομένα στα θεματικά αποθετήρια. Υποθέτουμε ότι οι κύκλοι ζωής των δεδομένων αναφέρονται σε αυτή ακριβώς τη διαδικασία.

  • 17 Δεκεμβρίου 2020, 00:31 | ΕΥΘΥΜΗΣ ΒΑΪΟΠΟΥΛΟΣ

    Αξιοποίηση δεδομένων από θεματικά αποθετήρια και χρήση υπολογιστικών πόρων και εργαλείων επεξεργασίας & ανάλυσης δεδομένων

    Με ποιους τρόπους ένας ερευνητής ή μία επιχείρηση ή κάποιος οργανισμός θα έχει πρόσβαση, μέσω της Εθνικής Πύλης Ανοικτών Δεδομένων, σε σύνολα δεδομένων στα θεματικά αποθετήρια και σε υπολογιστικούς πόρους και εργαλεία για να διεξαγάγει την έρευνα του; Η πρόσβαση και αξιοποίηση δεδομένων και πόρων θα ακολουθεί πρότυπα και διαδικασίες που θα προβλέπονται από το Μοντέλο Διακυβέρνησης των Δεδομένων;

    Η Εθνική Πύλη Ανοικτών Δεδομένων θα εμπλουτιστεί με πιλοτικές εφαρμογές προστιθέμενης αξίας που αξιοποιούν σύνολα δεδομένων από τα θεματικά αποθετήρια;

    Για την συνδυασμένη αξιοποίηση (από μεγάλες επιχειρήσεις & ΜΜΕ, ακαδημαϊκούς φορείς και φορείς της Δημόσιας Διοίκησης) δεδομένων / μαζικών δεδομένων και πόρων (υπολογιστικής υποδομής, ΑΙ frameworks) θα υπάρχει διασύνδεση των αποθετηρίων δεδομένων με την Πλατφόρμα ΤΝ/ΜΜ και με Υπολογιστικά Συστήματα Υψηλών Επιδόσεων της χώρας; Θα υπάρξει μέριμνα για να προδιαγραφούν στο Μοντέλο Διακυβέρνησης των Δεδομένων απαιτήσεις σε σχέση με τη δυνατότητα αξιοποίησης δημόσιων και θεματικών δεδομένων για την ανάπτυξη λύσεων ΤΝ;

  • 16 Δεκεμβρίου 2020, 19:44 | ΕΥΘΥΜΗΣ ΒΑΪΟΠΟΥΛΟΣ

    Συγκέντρωση δεδομένων & σύνθεση συνόλων δεδομένων στα θεματικά αποθετήρια

    Είναι αναγκαίο να σχεδιαστούν επιμέρους δράσεις για συντονισμένη συλλογή & συγκέντρωση δεδομένων για τα διάφορα θεματικά πεδία από τους αρμόδιους φορείς και οργανισμούς και σύνθεση συνόλων δεδομένων για συγκεκριμένες περιοχές προβλημάτων, ανά πεδίο ή διαθεματικών.

    Οι δράσεις αυτές θα πρέπει να ευθυγραμμίζονται με τις οριζόντιες πολιτικές που ορίζονται στο Μοντέλο Διακυβέρνησης των Δεδομένων αλλά και τυχόν επιμέρους πολιτικές ανά τομέα. Κάθε σύνολο δεδομένων που θα αποτίθεται από το φορέα που τηρεί αυτά τα δεδομένα θα πρέπει να είναι μετασχηματισμένο σε μορφή προσανατολισμένη σε ανάλυση, καθώς, τα παραγωγικά συστήματα των φορέων όπου συντηρούνται τα δεδομένα αποθηκεύουν τα δεδομένα σε σχήματα που είναι προσανατολισμένα στην καθημερινή λειτουργία και υποστήριξη των διαδικασιών.

    Η επεξεργασία & διάθεση των θεματικών δεδομένων υποθέτουμε ότι θα γίνεται μέσα από την Εθνική Πύλη Ανοικτών Δεδομένων, όμοια με τα Δεδομένα Δημόσιου Σκοπού.