Η οδύσσεια των δεδομένων και η πολιτικώς ορθή επιστήμη

315 Views |  1

 

Για να “συμμετάσχουν” με τον δικό τους τρόπο στην τελετή ανάληψης καθηκόντων από τον Trump φοιτητές στο Πανεπιστήμιο της Καλιφόρνια, Λος Άντζελες, οργάνωσαν hackathons άντλησης δεδομένων από ομοσπονδιακές βάσεις με στοιχεία για το κλίμα, φοβούμενοι ότι θα μπορούσαν να εξαφανιστούν από τη νέα διοίκηση.

Πρόκειται για μια προσπάθεια διατήρησης των δεδομένων, εν μέσω των αυξανόμενων ανησυχιών ότι η νέα διοίκηση ίσως διακόψει την πρόσβαση σε επιστημονικά δεδομένα που είναι αντίθετα στις πολιτικές τους απόψεις! Πριν λίγες μέρες η EPA (Environmental Protection Agency) ανέφερε ότι η ομάδα μετάβασης της υπηρεσίας σχεδίαζε να “επανεξετάσει” τα δεδομένα για το κλίμα στην ιστοσελίδα του οργανισμού. Αυτή η δράση είναι μέρος μιας σειράς συναφών πρωτοβουλιών όπως τα “Guerrilla Archiving” στο Πανεπιστήμιο του Τορόντο τον περασμένο μήνα, το Gov Data Hackathon του Internet Archive στο San Francisco και το DataRescue Philly στο Πανεπιστήμιο της Πενσυλβάνια στις αρχές Ιανουαρίου.

Ένα μεγάλο μέρος των συλλεγόμενων δεδομένων αποθηκεύονται στους servers του αρχείου End of Term Web Archive, που είναι μια συλλογική προσπάθεια για τη διατήρηση των στοιχείων στις κυβερνητικές ιστοσελίδες στις μεταβατικές περιόδους μεταξύ διαδοχικών διοικήσεων. Το Πανεπιστήμιο του Προγράμματος Penn της Πενσυλβανίας ξεκίνησε και την πρωτοβουλία DataRefuge project, ένα site που φιλοξενείται από τα Amazon Web Services, το οποίο θα χρησιμεύσει ως εναλλακτικό αποθετήριο για κυβερνητικά δεδομένα για το κλίμα και την περιβαλλοντική έρευνα κατά τη διάρκεια της διοίκησης Trump (και θα ειδοποιεί το χρήστη αν έχει αλλάξει κάτι μέσα σε αυτό). Άλλος σκοπός του DataRefuge είναι να δημιουργήσει αντίγραφα ασφαλείας των δεδομένων για το περιβάλλον που δεν μπορούν να συλλέξουν τα εργαλεία Web crawling, για παράδειγμα “harder-to-crack data sets” όπως διαδραστικούς χάρτες εκπομπής αερίων θερμοκηπίου που τροφοδοτούν τις βάσεις της EPA. Άλλες ομάδες εργασίας καταρτίζουν έναν κατάλογο ζωτικής σημασίας δεδομένων από τη NASA, την Εθνική Υπηρεσία Ωκεανών και Ατμόσφαιρας, το Τμήμα Γεωλογικής Επισκόπησης των ΗΠΑ, και άλλων φορέων. Σύμφωνα με την Laurie Allen, στη διεύθυνση ψηφιακών υποτροφιών του Penn, μερικά από τα πιο σημαντικά σύνολα δεδομένων δεν μπορούν να εξαχθούν με τα “συμβατικά” εργαλεία: είτε είναι πάρα πολύ μεγάλα ή πολύ σύνθετα, είτε φιλοξενούνται σε παλιό λογισμικό και οι διευθύνσεις URL τους δεν είναι πλέον λειτουργικές και οδηγούν σε σελίδες σφαλμάτων – γι αυτό οι ερευνητές πρέπει να γράφουν ειδικά προσαρμοσμένο κώδικα για να τα αντλήσουν. Επιπλέον, δεν αρκεί να κατέβουν τα δεδομένα – για να είναι λειτουργικά, πρέπει να είναι κατηγοριοποιημένα με εύχρηστο τρόπο και με ακριβείς περιγραφές για το περιεχόμενό τους. Για παράδειγμα, τα δεδομένα σχετικά με ατυχήματα λόγω επικίνδυνων υλικών (“Hazmat accidents” στο επιστημονικό jargon), που, σύμφωνα με τις αναφορές των ομάδων εργασίας, είναι σχεδόν 100.000 περιστατικά σε κάθε πολιτεία τα τελευταία 4 χρόνια, δεν μπορούν να είναι στον ίδιο “ψηφιακό σάκο” με τα δεδομένα για την μέτρηση της ακτινοβολίας ή με δεδομένα της NOAA για τους πολικούς πάγους ή τις ταχύτητες των ωκεανικών ρευμάτων.

Ενδιαφέρον έχει πως η ομάδα μετάβασης στη νέα διοίκηση είχε ζητήσει μια λίστα των υπαλλήλων του υπουργείου Ενεργείας που συμμετείχαν σε συνεδριάσεις για την Κλιματική Αλλαγή τα τελευταία χρόνια, ενώ ανησυχητικές είναι οι δημόσιες δηλώσεις από τους συμβούλους της προεκλογικής εκστρατείας που μιλούσαν για “πολιτικώς ορθή παρακολούθηση του περιβάλλοντος.”

Αυτή η τακτική έχει ιστορία στις ΗΠΑ. Στα τέλη του περασμένου έτους, προέκυψε ότι τμήματα της ιστοσελίδας Φυσικών Πόρων του Wisconsin ουσιαστικά είχαν ξαναγραφτεί για να αφαιρεθούν οι αναφορές στην αλλαγή του κλίματος. Επιπλέον, μια έρευνα του Κογκρέσου κατέληξε στο συμπέρασμα στην έκθεση του 2007 ότι η κυβέρνηση Μπους είχε κάνει συστηματική προσπάθεια να χειραγωγήσει την επιστήμη και να παραπλανήσει τα κέντρα χάραξης πολιτικής και το κοινό σχετικά με τους κινδύνους της υπερθέρμανσης του πλανήτη. Το Internet Archive που συνεργάστηκε με την πρωτοβουλία End of Term  το 2008 και το 2012, σημειώνει ότι πάνω από το 80% των αρχείων PDF σε ιστοσελίδες .gov εξαφανίστηκε κατά τη διάρκεια αυτής της τετραετούς περιόδου.

Οι ομάδες εργασίας αναμένουν να συλλέξουν περισσότερα από 100 terabytes δεδομένων φέτος, σε πολύτιμα 32-gigabyte zip drives, εστιάζοντας ιδίως σε στοιχεία για την κλιματική αλλαγή, που είναι μια ποσότητα σχεδόν τριπλάσια από τα δεδομένα που αρχειοθετήθηκαν τα προηγούμενα χρόνια. Το αρχικό πλάνο ήταν να συσχετίσουν τα δεδομένα μεταξύ τους και να διαβάσουν και την ιστορία ανάμεσα στα στοιχεία και τους αριθμούς τους (ας πούμε, να συσχετίσουν τις ατμοσφαιρικές μετρήσεις στις online βάσεις με τα στοιχεία των μετεωρολογικών αναφορών ώστε να συμπεράνουν τις πραγματικές επιβαρύνσεις στην ατμόσφαιρα συγκεκριμένων περιοχών στις ΗΠΑ), όμως, όταν ανακοινώθηκε η δήλωση της EPA και έγιναν δημόσιες δηλώσεις περί πολιτικώς ορθής επιστήμης, η όλη προσπάθεια άλλαξε προσανατολισμό και η οδηγία προς όλους πλέον ήταν “Red Fucking Alert: We’re archiving everything we can”.

Πηγές

https://www.technologyreview.com/s/603402/climate-data-preservation-efforts-mount-as-trump-takes-office/

Rogue Scientists Race to Save Climate Data from Trump

 

Πηγή Κεντρικής Φωτό  (Το κόκκινο αεροπλάνο είναι ένα DHC-3 Otter, και πετάει πάνω από τα παγόβουνα της Αλάσκας, στο πλαίσιο του προγράμματος Operation IceBridge-Alaska surveys of mountain glaciers in Alaska. Credit: Chris Larsen, Πανεπιστήμιο Alaska-Fairbanks)