ΑΠΘ – Duke ενώνουν δυνάμεις κατά του COVID-19

 

Ερευνητές από το Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης και το Πανεπιστήμιο Duke των ΗΠΑ συγκέντρωσαν και κοινοποίησαν στις 26 Μαρτίου 2020 μία βάση δεδομένων με επιστημονικά άρθρα από όλον τον κόσμο, σχετικά με τη μελέτη του COVID-19. Ονομάζεται γράφος βιβλιογραφικών αναφορών, διότι τα άρθρα δεν απαριθμούνται απομονωμένα, αλλά είναι συνδεδεμένα με τις παραπομπές και τις αναφορές τους. Τα βιβλιογραφικά δεδομένα είναι διαθέσιμα στους ακόλουθους συνδέσμους:

http://lg-covid-19-hotp.cs.duke.edu

http://www.kaggle.com/nikospitsianis/lgcovid19hotp

http://dx.doi.org/10.5281/zenodo.3728215

Στον πρώτο σύνδεσμο, νέα άρθρα προστίθενται καθημερινά και τα διαγράμματα ενημερώνονται εβδομαδιαία. Η τρέχουσα έκδοση έχει περισσότερα από 100 χιλιάδες άρθρα, από τα οποία πάνω από χίλια έχουν δημοσιευθεί από τον Ιανουάριο του 2020 μέχρι σήμερα, ενώ συνολικά ο γράφος έχει περίπου 1 εκατομμύριο συνδέσμους. Ο αριθμός συνδέσεων ανά κόμβο είναι πολύ υψηλότερος από ό,τι παρατηρείται συνήθως σε γράφους αναφορών, σημειώνουν οι ερευνητές. Ιδιαίτερο ενδιαφέρον παρουσιάζουν οι αναλύσεις που βασίζονται στον γράφο, όπως κατανομές και λίστες άρθρων με βάση τον αριθμό των ετεροαναφορών, και «δίσκους μελέτης». Στους άλλους δύο συνδέσμους αποθηκεύονται τα βιβλιογραφικά δεδομένα, τα οποία ενημερώνονται σε εβδομαδιαία βάση.

Η δημιουργία των δίσκων βασίζεται στη τεχνική αναπαράστασης στοχαστικού γράφου (stochastic graph embedding), η οποία παρουσιάζεται σε πρόσφατα δημοσιευμένο έργο των ερευνητών. Οι ομαδοποιήσεις στον δίσκο απεικονίζουν ισχυρές διασυνδέσεις μεταξύ των ερευνητικών δραστηριοτήτων των γειτονικών άρθρων. Επιπλέον, οι ερευνητές προσφέρουν μία διαδραστική έκδοση του δίσκου, που επιτρέπει στον χρήστη να βλέπει, να εντοπίζει και να εξερευνά τα άρθρα σύμφωνα με τα ενδιαφέροντα και την τεχνογνωσία του. Έτσι ο χρήστης δεν περιορίζεται στους καταλόγους άρθρων που προσφέρει μια συμβατική μηχανή αναζήτησης. Επόμενος στόχος των ερευνητών είναι η εκτεταμένη ανάλυση των δεδομένων με σκοπό την ανίχνευση κοινοτήτων και την ταξινόμηση των άρθρων σε θεματικές ενότητες, προκειμένου να διευκολυνθεί περαιτέρω η συνεχιζόμενη μελέτη του COVID-19.

Όπως σημειώνει ο κ. Πιτσιάνης «Δύο άρθρα, δηλαδή δύο σημεία της “σφαίρας” απεικονίζονται σε αυτή σε κοντινή απόσταση, εάν οι αναφορές τους ή οι  αναφορές τρίτων άρθρων προς αυτά είναι αριθμητικά πολλές».

Επόμενος στόχος των ερευνητών είναι η εκτεταμένη ανάλυση των δεδομένων με σκοπό την ανίχνευση κοινοτήτων και την ταξινόμηση των άρθρων σε θεματικές ενότητες, προκειμένου να διευκολυνθεί περαιτέρω η συνεχιζόμενη μελέτη του COVID-19. Για πληροφορίες και διευκρινήσεις απευθυνθείτε στο nikos.pitsianis@auth.gr.