Ωραία είναι αυτή η φωτογραφία, αλλά που στο καλό τραβήχτηκε...;;;
Σε αυτό το συχνό ερώτημα, ένας πειραματικός αλγόριθμος που ανέπτυξαν ερευνητές της Google ήδη τα καταφέρνει καλύτερα από τους ανθρώπους.
Οι ερευνητές, με επικεφαλής τον Τομπάιας Γουέιαντ, ανέπτυξαν ένα σύστημα «βαθιάς μάθησης» (deep learning), το οποίο επιτρέπει τον γεωεντοπισμό της φωτογραφίας χρησιμοποιώντας μόνο πληροφορίες από τα εικονοστοιχεία της.
Εκ πρώτης όψεως, φαντάζει δύσκολο έως αδύνατο να καταλάβει κανείς που τραβήχτηκε μια φωτογραφία χωρίς να έχει άλλες πληροφορίες πέρα από την ίδια την εικόνα. Οι άνθρωποι συχνά χρησιμοποιούν ενδείξεις, όπως ο καιρός, τα φυτά και διάφορα αντικείμενα που φαίνονται στη εικόνα.
Υπάρχουν εξάλλου και διαδικτυακοί τόποι, όπως το GeoGuessr και το View from your Window, όπου οι χρήστες μπορούν να δοκιμάσουν τις ικανότητές τους.
Η ομάδα της Google ακολούθησe μια τελείως διαφορετική μέθοδο. Σε πρώτη φάση, χώρισαν την υδρόγειο σε τετραγωνάκια, των οποίων το μέγεθος εξαρτάται από τον αριθμό των φωτογραφιών που λαμβάνονται εκεί και αναρτώνται στο Διαδίκτυο.
Για παράδειγμα, το τετραγωνάκι της Νέας Υόρκης, όπου οι τουρίστες τραβούν χιλιάδες φωτογραφίες κάθε μέρα, είναι μεγαλύτερο από ό,τι το τετραγωνάκι μιας ερημικής έκτασης ίδιου εμβαδού.
Στη συνέχεια, οι ερευνητές τροφοδότησαν το σύστημα τους με εκατομμύρια αποθηκευμένες φωτογραφίες που συνοδεύονταν από πληροφορίες γεωεντοπισμού. Το λογισμικό, ένα «νευρωνικό δίκτυο» που μιμείται την αρχιτεκτονική του εγκεφάλου, δημιούργησε αντιστοιχίες ανάμεσα στα πίξελ των εικόνων και στα τα μέρη όπου τραβήχτηκαν οι φωτογραφίες.
Τελικά, η εφαρμογή δοκιμάσθηκε με 2,3 εκατομμύρια εικόνες από το Flickr, και κατάφερε να βρει σε ποια ήπειρο τραβήχτηκε κάθε φωτογραφία στο 48% των περιπτώσεων. Το ποσοστό πέφτει στο 28,4% όσον αφορά τη χώρα λήψης, στο 10,1% για την πόλη λήψης και στο 3,6% για τον συγκεκριμένο δρόμο της πόλης.
Τα ποσοστά αυτά μπορεί μην φαίνονται εντυπωσιακά, ξεπερνούν όμως κατά πολύ τις δυνατότητες των ανθρώπων -αυτό αποδείχθηκε όταν ο αλγόριθμος αναμετρήθηκε με δέκα εθελοντές.
Ο αλγόριθμος, λένε οι ερευνητές, θα μπορούσε να βελτιωθεί αποκτώντας την ικανότητα να αναγνωρίζει αντικείμενα και άλλες παραμέτρους όπως η αρχιτεκτονική των κτηρίων, η βλάστηση, οι πινακίδες κυκλοφορίας και το χρώμα δέρματος των εικονιζόμενων.
Η μελέτη είναι διαθέσιμη στην υπηρεσία προδημοσίευσης ArXiv.
Δημοσίευση σχολίου Blogger Facebook
Παρακαλώ, την προσοχή σας ! ! !
* Εάν εντοπίσετε κάποιο πρόβλημα σε κάποια δημοσίευση (μη ενεργός συνδεσμος λ.χ. ή οτιδήποτε άλλο), παρακαλούμε κάντε τον κόπο να γράψετε στα σχόλιά σας, το οποιοδήποτε πρόβλημά σας, ώστε να προβούμε στην άμεση διόρθωσή του.
Επίσης, μπορείτε να αποστείλετε ένα "Ευχαριστώ" προς όσους ασχολήθηκαν & σας προσέφεραν ένα... κομμάτι από τη γνώση τους.
Παράκληση προς τους φίλους αναγνώστες-σχολιαστές:
* Να αποφεύγετε να γράφετε με greekglish γιατί τα σχόλιά σας ΔΕΝ θα γίνονται δεκτά.
* Αποφεύγετε το spamάρισμα στα σχόλια. - Please don't spam me!
* Σε περίπτωση που δεν έχετε καταλάβει κάτι, επικοινωνήστε μαζί μας μέσα από την φόρμα των σχολίων και θα σας απαντήσουμε σε εύλογο χρόνο, γι' αυτό ΜΗΝ καταφεύγετε στη αποστολή e-mail για τις όποιες απορίες σας.
* Χρησιμοποιήστε το Reply (που βρίσκεται κάτω από την εικόνα χρήστη), αν θέλετε να του απευθύνετε το λόγο, ή να απαντήσετε σε προυγούμενο σχόλιο.
* Το μέγιστο όριο χαρακτήρων είναι 4.096
* Τα σχόλιά σας θα δημοσιεύονται μετά τον απαραίτητο έλεγχο.
Σημείωση: Όσοι θέλετε να παίρνετε ειδοποιήσεις για τα σχόλια που κανετε, μην ξεχάσετε να τικάρετε το κουμπί "Να λαμβάνω ειδοποιήσεις"
Σας Ευχαριστούμε για την κατανόηση και την επίσκεψή σας.!