Το έργο παρουσιάστηκε για τους σκοπούς του μαθήματος της Ψηφιακής επεξεργασίας εικόνας. Ο απώτερος σκοπός του έργου είναι να βρίσκει σε ένα βίντεο κατα πόσο οι άνθρωποι διατηρούν τις αποστάσεις που προτάθηκαν κατά τον κορωνοϊό (δλδ 2 μέτρα), χρησιμοποιώντας αλγορίθμους υπολογιστικής όρασης (computer vision). Μια από τις απαιτήσεις του έργου ήταν όπως γίνει χρήση μηχανική μάθησης ή των νευρωνικών δικτύων (machine or deep learning), και χρησιμοποιήσαμε το YOLO. Χρησιμοποιήσαμε την υλοποιήση TrainYourOwnYOLO για να αναπτύξουμε το συγκεκριμένο έργο. Πιο κάτω αναγράφονται και οι πληροφορίες του αρχικού repository
Trivial
- Πιο ψηλός βαθμός του μαθήματος 🏆
Προαπαιτούμενα
Για να γίνει η εκπαίδευση του νευρωνικού μοντέλου χρησιμοποιήσαμε τις ακόλουθες βάσεις δεδομένων (εικόνων).
- Penn-Fudan Database (~200 εικόνες)
- INRIAPerson (~100 εικόνες)
- Εικόνες που βρήκαμε στο διαδίκτυο (~50 εικόνες) περαστικών, ανθρώπων, ποδηλάτων κτλπ.
- Το υλικό που βγάλαμε εμείς οι ίδιοι χρησιμοποιώντας drone στις εγκαταστάσεις του πανεπιστημίου
Οι εικόνες στο 3 και στο 4 έπρεπε να γίνουν annotated χειρακτικά χρησιμοποιώντας το εργαλείο labelImg.