Noise Meter - Αποκτήστε μια βαθύτερη κατανόηση της καταστολής θορύβου
Αφού κατανοήσουμε τις βασικές διαφορές μεταξύ της καταστολής θορύβου (καταστολή του περιβαλλοντικού θορύβου των ηχείων για να ακούν καθαρά οι ακροατές από απόσταση) και της ενεργητικής μείωσης θορύβου (αντισταθμίζοντας τον περιβαλλοντικό θόρυβο του ίδιου του ακροατή), ας εστιάσουμε στον τρόπο επίτευξης καταστολής θορύβου.
Μια μέθοδος είναι η χρήση πολλαπλών μικροφώνων για την καταστολή δεδομένων. Η συλλογή δεδομένων από πολλές τοποθεσίες θα έχει ως αποτέλεσμα οι συσκευές να λαμβάνουν παρόμοια (αλλά ακόμα διαφοροποιημένα) σήματα. Το φωνητικό σήμα που λαμβάνεται από το μικρόφωνο κοντά στον ομιλούντα πληθυσμό είναι σημαντικά ισχυρότερο από αυτό του δευτερεύοντος μικροφώνου. Δύο μικρόφωνα θα λαμβάνουν μη φωνητικό ήχο φόντου με παρόμοια ισχύ σήματος. Αφαιρέστε τις πληροφορίες ήχου που συλλέγονται από το ισχυρό μικρόφωνο φωνής και το δευτερεύον μικρόφωνο και η υπόλοιπη πλειοψηφία είναι οι φωνητικές πληροφορίες. Όσο μεγαλύτερη είναι η απόσταση μεταξύ των μικροφώνων, τόσο μεγαλύτερη είναι η διαφορά σήματος μεταξύ πιο κοντινών και πιο μακρινών μικροφώνων, καθιστώντας ευκολότερη τη χρήση αυτού του απλού αλγόριθμου για την καταστολή του θορύβου. Ωστόσο, όταν δεν μιλάτε ή όταν περιμένετε να αλλάξουν τα φωνητικά δεδομένα με την πάροδο του χρόνου (όπως όταν περπατάτε ή τρέχετε και το τηλέφωνό σας συνεχίζει να κουνιέται), η αποτελεσματικότητα αυτής της μεθόδου θα μειωθεί. Η καταστολή θορύβου πολλαπλών μικροφώνων είναι σίγουρα αξιόπιστη, αλλά υπάρχουν μειονεκτήματα στο πρόσθετο υλικό και την επεξεργασία.
Λοιπόν, τι θα γινόταν αν υπήρχε μόνο ένα μικρόφωνο; Εάν δεν χρησιμοποιούνται πρόσθετες πηγές ήχου για επαλήθευση/σύγκριση, μια λύση μικροφώνου θα βασίζεται στην κατανόηση των λαμβανόμενων χαρακτηριστικών θορύβου και στο φιλτράρισμα τους. Αυτό σχετίζεται με τους προαναφερθέντες ορισμούς του θορύβου σταθερής κατάστασης και μη σταθερού θορύβου. Ο θόρυβος σταθερής κατάστασης μπορεί να φιλτραριστεί αποτελεσματικά μέσω αλγορίθμων DSP, ενώ ο μη στάσιμος θόρυβος αποτελεί πρόκληση, τα βαθιά νευρωνικά δίκτυα (DNN) μπορούν να βοηθήσουν στην επίλυση του προβλήματος.
Αυτή η μέθοδος απαιτεί ένα σύνολο δεδομένων για την εκπαίδευση του δικτύου. Αυτό το σύνολο δεδομένων αποτελείται από διαφορετικούς (σταθερής κατάστασης και μη) θόρυβο και καθαρή ομιλία, δημιουργώντας ένα συνθετικό θορυβώδες μοτίβο ομιλίας. Τροφοδοτήστε το σύνολο δεδομένων ως είσοδο στο DNN και εξάγετε το με καθαρή φωνή. Αυτό θα δημιουργήσει ένα μοντέλο νευρωνικού δικτύου που θα εξαλείφει τον θόρυβο και θα παράγει μόνο καθαρή ομιλία.
Ακόμη και με εκπαιδευμένα DNN, υπάρχουν ακόμη ορισμένες προκλήσεις και δείκτες που πρέπει να ληφθούν υπόψη. Εάν θέλετε να εκτελείτε σε πραγματικό χρόνο με χαμηλή καθυστέρηση, χρειάζεστε ισχυρή επεξεργαστική ισχύ ή μικρότερο DNN. Όσο περισσότερες παράμετροι στο DNN, τόσο πιο αργή είναι η ταχύτητα λειτουργίας του. Ο ρυθμός δειγματοληψίας ήχου έχει παρόμοια επίδραση στην καταστολή του ήχου. Ένας υψηλότερος ρυθμός δειγματοληψίας σημαίνει ότι το DNN πρέπει να χειρίζεται περισσότερες παραμέτρους, αλλά με τη σειρά του θα επιτύχει παραγωγή υψηλότερης ποιότητας. Η φωνητική επικοινωνία στενής ζώνης είναι ιδανική επιλογή για καταστολή θορύβου σε πραγματικό χρόνο.
Αυτός ο τύπος επεξεργασίας είναι όλες εντατικές εργασίες και το cloud computing είναι πολύ εξειδικευμένο στην ολοκλήρωση τέτοιων εργασιών, αλλά αυτή η μέθοδος αυξάνει σημαντικά την καθυστέρηση. Λαμβάνοντας υπόψη ότι οι άνθρωποι μπορούν να διακρίνουν με αξιοπιστία καθυστερήσεις περίπου 108 χιλιοστών του δευτερολέπτου ή περισσότερο, η πρόσθετη καθυστέρηση που προκαλείται από την επεξεργασία του υπολογιστικού νέφους δεν είναι σαφώς ιδανικό αποτέλεσμα. Ωστόσο, η εκτέλεση DNN στην άκρη απαιτεί ορισμένες έξυπνες ρυθμίσεις. Η CEVA δεσμεύεται πάντα να βελτιώνει τις δυνατότητες επεξεργασίας φωνής και ομιλίας. Αυτό περιλαμβάνει επικυρωμένους αλγόριθμους σαφήνειας ομιλίας και αναγνώρισης εντολών - αυτοί οι αλγόριθμοι παρέχουν σαφή επικοινωνία και φωνητικό έλεγχο ακόμη και στις άκρες. Καλώς ήρθατε να επικοινωνήσετε μαζί μας και να ακούσετε προσωπικά.
