Η Γενιά Του MP3

Printable View

Show 40 post(s) from this thread on one page

01-10-2007, 15:11
Kingdom Gone

μλκ πως φαινεται ομως οταν καποιος ειναι τιγκα ψωνισμένος...
01-10-2007, 15:18
FaithFails

Quote:

Originally Posted by phthoggon

Quote:

Originally Posted by FaithFails

Μιλάμε για τον ίδιο τομέα αλλά εγώ βασίζομαι σε επιστημονική ορολογία. Στη Φωνητική ο όρος Phon δεν υπάρχει ως πειραματικά αποδεδειγμένη έννοια. Θεωρείται αυθαίρετη σύμβαση και δεν το χρησιμοποιούμε στις μετρήσεις. Ο όρος καταργεί κάθε έννοια επιστήμης αφού θεωρεί υποκειμενικό οτιδήποτε, άρα τους νόμους της Φυσικής, των Μαθηματικών, της Γλωσσολογίας κλπ. Ψάξτο λίγο καλύτερα. Εγώ δε θυμάμαι περισσότερα.

όχι όχι δε το θεωρεί υποκειμενικό έτσι όπως το εννοείς. υπάρχει ένα συγκεκριμένο σύστημα στο οποίο τα αντικειμενικά db του εξωτερικού χώρου γίνονται phon του "percieved loudness" του ανθρώπινου αυτιού. δε λέω τπτ παραπάνω όμως επειδή είναι πολύ αόριστα στη μνήμη μου αυτή τη στιγμή και μετά θα έρθει ο κόιλ και θα μας κράζει!!!!!!!

Ούτε εγώ τα θυμάμαι καλά αυτά τα Phon αλλά θυμάμαι ότι ο ίδιος νόμος ή αλγόριθμος τεσπα φέρνει ως παραδείγματα και άλλους νόμους (π.χ. βαρύτητα) και τους υποκειμενικοποιεί. Τι να κάνουμε, αυτά τα αισθητήρια έχουμε, έτσι καταλαβαίνουμε τα κιλά μας :P
01-10-2007, 15:19
FaithFails

Quote:

Originally Posted by Kingdom Gone

μλκ πως φαινεται ομως οταν καποιος ειναι τιγκα ψωνισμένος...

Επειδή ξέρεις κάτι λόγω επαγγέλματος σημαίνει ότι είσαι ψώνιο?
Μάλιστα. Οκ.
01-10-2007, 15:25
Rotting_Christ

Quote:

Originally Posted by FaithFails

Quote:

Originally Posted by Kingdom Gone

μλκ πως φαινεται ομως οταν καποιος ειναι τιγκα ψωνισμένος...

Επειδή ξέρεις κάτι λόγω επαγγέλματος σημαίνει ότι είσαι ψώνιο?
Μάλιστα. Οκ.

mi thigese vre epistimona :!:
01-10-2007, 15:31
FaithFails

Δε θίχτηκα, απλά δεν ήταν ωραίο σχόλιο από κάποιον που δε με ξέρει. Εξάλλου η δουλειά δεν είναι ντροπή.
01-10-2007, 15:41
ikonoklast

Καμία δουλειά δεν είναι ντροπή. Επίσης εγώ σας συγχωρώ όλους.
01-10-2007, 15:58
FaithFails

Quote:

Originally Posted by ikonoklast

Καμία δουλειά δεν είναι ντροπή. .

Ξέρω 1-2 που είναι
01-10-2007, 16:01
ikonoklast

Για πες.
01-10-2007, 16:26
enitharmon

Quote:

Originally Posted by phthoggon

Quote:

Originally Posted by enitharmon

μπορείτε επίσης να μου πείτε αν το tinnitus θα εξαφανιστεί ποτέ;

Όχι δε θα ξαφανιστεί, άμα σου σφυρίζει για παραπάνω από 3 μέρες έχεις πάθει μόνιμη ζημιά. Να μη πας σε grind συναυλίες ενιθάρμον, καλά να πάθεις!!

μα δεν πήγα :( (πούστηδες apokalyptische reiter μου καταστρεψατε ταφτια)

παίρνω :lsd: όμως και καλυτερεύει

συνεχίστε
01-10-2007, 16:29
sfinotouvlaki

τι είναι tinnitus;

εντάξει είδα τι είναι. και μένα μου χε γαμηθεί η ακοή (δε γράφω εξαιτίας ποιου λάηβ γιατί θα καταστραφεί το φόρουμ) στο δεξί αυτί για κάνα 6μηνο :?
01-10-2007, 17:09
enitharmon

εμένα δε μου χει γαμηθεί η ακοή, απλά έχω έναν ήχο όλο δικό μου@!
01-10-2007, 17:17
phthoggon

Quote:

Originally Posted by enitharmon

πούστηδες apokalyptische reiter μου καταστρεψατε ταφτια

και grind παίζουνε οι αποκαλύπτισχσκε εκτός των άλλων. χοχοχο.
02-10-2007, 08:58
Coil

Quote:

Originally Posted by FaithFails

Λοιπόν, δεν υπάρχει ψυχοακουστική καταρχάς.

:shock: Ας μην είμαστε απόλυτοι!

Σε όλα τα υπόλοιπα που γράφεις συμφωνω αλλά τα psychoacoustics είναι ένας ολόκληρος ξεχωριστός κλάδος στον τομέα της ακουστικής αλλά και της ψυχολογίας.
02-10-2007, 09:07
Coil

Επίσης on topic ένα πάρα πολυ καλό άρθρο για την κωδικοποιηση των mp3 σε συνάρτηση με την ανθρώπινη ακοή (καμπύλες Fletcher - Munson) κλπ.

Οι codecs ΜP3 χρησιμοποιούν ως βασικό μοντέλο ακοής αυτό που βασίζεται στις καμπύλες κατωφλίου ακουστότητας (Minimal Audition Threshold). Η ανθρώπινη ακοή παρουσιάζει την μέγιστη ευαισθησία της στην περιοχή 1kHz-5kHz και έξω από τα όρια αυτά μειώνεται δραστικά. Οι Fletcher και Munson κατασκεύασαν μία δέσμη από καμπύλες ελάχιστης ακουστότητας (οι οποίες περιγράφουν την στάθμη ηχητικής πίεσης που πρέπει να έχει ένας ήχος για να είναι μόλις ακουστός σε συνάρτηση με την συχνότητά του) όπου φαίνεται πώς η ευαισθησία της ακοής μεταβάλεται όχι μόνο με την συχνότητα αλλά και με την ένταση (loudness). Οσο μικρότερη είναι η ένταση, τόσο μικρότερη η ευαισθησία της ακοής και τόσο μεγαλύτερη στάθμη απαιτείται για να γίνει ακουστή μία συγκεκριμένη συχνότητα. Οι καμπύλες Fletcher/Munson προσφέρουν ένα πρώτο κριτήριο για την συμπίεση: Οι πληροφορίες κάτω από το κατώφλι ακουστότητας μπορούν να αποκοπούν από το σήμα ή, σκεπτόμενοι αντίστροφα, μπορούμε να αποθηκεύσουμε ανεπιθύμητα σήματα -όπως ο θόρυβος κβάντισης- σε περιοχές όπου το κατώφλι ακουστότητας είναι υψηλό. Ωστόσο πολύ μεγαλύτερο ενδιαφέρον έχει το φαινόμενο της επικάλυψης (masking): Με δεδομένους δύο γειτονικούς ήχους (δηλαδή ήχους με παραπλήσιες συχνότητες) ο ισχυρότερος αλλοιώνει τοπικά την καμπύλη κατωφλίου ακουστότητας επικαλύποντας τον ασθενέστερο ο οποίος πλέον δεν γίνεται αντιληπτός από τους ακροατές. Το μοντέλο που χρησιμοποιήται στον codec MP3 κάνει ακριβώς αυτό: Υπολογίζει σε κάθε στιγμή το φασματικό περιεχόμενο του σήματος, αποφασίζει ποιοί ήχοι επικαλύπτονται από ισχυρότερους και δεν τους κωδικοποιεί. Σε κάθε χρονική στιγμή, ο codec έχει στην διάθεσή του έναν αριθμό ψηφίων, ο οποίος εξαρτάται από τον βαθμό συμπίεσης που του έχει ζητηθεί (δηλαδή το επιτρεπόμενο bitrate). Καθώς η συμπίεση εξελίσσεται δεν χρησιμοποιούνται όλα τα ψηφία, ιδιαίτερα αν η στιγμιαία μορφή του σήματος είναι "εύκολα" συμπιέσιμη, έτσι είναι δυνατή η συντήρηση μίας δεξαμενής ψηφιών (bits reservoir) από την οποία αντλούνται περισσότερα ψηφία για σήματα που απαιτούν μεγαλύτερη ακρίβεια στην κωδικοποίηση.
Ο βασικός μηχανισμός του μοντέλου επικάλυψης, υποβοηθείται στην περίπτωση του MP3 και από δύο άλλους μηχανισμούς:
Ανάλογα με την πολυπλοκότητα του προγράμματος και τις ποιοτικές απαιτήσεις του ο χρήστης μπορεί να επιλέξει την κωδικοποίηση "Joint Stereo" κατά την οποία, κωδικοποιούνται οι μεν χαμηλές συχνότητες ως ένα μονοφωνικό κανάλι (mid channel, L+R), οι δε υψηλές (οι οποίες φέρουν κατά τεκμήριο και τις πληροφορίες για την στερεοφωνική εικόνα) σε ένα δεύτερο κανάλι ως διαφορές μεταξύ των αρχικών καναλιών (side channel, L-R).
To τελευταίο εργαλείο για την μείωση του bitrate που χρησιμοποιεί ο codec MP3 είναι, τέλος, γνωστό ως εντροπική κωδικοποίηση (entropy coding) ένα μάλλον τρομακτικό όνομα για μία διαδικασία η οποία κωδικοποιεί τα ψηφία που προκύπτουν από τα προηγούμενα στάδια με βάση την πιθανότητα εμφάνισής τους (probability coding, κατ΄αναλογίαν με τον γραπτό λόγο, όπου κάποιες λέξεις έχουν μεγαλύτερη πιθανότητα εμφάνισης σε σχέση με άλλες). Η εντροπική κωδικοποίηση είναι γνωστή και ως Huffman Coding και είναι μια μή-απωλεστική διαδικασία.
Από τα παραπάνω, γίνεται προφανές ότι το ψυχοακουστικό μοντέλο για την συμπίεση στην περίπτωση του MP3 "τρέχει" στο πεδίο της συχνότητας (γεγονός λογικό, αν αναλογιστεί κανείς ότι τόσο οι καμπύλες Fletcher/Munson όσο και η καμπύλη που περιγράφει το φαινόμενο της επικάλυψης έχουν ως οριζόντιο άξονα την συχνότητα. Ωστόσο, το ηχητικό σήμα εξελίσεται στον χρόνο. Πώς μεταφερόμαστε από το πεδίο του χρόνου στο πεδίο της συχνότητας για να κάνουμε τους υπολογισμούς μας; Στην περίπτωση του MP3 (αλλά και των codecs MPEG-2 AAC, MPEG-4 AAC, Ogg Vorbis και AC-3 -o τελευταίος χρησιμοποιήται από το Dolby Digital) χρησιμοποιήται μία πολύπλοκη μαθηματική διαδικασία κατά την οποία το υπό κωδικοποίηση μέρος του σήματος (block) υπόκειται σε επεξεργασία από μία τράπεζα φίλτρων (filter bank) η οποία χωρίζει το φάσμα σε 32 περιοχές και στην συνέχεια σε μετασχηματισμό MDC (Μοdified Discrete Cosine Transform). To σύνολο της διαδικασίας βασίζεται στις αρχές του μετασχηματισμού Fourier, ο οποίος αναλύει ένα σήμα εξελισσόμενο στον χρόνο σε μία σειρά συνιστωσών στο πεδίο της συχνότητας.

Στις παραπάνω τεχνικές, προστέθηκε, το 2001, μία ακόμη, με την ονομασία SBR (Spectral Band Replication, από την Coding Technologies), μετονομάζοντας τον codec που την υποστηρίζει σε MP3Pro. Ο τυπικός codec MP3 όταν λειτουργεί σε χαμηλά bitrates (μέχρι 96kbps, τα οποία απαιτούνται για streaming και μεταφορά δεδομένων από το διαδίκτυο) έχει σχετικά περιορισμένο εύρος συχνοτήτων που κυμαίνεται από τα 8-11kHz για bitrates 64kbps μέχρι τα 15kHz για bitrates 96kbps, μία επίδοση που είναι γνωστή και ως "FM Quality". Η τεχνική SBR χρησιμοποιεί την μορφή του φάσματος στις χαμηλές και τις μεσαίες συχνότητες καθώς και πληροφορίες για την μορφή του φάσματος στις υψηλές που έχουν κωδικοποιηθεί μαζί με το σήμα για να δημιουργήσει εκ του μηδενός την περιοχή που λείπει. Η τεχνική αυτή είναι πολύ αποτελεσματική αλλά απαιτεί πολύ μεγαλύτερη ισχύ επεξεργασίας: Για ένα σήμα με bitrate 64kbps (με πραγματικό εύρος 8kHz), χρησιμοποιεί τα 4kbps για την μεταφορά των παραμέτρων που περιγράφουν το φάσμα στις υψηλές συχνότητες και επιτρέπει την δημιουργία της περιοχής από τα 8kHz μέχρι τα 16kHz, απαιτώντας όμως τριπλάσια ισχύ από τον επεξεργαστή.

:shock:
02-10-2007, 10:56
fandango

Quote:

Originally Posted by ikonoklast

Για πες.

ΕΠ.ΟΠ :)

Show 40 post(s) from this thread on one page