übrigens, trainierte spracherkennungsprogramme funktionieren ziemlich gut.
Lass mal drei Leute gleichzeitig in das Mikrofon sprechen und schau mal was eine (von mir aus auch trainierte) Spracherkennungssoftware daraus macht...
und bei normalen tönen sollte es noch einfach sein - das signal zu interpretieren. wenn dann die 440hz rein rauschen ist es eben ein a'
Und was ist, wenn sich zu dem A noch ein Cis und ein E dazugesellen? Und wenn der Sound kein reiner Sinus ist sondern zum Beispiel ein Klaviersound oder ein Synth-Pad mit LFO ist. Was ist wenn untem im bass ein A liegenbleibt und Du mit der Rechten Hand eine Melodie spielst? Bei einer normalen Klavierbegleitung ist es nicht selten, dass man fünf Tasten gleichzeitig drückt...
Das ganze wird dann ziemlich schnell ziemlich komplex.
Die Entwicklung einer solchen Software (also die das in Echtzeit macht) wäre sehr aufwändig, aber gleichzeitig ziemlich sinnlos, weil sie kaum praktischen Nutzen bringt weil MIDI heute einfach extrem billig ist.
Gruß, Dave