Habt ihr euch auch gefragt, wieso OpenAI das Spracherkennungstool Whisper gebaut hat? OpenAI macht eigentlich Large Language Models, während Spracherkennung eher traditionelles Machine Learning ist.

Stellt sich raus: Sie fanden Ende 2021 keine englischsprachigen Trainingsdaten mehr im Internet, hatten schon alles inhaliert. Inklusive allen Spams, allen nigerianischen Prinzen und allen Shitcoin-Scams.

Was also tun? Nun, sie bauten Whisper, saugten einmal Youtube leer, ließen Whisper gegen die Audiotracks laufen, und inhalierten das auch noch als Trainingsdaten.

Please support this channel by hitting the like and subscribe buttons, and ring the bell to get updates!!

Es gibt ja diese schöne Geschichte, wo ein Reporter Gandhi fragt, was er von westlicher Zivilisation hält. Und Gandhi antwortete: Das wäre eine großartige Idee!

12.05.2024