mastodon.social is one of the many independent Mastodon servers you can use to participate in the fediverse.
The original server operated by the Mastodon gGmbH non-profit

Administered by:

Server stats:

380K
active users

@thedodger Ja, das ist erwiesen:

nature.com/articles/s41586-024

> We find that indiscriminate use of model-generated content in training causes irreversible defects in the resulting models, in which tails of the original content distribution disappear.

und

> The described process demonstrates that fine-tuning of language models does not curb the effects of model collapse

Greifbar: durch KI-Inzucht werden alle Hunde Golden Retriever.

@TheMorpheus

NatureAI models collapse when trained on recursively generated data - Nature Analysis shows that indiscriminately training generative artificial intelligence on real and generated content, usually done by scraping data from the Internet, can lead to a collapse in the ability of the models to generate diverse high-quality output.
Morpheus

@ArneBab @thedodger ja, tatsächlich wobei man ja lange vermutet hatte, dass project strawberry (das jetzige O1 Modell) mit synthetischen Daten lernen kann - sprich sich selbst Trainingsdaten generieren kann.
Was da intern vorgeht, keine Ahnung, aber mit Sicherheit wird dran gearbeitet oder geforscht

@TheMorpheus Ich gehe davon aus, dass ein begrenztes Lernen auf synthetischen Daten möglich ist, weil Menschen zumindest zum Teil ja auch lernen, indem sie in Träumen (synthetischen Daten) die Erfahrungen verarbeiten.

Wir müssen aber unsere Vorstellungen immer wieder mit der greifbaren Realität abgleichen, sonst lernen wir Sachen falsch.

Deswegen gehe ich davon aus, dass KI das auch braucht.

@thedodger