Die Grundidee ist, ein neuronales Netz nicht mit vorgegebenen Lösungen (Supervised Learning) oder Belohnungen (Reinforcement Learning) zu trainieren, sondern das Netz sich mit seinen eigenen Vorhersagen schrittweise selbst in einem iterativen Prozess …
Die Grundidee ist, ein neuronales Netz nicht mit vorgegebenen Lösungen (Supervised Learning) oder Belohnungen (Reinforcement Learning) zu trainieren, sondern das Netz sich mit seinen eigenen Vorhersagen schrittweise selbst in einem iterativen Prozess verbessern zu lassen. Zu Beginn ist das neuronale Netz untrainiert. Indem das Netz kontinuierlich eigene Lösungen generiert und diese Lösungen als "Expertenwissen" betrachtet, lernt es, sich schrittweise selbst zu verbessern. Die Arbeit „Self-Improvement for Neural …