Gemeinsame PM von TU Berlin, BIFOLD, Google DeepMind, Max-Planck-Institut für Bildungsforschung und Max-Planck-Institut für Kognitions- und Neurowissenschaften Auch wenn die so genannten Vision Foundation Modelle, Computermodelle für die automatisier…
Gemeinsame PM von TU Berlin, BIFOLD, Google DeepMind, Max-Planck-Institut für Bildungsforschung und Max-Planck-Institut für Kognitions- und Neurowissenschaften Auch wenn die so genannten Vision Foundation Modelle, Computermodelle für die automatisierte Bilderkennung, in den vergangenen Jahren enorme Fortschritte gemacht haben – sie unterscheiden sich immer noch deutlich von dem menschlichen visuellen Verständnis. Zum Beispiel erfassen sie in der Regel keine mehrstufigen semantischen Hierarchien und haben …
