


In den letzten Monaten hat die Gemeinschaft der künstlichen Intelligenz eine hitzige Debatte erlebt, die durch zwei einflussreiche, von Apple veröffentlichte Forschungsarbeiten ausgelöst wurde. Die erste, 'GSM-Symbolik' (Oktober 2024), und das zweite, 'Die Illusion des Denkens' (Juni 2025), stellten die angeblichen Denkfähigkeiten von Large Language Models in Frage und lösten in der Branche gemischte Reaktionen aus.
Wie bereits in unserem früheren Artikel über "Die Illusion des Fortschritts: Simulation einer allgemeinen künstlichen Intelligenz, ohne sie zu erreichen".analysiert haben, berührt die Frage des künstlichen Denkens den Kern dessen, was wir unter Intelligenz bei Maschinen verstehen.
Apple-Forscher führten eine systematische Analyse von Large Reasoning Models (LRM) durch, d. h. von Modellen, die ausführliche Argumentationsspuren erzeugen, bevor sie eine Antwort geben. Die Ergebnisse waren überraschend und für viele alarmierend.
In der Studie wurden die fortschrittlichsten Modelle klassischen algorithmischen Rätseln unterzogen:

Die Ergebnisse zeigten, dass selbst kleine Änderungen in der Problemformulierung zu erheblichen Leistungsschwankungen führen, was auf eine besorgniserregende Schwäche des Denkens hindeutet. Wie berichtet in AppleInsider-Berichterstattungnimmt die Leistung aller Modelle ab, wenn nur die numerischen Werte in den GSM-Symbolic-Benchmark-Fragen geändert werden".
Die Antwort der KI-Gemeinschaft ließ nicht lange auf sich warten. Alex Lawsen von Open Philanthropy veröffentlichte in Zusammenarbeit mit Claude Opus von Anthropic eine ausführliche Gegendarstellung mit dem Titel "Die Illusion des Denkens'.in der er die Methodik und die Schlussfolgerungen der Apple-Studie anzweifelt.
Als Lawsen die Tests mit alternativen Methoden wiederholte - indem er die Modelle aufforderte, rekursive Funktionen zu erzeugen, anstatt alle Züge aufzulisten - waren die Ergebnisse dramatisch anders. Modelle wie Claude, Gemini und GPT lösten Tower of Hanoi-Probleme mit 15 Datensätzen korrekt, weit jenseits der Komplexität, für die Apple null Erfolge meldete.
Gary Marcusein langjähriger Kritiker der Denkfähigkeiten von LLMs, begrüßte die Ergebnisse von Apple als Bestätigung seiner 20-jährigen These. Marcus zufolge haben LLMs nach wie vor Probleme mit der "Verteilungsverschiebung" - der Fähigkeit, über die Trainingsdaten hinaus zu verallgemeinern - und sind gleichzeitig "gute Löser von Problemen, die bereits gelöst wurden".
Die Diskussion hat sich auch auf spezialisierte Gemeinschaften wie LocalLlama auf Redditwo Entwickler und Forscher über die praktischen Auswirkungen von Open-Source-Modellen und die lokale Umsetzung diskutieren.
Diese Debatte ist nicht rein akademisch. Sie hat direkte Auswirkungen auf:
Wie in mehreren Beiträgen hervorgehoben technischen Erkenntnissenhervorgehoben wurde, besteht ein zunehmender Bedarf an hybriden Ansätzen, die eine Kombination darstellen:
Triviales Beispiel: ein KI-Assistent, der bei der Buchhaltung hilft. Das Sprachmodell versteht, wenn Sie fragen: "Wie viel habe ich diesen Monat für Reisen ausgegeben?" und extrahiert die relevanten Parameter (Kategorie: Reisen, Zeitraum: diesen Monat). Aber die SQL-Abfrage, die die Datenbank abfragt, die Summe berechnet und die steuerlichen Beschränkungen überprüft? Das wird durch deterministischen Code erledigt, nicht durch das neuronale Modell.
Beobachtern ist nicht entgangen, dass das Apple-Papier kurz vor der WWDC veröffentlicht wurde, was Fragen nach den strategischen Beweggründen aufwirft. Wie dieAnalyse von 9to5Mac"Der Zeitpunkt der Veröffentlichung des Apple-Papiers - kurz vor der WWDC - hat einige Augenbrauen aufgeworfen. War dies ein Meilenstein in der Forschung oder ein strategischer Schritt, um Apple in der breiteren KI-Landschaft neu zu positionieren?"
Die durch die Apple-Papiere ausgelöste Debatte erinnert uns daran, dass wir uns beim Verständnis der künstlichen Intelligenz noch in einem frühen Stadium befinden. Wie wir in unserem früheren Artikelhingewiesen, bleibt die Unterscheidung zwischen Simulation und echtem Denken eine der komplexesten Herausforderungen unserer Zeit.
Die eigentliche Lektion ist nicht, ob LLMs im menschlichen Sinne "denken" können oder nicht, sondern vielmehr, wie wir Systeme entwickeln können, die ihre Stärken nutzen und gleichzeitig ihre Grenzen ausgleichen. In einer Welt, in der KI bereits ganze Sektoren umgestaltet, stellt sich nicht mehr die Frage, ob diese Werkzeuge "intelligent" sind, sondern wie man sie effektiv und verantwortungsvoll einsetzt.
Die Zukunft der KI im Unternehmen wird wahrscheinlich nicht in einem einzigen revolutionären Ansatz liegen, sondern in der intelligenten Orchestrierung mehrerer sich ergänzender Technologien. Und in diesem Szenario wird die Fähigkeit, die Fähigkeiten unserer Tools kritisch und ehrlich zu bewerten, selbst zu einem Wettbewerbsvorteil.
Für Einblicke in die KI-Strategie Ihres Unternehmens und die Implementierung robuster Lösungen steht unser Expertenteam für maßgeschneiderte Beratungen zur Verfügung.