Das ultimative Ziel von Slide Creator ist es, die Lücke zwischen KI-gesteuerter Kreativität und der starren, deterministischen Welt von Microsoft PowerPoint zu schließen. Dies erfordert ein tiefes, forschungsbasiertes Verständnis derOffice Open XML (OOXML)Spezifikation – der ISO/IEC 29500-Standard, der das „.pptx“-Format definiert.
1. Die Native Anchor Architecture™
Die meisten „PPTX-Exporteure“ behandeln PowerPoint als „dummen“ Container, der Elemente als schwebende Bilder oder nicht standardmäßige Formen platziert. Unsere Forschung war der PionierNative Anchor Architecture™, was sicherstellt, dass:
Jedes Textfeld ist ein natives PowerPoint` Element.
Jedes Diagramm ist ein natives Excel-gestütztes Diagramm` Objekt.
Jeder Ankerpunkt wird mathematisch berechnet, um Layoutabweichungen beim Öffnen in verschiedenen PowerPoint-Versionen (2016-365) zu verhindern.
2. Lösung der „nichtdeterministischen“ Lücke
KI-Modelle sind nicht deterministisch; Sie geben nicht immer genau die gleichen Koordinaten aus. OOXML ist jedoch streng deterministisch. Unsere Forschung zuMittlere Schemaübersetzungerstellt eine „Pufferschicht“, in der die von der KI generierte Entwurfsabsicht validiert und an einem starren, OOXML-kompatiblen Raster „eingehängt“ wird, bevor die Datei zusammengestellt wird.
3. Hochleistungs-XML-Assembly
Das Erstellen eines 100-Folien-Decks mit komplexen Vektorgrafiken und hochauflösenden Bildern kann rechenintensiv sein. Wir haben ein Hochleistungsgerät entwickeltStreaming-XML-Generatorin Rust, dass:
Reduziert die Zeit zum Zusammenstellen einer „.pptx“-Datei im Vergleich zu Standard-Python- oder Node.js-Bibliotheken um 85 %.
Minimiert den Speicheraufwand, indem Folien-XML in Blöcken verarbeitet wird, anstatt das gesamte Dokument in den RAM zu laden.
4. Reverse-Engineering-Layoutdrift
Einer unserer Hauptforschungsschwerpunkte ist „Drift Analysis“. Wir öffnen generierte Decks programmgesteuert in verschiedenen Umgebungen (Windows, macOS, Web, Mobile) und nutzen Computer Vision, um winzige Verschiebungen in der Elementplatzierung zu erkennen. Diese Daten werden in unsere Trainingsschleife zurückgeführt, um die Präzision unserer generativen Layoutmodelle zu verbessern.
5. Zukunft von OOXML: AI-native Erweiterungen
Wir befürworten und entwickeln „AI-native“ Erweiterungen des OOXML-Standards, die eine bessere Einbettung von Metadaten ermöglichen würden – so dass sich eine KI „merken“ kann, warum sie ein bestimmtes Element an einer bestimmten Stelle platziert hat, was die Zusammenarbeit zwischen Mensch und Maschine erleichtert.
Um zu sehen, wie wir Markenregeln auf diese Layouts anwenden, besuchen Sie unsereDesign-Semantik page.