L'objectif ultime de Slide Creator est de combler le fossé entre la créativité basée sur l'IA et le monde rigide et déterministe de Microsoft PowerPoint. Cela nécessite une compréhension approfondie, fondée sur la recherche, duOffice Open XML (OOXML)spécification : la norme ISO/IEC 29500 qui définit le format « .pptx ».
1. L'architecture d'ancrage native™
La plupart des « exportateurs PPTX » traitent PowerPoint comme un conteneur « stupide », plaçant des éléments sous forme d'images flottantes ou de formes non standard. Notre recherche a été la première àArchitecture d'ancrage native™, qui garantit que :
Chaque zone de texte est un PowerPoint natif ``élément.
Chaque graphique est un fichier Excel natif`objet.
Chaque point d'ancrage est calculé mathématiquement pour éviter toute dérive de mise en page lorsqu'il est ouvert sur différentes versions de PowerPoint (2016-365).
2. Résoudre le fossé « non déterministe »
Les modèles d'IA ne sont pas déterministes ; ils ne génèrent pas toujours exactement les mêmes coordonnées. OOXML, cependant, est strictement déterministe. Nos recherches surTraduction de schéma intermédiairecrée une « couche tampon » où l'intention de conception générée par l'IA est validée et « accrochée » à une grille rigide et conforme à OOXML avant que le fichier ne soit assemblé.
3. Assemblage XML hautes performances
La génération d'un jeu de 100 diapositives avec des graphiques vectoriels complexes et des images haute résolution peut s'avérer coûteux en termes de calcul. Nous avons développé un système performantGénérateur XML de streamingdans Rust que :
Réduit le temps d'assemblage d'un fichier `.pptx` de 85 % par rapport aux bibliothèques Python ou Node.js standard.
Minimise la surcharge de mémoire en traitant le XML des diapositives en morceaux plutôt que de charger l'intégralité du document dans la RAM.
4. Dérive de mise en page par ingénierie inverse
L'une de nos principales pistes de recherche est « l'analyse de la dérive ». Nous ouvrons par programme les decks générés dans divers environnements (Windows, macOS, Web, Mobile) et utilisons la vision par ordinateur pour détecter des changements infimes dans le placement des éléments. Ces données sont réinjectées dans notre boucle de formation pour améliorer la précision de nos modèles de mise en page génératifs.
5. L'avenir d'OOXML : extensions IA natives
Nous préconisons et développons des extensions « AI-Native » de la norme OOXML qui permettraient une meilleure intégration des métadonnées, permettant à une IA de « se souvenir » de la raison pour laquelle elle a placé un élément spécifique à un endroit spécifique, facilitant ainsi la collaboration entre l'homme et la machine.
Pour voir comment nous appliquons les règles de marque à ces mises en page, visitez notreSémantique de conception page.