L'obiettivo finale di Slide Creator è colmare il divario tra la creatività basata sull'intelligenza artificiale e il mondo rigido e deterministico di Microsoft PPTX. Ciò richiede una comprensione profonda e orientata alla ricerca delOffice Open XML (OOXML)specifica: lo standard ISO/IEC 29500 che definisce il formato ".pptx".
1. La Native Anchor Architecture™
La maggior parte degli "esportatori PPTX" tratta PPTX come un contenitore "stupido", inserendo gli elementi come immagini fluttuanti o forme non standard. La nostra ricerca ha aperto la strada alArchitettura di ancoraggio nativa™, che garantisce che:
Ogni casella di testo è un file PPTX nativoelemento.
Ogni grafico è un file `"oggetto".
Ogni punto di ancoraggio viene calcolato matematicamente per impedire la deriva del layout quando viene aperto su diverse versioni di PPTX (2016-365).
2. Risolvere il divario "non deterministico".
I modelli di intelligenza artificiale non sono deterministici; non sempre restituiscono le stesse identiche coordinate. OOXML, tuttavia, è strettamente deterministico. La nostra ricerca suTraduzione di schemi intermedicrea un "Buffer Layer" in cui l'intento progettuale generato dall'intelligenza artificiale viene convalidato e "agganciato" a una griglia rigida e conforme a OOXML prima che il file venga assemblato.
3. Assemblaggio XML ad alte prestazioni
Generare una presentazione da 100 diapositive con grafica vettoriale complessa e immagini ad alta risoluzione può essere computazionalmente costoso. Abbiamo sviluppato un prodotto ad alte prestazioniGeneratore di flussi XMLin Rust che:
Riduce il tempo per assemblare un file `.pptx` dell'85% rispetto alle librerie Python o Node.js standard.
Riduce al minimo il sovraccarico della memoria elaborando l'XML della diapositiva in blocchi anziché caricare l'intero documento nella RAM.
4. Deriva del layout del reverse engineering
Uno dei nostri percorsi di ricerca principali è "Analisi della deriva". Apriamo a livello di programmazione i mazzi generati in vari ambienti (Windows, macOS, Web, dispositivi mobili) e utilizziamo la visione artificiale per rilevare piccoli spostamenti nel posizionamento degli elementi. Questi dati vengono reinseriti nel nostro ciclo di formazione per migliorare la precisione dei nostri modelli di layout generativi.
5. Futuro di OOXML: estensioni native dell'intelligenza artificiale
Stiamo sostenendo e sviluppando estensioni "AI-native" allo standard OOXML che consentirebbero un migliore incorporamento dei metadati, consentendo a un'intelligenza artificiale di "ricordare" il motivo per cui ha posizionato un elemento specifico in un punto specifico, facilitando una più facile collaborazione tra uomo e macchina.
Per vedere come applichiamo le regole del marchio a questi layout, visita il nostroSemantica del design page.