Slide Creator engagiert sich für die „Open Science“-Bewegung. Wir glauben, dass die bedeutendsten Durchbrüche in der KI entstehen, wenn Daten geteilt werden und die Forschung reproduzierbar ist. Zu diesem Zweck haben wir eine Reihe kuratierter Datensätze veröffentlicht, die aus unseren internen Daten stammenForschungs- und Entwicklungslabor work.
1. Der SCDD-15M (Slide Creator Design Dataset)
Unser Flaggschiff-Datensatz, der anonymisierte Metadaten und Layoutstrukturen für 15 Millionen professionelle Präsentationen enthält.
Inhalt:Semantische Element-Tags, relative Koordinaten, Marken-Kit-Einschränkungen und ästhetische Bewertungen.
Zweck:Ideal zum Trainieren von Layout-Vorhersagemodellen und zum Studium der visuellen Hierarchie in der Geschäftskommunikation.
-Zugang:Erhältlich über unsereForschungspartnerprogramm.
2. OOXML-Fidelity-Bench
Ein spezieller Benchmark-Datensatz für die Dokumentenentwicklung.
Inhalt:50.000 Paare von „Visual Design Intent“ (JSON) vs. „Actual Rendered Output“ (OOXML/PPTX).
Zweck:Speziell entwickelt für Ingenieure, die an der Interoperabilität zwischen generativer KI und älteren Büroformaten arbeiten.
-Zugang: Download über GitHub
3. Markensemantik-100k
Ein Datensatz, der sich auf die Beziehung zwischen Corporate Identity und Designausführung konzentriert.
Inhalt:100.000 Folien mit der Markenstimmung (z. B. „maßgeblich“, „innovativ“, „konservativ“) und den entsprechenden typografischen und Farboptionen.
Zweck:Erforschung des „Mood-to-Design“-Mappings in generativen Modellen.
-Zugang: Zugriffsschlüssel anfordern
4. Nutzungsbedingungen und Ethik
Obwohl diese Datensätze für die akademische Nutzung zugänglich sind, halten wir uns an strenge ethische Richtlinien:
Nichtkommerzielle Nutzung:Diese Datensätze werden ausschließlich zu Forschungszwecken bereitgestellt. Für die kommerzielle Nutzung ist eine separate Lizenz erforderlich.
Anonymisierung:100 % der benutzeridentifizierbaren Informationen, privaten Texte und proprietären Logos wurden entfernt oder durch synthetische Äquivalente ersetzt.
-Namensnennung:Wir bitten die Forscher, die Slide Creators zu zitieren2026 Semantisches Layoutpapierbei der Verwendung dieser Datensätze.
5. Bereitstellung von Daten
Wir laden andere Organisationen ein, sich uns anzuschließenOffene InnovationInitiative, indem sie ihre eigenen anonymisierten Design-Metadaten zum Slide Creator Open Data Portal beitragen.
Weitere Informationen zu unseren Hochschulkooperationen finden Sie unterAkademische Partnerschaften page.