Der Begriff „Data Centric AI“ ist vor allem in den Bereichen Künstliche Intelligenz, Big Data und Smart Data sowie Digitale Transformation zuhause. Bei Data Centric AI steht nicht mehr nur das Modell oder der Algorithmus im Mittelpunkt, sondern vor allem die Qualität und Auswahl der Daten, mit denen eine Künstliche Intelligenz (KI) trainiert wird.
Während früher hauptsächlich versucht wurde, die Modelle immer schlauer zu machen, legt Data Centric AI den Fokus darauf, die richtigen, sauberen und relevanten Daten zu sammeln und zu verarbeiten. Das führt oft zu besseren Ergebnissen, weil eine KI ohne gute Daten auch mit dem besten Algorithmus nicht sinnvoll arbeiten kann.
Ein einfaches Beispiel: Stellen Sie sich vor, Sie möchten eine KI einsetzen, die automatisch Rechnungen von E-Mails erkennt und richtig zuordnet. Mit Data Centric AI prüfen Sie zuerst, ob Ihre Daten, also die gesammelten Rechnungen, vollständig, korrekt und gut beschriftet sind. Sie entfernen fehlerhafte oder doppelte Einträge und ergänzen fehlende Informationen. Erst dann wird die KI damit trainiert.
So erhöht Data Centric AI die Zuverlässigkeit und Aussagekraft von KI-Systemen – und macht sie besser, weil sie von Anfang an mit hochwertigen Daten arbeitet.