Mit Google Lens die schicken Stühle finden, die du gerade in einem Café gesehen hast, das Smartphone mittels Gesichtserkennung entsperren, selbstfahrende Autos, die bei Rot an der Ampel stoppen, deine Freunde online taggen - all das wäre ohne Bilderkennung (Image Recognition) nicht möglich.
Weil die Bilderkennung im täglichen Leben immer wichtiger wird, möchten wir uns in diesem Artikel etwas eingehender mit diesem Thema beschäftigen.
Table of Contents
Was ist Bildererkennung (Image Recognition)?
4 Bilderkennungstechniken
Image Recognition vs. Computer Vision & Co.
Wie funktioniert Bilderkennung (Image Recognition)?
Image Recognition Beispiele
Bilderkennung und Marketing
Was ist Bildererkennung (Image Recognition)?
Bilderkennung (auf Englisch Image Recognition) ist eine Form der künstlichen Intelligenz (KI), die sich auf die Fähigkeit einer Software zur Erkennung von Orten, Objekten, Personen, Aktionen, Tieren oder Text in einem Bild oder Video bezieht.
4 Bilderkennungstechniken
Bilderkennung erfolgt mittels vier wesentlichen Techniken:
- Klassifizierung: Die Klassifizierung hat zum Ziel, die Kategorie zu identifizieren, in die ein bestimmtes Bild passt.
- Markierung/Labeling: Dies ist eine Form der Klassifizierung, jedoch mit höherer Genauigkeit. So können beispielsweise mehrere Objekte innerhalb eines Bildes markiert und gelabelt werden.
- Objekterkennung: Die Erkennung wird verwendet, um ein bestimmtes Objekt in einem Bild zu lokalisieren. Nachdem das Objekt erkannt wurde, wird ein Begrenzungsrahmen um das Objekt gelegt.
- Segmentierung: Mit der Segmentierung kann ein Element eines Bildes bis zum nächsten Pixel lokalisiert werden.
Image Recognition vs. Computer Vision & Co.
Bevor wir fortfahren, schauen wir uns kurz einige Begriffe an, die im Zusammenhang mit der KI-Bilderkennung häufig vorkommen:
Computer Vision
Bilderkennung ist eine Unterkategorie der Computer Vision.
Computer Vision umfasst eine Reihe von Techniken, die es Computern ermöglichen, wichtige Informationen aus Bildern, Videos oder anderen visuellen Daten zu identifizieren und basierend darauf automatisierte Aktionen durchzuführen. Mit anderen Worten geht es darum, Computern beizubringen, etwas "zu sehen" und dann "zu handeln".
Maschinelles Lernen (Machine Learning)
Maschinelles Lernen ist ein Teilbereich von künstlicher Intelligenz (KI).
Es zielt darauf ab, bestimmte Aufgaben durch Vorhersagen, die auf Inputs und Algorithmen basieren, auszuführen. Ein Computersystem, das mit einem Algorithmus für Katzenbilder trainiert wird, kann beispielsweise früher oder später lernen, Bilder von Katzen eigenständig zu erkennen.
💡 Tipp: Willst du mehr über KI erfahren? Wir decken alle Bereiche ab: Data Analytics, KI im Marketing, KI in PR, Medienwirkungsanalyse, Ebook: Die Revolution künstlicher Intelligenz, Deepfake-Videos auf Facebook
Deep Learning
Deep Learning ist eine Unterkategorie des maschinellen Lernens, bei der mittels künstlicher neuronaler Netze (auch bekannt als Algorithmen, die unser menschliches Gehirn imitieren) riesige Datenmengen analysiert werden.
Neuronale Netze
Neuronale Netze sind eine Form des maschinellen Lernens, die sich am menschlichen Gehirn orientieren. Hier ist ein interessantes Video, das neuronale Netze und ihre Funktionsweise genauer erklärt.
Damit ist das erste Kapitel abgeschlossen! 🥳 Weiter geht's mit der Beantwortung der Frage...
Wie funktioniert Bilderkennung (Image Recognition)?
So funktioniert Bilderkennung in vier Schritten.
1. Schritt: Extrahierung der Pixelmerkmale eines Bildes
2. Schritt: Aufbereitung der gelabelten Bilder zum Trainieren des Modells
3. Schritt: Training des Modells zur visuellen Bilderkennung
4. Schritt: Erkennung von neuen Bildern
Schauen wir uns das ganz etwas genauer an.
1. Schritt: Extrahierung der Pixelmerkmale eines Bildes
Im ersten Schritt der KI-Bilderkennung wird eine große Anzahl von Merkmalen (sogenannte Features) aus einem Bild extrahiert. Ein Bild besteht aus Pixeln und jedem einzelnen Pixel ist eine Zahl oder ein Wert zugeordnet, die/der seine Farbtiefe definiert.
2. Schritt: Aufbereitung der gelabelten Bilder zum Trainieren des Modells
Nachdem das Bild in Tausende von individuellen Merkmalen aufgeschlüsselt wurde, werden die Komponenten gelabelt, um das Image Recognition Modell für ihre Erkennung zu trainieren.
Die goldene Regel: Je mehr gelabelte einzelne Teilchen vorhanden sind, desto genauer kann das Image Recognition Modell trainiert werden.
3. Schritt: Training des Modells zur visuellen Bilderkennung
In diesem dritten Schritt wird das Modell tatsächlich trainiert.
Die Bilder werden in ein künstliches neuronales Netz eingefügt, das als riesiger Filter fungiert. Die extrahierten Bilder werden dann dem Input und die Labels dem Output hinzugefügt.
Ziel ist es, das neuronale Netz so zu trainieren, dass ein Bild, das im Input hinzugefügt wird, mit dem richtigen Label im Output übereinstimmt.
4. Schritt: Erkennung von neuen Bildern
Nach dem Training sollte das Modell bereit sein, neue, unbekannte Bilder zu erkennen. Das ist allerdings nur möglich, wenn es mit genügend Daten trainiert wurde, um neue Bilder selbstständig mit den korrekten Labels zu versehen.
💡 À propos Daten: Schau dir unsere verschiedenen Beiträge zu diesem Thema an - von unserem Reporting Guide, Business Intelligence, Market Intelligence, Der Nutzen von API Schnittstellen, datengesteuerte Marketingkampagnen, Customer Data Management, Big Data, Datenbereinigung und Datenanreicherung, Single Source of Truth bis hin zur Datenbanknormalisierung.
Bevor wir zum letzten Teil übergehen, schauen wir uns an, wie Bilderkennung in der Praxis funktioniert.
Image Recognition Beispiele
Zahlreiche Branchen haben die Vorteile und Möglichkeiten der KI-gestützten Bilderkennung bereits für sich entdeckt:
Bilderkennung im E-Commerce
Dank ausgeklügelter Bilderkennungssoftware ist das Online-Shopping heute so schnell und einfach wie nie zuvor. Das verändert Social Commerce nachhaltig.
Die mobile App des Modehändlers ASOS ermutigt Kunden beispielsweise dazu, unterwegs Fotos von Kleidungsstücken zu machen, die ihnen gefallen, oder Screenshots mit Wunsch-Outfits von allen möglichen Medien hochzuladen.
Der KI-Algorithmus der App scannt dann das Bild und zeigt den Kunden ähnliche Artikel an, die im ASOS-Shop erhältlich sind.
Sitzt du in einem Straßencafé und siehst jemanden in einem tollen Outfit vorbeispazieren? Kein Problem! Mach einen Schnappschuss und das Shopping kann beginnen. 📷
Bilderkennung in der Finanzbranche
Im Finanzsektor setzen Banken zunehmend Bilderkennung ein, um die Identität ihrer Kunden zu überprüfen, z. B. beim Abheben von Bargeld an Geldautomaten oder bei Überweisungen.
Zudem wird die Bilderkennung bei manchen Unternehmen eingesetzt, um sicherzustellen, dass nur befugtes Personal Zugang zu bestimmten Bereichen der Bank hat.
Das könnte dich auch interessieren: So nutzt das Fintech-Startup YAPEAL Meltwater Daten, um seine Reputation zu verfolgen, zu verbessern und aktiv zu steuern.
Bilderkennung in der Autoindustrie
Das Autofahren wird immer autonomer. Die heutigen Fahrzeuge sind mit modernsten Bilderkennungstechnologien ausgestattet, die es ihnen ermöglichen, die Umgebung (z. B. andere Fahrzeuge, Fußgänger, Radfahrer oder Verkehrsschilder) in Echtzeit wahrzunehmen und abzuschätzen.
Ingenieure verfolgen das Ziel, mittels KI-gestützter Bilderkennung menschliche Fehler zu minimieren, Autounfälle zu verhindern und dem Verlust der Fahrzeugkontrolle auf den Straßen entgegenzuwirken.
Kennst du schon unseren Automobilindustrie Branchenreport?
Bilderkennung und Marketing
Jetzt solltest du eine bessere Vorstellung davon haben, was Image Recognition bedeutet und wie vielseitig sie im Alltag eingesetzt werden kann. Im Marketing ermöglicht die Bilderkennungstechnologie visuelle Suchen, also das Beobachten und Analysieren von Bildern im Internet.
Ähnlich wie beim Social Listening können Marketer visuelle Markenerwähnungen und andere wichtige Elemente wie Logos, Objekte und bekannte Personen beobachten.
Angesichts der Tatsache, dass sich ein Großteil der Online-Unterhaltungen anhand von Bildern abspielen, ist dieses Tool für das digitale Marketing äußerst wichtig.
- ✓ Markenerkenntnisse aus visuellen Inhalten in Nachrichten, Blogs und Reddit zu gewinnen
- ✓ Markenerwähnungen in Memes mit einer Genauigkeit von über 90 % zu erkennen und zu klassifizieren
- ✓ Bildsentiment mit visueller Emotionserkennung zu analysieren
- ✓ Altersgruppen- und Geschlechterklassifizierung sowie die Erkennung von Personendichten für Customer Insights zu nutzen
- ✓ Die Suche nach Objekten, bekannten Personen, Szenen und vielem mehr!
Lasst eure Marke nicht aus den Augen und setzt mit der Meltwater Social Media Monitoring Suite zu neuen Höhenflügen an. In einer kostenlosen Demo zeigen wir dir, wie! Fülle dafür einfach das folgende Formular aus: