Cet article a été rédigé par Giorgio Orsi, directeur principal de l'innovation en science des données chez Meltwater.
Chez Meltwater, nous prenons le big data, l'IA et le Machine Learning (ML) très au sérieux, car ils sont au cœur de ce que fait notre entreprise depuis ses débuts.
Les premiers modèles de ML pour l'analyse des sentiments et la reconnaissance des entités ont été déployés en 2005, bien avant que les médias sociaux ne deviennent monnaie courante. Aujourd'hui, nous traitons chaque jour plus de 1,3 milliard de nouveaux messages sur les médias sociaux, d'articles d'actualité et de blog. Nous traitons plus de 20 milliards d'actions d'engagement en temps réel sur tous les canaux sociaux et faisons plus de 15 milliards d'inférences grâce à nos modèles d'IA.
Dans ce blog, nous allons vous présenter tous les domaines couverts par nos équipes d'IA et de Data Science chez Meltwater, et vous expliquer comment nous utilisons l'IA dans tous nos produits à travers notre plateforme unifiée Fairhair.AI :
Domaines de l'IA
Traitement du langage naturel et LLM
Traitement de la parole
Vision par ordinateur : Analyse d'images et de vidéos
Graphe de connaissances
Analyse des séries temporelles et analyse prédictive
Détection des langues et géolocalisation
L'avenir de l'IA chez Meltwater
Domaines de l'IA
Les domaines de l'IA sont souvent classés en deux catégories principales :
- Symbolique (par exemple, règles logiques et autres méthodes formelles)
- L'IA sub-symbolique (c'est-à-dire statistique) qui comprend l'apprentissage automatique, l’apprentissage en profondeur et les réseaux neuronaux.
Dans l'IA symbolique, les connaissances et les règles sont explicitement programmées dans le système, ce qui signifie que le système dispose d'un ensemble prédéfini de règles à suivre. L'avantage est qu'elles manipulent les données et les connaissances de manière transparente et facile à comprendre. Cependant, les règles peuvent être limitées lorsqu'il s'agit de gérer l'incertitude et d'apprendre à partir des données.
L'apprentissage automatique, quant à lui, traite les données à l'aide de modèles statistiques et d'algorithmes. Il s'agit souvent d'entraîner des modèles sur de grands ensembles de données afin d'apprendre des modèles et de faire des prédictions basées sur les données. L'apprentissage automatique permet de traiter des relations très complexes entre les données et de faire des déductions sur des scénarios qui n'ont jamais été rencontrés auparavant.
L'avenir de l'IA sera très probablement une combinaison des deux approches, où l'apprentissage et le raisonnement fonctionnent ensemble pour apprendre à partir des données et "obéir" aux règles, car de nombreuses applications ont certaines exigences en matière de sécurité, de réglementation et d'équité qui doivent être respectées.
Traitement du langage naturel et LLM
Le traitement du langage naturel (NLP) est au cœur des activités de Meltwater depuis plus de 20 ans. Le NLP est un sous-domaine de l'intelligence artificielle qui traite de l'interaction entre les ordinateurs et le langage humain.
Chez Meltwater, les techniques NLP sont utilisées pour extraire, analyser et structurer des données textuelles provenant d'actualités, de blogs, de plateformes de médias sociaux et de données de première partie afin d'obtenir des informations sur la façon dont les marques sont perçues par leur public, comment et où se déroulent les conversations, et comment elles se propagent. Cela nous permet de dériver des modèles de comportement des consommateurs, de comprendre les tendances émergentes et de fournir des recommandations aux professionnels des relations publiques et du marketing.
Voici quelques-unes des tâches NLP prises en charge par l’'IA de Meltwater :
Analyse des sentiments et détection des émotions
Il s'agit de comprendre le ton (positif, négatif, neutre) et les émotions (par exemple, la colère, la joie, la surprise) d'un message, d'un article ou de conversations entières. Nos modèles sont basés sur de grands modèles de langage (LLM) pour prédire à la fois le sentiment et les émotions.
Nous prenons en charge plus de 200 langues avec une précision supérieure à 90 %, et d'autres langues sont en passe d'être ajoutées. Nos modèles d'analyse des sentiments alimentent l'analyse des sentiments dans toutes nos suites de produits.
Conseil : En savoir plus sur Le quoi, le pourquoi et le comment de l'analyse des sentiments
Extraction d'entités et de phrases clés et établissement de liens
Il s'agit de reconnaître les entités pertinentes et les phrases/termes clés dans un texte.
Cette tâche fait appel à des techniques d'apprentissage automatique et à la puissance du graphe de connaissances Meltwater pour détecter et relier entre eux des marques, des personnes, des produits, des lieux et des termes généraux (câble d'alimentation, protecteur d'écran) dans plus de 90 langues.
Les algorithmes d'extraction d'entités et de phrases clés alimentent les widgets d'analyse d'entités dans tous nos produits, les capacités de recherche d'entités dans Explore et les alertes intelligentes. Ils permettent également d'améliorer l'analyse du sentiment en activant l'analyse du sentiment au niveau de l'entité (ELS).
Classification des thèmes
Il s'agit de classer un texte en catégories, par exemple Sports, Finances, Affaires.
La classification thématique est cruciale pour éliminer le bruit et concentrer l'analyse sur les sources pertinentes et à fort impact.
Meltwater utilise également les LLM pour la classification des sujets et est capable de classer le contenu dans plus de 30 langues en utilisant une taxonomie de milliers de catégories. Parce qu'une taille unique ne convient pas à tous, nous prenons également en charge les catégories personnalisées pour aider les clients à affiner leurs recherches afin d'obtenir des résultats encore plus pertinents.
Profilage des utilisateurs
Bien qu'il ne s'agisse pas à proprement parler d'une tâche de la PNL, elle s'appuie sur de nombreux éléments constitutifs de la PNL.
Chez Meltwater, les auteurs de messages sur les médias sociaux sont profilés sur la base de caractéristiques telles que
- âge
- sexe
- profession
- statut de la relation
- langue parlée
- les lieux qu'ils mentionnent dans leurs messages
- les sujets abordés ou traités
Meltwater utilise la même technologie que celle utilisée par les LLM pour créer des modèles capables de prédire ces profils pour les auteurs d'articles sur la base de millions d'autres profils.
L'analyse démographique et la capacité d'identifier automatiquement les tribus sont essentielles pour l'intelligence du consommateur et le marketing des médias sociaux. Elles permettent de mieux cibler les campagnes de marketing et d'améliorer le service à la clientèle et l'expérience des clients.
Nos capacités de profilage des utilisateurs alimentent l'onglet "auteurs" d'Explore et notre produit "Communautés". Notre modèle d'IA est également capable de détecter si le compte appartient réellement à un auteur humain plutôt qu'à des comptes automatisés tels que des pages de produits ou d'entreprises. Un score d'autorité est également calculé pour identifier les principaux leaders d'opinion et les autorités de la communauté.
Clustering et résumé
Cette tâche permet d'obtenir un aperçu significatif d'un ou plusieurs articles et messages liés à la même histoire. Cette fonction permet aux professionnels des relations publiques et du marketing d'identifier rapidement les articles pertinents et les sources sous-jacentes sans avoir à passer au crible des milliers de mentions non pertinentes.
Notre technologie de clustering, la meilleure de sa catégorie, alimentée par le LLM, identifie automatiquement les articles et les posts appartenant à la même histoire, ainsi que les paraphrases par copier-coller ou les articles plagiés.
Notre technologie de résumé utilise ensuite l'IA générative pour condenser les histoires en résumés concis.
Notre IA peut résumer un ou plusieurs articles et posts dans plus de 50 langues. Chaque jour, nous traitons plus de 600 000 histoires distinctes (clusters), chacune comprenant jusqu'à quelques milliers d'articles.
Détection d'événements
La détection d'événements permet d'identifier les événements pertinents tels que les lancements de produits, les introductions en bourse et les nominations de dirigeants clés. La détection d'événements suit des millions de documents d'information chaque jour et prend en charge plus de 40 types d'événements différents.
La détection d'événements utilise la technologie avancée des réseaux neuronaux pour identifier les événements et en extraire les attributs clés, par exemple le prix payé pour une acquisition ou le nom des dirigeants nommés. La détection d'événements est prise en charge à la fois dans Smart Alerts et dans Explore. Les événements sont ensuite liés à des posts de médias sociaux partageant des articles liés à l'événement grâce à notre technologie avancée de clustering alimentée par LLM.
Détection du spam
Une suite de produits de surveillance des médias et d'écoute sociale n'est pas complète sans la capacité de séparer les informations utiles du bruit.
Notre technologie de détection des spams prend en charge plus de 200 langues et peut identifier tous les types de spams, qu'il s'agisse de contenus dangereux pour le travail (NSFW), de contenus générés par des robots ou de publicités promotionnelles.
Cela permet aux équipes de relations publiques et de marketing d'éliminer le bruit qui peut affecter leurs recherches et gonfler les mesures d'impact et de retour sur investissement.
Conseil : En savoir plus sur le ROI du marketing et le ROI des relations publiques.
Traitement de la parole
Le traitement de la parole fait référence à l'analyse et à la manipulation des signaux vocaux, généralement dans le but d'extraire des informations utiles ou de les transformer à des fins spécifiques.
La reconnaissance vocale consiste à convertir les mots prononcés en texte et est utilisée par Meltwater pour traiter les données de diffusion (radio, télévision et podcasts) que nous recevons de nos partenaires tels que TVEyes. Une fois le texte extrait, il peut être traité comme n'importe quel texte normal. Le traitement de la parole joue un rôle crucial dans l'écoute sociale et le suivi des marques, car les vidéos courtes et les podcasts sont désormais très populaires parmi les influenceurs.
Le traitement de la parole est pris en charge dans plus de 20 langues et nous traitons quotidiennement l'équivalent de 37 000 heures de parole provenant de plus de 60 000 stations, ce qui équivaut approximativement à 1,5 km de jours de parole par jour !
Vision par ordinateur : Analyse d'images et de vidéos
Une image vaut mille mots, et en matière d'image de marque c'est tout à fait vrai. Nos propres recherches montrent que les messages Twitter contenant des images sont 2,6 fois plus lus que les messages textes.
De même, les vidéos sur les médias sociaux se sont révélées très efficaces pour capter l'attention et susciter l'engagement, les données de Meltwater montrant un engagement deux fois plus important pour les tweets contenant des vidéos que pour les posts classiques. Il est donc essentiel qu'une plateforme de social listening dispose d'une technologie d'IA capable de comprendre les images et les vidéos et d'en tirer des enseignements.
Chez Meltwater, nous avons développé une technologie de pointe en matière de vision par ordinateur, basée sur les transformateurs de vision (l'équivalent des LLM pour le monde visuel).
Notre plateforme unifiée prend actuellement en charge plus de tâches de vision par ordinateur que n'importe quel autre acteur de notre secteur, notamment :
- Détection de logos et de célébrités : identifie les logos de marques, les célébrités et autres VIP (par exemple, les dirigeants d'entreprise) dans les images. Nous prenons actuellement en charge plus de 3,5K de logos et 400 célébrités, et d'autres sont ajoutés chaque jour.
- Détection des visages (âge, sexe, densité) : notre IA visuelle peut détecter le groupe d'âge et le sexe probables des personnes apparaissant dans les images à la granularité du visage individuel. Cela complète nos capacités de segmentation démographique fournies par notre stack NLP. Notre IA peut même compter les personnes dans les images, ce qui nous permet de répondre à des recherches telles que "retrouver les résultats où le logo Nike apparaît avec une foule de personnes". C'est très intéressant !
- Détection de scènes et d'objets : notre IA peut identifier plus de 700 objets différents et plus de 120 scènes et situations. Cela permet de rechercher, par exemple, le logo d'une marque dans certains contextes, comme le logo d'un événement sportif ou celui d'un gala MET.
- Détection des émotions : cette fonction améliore nos capacités de traitement des sentiments et des émotions en permettant de détecter les mêmes types d'émotions dans les images pour une expérience d'écoute plus complète sur tous les canaux médiatiques.
- Détection des mèmes : dans le paysage actuel des médias sociaux, les mèmes peuvent devenir très viraux. Aucune suite d'écoute sociale n'est complète sans le suivi et la détection des mèmes.
- Reconnaissance de caractères : tâche consistant à reconnaître des mots écrits à l'intérieur d'images. Aucune suite d'écoute sociale n'est complète si elle n'est pas capable d'identifier le contenu imprimé à l'intérieur d'images visuelles. Cette capacité améliore nos capacités de recherche et d'écoute dans Radarly et Explore, et complète notre détection de logos pour ne jamais manquer une mention de marque.
- Regroupement d'images : en s'appuyant sur la puissance des transformateurs visuels, notre IA peut identifier les similitudes entre les images et créer des regroupements d'images similaires, ce qui permet un niveau de découverte et de contrôle sans précédent dans les applications d'écoute sociale.
La technologie Visual AI alimente les fonctions de recherche et d'analyse d'images dans Radarly et Explore, ainsi que notre suite Meltwater Influencer Marketing.
Graphe de connaissances
Un graphe de connaissances est un type de base de données conçu pour représenter et stocker des connaissances sous la forme d'entités (nœuds) telles que des personnes, des lieux, des marques, des produits, et leurs relations (arêtes). Par exemple, John Box est le PDG de Meltwater, les iPhones sont fabriqués par Apple, John Simpson écrit pour la BBC.
Les graphes de connaissances sont souvent utilisés pour alimenter des applications intelligentes telles que les moteurs de recherche, les assistants personnels intelligents et les systèmes de recommandation. Parmi les exemples de graphes de connaissances, on peut citer le Knowledge Graph de Google, qui alimente son moteur de recherche et fournit des informations sur des entités telles que des personnes, des lieux et des objets, et le Social Graph de Facebook, qui représente les relations entre les personnes et leurs centres d'intérêt.
Le graphe de connaissances de Meltwater contient plus de 20 millions d'entités et 70 millions de relations, et inclut des entreprises et leurs dirigeants dans plus de 300 secteurs d'activité. Le graphe de connaissances alimente nos Smart Alerts, la recherche d'entités d'Explore, ainsi que nos produits de relations avec les médias, de marketing d'influence et d'intelligence commerciale.
Nous l'utilisons également pour recommander automatiquement les concurrents à suivre ou à surveiller grâce à nos classificateurs sectoriels basés sur l'IA qui affectent automatiquement les entreprises à leur secteur d'activité, reliant ainsi les concurrents entre eux.
Analyse des séries temporelles et analyse prédictive
L'analyse des séries chronologiques est le processus qui permet de comprendre les phénomènes, les modèles, les tendances, les saisonnalités et d'autres relations de données plus exotiques au fil du temps. Elle est utilisée pour faire des prédictions sur les valeurs futures basées sur les observations passées.
Chez Meltwater, notre équipe d'analyse prédictive a conçu des modèles d'IA pour comprendre les tendances en matière d'engagement et de mentions, le comportement des clients, identifier et expliquer les anomalies (par exemple, les pics) et faire des prédictions sur les tendances futures. Ces algorithmes alimentent notre produit Smart Alerts pour informer les utilisateurs des pics de mentions et d'engagement, des changements de sentiment, identifier les posts Facebook sponsorisés et les tweets viraux, le tout en temps réel. Les algorithmes d'analyse prédictive permettent également de détecter les pics dans notre nouvelle offre Discovery.
Détection des langues et géolocalisation
La détection de la langue et la géolocalisation consistent à déterminer la langue et la localisation d'un utilisateur sur la base de certaines caractéristiques. Dans certains cas, Meltwater reçoit ces informations directement de nos fournisseurs de données, mais nous validons toujours la localisation ou la déduisons lorsqu'elle manque à l'aide de la technologie de l'IA.
La détection des langues par l'IA est prise en charge dans plus de 240 langues, mais notre plateforme prend en charge la recherche et l'extraction dans toutes les langues humaines connues (plus de 7 000 !). La localisation linguistique et géographique est cruciale pour l'analyse démographique et la segmentation de la clientèle, ainsi que pour l'application de nos règles strictes en matière de conformité des données.
En fonction de la plateforme, notre IA est capable de déterminer la localisation d'un utilisateur jusqu'à la granularité d'un quartier d'une ville sur la base des informations disponibles dans le message, de la biographie d'un auteur et parfois de l'adresse IP de l'appareil utilisé pour publier le message. Actuellement, tous les pays et territoires ISO reconnus sont pris en charge par tous les produits Meltwater.
L'avenir de l'IA chez Meltwater
Maintenant que nous avons examiné le passé et l'état actuel de l'IA de Meltwater, il est temps de se pencher sur son avenir.
En tant que leader de l'innovation et entreprise privilégiant l'IA, Meltwater double ses investissements dans l'IA et l'apprentissage automatique. Notre conseil scientifique fournit des informations sur les changements à la frontière de l'innovation technologique de l'IA et aide à identifier des solutions ou des nouvelles technologies pour certains de nos défis les plus difficiles en matière d'IA.
La technologie de l'IA a un potentiel énorme pour les secteurs des relations publiques et du marketing, et Meltwater intègre la technologie d'assistance de l'IA dans tous ses produits, y compris nos services d'entreprise et de livraison.
Restez à l'écoute de notre prochaine série de blogs sur l'IA, nous vous guiderons à travers les nouvelles fonctionnalités de nos produits, notamment nos capacités d'IA générative, l'analyse vidéo révolutionnaire, nos assistants PR et Engage alimentés par GPT, les classificateurs personnalisés alimentés par l'IA, la recherche sémantique, l'analyse des pics, la recommandation et l'analyse prescriptive, ainsi que de nombreux conseils et astuces pour utiliser efficacement nos fonctionnalités alimentées par l'IA.
Conseil : Découvrez le fonctionnement de l'assistant de rédaction IA de Meltwater pour les responsables des médias sociaux, et apprenez-en plus sur l'assistant de relations publiques IA de Meltwater.