AI-Powered Classification vs Keywords

Aller au-delà d’un accès unidimensionnel au savoir.

Pendant des années, l’accès au savoir a été régi par la présence de mots-clés. Moteurs de recherche, sélection de corpus pour la business intelligence, DSPs pour la publicité en ligne, Brand Safety, Alertes de veille… Tout est question de présence ou d’absence de mots-clés pour déclencher la sélection de contenu : Un accès unidimensionnel à la connaissance, uniquement basé sur des mots-clés. Linéaire. Limité à 0 (absent) ou 1 (présent)..

La présence des mots-clés ne perçoit pas les angles, la subtilité et les orientations prises par l’auteur (ni la sensibilité dans le temps. Les significations d’aujourd’hui sont les mêmes que celles de n’importe quel autre jour).
Par exemple, la présence de « cadeau de Noël » (comme dans les articles ci-dessous) pourrait être « ok » mais est-ce dans un contexte de « Défense militaire » et « Armement » ? Pouvez-vous maintenir des requêtes excluant tous les dictionnaires de synonymes connexes et en constante évolution et vous assurer que votre marque ne sera pas exposée ? Après tout, un mot peut avoir plusieurs significations selon son contexte et l’heure à laquelle il est lu. Les classifications AI-Powered sont la solution :

Les classifications par IA ajoutent 2 dimensions : Orientations éditoriales et contexte temporel.


1. Détection des orientations éditoriales.

Tous deux, Classifications par IA et mots-clés sont non-biaisés, universels et à jour. Parce que TrustedOut est opéré par IA, notre machine learning offre les mêmes garanties non-humaines alimentées par une machine qu’un moteur de recherche.

Example de détection Editoriales:
1 événement, 2 pays, 3 articles, 10 classifications.

L’événement : prenons la Corée du Nord qui a annoncé un « cadeau spécial » pour les États-Unis. Les 2 pays : Nous avons ensuite sélectionné 3 articles dans une recherche Google sur « North Korea Gift » pour les USA et « Corée du Nord Cadeau » pour la France. Les 3 articles : nous avons choisi au hasard ceux de USAToday, CBSNews et Le Figaro. Voici les 10 premières classifications établies par TrustedOut. Pour chacun des médias, nous avons ajouté comment les Orientations Politiques du média sont perçues (bêta).

USAToday



Vase or missiles? US awaits Christmas 'gift' from North Korea's Kim (Vase ou missiles ? Les Etats-Unis attendent un « cadeau » de Noël de la part du Nord-Coréen Kim)

1 General › Politics › Diplomacy
2 General › Politics › International
3 Industries › Aerospace And Defense › Weapon
4 General › Politics › Military Defense
5 General › Politics › Civil Defense
6 Industries › Energy › Nuclear Power
7 Industries › Aerospace And Defense › Naval System
8 General › Politics › Administration
9 Industries › Aerospace And Defense › Aerospace Systems
10 General › Politics › Government


CBSNews

No sign of "Christmas gift" from North Korea yet, but deadline looms (Pas encore de signe de « cadeau de Noël » de la part de la Corée du Nord, mais la date limite approche)

1 General › Politics › Military Defense
2 Industries › Aerospace And Defense › Weapon
3 General › Politics › Diplomacy
4 General › Politics › International
5 Industries › Aerospace And Defense › Naval System
6 Industries › Aerospace And Defense › Aerospace Systems
7 Industries › Aerospace And Defense › Missiles And Rockets
8 Industries › Energy › Nuclear Power
9 Industries › Aerospace And Defense › Satellite
10 Industries › Transportation › Ship


Le Figaro

Trump is hoping for a "nice vase" instead of a North Korean missile for Christmas. (Trump espère un «beau vase» au lieu d'un missile nord-coréen pour Noël)

1 General › Politics › Diplomacy
2 Industries › Aerospace And Defense › Weapon
3 Industries › Aerospace And Defense › Aerospace Systems
4 Industries › Aerospace And Defense › Missiles And Rockets
5 General › Politics › International
6 General › Politics › Military Defense
7 People › Society › Opinion And Idea
8 Industries › Aerospace And Defense › Satellite
9 General › Law › International
10 Industries › Aerospace And Defense › Aircraft


Orientations Editoriales

Voici un résumé des orientations éditoriales pour les 3 articles:

Quelques remarques :

Voici comment TrustedOut voyait l’Industrie de l’aérospatiale et de la défense, en octobre dernier.

2. Evolution avec le temps.



Pour la sélection de contenu : Les classifications par IA peuvent détecter les orientations éditoriales ET les évolutions dans le temps. Les mots-clés ne le peuvent pas.

Nous venons d'aborder le premier avantage des classifications basées sur l'IA par rapport à la sélection par mots-clés, les orientations éditoriales, et montré comment un même événement, sur 3 publications différentes, peut avoir des orientations éditoriales différentes. Il s'agit d'une dimension supplémentaire pour accéder à la sélection de contenu.
Read post

Regardons maintenant une 3ème dimension : L’évolution dans le temps.

La perception d’un événement évolue avec le temps, de même que nos classifications par IA.

La France a connu beaucoup de mouvements sociaux avec la réforme des retraites que le gouvernement français préconise. Depuis le début des protestations début Décembre 2019 jusqu’à fin décembre, la perception sur celles-ci a évolué. Examinons le même article et la façon dont l’IA le classe à deux moments différents.

Cet article a été publié le 10 décembre 2019 :

Réforme des retraites: « Ne parler que de parcours hachés serait une erreur de diagnostic »  [google Translation] ()

Le 10 décembre, la première classification était :

Nous sommes au début du mouvement, Emploi et Chômage est la classification la plus élevée:

Le 31 décembre, les premières classifications sont à présent :

3 semaines plus tard, le même article avec le même contenu est classé d’abord dans la catégorie Aînés, puis Aide sociale et, maintenant en 3ème place: Emploi et chômage.
Il est clair qu’après 3 semaines de protestations, les séniors et le social sont en tête, devant l’emploi.

Comment la classification par IA peut-elle faire cela ?

Chaque nouvel article est classifié comme suit :
Ce qui signifie que le jour de la publication de l'article, nous utilisons des ensembles de données de classification (aussi appelés "bags of words") correspondant à ce jour-là.

Ces ensembles de données de classification sont également mis à jour afin de se synchroniser avec chaque classification et de détecter la profondeur de l'expertise au fil du temps. Cela signifie que certains mots peuvent entrer et/ou sortir et avoir un poids différent au fil du temps. Cela signifie que les classifications sont définies, par défaut, pour le jour où un article est publié, mais qu'elles peuvent être relancées un autre jour et produire une classification différente. Comme dans la vie réelle, votre perception de quelque chose évolue avec le temps.

Pourquoi c'est très important.

Tout simplement parce que le temps est une dimension vitale de la perception. S’appuyer simplement sur la présence de mots-clés pour sélectionner du contenu pour l’analyse, exposer votre marque via la publicité etc… est dangereux.

Ce qui est vrai au moment de la publication peut ne plus l’être au moment de l’analyse, ou de l’exposition de votre marque dans une publicité…
Dans l’exemple ci-dessus, vous pouvez vouloir ou non des articles sur les « Séniors ». Au moment de la publication, l’article était sous le radar, 3 semaines plus tard, il est classé comme « Séniors « . Est-ce que c’est encore là que votre marque veut être exposée ? est-ce que ce contenu est celui que vous voulez analyser aujourd’hui ? est-ce que ces articles sont importants pour l’éducation de vos équipes ? S’appuyer sur des mots-clés, qui sont présents dans le contenu pour toujours, non seulement ne vous donne pas l’orientation éditoriale du contenu mais n’est pas sensible à l’évolution de la perception et comme nous le savons :

Perception is reality.