Notre Technologie : Profilage spécialisé par IA dédiée



1. La taxonomie :
Les Médias de l’intérieur.
Incluant expertise et sensibilité.

Un média a des sources qui publient chacune de nouveaux articles. De chaque nouvel article, nous ne gardons que des mots utiles (pas de "bloc words" comme "le, est, mais...") que nous appelons un "résumé". Chacun des mots de ce nouveau résumé est comparé à plusieurs centaines d'ensembles de données (datasets ou "bags of words"). Chaque classification de notre taxonomie a son propre ensemble de données.

Pour chaque million de résumés, cela signifie 75 000 000 000 opérations.

Cette méthode est proche du modèle de la tribu. Chaque tribu utilise un dialecte composé de mots identifiant ce dialecte. Quand vous reconnaissez un dialecte, vous reconnaissez une tribu. Voici une classification. En fonction du nombre et du poids des mots, nous pouvons évaluer le niveau d'expertise dans la classification. Cela nous donne un score pour l'article. En jouant sur le nombre de jours passés, nous pouvons également mesurer la sensibilité des sources aux news. La compilation des sources nous indique la position des médias.

Résultat : Nous disposons d'une taxonomie, non-biaisée, universelle, toujours mise à jour et pouvant être filtrée par niveau d'expertise et sur 3 périodes de temps pour détecter la sensibilité au temps.


2. Les Perceptions :
Les Médias de l’extérieur.
Comment un média est perçu.

Les "fake news", la "junk science" et autres appréciations toxiques sont tangibles. Rarement, cela peut être intangible (lorsque ce n'est pas debatable), parce que ce sont des appréciations. Ce qui est une "fake news" pour certains ne l'est pas pour d'autres. C'est pourquoi nous considérons ces appréciations comme "évaluées", ou "perçues comme". Comme pour notre taxonomie, la perception est une appréciation, mais alors que la taxonomie concerne l'éditeur lui-même, nous l'appelons le profil interne de l'éditeur, la perception, au contraire, représente le profil externe de l'éditeur. Pour y parvenir, nous collectons la façon dont l'éditeur est perçu sur Internet, en excluant strictement toute publication de l'éditeur. Cela nous donne des pages et des mots que nous faisons correspondre à des ensembles de données sur la perception (un pour les "fake news", un pour les "junk sciences", etc.) de la même manière que celle expliquée ci-dessus. Nous avons alors un score qui, lorsqu'il dépasse un certain seuil, fait que la publication est "repérée comme éditeur de "fake news" par exemple.

Résultat : Nous évaluons d'une façon totalement impartiale comment une publication est perçue, car aucune personne ou groupe ne peut le faire sans un doute sur un biais possible.


3. Suivre l'évolution des langues:
Mettre à jour en permanence et contrôler les chevauchements dans les ensembles de données.
Taxonomie opérée par IA.


Pour la taxonomie, les mots des articles sont mesurés par rapport aux ensembles de données des classifications (alias sacs de mots)
Pour évaluer la façon dont un média est perçu, nous mesurons cette fois ce qui est dit par rapport à des ensembles de données sur les diverses perceptions.
L'appariement et la pondération font le score du document. C'est ainsi que l'on sait classifier un article et quel est son niveau d'expertise/gravité.

L'IA pour que les ensembles de données restent pertinents en permanence.

La perception que nous avons d'un événement évolue avec le temps. Il en va de même pour la classification de cet article. C'est pour cela que nous tenons les ensembles de données à jour en permanence.

L'effet domino de l'évolution : Les langues ont un impact sur les ensembles de données, qui ont un impact sur la taxonomie.

La façon dont nous parlons de quelque chose évolue avec le temps. En fait, le dialecte de la tribu, composé de personnes préoccupées, amusées, excitées..., évolue avec le temps. Plus spécifique, plus cool, plus geek, plus récent... quelle qu'en soit la raison, nous aimons les changements, nous aimons les nouvelles façons de s'exprimer.

Mise à jour des ensembles de données. En permanence.

Les ensembles de données doivent être reconstruits et mis à jour en permanence pour saisir les nouveaux mots, la nouvelle importance, plus ou moins grande, des mots, voire la disparition de certains.

Intelligence des chevauchements. Sous surveillance permanente.

Au fur et à mesure que les ensembles de données évoluent, ils peuvent faire se chevaucher une classification sur une autre, ce qui affaiblirait la taxonomie. Nous mesurons ces chevauchements potentiels, de manière permanente également, et si l'un d'entre eux est détecté, la taxonomie évolue en conséquence.