Cliquez sur un nœud du graphe ou dans un élément de l'index pour ouvrir une fiche.

AB Testing

types : techniques

mots-clés :

A/B testing, ou test A/B : technique marketing d'échantillonnage en double-aveugle qui consiste à proposer à un panel d’internautes un même objet qui diffère selon un seul critère (la couleur, le logo, le matériau etc.). Par exemple, on peut proposer aux sondés de choisir quelle brique de lait ils préfèrent entre une bleue, une verte et une rouge.

Cette technique (...) conçoit désormais la société comme un laboratoire à grande échelle. Nous sommes leurs cobayes. [@cardonQuoiReventAlgorithmes2015a, p.64]

Les → internautes sont donc utilisés pour améliorer le produit.

abbréviation

types : concept

mots-clés :

Husserl mentionne le processus algorithmique comme une abbréviation qu'il faut comprendre à la fois dans son sens symbolique et son écriture, mais également comme un élement pratique qu'il est possible de mobiliser dans sa formulation pour gagner du temps.
Cela peut supposer un gain de temps dans la recherche de l'algorithme qui est ici fourni et qu'il faut simplement utiliser sans se poser trop de question, mais également dans l'opération une fois réalisée qui permet d'économiser du temps de calcul fastidieux.
L'abbréviation devient alors un avantage de l' → algorithme.

Adresse IP

types : techniques

mots-clés :

Adresse IP : l'adresse IP (Internet Protocol) désigne un numéro unique attribué de manière provisoire ou durable à un ordinateur connecté à un réseau informatique qui utilise l'internet protocole. Cette adresse est une de bases du protocole du réseau → Internet.
Elle est considérée comme un type de → données personnelles même si elle ne garantit pas l'identification de manière absolue.

Agentivité

types : concept

mots-clés :

types : techniques

mots-clés :

algorisme

types : concept

mots-clés :

Concept alternatif à celui d'→ algorithme qui a parfois été confondu en terme de portée et de définition.
Striphas tente d'ailleurs d'utiliser le concept d'une façon qui le distingue de celui d'algorithme :

D'une part, nous avons des algorithmes - un ensemble de procédures mathématiques dont le but est d'exposer une >vérité ou une tendance sur le monde. D'un autre côté, nous avons des algorismes, des systèmes de codage qui ont >la capacité de révéler, mais qui sont tout aussi sinon plus susceptibles de cacher. [@striphasAlgorithmicCulture2015, p. 404-405]

Algorithm accountability act

types : undefined

mots-clés :

Projet de loi qui n'a jamais abouti déposé en 2019 par les sénateurs américains Ron Wyden et Cory Booker, et la représentante Yvette Clarke. Le projet de loi prévoyait que les entreprises ayant plus de 50 millions de dollars de revenus (ou possédant plus de 100 millions de données de personnes) devraient rendre compte → des effets algorithmiques de leur technologie.

algorithm awareness

types : concept

mots-clés :

Concept qui désigne la prise de conscience des algorithmes et de leurs effets dans les dispositifs utilisés.
Ce stade est souvent le premier niveau d'une → littératie algorithmique.
Plusieurs études mentionnent cette importance et envisage le fait d'évaluer cette prise de conscience par une échelle de littératie algorithmique dédiée [@dogruelDevelopmentValidationAlgorithm2021]

types : algorithme

mots-clés :

Algorithme qui permet de recommander à un usager à un produit en fonction de ses requêtes mais également en fonction des achats ou des habitudes d'autres usagers.
Par exemple,→ suggère des pistes d'achats de cette manière.

Algorithmes de Google

types : algorithme

mots-clés :

Parmi les algorithmes de → Google figurent notamment :

→ Panda
→ Venice
→ Penguin
→ Pirate
→ Hummingbird
→ Pigeon
→ Rankbrain
→ Possum
→ Medic
→ BERT
→ Passage ranking

Algospeak

types : algorithme

mots-clés :

Agospeak est l'algorithme de → Tik Tok.
La personnalisation : L'Algospeak de TikTok est conçu pour fournir un contenu personnalisé à chaque utilisateur en fonction de ses intérêts. L'algorithme utilise des informations telles que les préférences de visionnage, les interactions précédentes, l'emplacement géographique et l'heure de la journée pour sélectionner le contenu à afficher.

La durée de visionnage : L'Algospeak de TikTok utilise également des informations sur la durée de visionnage pour déterminer la pertinence d'une vidéo pour un utilisateur. Si un utilisateur regarde une vidéo pendant toute sa durée, cela indique à l'algorithme qu'il est probablement intéressé par ce type de contenu.

L'interaction : Les interactions de l'utilisateur, telles que les likes, les commentaires, les partages et les abonnements, sont également prises en compte par l'Algospeak de TikTok pour déterminer la pertinence du contenu à afficher. Les vidéos qui reçoivent des interactions positives sont plus susceptibles d'être recommandées à d'autres utilisateurs.

Le contenu récent : L'Algospeak de TikTok privilégie également les contenus récents. Les vidéos qui ont été publiées récemment et qui reçoivent des interactions positives ont plus de chances d'être recommandées à d'autres utilisateurs que les vidéos plus anci

Alto

types : techniques

mots-clés :

La BBC a développé un outil, appelé ALTO, qui utilise la technologie de synthèse vocale pour fournir des pistes de voix off en plusieurs langues pour des vidéos. D'autres médias, comme ABC News, le New York Times et ESPN emploient Trint, une une technologie similaire à ALTO pour transformer l'audio des entretiens en texte en temps réel.

Amazon

types : organisation

mots-clés :

Plateforme
Considérée comme faisant partie des → GAFAM, la plateforme créée par Jeff Buzos utilise de nombreux algorithmes.

Analyse des sentiments

types : concept

Apple

types : organisation

Entreprise considérée comme étant un → GAFAM, elle s'inscrit dans l'histoire de la micro-informatique avec plusieurs innovations marquantes.

Apprentissage automatique

types : techniques

mots-clés :

Apprentissage automatique (machine learning) : l’apprentissage automatique, ou machine learning, est une technologie d’→ Intelligence artificielle qui permet aux machines d’apprendre par le biais des données, sans avoir été préalablement programmées à cet effet. Pour apprendre et se développer, les ordinateurs ont besoin d’un flux important de données à analyser. Par exemple, l’algorithme de → Amazon met en avant des produits qui correspondent le mieux à chaque utilisateur - en fonction de ses données de navigation, de ses clics et donc, de ses préférences apparentes. Le machine learning correspond à ce qu’on peut appeler “l’alignement” en matière d’intelligence artificielle : il s’agit de toutes les techniques qui permettent de valoriser ce que l’utilisateur apprécie déjà et effectuer ce qu’il demande à la machine. Cet usage est rassurant, réconfortant : c’est la sécurité pour l’internaute et la machine.

Approches user centric et site centric

types : techniques

mots-clés :

User-centric et site-centric : deux approches complémentaires de la → mesure d'audience sur des sites internet, dans une même logique marketing. L’étude site-centric désigne l’observation du trafic d’internautes sur une page web, tandis que l’approche user-centric se concentre sur le parcours de l’utilisateur, visible grâce au traçage de ses données (par le biais de → Cookies, par exemple).

Armes de destruction mathématique (ADM)

types : concept

mots-clés :

Arme de destruction mathématique (ADM) : défini par Cathy O'Neil [@oneilAlgorithmesBombeRetardement2018], cet acronyme fait référence aux outils algorithmiques employés pour servir les technologies d'intelligence artificielle. Certains d'entre eux, lors de leur application, répètent des schémas sociaux discriminatoires : face à l'embauche, par exemple, certains algorithmes de sélection associent des caractéristiques (qualité, défaut, notation etc) à des groupes ethniques, sociaux ou de genre en s’inspirant des représentations sociétales. Ils adoptent, pour certains, une attitude différenciée face aux candidats à l’embauche, sur des critères ethniques : les personnes de couleur sont moins bien considérées que les candidats associés - au moins socialement - à la couleur de peau blanche. On parle alors de → biais algorithmique (O’Neil, 2018).

artificial Intelligence Act

types : organisation

mots-clés :

L'Artificial Intelligence Act (AIA) est un cadre législatif proposé par la Commission européenne en avril 2021 pour réglementer et superviser les applications de l'intelligence artificielle (IA) au sein de l'Union européenne (UE). Voici une fiche explicative des éléments clés de l'AIA :

Objectif : L'AIA vise à garantir un niveau élevé de protection de la vie privée, des consommateurs, des droits de l'homme et des libertés fondamentales pour les citoyens de l'UE. Il encourage également l'innovation et la compétitivité des entreprises européennes en fournissant un cadre réglementaire clair et harmonisé pour le développement et l'application de l'IA.
Champ d'application : L'AIA s'applique aux fournisseurs, utilisateurs et importateurs d'IA au sein de l'UE, ainsi qu'aux fournisseurs et importateurs situés en dehors de l'UE, dont les systèmes d'IA sont utilisés dans l'UE.
Catégories de risques : L'AIA établit une classification des applications d'IA en fonction des risques potentiels qu'elles présentent pour les droits fondamentaux et la sécurité :

Risque inacceptable : Les applications d'IA présentant un risque inacceptable pour les droits fondamentaux et la sécurité publique sont interdites. Cela inclut les systèmes de manipulation du comportement humain, les systèmes de notation sociale généralisée et les applications de surveillance en temps réel, entre autres.
Risque élevé : Les applications d'IA présentant un risque élevé sont soumises à des exigences réglementaires strictes en matière de transparence, de responsabilité, de sécurité et de protection des données.
Risque limité : Les applications d'IA présentant un risque limité, telles que les chatbots, doivent respecter certaines obligations en matière de transparence.
Risque minimal : Les applications d'IA présentant un risque minimal ne sont pas soumises à des exigences spécifiques.

Exigences réglementaires : Les applications d'IA à haut risque doivent se conformer aux exigences suivantes :

Qualité des données : Les fournisseurs d'IA doivent s'assurer que les données utilisées pour entraîner, valider et tester les systèmes d'IA sont de haute qualité, sans biais discriminatoires.
Documentation : Les fournisseurs d'IA doivent documenter et fournir des informations détaillées sur les systèmes d'IA, leur fonctionnement, leurs objectifs, leurs limites et leur impact sur les droits fondamentaux.
Transparence : Les utilisateurs d'IA doivent être informés lorsqu'ils interagissent avec un système d'IA, et les informations sur la logique et les paramètres de fonctionnement de l'IA doivent être accessibles.
Responsabilité humaine : Les décisions prises par les systèmes d'IA à haut risque doivent être supervisées et vérifiées par des humains.
Sécurité et robustesse : Les systèmes d'IA doivent être sécurisés et résistants aux attaques et aux erreurs, et les fournisseurs d'IA doivent mettre en place des mécanismes de contrôle et de surveillance appropriés.

#GPT4

Augmentation

types : concept

mots-clés :

Le concept est ici appliqué au journalisme pour montrer qu'il ne s'agit pas de remplacer le journalisme par des IA qui vont reposer sur de l' → automatisation mais bien d'une hybridation qui vise à accroître le potentiel des rédactions :

Technologies like AI can augment—not automate—the industry. In a journalism landscape altered by new technology, the next [@marconiNewsmakersArtificialIntelligence2020]

Calculateur : un calculateur est un ordinateur, logiciel ou → algorithme spécialisé dans les calculs→. Les calculateurs sont guidés par des choix : selon la nature des données enregistrées, la manière de les catégoriser, les techniques statistiques ou la visualisation employées, le résultat sera différent.
Selon Dominique Cardon

Les calculateurs fabriquent notre réel, l’organisent et l’orientent. Ils produisent des
conventions et des systèmes d’équivalence qui sélectionnent certains objets au
détriment d’autres, imposent une hiérarchisation des valeurs qui en vient
progressivement à dessiner les cadres cognitifs et culturels de nos sociétés →. (Cardon, 2015, p.13)

La culture algorithmique est un concept qui désigne l'influence des algorithmes sur la culture et la manière dont on perçoit le monde qui nous entoure. Le concept est notamment décrit par [@striphasAlgorithmicCulture2015]
Rob Horning montre cet effet de "façonnage" des perceptions que produit notamment les → Newsfeed des réseaux sociaux sur les individus :

La culture algorithmique nous laisse généralement éprouver notre identité en tant que « forme pure » atomisée
que pour vous ; vous êtes la seule raison pour laquelle il apparaît sous cette forme, et il n’accomplit rien d’autre que >de vous autoriser à apprécier votre place au cœur de cette boucle fermée. [@horningPolitiqueScroll2022]

Daily Wire

types : techniques

mots-clés :

Le Daily Wire est un site de contenu qui a optimisé ses résultats de diffusion sur → Facebook en cherchant à mieux comprendre son mode de fonctionnement. Une opportunité pour ce média qui propose des contenus de type sensationnel.
Ben Shapiro son fondateur possède une maîtrise avancée de l' → algorithme d Facebook et est parvenu à placer régulièrement des séries de contenus parmi les dix meilleures audiences de la plateforme avec une stratégie fondée notamment sur la → publicité ciblée
The markup a analysé les raisons de ce succès après un premier travail de *https://www.npr.org/2021/07/19/1013793067/outrage-as-a-business-model-how-ben-shapiro-is-using-facebook-to-build-an-empire?t=1628664284408NPR*

Data analyst

types : professionnel

mots-clés :

LeData-analyste est la personne chargée de recueillir des données sur différents canaux médiatiques (entre autres numériques) en vue de produire des informations utiles aux prises de décision des dirigeants.
Son travail précède souvent celui du → data scientist.

Data broker

types : professionnel

mots-clés :

Data broker, ou “courtier de données” : individu ou organisme qui se spécialise dans la collecte de → données personnelles en ligne. Les data brokers achètent, agrègent, affinent et revendent les données qu’ils obtiennent avec le consentement des utilisateurs à travers l’acceptation de Conditions générales d’utilisation (CGU). Ils spéculent sur la valeur de ces données avant de les revendre à un prix avantageux. Les organismes Epsilon, Ecxiom, Experian, Datalogix ou encore Cambridge Analytica sont des data brokers.

Data driven society

types : concept

mots-clés :

Le concept est utilisé par Sun Ha Hong [@hongTechnologiesSpeculationLimits2020a] pour désigner une société qui repose sur la captation des données et son analyse en temps reél pour imposer des → technologies de spéculation

Data journalisme

types : professionnel

mots-clés :

Journalisme de données - data journalism : Le journalisme de données, ou journalisme de bases de données, est une manière d’exercer le journalisme via l'exploitation de données → statistiques et la mise à la disposition de celles-ci au public (data visualisation, graphique, article etc). La donnée peut être exploitée par plusieurs prismes : l’investigation, la vérification d’une information ou d’un postulat, mais aussi la visualisation. Il n’existe pas une manière de pratiquer le Data Journalisme bien qu’elle soit liée à des outils statistiques : dans certains cas, elle dépend de l’ouverture des bases de données pourtant dites “open source”, mais aussi de la maîtrise de leur traitement sur un tableur. Le data journaliste peut aussi faire appel à des hackeurs et spécialistes du monde numérique pour les accompagner dans la recherche d’informations en ligne [@grayGuideDatajournalismeCollecter2013a]

L'importance des données en → Open Data est régulièrement rappelée pour réaliser un travail avec des données à jour et précises afin de dépasser les seules impressions.

Data labeler

types : professionnel

mots-clés :

Data labeler : personne rémunérée pour effectuer des travaux de nettoyage de données à bas prix. Ces travaux sont postés sur des interfaces de micro-travail en ligne comme la plateforme d’Amazon : Mechanical Turk.
Ces travaux à bas coût font partie du phénomène plus général du → digital Labor [@cardonQuEstceQue2015 ; @casilliAttendantRobots2019]

Data mining

types : méthodes

mots-clés :

Data Mining, ou “fouille des données” : cette méthode établit des liens entre les données → données et les transforme en informations. Elle consiste à ranger et hiérarchiser des profils selon des catégories établies par le propriétaire des données. Par exemple, des clients jugés “intéressants” sont dissociés des autres. De même, de nouveaux utilisateurs sont orientés et catégorisés. L’algorithme de l’application de rencontres → Tinder correspond à cette méthode de calcul [@duportailAmourSousAlgorithme2019]

Data scientist

types : professionnel

mots-clés :

Spécialiste de l'analyse des données, notamment des →

Deep learning

types : méthodes

mots-clés :

Apprentissage profond, ou deep learning : dérivé du →machine learning, ce type d’ → intelligence artificielle permet à l’algorithme → algorithme d’apprendre de lui-même à partir d’un réseau de neurones artificiels s’inspirant du cerveau humain. Ceux-ci sont dispersés sous forme de couches, chacune d’elle recevant les informations que véhicule la précédente. Par exemple, lorsque l’algorithme souhaite reconnaître quelqu’un sur une photo, il identifie d’abord une personne, un visage, puis la couleur des yeux avant d’arriver à un résultat : l’identification du visage, par le biais d’une comparaison avec les physiques déjà enregistrés en base de données. Les algorithmes de reconnaissance faciale sont basés sur ce type de processus.

Deep Nude

types : algorithme

mots-clés :

types : organisation

mots-clés :

La législation sur les services numériques a pour but d'encadrer les pratiques des plateformes en matière de gestion des données, de ciblage et de diffusion de l'information.
Elle prévoit des obligations croissantes proportionnellement avec la taille de la plateforme.

https://www.consilium.europa.eu/fr/press/press-releases/2022/04/23/digital-services-act-council-and-european-parliament-reach-deal-on-a-safer-online-space/

Documenter les algorithmes

types : méthodes

mots-clés :

Processus qui consiste à documenter et expliciter les algorithmes utilisés au sein d'une plateforme soit de la part des protagonistes soit par des usagers extérieurs.
Le processus extérieur nécessite souvent un travail de → rétroingénierie.

Au niveau des rédactions, Marconi recommande d'effectuer ce travail de documentation :

Journalists can streamline the process of assessing the reliability of algorithms by developing documentation to be used as a reference for future projects. [@marconiNewsmakersArtificialIntelligence2020]

Il décrit ensuite les éléments qui doivent figurer dans ce travail :

OVERVIEW: What AI system is being used and what are its
attributes?
• METHODOLOGY: Why was this particular algorithm used and how
was the data sourced?
• PROCESS: What steps were taken to ensure editorial quality and
accurate results?
• EDGE CASES: What potential errors were flagged with the data and
algorithm?
• DISCLOSURE: How was the audience informed of the use of AI?
• NEWSROOM IMPACT: What were the success metrics in terms of
story engagement, differentiation, time savings, etc.?

Donnée brute

types : concept

mots-clés :

Donnée brute : une donnée brute, aussi appelée “primaire”, est une → donnée numérique non interprétée qui émane d'une source primaire, sans traitement ou manipulation.

Donnée numérique

types : concept

mots-clés :

Donnée numérique : représentation d’une information (sexe, âge, géolocalisation, transaction, infromations personnelles, administratives, commerciales etc) dans un programme informatique. Une donnée peut être présente dans le texte du programme, comme dans la mémoire durant l’exécution. Les données sont des traces de comportements, enregistrées dans des serveurs. Leur association peut produire une information notamment quand il s'agit d'obtenir des → données personnelles.

Données calculables

types : concept

mots-clés :

Données calculables : les données calculables sont des informations qui peuvent être prises en compte par un système informatique.

Le savoir et les connaissances, les photographies et les vidéos, nos mails et ce que nous racontons sur Internet, mais aussi nos clics, nos conversations, nos achats, notre corps, nos finances ou notre sommeil deviennent des données calculables. [@cardonQuoiReventAlgorithmes2015a]

Les sociétés numériques ont construit leur économie sur la monétisation de ce temps attentionnel : les réseaux sociaux sont à prime abord gratuits, mais leur économie est fondée sur l’attention qu’un utilisateur porte à une publicité ou encore un contenu commercial. L’attention dirige l’acte d’achat et semble plus “rentable” qu’un abonnement traditionnel.

Edge Rank

types : algorithme

mots-clés :

EdgeRank : → Algorithme utilisé par le réseau social → Facebook. Son objectif est de privilégier et mettre en avant sur le fil d’actualité → (Newsfeed) les publications des “amis” avec lesquels l’utilisateur a le plus d’interactions via des → likes, commentaires ou discussions. A l’inverse, il voit peu de publications de ses “amis” avec lesquels il a le moins interagi. Cet algorithme s'appuie sur les pratiques de sociabilité des utilisateurs [@cardonQuoiReventAlgorithmes2015a]

Effet Jaberwocky

types : algorithme

mots-clés :

L'effet Jabberwocky est un phénomène qui se produit lorsque l'on utilise l'apprentissage automatique (→ Machine learning] pour traiter de grandes quantités de données. Le terme fait référence au poème de Lewis Carroll "Jabberwocky", dans lequel des mots inventés sont utilisés pour créer une impression de sens sans pour autant avoir de signification précise.

Lorsqu'un algorithme de machine learning est utilisé pour traiter des données massives, il peut devenir très complexe et difficile à comprendre. Les données entrées dans le modèle peuvent également contenir des erreurs ou des biais, ce qui peut conduire à des résultats inattendus. Les chercheurs peuvent alors avoir du mal à comprendre comment le modèle fonctionne exactement et comment il a produit ses résultats.

L'effet Jabberwocky peut également se produire lorsque le modèle est utilisé pour des tâches pour lesquelles il n'a pas été spécifiquement conçu. Par exemple, un modèle conçu pour la reconnaissance d'images peut être utilisé pour générer des descriptions de ces images. Les résultats peuvent sembler corrects à première vue, mais sans une compréhension précise de la façon dont le modèle fonctionne, il peut être difficile de dire avec certitude si les résultats sont fiables ou non.

En résumé, l'effet Jabberwocky souligne la difficulté à comprendre les résultats produits par des algorithmes de machine learning très complexes et à grande échelle, en raison de la masse de données traitées et de la difficulté à comprendre le cheminement effectué et l'impossibilité de le comprendre et de le reproduire.
Le concept a été créé par Olivier Le Deuff en 2020 dans un de ces cours sur les enjeux algorithmiques autour des données.

ELO ranking

types : algorithme

mots-clés :

Fameux algorithme de → Tinder qui calcule un indice de désirabilité en fonction des interactions produites. Il s'agit d'un indice qui est basée sur la captation de l'→ de l'attention.
Judith Duportail cherche à en comprendre les principes dans son ouvrage [@duportailAmourSousAlgorithme2019].
Un article de The tab décrypte rapidement ses bases de fonctionnement.
L'algorithme a évolué depuis et fonctionne en complément d'autres algorithmes.
Le principe fonctionne sur des critères de popularité qui permettent d'attribuer une note de 1 à 10 à chaque usager. Plus la note est élevée, plus les chances d'apparaître sur l'application sont élevées. On retrouve finalement une philosophie de classement proche de celui des sites web du → Page Rank, sauf qu'ici il s'agit de classer des profils.

Emetteur-récepteur

types : concept

mots-clés :

Notion d’émetteur - récepteur : d’après la théorie de la transmission de l’information définie par Claude Shannon et Warren Weaver en 1948, un message se déplace d’un point A (l'émetteur) vers un point B (le récepteur) via un signal qui traverse un canal (ici, la machine : ordinateur, smartphone etc). Cette théorie schématique est un point d’ancrage essentiel pour comprendre la transmission d’un message par le biais d’une technologie. Pour autant, son interprétation considère le récepteur comme passif, tandis que Stuart Hall critique le modèle de linéarité de ce schéma. Il considère ainsi, à travers l’analyse du média télévisuel, que la distribution d’un message est circulaire et entretenue par l’articulation de moments liés entre eux, mais distincts : la production, la circulation, la distribution, la reproduction. Marshall McLuhan remarque, dès les années 1960, que les médias fournissent les bases de la réflexion et du processus de la pensée [@mcluhanPourComprendreMedias2013].
Il définit également la dimension de “village global [@mcluhanGlobalVillageTransformations1989] avec la mondialisation des nouvelles technologies de l’information-communication.

Le réseau internet permet désormais d’aller plus loin que la définition de la communication par Shannon et Weaver : le web est un réseau d’échange et les récepteurs peuvent non seulement adresser des → Feed backs , mais ils sont aussi devenus créateurs de contenu.

Enchère en temps réel

types : méthodes

mots-clés :

Enchère en temps réel, ou real-time bidding : une technologie marketing qui consiste à vendre en temps réel un → profil d’utilisateur en vue de cibler la publicité. Pendant que l’internaute charge la page web qu’il désire consulter, ses données sont mises aux enchères afin que des → algorithmes programmés par des annonceurs déroulent des bandeaux publicitaires adaptés.

Engagement

types : concept

mots-clés :

Erreur de données

types : concept

mots-clés :

Une erreur dans une base de données ou un problème d'interprétation de la donnée peut entraîner par la suite des erreurs d'interprétation notamment par des intelligence artificielle. C'est le cas d'une programme de production de news de façon automatique qui a publié en juillet 2015 une annonce comme quoi l'action → Netflix avait chuté de 71% alors qu'elle avait en réalité plus que doubler, du fait d'une erreur d'analyse de la → qui avait été remontée.
Ces erreurs montrent l'importance de la → documentation des dispositifs et la nécessité de personnels qui veillent à la cohérence et la conformité des sets de données utilisées.

In fact, journalists should always be on the lookout for potential errors. For instance, a Los Angeles Times’s bot in 2017 mistakenly published an automated news update about a 6.8 magnitude earthquake off the coast of California—that actually happened in 1925.16 The inaccuracy was linked to an error in the United States
Geological Survey data and is an important reminder that automated systems require human oversight, such as review from automation editors in the newsroom. [@marconiNewsmakersArtificialIntelligence2020]

Expérience du NYT en reconnaissance faciale

types : investigations

mots-clés :

Le New York Times a testé les technologies de reconnaissance faciale en utilisant les technologies → Amazon dédiées qui sont disponibles facilement. Le but était de montrer les risques de la → reconnaissance faciale. L'équipe de journalistes est parvenue à identifier une centaine de visages de personnes filmées par les caméras alors qu'ils marchaient à New York dans le Bryant Park. Un article interactif a été publié pour présenter les résultats et lancer une discussion sur les risques de l'utilisation de ce genre de technologies par les gouvernements et sur la → Responsabilité (accountability) que cela entraîne.

Facebook

types : organisation

mots-clés :

le réseau social créé par Zuckerberg est considéré comme faisant partie des fameux → GAFAM

Facebook Files

types : investigations

mots-clés :

Série de documents issus de la lanceuse d'alertes Frances Haugen qui a voulu montrer que → Facebook maximisait surtout les stratégies de profil au détriment des promesses éthiques et de qualité de l'information de la plateforme.
Les documents ont permis plusieurs investigations de la part de collectifs de journaux.
Les révélations ont également intéressé les autorités politiques.
Au niveau européen, le → Digital Service act qui est en cours de finalisation envisage des moyens législatifs pour éviter ces dérives.

Julien Mazurier Quel traitement la presse française généraliste réserve-t-elle aux algorithmes ?
Étude de la couverture médiatique des Facebook Files, AlgoJ , 6 mars 2022, https://algoj.hypotheses.org/115

Fairness flow

types : techniques

types : concept

mots-clés :

Filter bubble : la “bulle de filtre” désigne un concept où les → algorithmes confrontent les internautes à des situations et des opinions similaires aux leurs sur les réseaux sociaux. Aussi appelées “bulles de préférences”, elles ont été théorisées par l'informaticien et cyber militant américain Eli Pariser. Ces “cloisons” informationnelles enfermeraient l’internaute dans un même paysage médiatique, avec peu d’ouverture vers d’autres formes d’idées que celles qu'il partage avec ses proches. Par exemple, sur la plateforme de streaming Netflix, les recommandations de l’algorithme dépendent des films et séries que l’utilisateur a regardé, consommé et aimé. Si un individu regarde régulièrement des films d’action, celui-ci sera plus facilement dirigé vers des films similaires_._ L’accès à l’information et à une pluralité d'opinions serait de plus en plus filtré sur internet, par des algorithmes de moteurs de recherche et les réseaux sociaux (Bakshy, 2015). Pour autant, l’algorithme n’explique pas à lui seul ce phénomène : les individus peuvent s’enfermer eux-mêmes dans une bulle, en fonction de leurs critères de socialisation.
Sur → facebook, le phénomène peut conduire à des formes de radicalisation ou de désinformation politique.

Marconi explique la nécessité de veiller à une ouverture journalistique tant les algorithmes de personnalisation accroissent ce risque : The dilemma is far too common in newsrooms. And it creates an incentive to publish stories on topics that are at one of two extremes: marginal or hyperpolarizing. Neither is productive for fostering a healthy public discourse. This conundrum is, in some cases, exacerbated by personalization algorithms that tailor content to the profile of each individual. When users are only shown stories on topics they already care about, and thus are not exposed to a diverse range of viewpoints, this can lead to a one-dimensional media diet and ultimately to a reinforcement of preconceived ideas. [@marconiNewsmakersArtificialIntelligence2020]

Filtrage collaboratif

types : méthodes

mots-clés :

Filtrage collaboratif : propose à l’utilisateur d’étendre son champ de recommandations en comparant son profil →profil et ses données avec celles d’autres utilisateurs ayant acheté les mêmes produits.

First Party Cookie

types : techniques

mots-clés :

First party cookie ou cookie interne : un → Cookie associé au nom de domaine de la page sur laquelle est placé le code du marqueur servant à auditer un site.

Flux Rss

types : techniques

mots-clés :

Le flux rss est le flux qui permet de s'abonner à un média pour le consulter sur un dispositif personnel comme un agrégateur de flux.
Il permet d'être au courant des mises à jour et des dernières publications du site ou média sélectionné.
Le système tend à être de plus en plus contraint par des médias qui les suppriment voire qui les restreignent car le système décentralisé qu'il suppose s'oppose au final à des logiques de monétisation et de → profilage des usagers.
Comme le dit Lorusso :

De nos jours, le processus de collecte des URL de fil RSS semble extraordinairement pénible en comparaison avec la >fluidité des "suggestions pour vous" de Twitter." [@lorussoLiquiderUtilisateur2022a]

For You

types : algorithme

mots-clés :

Algorithme de personnalisation du → Newsfeed de → Tik Tok.

Forensic Architecture

types : organisation

mots-clés :

Forensic Architecture, ou architecture légale : Forensic Architecture est un collectif de recherche multidisciplinaire qui enquête sur des sujets liés aux droits de l’homme, aux forces de police, aux armées et à l’Etat. Dirigée par l’architecte Eyal Weizman, à Londres, l’agence a publié une soixantaine de contre-enquêtes disponibles en accès libre. La dernière concerne la mort de Ahmad Erekat, un jeune palestinien tué le 23 juin 2020 par des troupes isréliennes.
Les travaux sont basés sur une approche spécifique de l' → OSINT qui repose sur une analyse des → traces.

Fun

types : concept

mots-clés :

Le mot fun est ici à comprendre dans un sens quasiment culturel dans une approche qui rappelle Alan Liu lorsqu'il évoque une culture de l'information qui est essentiellement "cool".
Ici, il s'agit de décrire un phénomène dans lequel le "fun" est un prérequis de la → Culture algorithmique comme l'explique bien :

Le « fun » évoque souvent les formes de plaisir caractérisées par « l’économie de l’expérience », dans laquelle la vente >est associée au tourisme, saturée d’une « authenticité » qui se déconstruit elle-même. Il comprend aussi des >« expériences » vécues par l’utilisateur – du divertissement sur écran, souvent présenté en série sous forme de feed >(zapper ou scroller à l’infini sont les cousins contrariés du « fun »). Le « fun » fait du plaisir une marchandise, une >fin en soi qui peut s’abstraire de ses moyens. Il suppose – ou plutôt prescrit – de ressentir le temps comme un vide >uniforme, un espace vierge qui doit être rempli par différentes phases d’attention préfabriquées. Le « fun » advient >lorsque nous terrassons l’ennui ; l’idée que par défaut l’on s’ennuie est le prérequis du « fun ».
[@horningPolitiqueScroll2022]

FUNES

types : algorithme

mots-clés :

Algorithme créé par un collectif de →journalistes d'investigations pour détecter des corruptions parmi des masses de documents.

It allows us to have a holistic view of the system, to fight corruption in public procurement more effectively

GAFAM

types : organisation

mots-clés :

GAFAM : cet acronyme fait référence aux géants américains du numérique, → Google, → Amazon, → Facebook, → Amazon, → Microsoft . Ces multinationales ont construit leur fortune sur l’espace numérique → et internet : nouvelles technologies, télécommunications et commerce en ligne. Désormais, ils sont concurrencés par leurs équivalents chinois : les BATX (Baidu, Alibaba, Tencent, Xiaomi). Les GAFAM font l'objet de critiques et de tentatives de législation. L’union européenne s’attelle, depuis peu, à rééquilibrer le jeu de la concurrence en matière de numérique.

Gaslighting

types : concept

mots-clés :

Gatekeeper

types : professionnel

mots-clés :

Gatekeeper : désigne un “portier” - journaliste, citoyen sur le web - qui sélectionne les entrées informationnelles. Ces gatekeepers critiquent l’hégémonie des → algorithmes, accusés de déformer, voire de censurer les messages et de produire des → biais. Le gatekeeper peut être associé au mouvement de la → sousveillance.
Son efficacité dépend également de la → littératie algorithmique dont il dispose et qu'il parvient à transmettre aux autres.

Gimmick

types : concept

Gloriomètre

types : concept

mots-clés :

Gloriomètre : théorisé par Gabriel Tarde comme étant un “moyen de mesurer la gloire” (Psychologie économique, 1902), ce concept s’étend aujourd’hui aux mesures de → réputation en ligne ou → E-réputation. L’objet est d’évaluer, chiffrer et quantifier l’influence et la notoriété numérique au travers de chiffres, compteurs et algorithmes. Selon Dominique Cardon : “Ils dessinent un paysage hérissé de monticules et de vallées creuses, une topologie signalant les réputés, les influents et les notoires à ceux qui traversent la carte en utilisant les reliefs pour s’orienter” [@cardonQuoiReventAlgorithmes2015a]

Google

types : organisation

mots-clés :

Le célèbre leader du web, considéré comme un des → GAFAM était à la base un → moteur de recherche.

Google Dorking

types : méthodes

mots-clés :

Google Dorking, ou Google Hacking : le Google Dorking, aussi appelé Google Hacking, permet de récupérer des documents grâce à des recherches ciblées sur le → moteur de recherche → Google. Employé pour la première fois en 2002, le terme de GoogleDork désigne tous les outils disponibles pour aller au-delà d’une recherche d’information sémantique classique sur un moteur de recherche, comme “Qu’est-ce que le hacking ?”. Par exemple, il est possible d’affiner un résultat en allant dans les paramètres avancés de la barre de recherche, ou en employant des raccourcis, mots clés et symboles (aussi appelés “opérateurs” ou “filtres”) comme l’emploi des guillemets pour rechercher l’ensemble d’un groupe de mots.

Exemple d’outils :

Pour faire une recherche de mot clef sur un seul site internet, il faut rentrer dans la barre de recherche : “site:(adresse d’un site, exemple www.franceinter.fr) + mot clef”.
Pour trouver un mot dans le titre d’une page web, rentrer : “intitle:“(mot clef, exemple Qu’est-ce que le hacking ?)”
Pour chercher des mots dans une URL, rentrer : “inurl:/mot clés”

Il existe de nombreuses autres combinaisons, qui peuvent aussi être associées, en vue d’affiner un résultat.

Google News

types : techniques

mots-clés :

Application de → Google qui va émerger en 2001 lors du 11 septembre.
Un → algorithme spécifique →]] Story Rank est créé à l'occasion

https://larevuedesmedias.ina.fr/google-news-actualites-origine-11-septembre-attentats

Graphext

types : algorithme

types : concept

mots-clés :

Concept qui désigne les stratégies en matière de design de l'information qui privilégie des logiques de flux ininterrompu qui s'observent notamment dans les → Newsfeed des réseaux sociaux où les contenus sont générés automatiquement et qui s'opposent à des flux construits à partir de traitements informationnels reposant sur le travail de l'usager qui sélectionne ses → Flux Rss
L'hyperlinéarité tel que le décrit Silvio Lorusso est une → prolétarisation :

L’hyperlinéarité est la linéarisation en réseau de contenus, de sources et d’activités disparates dans des listes : photos >personnelles, articles, discussions, sondages, publicités, etc. Bien sûr, un utilisateur peut toujours cliquer pour >sortir, mais cela ressemble plus à du zapping sédentaire qu’à une exploration active de l’espace organisé en réseau. >De Facebook à Instagram à Reddit, et on recommence. Voilà le zapping hyperlinéaire, particulièrement visible >dans la structure compartimentée des ordinateurs mobiles" [@lorussoLiquiderUtilisateur2022a]

Hypernudge

types : concept

mots-clés :

Imaginaire algorithmique

types : concept

mots-clés :

Le concept s'appuie sur l'étude des représentations fantasmées ou mythifiées en ce qui concerne les algorithmes ou leurs effets.

L'imaginaire algorithmique ne doit pas être compris comme une fausse croyance ou une sorte de fétiche, mais >plutôt comme la manière dont les gens imaginent, perçoivent et expérimentent les algorithmes et ce que ces >imaginations rendent possible. En utilisant le prisme théorique de l'affect, compris comme l'humeur et l'intensité >correspondant aux « forces de rencontre » (Gregg & Seigworth, 2010), l'objectif est de comprendre comment les >algorithmes ont la capacité « d'affecter et d'être affecté ». [@bucherAlgorithmicImaginaryExploring2017, p.31]

increasing algorithm life

types : algorithme

mots-clés :

Indexation

types : concept

mots-clés :

Processus destiné à représenter, au moyen des termes ou indices d'un langage documentaire ou au moyen des éléments d'un langage libre, les notions caractéristiques du contenu d'un document (ressource, collection) ou d'une question, en vue d'en faciliter la recherche, après les avoir identifiées par l'analyse.
(Glossaire adbs)

Ron Day [@dayIndexingItAll2014a] effectue un lien entre l'indexation et les actuels processus algorithmiques → :

Comme dans un passé lointain, mais de plus en plus et de façon exponentielle au cours du XXe siècle et jusqu'à aujourd'hui, ces "faits" se produisent grâce à l'infrastructure des techniques et technologies documentaires, non seulement dans les activités scientifiques et professionnelles, mais aussi en tant que dispositifs de médiation dans la vie quotidienne. Avec la récursivité, l'échelle et l'ubiquité croissantes des infrastructures sociotechniques, les algorithmes et les index sont devenus à la fois plus opaques et plus mobiles, dissimulant les hypothèses logiques et psychologiques qui étaient autrefois très claires dans les classifications et les structures taxonomiques traditionnelles, descendantes et universelles, ainsi que dans d'autres objets et sujets professionnels des technologies de l'information. [@dayIndexingItAll2014a, P.16]

Les → métadonnées présentes dans les fichiers et les profils constituent un important volet actuel de l'indexation.

Instrument statistique

types : techniques

mots-clés :

Instrument statistique : dont l'objectif est de mesurer des → statistiques.

à compléter

Intelligence artificielle

types : concept

mots-clés :

Intelligence artificielle (IA) : née dans les années 1980, son ambition était de faire reproduire les → automates de l'intelligence humaine à des machines. Mais la diversité des comportements du vivant ne peut être automatisée. Aujourd’hui, les informaticiens s’attachent plus à rendre les algorithmes “statistiques” via la l'ingestion de masses de données contextuelles..

Anecdocte : AI pourrait être aussi une référence à Isaac Asimov de la part de Marvin Minsky

Intelligibilité

types : concept

mots-clés :

Concept qui vise à rendre compréhensible un algorithme et sa systémique pour le grand public.
L'intelligibilité peut être produite par un travail de → rétroingénierie ou bien être réalisée grace à un travail de documentation du code.
Elle peut être aussi exigée dans les relations "code-public" en ce qui concerne les codes et algorithmes produits par les administrations comme ce qui est expliqué ici. Dans ce cas, la démarche s'approche des logique de l' → accountability)

Internaute

types : concept

mots-clés :

Internaute : utilisateur d’internet. L’individu, en tant qu’internaute, peut interagir avec les autres utilisateurs d’internet, consulter et créer du contenu en ligne. L’espace médiatique en ligne est un lieu d’expression où l’internaute dispose du pouvoir de création et d’alimentation de la connaissance d’après le mouvement libertaire incarné par Richard Stallman. La mathématicienne Cathy O’Neil [@oneilAlgorithmesBombeRetardement2018]alerte, quant à elle, sur le risque de reproduction des inégalités sociales (genre, origine sociale, handicap, couleur de peau etc.) Des effets exposés par le journaliste canadien Nicolas Carr dans son article “Is Google making us stupid ?”, paru en 2008 dans la revue The Atlantic. L’auteur y illustre les enjeux sociaux, cognitifs et culturels du monde digital pour l’internaute en tant qu’individu et citoyen.

Internet

types : techniques

mots-clés :

Internet : ensemble des réseaux informatiques internationaux et interconnectés. Né en 1969 avec le →réseau ARPANET, l’Internet permet désormais à des serveurs de communiquer sur la base d’un protocole commun. Cette technologie permet aux informations de circuler dans un espace et une temporalité inédits, propice au pluralisme des informations. Le → Web constitue une de ses plus célèbres applications.

Iterative Journalism

types : concept

mots-clés :

Décrit dans son ouvrage [@marconiNewsmakersArtificialIntelligence2020] ce type de journalisme désigne :

Iterative journalism is empathetic journalism: It uses audience interviews, surveys, analysis of comments, and observation to learn what readers care about, not just how many of them there are. https://www.niemanlab.org/2019/01/the-year-of-iterative-journalism/

Il s'agit d'une approche qui consiste à mieux comprendre les publics de lecteurs et ce qu'ils sont susceptibles d'apprécier. Un travail de → profilage est alors requis.

Iterative journalism is the idea of adjusting coverage in real time to serve the rapidly changing information needs of readers. This is possible by mixing editorial insights with audience feedback. Knowing which issues readers care about helps journalists to be accountable to them. The iterative process starts with defining opportunities for news experimentation and identifying both the editorial resources needed and technical requirements. After launching a story prototype and measuring its audience impact, journalists evaluate whether the effort warrants additional commitment. If so, they can develop a scaling strategy, handing off the project to the proper group for the day-today management. Implementing “minimally viable” stories, pursuing augmented audience understanding, and setting up research and development labs are three distinct strategies of iterative journalism that allow newsrooms to understand what variables of a story are most relevant to news consumers. [@marconiNewsmakersArtificialIntelligence2020]

Littératie algorithmique - un sous-ensemble de la maîtrise de l'information, la littératie algorithmique s'avère une >conscience critique de ce que sont les algorithmes, comment ils interagissent avec les données comportementales >humaines dans les systèmes d'information, et une compréhension des enjeux sociaux et éthiques liés à leur utilisation.
Citation originale :
Algorithmic literacy — a subset of information literacy, algorithmic literacy is a critical awareness
of what algorithms are, how they interact with human behavioral data in information systems,
and an understanding of the social and ethical issues related to their use. [@headInformationLiteracyAge2020, p.51]

Les auteurs distinguent souvent deux niveaux. Le premier est celui de la prise de la conscience de la présence des algorithmes et d'une partie de leurs effets dans les dispositifs.
Le second renvoie à une connaissance plus approfondie qui se rapproche d'une maîtrise avancée des dispositifs au point de se prémunir contre des effets indésirables voire de contourner le dispositif.
Plus le niveau de littératie augmente, plus il se rapproche de l'état de majorité décrit par Gilbert Simondon. [@simondonModeExistenceObjets1989]

Projet Décode les algorithmes, par KCJ et CCUNESCO. Voir le Guide éducatif Apprenez en plus sur les algorithmes, 2020.

Log

types : techniques

mots-clés :

Logging, ou “log” : on parle de log (diminutif de logging) pour désigner un fichier (généralement textuel) permettant de stocker un historique des événements attachés à un processus. Ces évènements sont horodatés et ordonnés en fonction du temps. On peut le traduire comme étant un “journal” de toutes les actions effectuées. Le plus connu reste l'historique des requêtes effectuées sur un → moteur de recherche car cela permet ensuite d'individualiser les résultats en constituant un → profil de l'utilisateur.

Logiciel libre

types : techniques

mots-clés :

Logiciel libre : il s’agit d’un logiciel informatique que l’on peut copier, utiliser, modifier, transformer ou encore distribuer librement (Chevet, 2002). Apparu dans les années 1980, aux prémices du mouvement Open Source, le logiciel libre est issu de l’idée d’un internet où la connaissance serait accessible à tous et sans contrainte, en réponse à la sécurisation et la protection croissante des logiciels. L’informaticien Richard Stallman, créateur du projet GNU, lança la licence GPL “copyleft” (en contradiction avec le “copyright”) permettant à tous les utilisateurs d’employer les logiciels - et par ailleurs, les connaissances - qui y sont associés [@chevetNumerisationRevuesScientifiques2002].

Logistica numeralis

types : concept

mots-clés :

Loi de Goodhart

types : concept

mots-clés :

Loi de Goodhart : cette théorie, initiée par Charles Goodhart en 1975, souligne la difficulté de mesurer des indicateurs faisant l’objet d’enjeux politiques, sociaux et/ou financiers. Celle-ci indique que “toute régularité → Statistique tend à s’effondrer dès lors qu’une pression lui est appliquée pour la contrôler”.

Lunette statistique

types : concept

mots-clés :

Lunette statistique : un prisme, une optique variable en fonction de paramètres → statistiques et → algorithmiques.

Selon la nature des données enregistrées, la manière de les catégoriser, le choix des <techniques statistiques ou les options de visualisation des résultats, le fait de modifier <les paramètres du calcul conduit à valoriser des choses très différentes. [@cardonQuoiReventAlgorithmes2015a]

Machine learning

types : méthodes

mots-clés :

à compléter

→ Intelligence artificielle

Majorité technique

types : concept

mots-clés :

Medic

types : algorithme

mots-clés :

Un des algorithmes de Google mis en place en 2018

Mesure d'audience

types : méthodes

mots-clés :

Mesure d’audience : mesure qui permet de dénombrer les → clics des → internautes et d’ordonner la popularité des sites. Dominique Cardon la définit comme « à côté du web » :

La mesure d’audience mime le vote démocratique : chaque internaute qui clique dispose d’une voix et d’une seule, et ceux qui dominent le classement sont ceux qui ont < attiré l’attention du plus grand nombre. [@cardonQuoiReventAlgorithmes2015a]

Mesure d'autorité

types : méthodes

mots-clés :

Mesure d’autorité : permet de hiérarchiser les sites au moyen des liens hypertextes qu’ils s’échangent. Dominique Cardon place cette mesure “au-dessus du web”:

La hiérarchisation, et donc la visibilité, est déterminée par la stratégie de référencement des sites internet. L’autorité provient d'une famille de mesures issue du PageRank, L’algorithme de Google qui hiérarchise l’information. [@cardonQuoiReventAlgorithmes2015a]

Mesure de réputation

types : méthodes

mots-clés :

Mesure de réputation : cette mesure se positionne “à l’intérieur du web” [@cardonQuoiReventAlgorithmes2015a], puisqu’elle confie aux internautes des outils pour valoriser leur → réputation, ainsi que celle de leurs produits (dans un cadre marketing). La réputation mesure le pouvoir qu’a l’internaute de voir les autres relayer les messages qu’il émet sur le réseau. Cette métrique se mesure grâce à une série d’indicateurs chiffrés, comme le → Like de →]] Facebook, mais aussi le nombre d’amis, le nombre de publications relayées, likées et commentées etc. Ces → calculateur sont aussi employés pour mesurer la réputation d'une activité. Par exemple, les livreurs indépendants en partenariat avec → Uber Eats sont notés par les clients : leur → E-réputation en dépend, ainsi que leur contrat avec la plateforme.

Mesure prédictive

types : méthodes

mots-clés :

Mesure prédictive : mesure qui se positionne “sous le web” [@cardonQuoiReventAlgorithmes2015a] et qui permet de calculer des → traces de navigation des → internautes. L’objectif est d’établir une → prédiction en vue d’anticiper un comportement, un acte d’achat.

Métadonnées

types : techniques

mots-clés :

Métadonnée : donnée qui définit ou décrit une autre donnée. Elle confère une information à un contenu, dont elle est extraite. Par exemple, une photographie peut contenir différentes métadonnées : l’heure de prise de la photo, le nom de l’appareil utilisé, la vitesse d'obturation employée etc. Tous ces éléments peuvent, le cas échéant, constituer une information, voire une preuve.
Elles sont utilisées à des fins documentaires, à des fins marketing mais également en matière d' → OSINT notamment par certains → journalistes d'investigation.

types : algorithme

mots-clés :

Reuters a utilisé la plate-forme News Tracer pour analyser less sujets émergents sur les réseaux sociaux afin de détecter le plus pertinents, ce qui facilite le travail de repérage et de détection des journalistes. L'outil s'est avéré particulièrement efficient pour les évènements de dernière minutes. En 2015, il a permis de révéler l'existence d'une fusillade à San Bernardino en, Californie, avant tout autre organisme de presse. En 2016, News Tracer a averti ses journalistes d'un tremblement de terre en Equateur dix-huit minutes avant tout autre média.

Newsfeed

types : techniques

mots-clés :

Fil d’actualité (newsfeed) : ensemble des nouvelles publications sur les réseaux sociaux en temps réel, à la suite les unes des autres.
Le fil est notamment utilisé sur les réseaux sociaux comme → Facebook et Twitter. L'algorithme qui préside à l'affichage influe fortement sur les informations dispensées au point de privilégier certains flux à d'autres.

Newsmaker

types : professionnel

mots-clés :

L'expression vient de l'ouvrage de Francesco Marconi qui décrit une hybridation entre le journalisme et les potentialités de l' → Intelligence artificielle.

The main message in Newsmakers is that AI can augment—not automate—the industry, allowing journalists to break more news more quickly while simultaneously freeing up their time for deeper analysis. [@marconiNewsmakersArtificialIntelligence2020]

Le newsmaker est alors un professionnel qui cherche à améliorer les dispositifs, à expérimenter sans craindre les échecs pour en tirer toutes les leçons.
Marconi entreprend d'emblée de marquer le changement de statut par une féminisation assumée :

She makes news using new tools at her disposal. She is a journalist, but right now, she’s also being asked to be a technologist. She represents what the media industry is becoming: an arena for story-enabling, not just storytelling. She is every journalist and every newsroom who wants not only to survive but to thrive in this current era of digital change.

Marconi montre la tension entre deux types de positions :

For the Newsmaker, this feels like a decision between popularity and journalistic necessity.

Numérisation de l'information

types : techniques

mots-clés :

Numérisation de l’information : phénomène de transformation d'un signal analogique en un signal numérique. La numérisation des médias et de nos modes de consommation de l’information suit la → Révolution numérique : les premiers pure players (médias en ligne) se développent dans les années 2000 avec un modèle d’abord publicitaire, puis par abonnement (Mediapart, Rue89). En parallèle, les connaissances et savoirs sont numérisés et stockés(Piègay, 2014).
Dès 1979, le philosophe Jean-François Lyotard notait que

L’Encyclopédie de demain, ce sont les banques de données. Elles excèdent la capacité < de chaque utilisateur. Elles sont la "nature" pour l’homme post-moderne. [@lyotardConditionPostmoderneRapport1979, p.84-85]

Selon l’IDC (cabinet de recherche international dans le domaine des technologies), le volume mondial de données stockées atteindrait 175 zettaoctets en 2025, soit cinq fois plus qu’en 2018.

types : techniques

mots-clés :

Publicité contextuelle : technique marketing visant à proposer une→ publicité ciblée à un → Internaute en fonction de ce qu’il est en train de faire, ou de ce qu’il a fait récemment (comme regarder une page internet, une vidéo etc). La publicité contextuelle ne s’appuie pas sur les → données personnelles ou comportementales de l’utilisateur, mais sur les recherches qu’il vient d’effectuer : ainsi, si un internaute s’est renseigné sur les baskets d’une marque connue, il pourrait retrouver des publicités en lien avec cette même marque.

Publicité native

types : techniques

mots-clés :

Publicité native : publicité publiée sous la forme d’un publi-rédactionnel, intégrée à un média en ligne. Elle s’harmonise avec la charte graphique du média, ce qui peut porter à confusion entre publicité et contenu médiatique.

Quantificateur

types : techniques

mots-clés :

Quantificateur : au tournant des années 1980, les quantificateurs sont apparus comme des outils → statistiques pour mesurer la vie sociale.

Baromètres, indices et palmarès entreprennent de chiffrer des activités qui, jusqu’alors, n’étaient pas mesurées ou dont la quantification ne faisait pas l’objet d’une attention constante et inquiète. [@cardonQuoiReventAlgorithmes2015a]

Quantified self

types : concept

mots-clés :

Pratique de mesure de soi (quantified self) : mouvement qui permet à chacun, par le biais d’outils et de méthodes, d’avoir un regard sur ses → données personnelles en vue de les diffuser, les analyser, les partager. Pour cela, des capteurs numériques peuvent être employés pour chiffrer ces activités : par exemple, le temps et l’intensité des activités sportives, les heures de sommeil, les battements de cœur etc.

types : concept

mots-clés :

Réputation : opinion favorable ou défavorable du public sur quelqu’un. On parle d' → E-réputation lorsqu’elle émane du web. La réputation engendre de l’influence, à savoir :

Le ratio entre le nombre de personnes que l’on connaît et le nombre de personnes dont on est connu : elle mesure la force sociale d’un nom, d’un portrait ou d’une image. [@cardonQuoiReventAlgorithmes2015a]

Réseau

types : concept

mots-clés :

Réseau : un réseau (network) est un ensemble d'objets interconnectés les uns avec les autres. Il permet de faire circuler des informations numériques entre chacun de ces objets. On peut le distinguer de la mise en réseau (networking), qui désigne la mise en œuvre des outils et des tâches permettant de relier des objets afin qu’ils puissent partager des ressources.

Réseau bayésien

types : concept

mots-clés :

Réseau bayésien : dans les champs informatiques et →]] statistique, ce → Réseau est un modèle graphique de probabilités représentant les causes et effets d’un ensemble de variables aléatoires.

[

Réseau. Théorie des trois couches

types : concept

mots-clés :

Réseaux, théorie des trois couches : En fonction de la localisation, la distance et le débit, les réseaux sont classés en trois types :

LAN (Local Area Network) : un réseau local, interne à une organisation. Permet le partage de ressources. Par exemple, une salle informatique, le réseau d’une résidence.
MAN (Metropolitan Area Network) : réseau qui permet la connexion de plusieurs sites à l’échelle d’une ville. Par exemple, l’intranet d’une université.
WAN (Wide Area Network) : réseau à l’échelle d’un pays. Internet est un réseau WAN, comme la couverture nationale des opérateurs télécom.

Résistance algorithmique

types : concept

mots-clés :

Le concept renvoie aux capacités de résistance aux effets des → Algorithmes et aux possibilités de contournement et de détournement voire de braconnage.
Ces effets ont été étudiés dans certaines études notamment auprès des jeunes publics.
Cette résistance algorithmique peut être considérée comme faisant partie des compétences de la → Littératie algorithmique.

Responsabilité (accountability)

types : concept

mots-clés :

Responsabilité : le fait de tenir quelqu’un responsable des conséquences dues à un système employant l’intelligence artificielle.
Le concept est particulièrement appliqué à la question algorithmique du fait de la délégation de responsabilités que ça peut engendrer et à l'absence de transparence dans les processus. Les usagers déplorent ainsi l' → opacité des plateformes et de leur traitement algorithmique.
Nikolas Diakopoulos [@diakopoulosAlgorithmicAccountability2015] décrit cette responsabilité algorithmique en montrant l'intérêt d'une montée en compétences des usagers et des journalistes afin qu'ils puissent montrer les éventuels biais et abus via notamment des processus de → Rétroingénierie.

Rétroingénierie

types : investigations

types : techniques

mots-clés :

Serveur informatique : un serveur est un système informatique utilisé pour accéder à une base de données, mais aussi Internet. Il permet par exemple de consulter ses mails ou de stocker des fichiers.

types : concept

mots-clés :

Sousveillance : la sousveillance désigne l’acte de s’emparer de données (publiques, privées) pour surveiller les puissants. Elle s’inscrit dans une action citoyenne, au titre du droit à l’information et du bien commun . Internet est un outil de sousveillance primordial : ses origines sont associées à une branche du mouvement libertaire, incarnée par Richard Stallman, en plus de ses capacités à outrepasser les frontières de diffusions d’autres canaux. C’est le cas des fuites d’informations →]] , comme celles provoquées par Edward Snowden ou encore Chelsea Manning. Il s’agit de surveiller et radicaliser l’exigence démocratique (de Lagasnerie, 2015).

fiche à revoir

Soylent Grin

types : concept

mots-clés :

Le soylent grin" désigne un mème qui consiste à réaliser une grimace d'étonnement sur des photos ou des vidéos
https://knowyourmeme.com/memes/soy-boy-face-soyjak
Les algorithmes de certaines plateformes ayant considéré cette attitude comme significative et donc à prendre en compte, beaucoup d'internautes se sont mis à reproduire cette attitude dans leurs productions vidéos pour bénéficier des effets des algorithmes. Il s'agit quelque part d'une forme de hacking → des dispositifs algorithmiques dans une → économie de l'attention qui recherche les → Clickbait.
Le mème s'est inscrit comme réaction face à la logique des vignettes générées parfois automatiquement pour mettre en avant des contenus. C'est particulièrement présent sur → Youtube où le phénomène est qualifié de thumbnails faces"/

Sur ce sujet, voir la vidéo https://youtu.be/S2xHZPH5Sng

Spirale de recommandations

types : algorithme

mots-clés :

Spirale de recommandations : effet faisant référence à la boucle sans fin de visualisation de contenus fournis par un algorithme de recommandation. L’internaute passe d’un contenu à un autre en les faisant défiler, tout en perdant la notion du temps : cette spirale, construite pour satisfaire l’utilisateur, le pousse à rester actif et scroller. L’application Tik Tok est un bon exemple ; il n’y a pas de fin au fil d’actualité → et le format de ce réseau social pousse à la curiosité : “que se cache-t-il derrière cette énième publication ?” Les plateformes jouent sur l’attention des internautes en proposant des contenus toujours plus personnalisés et cognitivement addictifs.

fiche à faire sur Tik Tok

Spotify

types : organisation

mots-clés :

Plateforme de musique en ligne qui fonctionne avec des systèmes algorithmiques qui permettent de générer des playlists avec des suggestions.

Statisticien

types : professionnel

mots-clés :

LeStatisticien : est à la base un spécialiste des →]] statistique, capable de les formaliser et de les analyser. L'accroissement des données disponibles notamment via les instruments de captation accroît le besoin de professionnels dédiés comme les ou les → data analysts.

Statistiques

types : méthodes

mots-clés :

Statistique : science et technique d'interprétation mathématique de données complexes et nombreuses, permettant de faire des prévisions. On peut associer la statistique à un instrument de connaissances, mais aussi politique :

En « photographiant » le monde, elles donnent aux hommes le pouvoir des outils pour évaluer, choisir et faire agir. [@cardonQuoiReventAlgorithmes2015a]

Le besoin de → statisticiens spécialisés dans l'analyse des → données est grandissant.

Story Rank

types : algorithme

mots-clés :

Algorithme de → Google News créé suite aux évènements du 11 septembre.

TAL

types : concept

mots-clés :

Technologie de traitement automatique de la langue (TAL) : technologie mêlant la linguistique, l’informatique et l’intelligence artificielle qui permet de créer des outils de traitement de la langue sur le numérique. Les TAL apportent du sens à un contenu. Par exemple, la retranscription informatique d’un texte à partir d’un enregistrement vocal est l’une de ces technologies.
Le tal permet de réaliser de l'→ indexation automatique en s'appuyant sur les mots d'un document ou d'un texte. Cela permet des masses de documents et de pouvoir grace à un → robot d'indexation qui va ensuite créer les index des → moteurs de recherche comme celui de → Google.

Techlash

types : concept

Technique prédictive

types : algorithme

mots-clés :

Technique → prédictive : l’ → algorithme apprend en comparant un →]] profil à ceux d’autres internautes ayant les mêmes caractéristiques en vue d’anticiper un comportement (d’achat notamment). “Le futur de l’internaute est prédit par le passé de ceux qui lui ressemblent” [@cardonQuoiReventAlgorithmes2015a] ). Par exemple, l’algorithme d’→ Amazon propose des articles associés à nos actes d’achat en fonction de la consommation des clients ayant acheté le même produit.

_

Technique statistique prédictive

types : méthodes

mots-clés :

Technique statistique →]] prédictive : l’analyse prédictive consiste à anticiper une action probable à partir de données, algorithmes statistiques et techniques de _→ Machine learning en fonction des données et actions historiques. L'objectif est d'extrapoler à partir des événements survenus pour mieux prévoir les événements futurs.

Technologies de spéculation

types : concept

mots-clés :

Concept créé par Sun Ha-Hong dans son ouvrage éponyme [@hongTechnologiesSpeculationLimits2020a] sur les technologies et dispositifs notamment algorithmiques qui tendent à encadrer nos systèmes informationnels et nos existences au sein d'une société conduite par les données

The santa clara principles

types : organisation

mots-clés :

Principes en ce qui concerne la gestion et la modération des contenus notamment avec des traitements algorithmiques.
Mis en place dans une première version en 2018 signée par de gros acteurs dont des GAFAM, une nouvelle version est en cours.
L'objectif est d'édicter des règles de transparence et de → responsabilité (accountability)

Disponibles sur https://santaclaraprinciples.org/

Third Party cookie

types : techniques

mots-clés :

Third party cookie, ou → cookie tiers : un cookie intégré par un site différent de celui visité par l’internaute, via un navigateur, en vue de stocker des informations. Il suit le → parcours de l’utilisateur → sur plusieurs sites web en vue de → mesurer l'audience et cibler la publicité. Les cookies tiers sont la propriété d’une régie publicitaire en ligne (ad-network) contrairement à des first party cookies appartenant à un éditeur unique.

types : concept

mots-clés :

Transhumanisme : usage des sciences et techniques en vue d’augmenter les capacités humaines et naturelles. Par exemple, la pose d’un pacemaker - cette pile que l’on insère près du cœur - est un acte de transhumanisme. Cela met en lumière des questions éthiques : peut-on accepter de développer des humains “augmentés” grâce aux machines ?

Les théories de ce type sont fortement présentes dans la Silicon Valley et chez les ingénieurs et entrepreneurs des → GAFAM. Ray Kurzweil considéré comme un des gourous du transhumanisme occupe d'ailleurs un poste stratégique chez → Google.

True Anthem

types : techniques

mots-clés :

La plateforme True Anthem utilisée notamment par Reuter, the Chicago Tribune permet de déterminer quelles "histoires" peuvent être remises en circulation et rediffusées sur les médias sociaux. Le système détecte les signaux afin de →prédire les performances, le taux potentiel d'engagement et les moments opportuns où relancer l'information.
Une indexation automatique à partir des métadonnées permet la génération automatique des contenus en respectant la charte éditoriale du média.

Uber

types : organisation

types : organisation

mots-clés :

Plateforme de contenus vidéos rachetée par → Google qui est leader sur le marché de contenus vidéos et des publicités afférentes. Les algorithmes de Youtube sont basées sur l'→ économie de l'attention.

Aide

Cliquez ici pour accéder à la documentation de Cosma

Raccourcis

Espace	Réactiver l'algorithme de dessin du graphe
S	Déplacer le curseur dans le champ Recherche
Alt + clic	(sur un type de fiche) Désélectionner les autres types
R	Réinitialiser le zoom
Alt + R	Réinitialiser l'affichage
C	Zoomer et centrer sur le nœud sélectionné
F	Passer en mode Focus
Echap	Fermer la fiche sélectionnée

AlgoJ

Olivier Le Deuff, Rayya Roumanos

Mené par l'Institut de Journalisme Bordeaux Montaigne (IJBA) et le laboratoire MICA en partenariat avec Sud Ouest et Curieux!, le projet Algo-J entend étudier la place et le rôle des algorithmes numériques dans le secteur de la presse. Il est porté par Rayya Roumanos et Olivier Le Deuff et s’appuie sur une équipe pluridisciplinaire composée d’Arnaud Schwartz, Florian Tixier, Ugo Verdi et Mohamed Mosbah. L’enquête comprend trois visées qui répondent aux multiples enjeux de la présence massive et structurante des algorithmes dans l’écosystème informationnel. Celle, d’abord, d’étudier l’influence de ces actants technologiques sur les écritures journalistiques. Celle, ensuite, de mesurer le niveau d’acculturation des journalistes à la logique algorithmique qui charpente leurs horizons de production de l’information. Et celle, enfin, de mettre en œuvre une méthodologie à mi-chemin entre l’exploration scientifique et l’investigation journalistique pour enquêter sur les algorithmes. Ces fiches dédiées à la thématique algorithmique ont été réalisées par l'équipe après un premier travail exploratoire d’Emma Rondot, étudiante en master à l’IJBA.

Version 2.4.0 • Licence GPL-3.0-or-later

Arthur Perret
Guillaume Brioudes
Clément Borel
Olivier Le Deuff
Programme ANR HyperOtlet

D3 v4.13.0: Mike Bostock (BSD 3-Clause)
Nunjucks v3.2.3: James Long (BSD 2-Clause)
Js-yaml v4.1.0: Vitaly Puzrin (MIT License)
Markdown-it v12.3.0: Vitaly Puzrin, Alex Kocharin (MIT License)
Citeproc v2.4.62: Frank Bennett (CPAL, AGPL)
Fuse-js v6.4.6: Kiro Risk (Apache License 2.0)