
L'algorithme
Ce qu'on voit n'est jamais ce qui est vraiment là
Description
Peut-on expliquer comment on nous recommande du contenu sans avoir le droit de regarder dedans ?
Les algorithmes de recommandation sont partout : YouTube choisit ce que nous regardons ensuite, Netflix prédit ce film qui va nous plaire, Spotify organise notre fil musicale selon nos préférences supposées. Chaque jour, milliards d’utilisateurs acceptent silencieusement que des systèmes automatisés façonnent ce qui apparaît devant eux. Mais ce qui est troublant, c’est qu’aucun de ces systèmes n’est vraiment ouvert à l’examen. Les compagnies qui les construisent les traitent comme des secrets commerciaux : c’est du code propriétaire, caché derrière des contrats de confidentialité. Nous vivons dans un monde où des machines décident d’une partie significative de ce que nous voyons, et on ne peut pas regarder le code qui le fait.
Il y a une asymétrie fondamentale ici : des entreprises massives comprennent comment nous fonctionnons (nos préférences, nos comportements, nos émotions), tandis que nous n’avons aucune visibilité sur le mécanisme qui prend les décisions nous concernant. C’est différent d’une censure classique, où on sait au moins qu’on nous interdit quelque chose. Ici, on ne sait pas ce qu’on ne nous montre pas. Et la question devient : à quel point est-ce un problème, et comment régule-t-on une technologie qu’on ne peut pas voir ? Question centrale : comment régule-t-on les algorithmes qui décident de ce que nous voyons, alors qu’aucun acteur extérieur ne peut vraiment en scruter le fonctionnement ?
Ce qu’on va voir : L’évolution des algorithmes de recommandation du filtrage collaboratif aux embeddings latents, les raisons réelles et prétextées pour garder les algorithmes secrets, les cadres réglementaires émergents en Europe (DSA), et les approches d’audit externe qui tentent de concilier transparence et secrets commerciaux.
Le fil rouge : Entre le besoin public de comprendre ce qui nous affecte et le secret commercial légitime des entreprises, la tension révèle qu’il n’existe pas de solution parfaite : la régulation doit accepter une opacité partielle en échange d’audits intermittents et de garde-fous limités.
Sommaire
01De la recommandation simple à l'opacité totale
Les algorithmes de recommandation n’existaient pas avant les années 2000. À l’époque du commerce électronique classique, c’était simple : plus de produits = plus de ventes potentielles. Mais à partir du moment où Internet devient massif, le problème inverse se pose : comment choisir parmi des millions de vidéos, de produits ou de chansons ? Le choix devient paradoxalement plus difficile quand l’offre est infinie.
Les premières approches étaient naïves : recommander ce qui était le plus populaire. Puis on s’est affranchi des données d’autres utilisateurs. Netflix a fait un pari célèbre au milieu des années 2000 : ils ont promis 1 million de dollars à quiconque améliorerait leur algorithme de 10 pour cent. Des chercheurs du monde entier se sont lancés. Ce qui en est sorti, c’est une compréhension que les préférences peuvent s’inférer en voyant ce que les utilisateurs qui te ressemblent apprécient : c’est le filtrage collaboratif.

Téléchargez Dygest
pour avoir une expérience complète !
02Pourquoi les entreprises cachent leurs algorithmes
Les raisons qu’invoquent les géants tech pour garder leurs algorithmes secrets sont au moins partiellement légitimes. D’abord, c’est vraiment un secret commercial : si Spotify expliquait exactement comment l’algorithme fonctionne, des concurrents pourraient le reproduire ou le contourner. Deuxièmement, les entreprises prétendent que ces systèmes sont trop complexes pour être rendus explicites sans perdre en efficacité. Si on est obligé de simplifier l’algorithme pour que les régulateurs puissent le comprendre, on dit que les recommandations vont s’en ressentir.

Téléchargez Dygest
pour avoir une expérience complète !
03Le cadre réglementaire émergent
La régulation commence à bouger, d’abord lentement, ensuite plus vite. L’Union européenne a été un pionnier avec la directive sur la protection des données (RGPD, 2018). Elle impose que les entreprises expliquent comment elles traitent les données des utilisateurs. Mais elle ne dit pas “il faut expliquer l’algorithme” : elle dit “il faut transparence sur le traitement des données”. C’est plus faible. Connaître ses données ne dit pas comment elles servent à prendre des décisions.
En 2021, l’Europe a proposé le Digital Services Act (DSA), qui entre en vigueur en 2024. Celui-ci impose que les très grandes plateformes en ligne expliquent comment leurs algorithmes de recommandation fonctionnent, à quels paramètres l’utilisateur peut modifier, et comment cela affecte ce qu’on voit. C’est plus musclé que le RGPD. Mais évidemment, “expliquer comment un algorithme fonctionne” n’existe pas comme catégorie légale simple. Qu’est-ce que ça veut dire ? Donner le code source ? Les paramètres clés ? Une description en langage naturel ?

Téléchargez Dygest
pour avoir une expérience complète !
04Transparence algorithmique et audit
L’approche la plus sophistiquée qu’on explore actuellement, ce sont les audits externes. Plusieurs chercheurs et organisations indépendantes proposent des modèles où une équipe d’experts peut accéder au code de l’algorithme (sous confidentialité), l’analyser, et publier un rapport d’audit sans révéler les secrets propriétaires. C’est ce que propose notamment la Brookings Institution dans ses rapports de 2020 et 2022 sur la gouvernance algorithmique.
L’idée : plutôt que de rendre le code public, on le rend auditable. On pose des questions précises. Est-ce que cet algorithme amplifie les contenus polarisants ? Est-ce qu’il pénalise systématiquement certains types de créateurs ? Est-ce qu’il entraîne des biais raciaux ou de genre dans les recommandations ? Les auditeurs peuvent vérifier sans avoir besoin de comprendre chaque détail du code. Mais il y a un problème : les algorithmes sont souvent inséparables de leurs données. Comprendre comment YouTube recommande, c’est aussi comprendre sur quelles données il s’entraîne. Et ça, les entreprises refusent de le partager plus largement. De plus, les algorithmes changent constamment. Une plateforme peut modifier son algorithme toutes les semaines. Un audit d’aujourd’hui peut être complètement obsolète dans trois mois. Il faudrait donc des audits continus, ce qui est coûteux et logistiquement compliqué.

Téléchargez Dygest
pour avoir une expérience complète !
05Conclusion
La transparence algorithmique reste un front ouvert. Les régulateurs pressentent qu’il y a un problème : des systèmes automatisés façonnent nos expériences numériques sans mécanisme de responsabilité. Mais entre la nécessité de protéger les secrets commerciaux réels, l’impossibilité pratique de simplifier des systèmes massifs, et la difficulté de définir juridiquement ce que “transparence” signifie, la régulation avance lentement.

Téléchargez Dygest
pour avoir une expérience complète !
06Pour aller plus loin
Questions pour aller plus loin
- Un algorithme peut-il être réellement neutre, ou toute décision de ce qu’on montre à quelqu’un reflète-t-elle inévitablement des valeurs de ceux qui l’ont conçu ? - Si les entreprises devaient divulguer complètement leur code algorithme, serait-ce réellement utile au citoyen moyen, ou faudrait-il traduire cela en concepts compréhensibles sans révéler les secrets commerciaux ? - Qui devrait auditer les algorithmes : des régulateurs gouvernementaux, des organisations indépendantes, ou les chercheurs universitaires ?

Téléchargez Dygest
pour avoir une expérience complète !












