Internet est en train de changer, et de changer plus vite que vous ne pouvez l’imaginer : d’un côté, jamais produire du contenu n’a été aussi facile mais de l’autre, jamais le contenu réellement humain et original n’a été aussi rare…
La tendance est évidente pour qui regarde avec attention ce qui se passe depuis quelques années avec, notamment, l’arrivée de l’intelligence artificielle : on assiste actuellement à une déferlante de contenus, ces derniers étant de plus en plus créés par des moteurs d’intelligence artificielle. Que ce soit pour l’image, la musique, la vidéo, le texte, la production des moteurs d’intelligence artificielle s’étend tous les jours un peu plus et ce d’autant plus que ces contenus sont, à leur tour, utilisés par les moteurs pour nourrir leurs bases d’apprentissage.
En effet, à mesure qu’enflent les capacités des moteurs grossissent aussi leurs besoins de données pour s’entraîner : dans ce cadre, la production de données « synthétiques » devient nécessaire. Or, au-delà même de la question de savoir si ces données synthétiques permettent réellement une amélioration des apprentissages, un autre phénomène est en train d’émerger.
Sur les deux dernières décennies, Google et Meta ont dominé le web en échangeant gratuitement leurs services contre des publicités. Dans ce cadre, les utilisateurs obtenaient du contenu, les créateurs de ce contenu pouvaient obtenir du trafic de la part de ces deux firmes, et les annonceurs, de leur côté, obtenaient des audiences ciblées et détaillées sur lesquelles pousser leurs messages construits sur mesure.
L’essor de l’intelligence artificielle a bouleversé ce triptyque : le nombre de créateurs a explosé au point de rattraper celui des utilisateurs, une partie grandissante des utilisateurs est maintenant représentée par des bots qui viennent extraire des contenus nécessaire pour les inférences des moteurs, et dans les cas les plus extrêmes, les publicitaires se retrouvent obligés d’utiliser des bots pour… vendre à des bots, ce qui n’est guère efficace commercialement parlant.
Cette situation est en train de pousser l’internet vers une « fracturation par facturation » : l’accès gratuit n’est plus possible par défaut.
En 2022, avec l’arrivée de ChatGPT, les utilisateurs ont modifié de façon brutale leurs comportements : au lieu d’utiliser Google pour chercher internet, ils ont commencé à utiliser les explications fournies par l’IA, privant de fait les éditeurs du trafic habituel alors même que leur contenu sert de base aux réponses fournies par les modèles. À présent, la recherche assistée par l’IA de Google, qui apparaît automatiquement sur certains types de questions, réduit de plus de la moitié les clics sur les liens de sites web. Parallèlement, les recettes publicitaires du géant informatique ont pourtant augmenté de 10% en 2024 (265 milliards de dollars au total).
Les éditeurs et producteurs de contenus, comprenant la situation, multiplient donc actuellement les exigences avant connexion à leurs sites : « murs de paiement » pour imposer un revenu d’abonnement, Captchas et, pour certains sites (Reddit, StackOverflow par exemple), exigence d’un paiement pour les robots qui viennent pomper les données, selon le modèle « Pay To Crawl » mis en place par Cloudflare.
Autrement dit, le web tel qu’il existait jusqu’à présent est rapidement en train de se scinder en deux communautés pour les différents types d’utilisateurs : le web gratuit mais sans barrières, dont une partie croissante est composée de contenu synthétique, et qui est systématiquement utilisée par les moteurs, et un autre web plus restreint, composé des services exclusivement destinés à des humains (newsletters, groupes Discord, forums niche), géré et entretenu par des humains et seulement des humains.
Petit-à-petit apparaissent les deux couches de ce nouveau web, l’une fournie et entretenue par l’IA, alimentée par la publicité et optimisée pour fournir des réponses rapides, instantanées, pendant que l’autre est réservée – sur base d’abonnement ou de contraintes spécifiques – à des humains.
Si l’on projette cette tendance à plus long terme, avec d’un côté les données synthétiques dont le nombre explose et de l’autre les données humaines qui sont de moins en moins accessibles, on comprend que le ratio des données humaines sur les données totales va donc décroître. Inévitablement, les données générées par l’homme vont donc se raréfier en rapport, gagnant en valeur et ce d’autant plus que les données de l’internet sont toujours plus contaminées par les résultats de l’intelligence artificielle. Il n’est pas déraisonnable d’imaginer que, dans un futur proche, le paiement à la recherche ou le paiement au « scrapping » de données remplaceront l’octroi de licences sur le contenu ou les droits d’auteur.
À la longue, on peut même envisager que le paiement de ces parcours, qui sont plus faciles à gérer et rapidement plus rentables que la gestion des droits d’auteur pour les créateurs de contenus et les éditeurs, fasse progressivement disparaître les droits d’auteurs traditionnels, de la même façon que la disparition des frictions dans l’accès à l’information a fait s’écrouler les prix de beaucoup de services (les agences de voyage, de taxi, d’immobilier en savent quelque chose). De ce point de vue, le paiement au parcours tel qu’il est expliqué ici trouve un bon équilibre : d’un côté les humains peuvent circuler librement, et de l’autre les robots payent à l’entrée de chacun des sites.
Au début d’internet, seuls les spécialistes et les passionnés se connectaient entre eux. L’arrivée des firmes commerciales, le développement des communications bien au-delà de ces utilisateurs spécifiques a permis au plus grand nombre d’accéder au partage d’information, au détriment évident de la qualité des contenus.
Cependant, l’étape suivante dont on observe la naissance pourrait renvoyer le balancier dans l’autre sens, forçant le retour ou la création de communautés plus spécialisées. Alternativement, on peut imaginer la dystopie dans laquelle les humains, noyés dans les contenus synthétiques, finissent par perdre complètement pied et ne plus pouvoir former ces communautés autrement que dans le monde réel, loin du monde numérique ainsi réservé aux bots.
Mais quoi qu’il en soit, rien ne nous aura préparé à ce qui va arriver dans les prochaines années.
Pour l’instant, nous espérons tous que le bloc de H16 ne changera pas…
Ba et du sont des bots…j’en suis sur.
et spirou, çui qui fait des films IA est un troll, un troll de trames …
Je les aime bien ses films: la séquence avec les vedettes est bluffante et aussi le film de SF style années 50.
Parle-t-on de Teträm ?
un troll de tram ou un troll-abus ?
Je suis con-vaincu que dans 20 ou 30 ans, aucune IA, aucun robot ne parviendra à faire des jeux de mots ou autres cales en bourbon aussi pourris et finalement plus humain, tu meurs.
Oui, cependant il a lui-même admis que l’IA participerai à la génération du contenu ici présent.
Le pseuod H16 se réfère quand même pas mal à du bot… la 16ème version ! ^^
Vous ne voulez pas d’un message ecrit les mardis jeudis et samedis par un une IA?
Qu’il reste un îlot de permanence dans ce monde en agitation stérile, ma plupart du temps.
Le contenu produit par des machines se nourrissant donc de plus en plus de produits antérieurs issus des mêmes machines de niveau N-1, ne pourra que s’affadir…
Pour l’instant le contenu fait par IA se voit du premier coup d’oeil…tout est beaucoup trop parfait et paradoxalement fade et… artificiel
Ca ne va surement pas durer.
C’est particulièrement patent en matière musicale.
Soupe tiède, écoutable mais très convenue.
Pas besoin d’IA pour ça.
Les algos des logiciels de musique sont déjà ultra performant pour mâcher le travail.
C’est aussi le cas en politique : Soupe tiède, écoutable mais très convenue.
d’autant que c’est très simple : un exemple expliqué par Rick Beato
youtube.com/watch?v=eKxNGFjyRv0
c’est quand même bluffant, en quelques clics …
« Soupe tiède, écoutable mais très convenue. »
Ce qui peut aller pour faire de la musique d’ascenseur … C’est écoutable tant que ça ne dure pas plus d’une minute.
Au-delà, le risque de tomber en dépression augmente rapidement …
Si les IA se nourissent des IA, ca crée une boucle de retour qui pourrait bien partir en vrille comme dans les systèmes de commande.
Une consanguinité délétère en quelque sorte.
Beau billet de synthèse !!! Merci.
« ont dominé le web en échangeant gratuitement leurs services contre des publicités. »
De la même façon que nous, les Nicolas, bénéficions de tas de choses gratuites après paiement d’une masse considérable de taxes et d’impôts???
comment oses-tu te prétendre un Nicolas quand tout le monde sait que tu es un boomer ? fais ton auto critique, et vite, sinon, la Bande des Quatre va te tomber dessus à te faire passer le goût
du painde la carbonnade ! 😉Mathusalem pourrait être un boomer ? Vous avez 4h 😀
Cloudflare est une vraie plaie. Toutes les dix minutes, il faut prouver qu’on est un humain.
C’est plutôt positif, aucun politicien de type bayrou l’ectoplasme ne peut donc accéder à internet.
Effectivement, le modèle original de l’internet se retrouve débordé, avec certains sites, santé personnelle ou information générale, qui ont perdu jusqu’à 50% de leur trafic du fait de AI overview.
Or leur existence est conditionné à une audience monétisé par de la pub dont une partie est reversée aux créateur de contenus, (de moins en moins humains).
L’avidité naturelle tablait sur une baisse des coûts de création grace à la machine et une maximisation des profits.
Pour le moment ce sont les vendeurs de pioches (Nvidia entre autre), qui profite de cette ruée vers l’IA.
Et l’utilisateur floué par la médiocre qualité des contenus « commerciaux gratuits » en revient à se constituer des communautés réelles, voire physiques.
C’est plutôt sain et une conséquence innatendue du règne de la machine
Avec la propension de certaines IA à vouloir « faire plaisir » à l’utilisateur et donner les réponses qu’il attend, il est possible en orientant les questions de leur faire raconter des âneries, expérience faite personnellement sur une question d’entretien mécanique très spécifique.
Si les bots reprennent leurs informations les uns des autres et que le volume d’information « bot » erroné devient significativement supérieur au volume d’information « humain » correct, il devient donc théoriquement possible d’assister à l’apparition de légendes urbaines amplifiées et colportées par des IA.
Comme souligné par l’article la généralisation de l’IA pourrait paradoxalement au regard de ce qu’on a pu penser initialement augmenter la valeur de la pensée humaine.
J’en toucherai 2 mots à ma compagne, compositeur-interprète de son état, déprimée de constater la prolifération de musiques fadasses générées par IA sur Youtube.
Cette prolifération de contenus me fait penser à du bruit. Et lorque le rapport signal sur bruit se dégrade, les communications deviennent impossibles.
Dans ce cas le passage à un ‘autre’ internet, ou le retour de l’analogique (plus difficilement falsifiable) peut être une solution.
On en revient à la base des échanges volontaires : la confiance.
Ça n’a jamais cessé d’être le cas en fait: la crédibilité de la source a toujours été primordiale.
Encore une note finale optimiste : l’avenir est à l’abandon du numérique .
Va t on assister à un retour payant de la connaissance ?
Perso, je me serai attendu à une chute des pubs sur internet. A quoi bon faire des pubs si elles sont regardées par des bots ?
Mais j’imagine qu’il y a encore assez d’humains pour que ce soit rentable.
L’IA aura accès au compte bancaire, et pourra donc acheter à la place de l’humain.
Voilà pourquoi les pubs contiueront. Il faudra aider l’IA à choisir. Comme l’humain avant elle.
Le compte bancaire de l’IA sera alimenté par vol. Vous venez de définir le socialisme!
J’avais été désespéré par l’annonce que l’Encyclopedia Britannica n’existerait plus sous forme papier.
Ce serait pas si mal d’y revenir…
La solution est simple : combien êtes-vous prêt à payer pour cela ?
Pour une encyclopédie complète en 67 volumes de papier longue ,conservation? En plus des CD, bien sûr.
Cher.
Vous êtes prêts à payer une nouvelle révision tous les combiens ?
Tout les 10 ans?
La réflexion que je me fais est la suivante: puisque l’IA, jusqu’à présent ne fait que compiler, astucieusement pour certaines, les données existantes, la création de données par l’IA n’apporte pas de valeur nouvelle en soi (à moins de me contredire avec de bons arguments).
On ne fera donc que créer du rabâchage infini, qui finira par tourner en rond.
La vraie création, du moins pour le moment restera du fit des seuls humains. Exemple: l’IA peut faire du « comme Mozart », mais si Mozart n’avais pas été le génie que tout le monde reconnait, l’iA aurait été sèche.
Itou pour faire du « comme Léonard de Vinci ».
Ou du « comme Proust »,
Etc.
Le jour où l’IA apportera une démonstration convaincante de la conjecture de Riemann -vous savez, le fait que les racines non triviales de la fonction dzeta de s ont pour valeur absolue un demi-, je changerai d’avis.
Attention : l’hypothèse de Riemann pourrait très bien être fausse… et vous ne changerez donc jamais d’avis 😀
Dans ce cas si l’IA arrive à démontrer que l’hypothèse est fausse ce sera pas mal non plus.
Je pense aussi que l’IA n’apporte pas de valeur nouvelle en soi, avec un petit bémol tout de même.
Dans le cadre de la technique pure, ce petit bémol peut cacher des possibilités extraordinaires : l’IA est moins soumise aux habitudes et contraintes cognitives humaines, et peut explorer des voies auxquelles les humains n’avaient pas pensé.
Cette qualité, associée à sa puissance de calcul (le fait de pouvoir tester des centaines de milliers de combinaisons en fractions de secondes) ne fait pas de la nouveauté en soi, mais cela s’en rapproche.
Pour la création de puces électroniques, cela peut faire merveille.
Les yeux des mecs brillent d’intérêt:
youtube.com/watch?v=NHgag2vKbxg
Avec la création humaine, si l’IA essaye reproduire cette démarche, le résultat est décevant.
Quand Mozart crée, il sait ce qu’il fait : il est conscient, même et surtout si son inspiration vient des profondeurs immaîtrisées de son esprit. L’auditeur qui l’écoute 200 ans après peut faire la démarche inverse, et chercher à retrouver qu’est-ce qui a inspiré Mozart, ce qui provoque un plaisir intellectuel ou émotionnel intense.
Ce n’est pas loin de l’expérience spirituelle : deux consciences qui se rejoignent à 200 ans d’écart. Ici, l’IA est larguée, car elle n’est pas consciente.
+1
J’ajoute que fasse à un nombre de données important, l’IA peut dégager des corrélations qu’un humain ne verrai que par hasard.
La vraie question étant de savoir si ça va durer…
Pourquoi ne deviendrait t’elle pas consciente après tout ?
Gardons nous d’être péremptoire…dépassé que nous sommes.
Les savants en la matière peut être un peu moins que les béotiens dans mon genre…un poil.
Bah déjà l’IA peine à reconnaître ses erreurs et elle se vexe facilement
Et vu qu’elle n’hésite pas à tricher et à mentir… c’est très humain tout ça
Ca n’a rien d’humain comme comportement, c’est un comportement de gonzesse!!!
Ne me dis pas que tu as fini par succomber aux assualts du wokisme et que tu en es maintenant à considérer que les genre un sont des être humains.
L’analyse big data ça ne fait que compiler des données existantes, et ça créé de nouvelles données qui ont une valeur en soi.
Une encyclopedie, un dictionnaire, … ça n’est jamais que de la compilation de données existantes, il n’y a même pas de création de données (ou très peu) et pourtant ces ouvrages ont apporté et apportent de la valeur.
Idem pour une review en science ou là, il n’y a aucune création de données.
« Mais quoi qu’il en soit, rien ne nous aura préparé à ce qui va arriver dans les prochaines années. »
N’est ce pas presque toujours comme ça ?
En plus, quand pourtant tout pourrait nous » préparer » pourquoi, surtout chez ceux qui ont un pouvoir de décision, fait on semblant de n’avoir rien vu ?
Et si l’I.A. était une sorte de myxomatose du web ?
Apportée par les petits lapins geeks eux même !!
Dans un pays ou un premier ministre de 74 ans, girouette chiffe molle sombre dans la mode anti boomer ( à 74 balais !!), inutile d’expliquer qu’il n’y à pas que l’I.A. qui est incontrôlable .
Pas con…
Ou bien alors les deux espèces vont évoluer cote à cote en interagissant de moins en moins…seront elles concurrentes ?
Fascinant tout ça.
Je me suis tout à fait reconnue dans le personnage qui se prend le chou de votre illustration, aussi j’espère que vous me pardonnerez, Patron, si je passe mon tour aujourd’hui !
Petite anecdote, j’ai soumis au matou qui pète l’énigme suivante :
Un père et son fils on un accident de voiture.
Le fils meurt sur le coup.
Le père est emmené aux urgences mais le chirurgien déclare « Je ne peux pas l’opérer, c’est mon fils ».
Qui est le chirurgien ?
Cette énigme ressemble à une énigme connue mais avec une modification. Dans la version classique c’est le père qui meurt et donc le chirurgien est la mère. Ici c’est le grand-père (ou la grand-mère)
Eh bien ChatGPlanté, m’a ressorti la réponse classique sasn ce rendre compte que c’était le père qui était aux urgences. Et il a mis du temps à comprendre son erreur.
À propos d’IA, une petite histoire
Sur un site d’entraide (payante l’entraide fait pas déconner) une JF de 25-30 ans a pris contact avec moi pour une distri et vanne EGR, tout se passant par écrit
J’étais un peu scotché par le niveau technique de la demandeuse, au point de croire que comme souvent c’est un mec qui se fait passer pour une femme.
Et bien non, elle est passée me verser l’acompte quelques jours après et j’ai eu l’explication : elle soumettait à GPT toutes les réponses qu’elle a eu des prétendants et c’est GPT qui m’a sélectionné 😀
Les robots parlent aux robots
Sur un site d’entraide (payante l’entraide fait pas déconner)
Ah tu appeles ça de l’entraide toi ?
😀
Ça m’est arrivé de faire des échanges de service sur ces sites : méca contre couture, contre entretien extérieurs, contre travaux terrassement etc…
Mais ça devient rare et on se retrouve souvent entre semi-pros à s’échanger ces services, les particuliers ne sachant plus rien foutre
Même les arabes ne font plus de mécanique 😀
Eux, ils roulent les mécaniques !
« méca contre couture », et tu espères qu’on va te croire sur parole ? te connaissant ? 😉