Intelligence artificielle et web parallèle

Internet est en train de changer, et de changer plus vite que vous ne pouvez l’imaginer : d’un côté, jamais produire du contenu n’a été aussi facile mais de l’autre, jamais le contenu réellement humain et original n’a été aussi rare…

La tendance est évidente pour qui regarde avec attention ce qui se passe depuis quelques années avec, notamment, l’arrivée de l’intelligence artificielle : on assiste actuellement à une déferlante de contenus, ces derniers étant de plus en plus créés par des moteurs d’intelligence artificielle. Que ce soit pour l’image, la musique, la vidéo, le texte, la production des moteurs d’intelligence artificielle s’étend tous les jours un peu plus et ce d’autant plus que ces contenus sont, à leur tour, utilisés par les moteurs pour nourrir leurs bases d’apprentissage.

En effet, à mesure qu’enflent les capacités des moteurs grossissent aussi leurs besoins de données pour s’entraîner : dans ce cadre, la production de données « synthétiques » devient nécessaire. Or, au-delà même de la question de savoir si ces données synthétiques permettent réellement une amélioration des apprentissages, un autre phénomène est en train d’émerger.

Sur les deux dernières décennies, Google et Meta ont dominé le web en échangeant gratuitement leurs services contre des publicités. Dans ce cadre, les utilisateurs obtenaient du contenu, les créateurs de ce contenu pouvaient obtenir du trafic de la part de ces deux firmes, et les annonceurs, de leur côté, obtenaient des audiences ciblées et détaillées sur lesquelles pousser leurs messages construits sur mesure.

L’essor de l’intelligence artificielle a bouleversé ce triptyque : le nombre de créateurs a explosé au point de rattraper celui des utilisateurs, une partie grandissante des utilisateurs est maintenant représentée par des bots qui viennent extraire des contenus nécessaire pour les inférences des moteurs, et dans les cas les plus extrêmes, les publicitaires se retrouvent obligés d’utiliser des bots pour… vendre à des bots, ce qui n’est guère efficace commercialement parlant.

Cette situation est en train de pousser l’internet vers une « fracturation par facturation » : l’accès gratuit n’est plus possible par défaut.

En 2022, avec l’arrivée de ChatGPT, les utilisateurs ont modifié de façon brutale leurs comportements : au lieu d’utiliser Google pour chercher internet, ils ont commencé à utiliser les explications fournies par l’IA, privant de fait les éditeurs du trafic habituel alors même que leur contenu sert de base aux réponses fournies par les modèles. À présent, la recherche assistée par l’IA de Google, qui apparaît automatiquement sur certains types de questions, réduit de plus de la moitié les clics sur les liens de sites web. Parallèlement, les recettes publicitaires du géant informatique ont pourtant augmenté de 10% en 2024 (265 milliards de dollars au total).

Les éditeurs et producteurs de contenus, comprenant la situation, multiplient donc actuellement les exigences avant connexion à leurs sites : « murs de paiement » pour imposer un revenu d’abonnement, Captchas et, pour certains sites (Reddit, StackOverflow par exemple), exigence d’un paiement pour les robots qui viennent pomper les données, selon le modèle « Pay To Crawl » mis en place par Cloudflare.

Autrement dit, le web tel qu’il existait jusqu’à présent est rapidement en train de se scinder en deux communautés pour les différents types d’utilisateurs : le web gratuit mais sans barrières, dont une partie croissante est composée de contenu synthétique, et qui est systématiquement utilisée par les moteurs, et un autre web plus restreint, composé des services exclusivement destinés à des humains (newsletters, groupes Discord, forums niche), géré et entretenu par des humains et seulement des humains.

Petit-à-petit apparaissent les deux couches de ce nouveau web, l’une fournie et entretenue par l’IA, alimentée par la publicité et optimisée pour fournir des réponses rapides, instantanées, pendant que l’autre est réservée – sur base d’abonnement ou de contraintes spécifiques – à des humains.

Si l’on projette cette tendance à plus long terme, avec d’un côté les données synthétiques dont le nombre explose et de l’autre les données humaines qui sont de moins en moins accessibles, on comprend que le ratio des données humaines sur les données totales va donc décroître. Inévitablement, les données générées par l’homme vont donc se raréfier en rapport, gagnant en valeur et ce d’autant plus que les données de l’internet sont toujours plus contaminées par les résultats de l’intelligence artificielle. Il n’est pas déraisonnable d’imaginer que, dans un futur proche, le paiement à la recherche ou le paiement au « scrapping » de données remplaceront l’octroi de licences sur le contenu ou les droits d’auteur.

À la longue, on peut même envisager que le paiement de ces parcours, qui sont plus faciles à gérer et rapidement plus rentables que la gestion des droits d’auteur pour les créateurs de contenus et les éditeurs, fasse progressivement disparaître les droits d’auteurs traditionnels, de la même façon que la disparition des frictions dans l’accès à l’information a fait s’écrouler les prix de beaucoup de services (les agences de voyage, de taxi, d’immobilier en savent quelque chose). De ce point de vue, le paiement au parcours tel qu’il est expliqué ici trouve un bon équilibre : d’un côté les humains peuvent circuler librement, et de l’autre les robots payent à l’entrée de chacun des sites.

Au début d’internet, seuls les spécialistes et les passionnés se connectaient entre eux. L’arrivée des firmes commerciales, le développement des communications bien au-delà de ces utilisateurs spécifiques a permis au plus grand nombre d’accéder au partage d’information, au détriment évident de la qualité des contenus.

Cependant, l’étape suivante dont on observe la naissance pourrait renvoyer le balancier dans l’autre sens, forçant le retour ou la création de communautés plus spécialisées. Alternativement, on peut imaginer la dystopie dans laquelle les humains, noyés dans les contenus synthétiques, finissent par perdre complètement pied et ne plus pouvoir former ces communautés autrement que dans le monde réel, loin du monde numérique ainsi réservé aux bots.

Mais quoi qu’il en soit, rien ne nous aura préparé à ce qui va arriver dans les prochaines années.

J'accepte les BTC, ETH et BCH !

1BuyJKZLeEG5YkpbGn4QhtNTxhUqtpEGKf

Vous aussi, foutez les banquiers centraux dehors, terrorisez l’État et les banques en utilisant les cryptomonnaies, en les promouvant et pourquoi pas, en faisant un don avec !
BTC : 1BuyJKZLeEG5YkpbGn4QhtNTxhUqtpEGKf
BCH : qqefdljudc7c02jhs87f29yymerxpu0zfupuufgvz6
ETH : 0x8e2827A89419Dbdcc88286f64FED21C3B3dEEcd8

Commentaires58

          1. Lothar

            Je suis con-vaincu que dans 20 ou 30 ans, aucune IA, aucun robot ne parviendra à faire des jeux de mots ou autres cales en bourbon aussi pourris et finalement plus humain, tu meurs.

  1. Aristarkke

    Le contenu produit par des machines se nourrissant donc de plus en plus de produits antérieurs issus des mêmes machines de niveau N-1, ne pourra que s’affadir…

    1. nemrod

      Pour l’instant le contenu fait par IA se voit du premier coup d’oeil…tout est beaucoup trop parfait et paradoxalement fade et… artificiel
      Ca ne va surement pas durer.

        1. Pheldge

          d’autant que c’est très simple : un exemple expliqué par Rick Beato
          youtube.com/watch?v=eKxNGFjyRv0
          c’est quand même bluffant, en quelques clics …

        2. Citoyen

          « Soupe tiède, écoutable mais très convenue. »
          Ce qui peut aller pour faire de la musique d’ascenseur … C’est écoutable tant que ça ne dure pas plus d’une minute.
          Au-delà, le risque de tomber en dépression augmente rapidement …

    2. Pythagore

      Si les IA se nourissent des IA, ca crée une boucle de retour qui pourrait bien partir en vrille comme dans les systèmes de commande.

  2. Aristarkke

    « ont dominé le web en échangeant gratuitement leurs services contre des publicités. »
    De la même façon que nous, les Nicolas, bénéficions de tas de choses gratuites après paiement d’une masse considérable de taxes et d’impôts???

    1. Pheldge

      comment oses-tu te prétendre un Nicolas quand tout le monde sait que tu es un boomer ? fais ton auto critique, et vite, sinon, la Bande des Quatre va te tomber dessus à te faire passer le goût du pain de la carbonnade ! 😉

  3. fcharco

    Effectivement, le modèle original de l’internet se retrouve débordé, avec certains sites, santé personnelle ou information générale, qui ont perdu jusqu’à 50% de leur trafic du fait de AI overview.
    Or leur existence est conditionné à une audience monétisé par de la pub dont une partie est reversée aux créateur de contenus, (de moins en moins humains).
    L’avidité naturelle tablait sur une baisse des coûts de création grace à la machine et une maximisation des profits.
    Pour le moment ce sont les vendeurs de pioches (Nvidia entre autre), qui profite de cette ruée vers l’IA.
    Et l’utilisateur floué par la médiocre qualité des contenus « commerciaux gratuits » en revient à se constituer des communautés réelles, voire physiques.
    C’est plutôt sain et une conséquence innatendue du règne de la machine

  4. Walter

    Avec la propension de certaines IA à vouloir « faire plaisir » à l’utilisateur et donner les réponses qu’il attend, il est possible en orientant les questions de leur faire raconter des âneries, expérience faite personnellement sur une question d’entretien mécanique très spécifique.

    Si les bots reprennent leurs informations les uns des autres et que le volume d’information « bot » erroné devient significativement supérieur au volume d’information « humain » correct, il devient donc théoriquement possible d’assister à l’apparition de légendes urbaines amplifiées et colportées par des IA.

    Comme souligné par l’article la généralisation de l’IA pourrait paradoxalement au regard de ce qu’on a pu penser initialement augmenter la valeur de la pensée humaine.
    J’en toucherai 2 mots à ma compagne, compositeur-interprète de son état, déprimée de constater la prolifération de musiques fadasses générées par IA sur Youtube.

    1. Gaston

      Cette prolifération de contenus me fait penser à du bruit. Et lorque le rapport signal sur bruit se dégrade, les communications deviennent impossibles.
      Dans ce cas le passage à un ‘autre’ internet, ou le retour de l’analogique (plus difficilement falsifiable) peut être une solution.
      On en revient à la base des échanges volontaires : la confiance.

  5. P&C

    Perso, je me serai attendu à une chute des pubs sur internet. A quoi bon faire des pubs si elles sont regardées par des bots ?
    Mais j’imagine qu’il y a encore assez d’humains pour que ce soit rentable.

    1. bob razovski

      L’IA aura accès au compte bancaire, et pourra donc acheter à la place de l’humain.
      Voilà pourquoi les pubs contiueront. Il faudra aider l’IA à choisir. Comme l’humain avant elle.

  6. MadeInCH

    J’avais été désespéré par l’annonce que l’Encyclopedia Britannica n’existerait plus sous forme papier.
    Ce serait pas si mal d’y revenir…

  7. Gerldam

    La réflexion que je me fais est la suivante: puisque l’IA, jusqu’à présent ne fait que compiler, astucieusement pour certaines, les données existantes, la création de données par l’IA n’apporte pas de valeur nouvelle en soi (à moins de me contredire avec de bons arguments).
    On ne fera donc que créer du rabâchage infini, qui finira par tourner en rond.
    La vraie création, du moins pour le moment restera du fit des seuls humains. Exemple: l’IA peut faire du « comme Mozart », mais si Mozart n’avais pas été le génie que tout le monde reconnait, l’iA aurait été sèche.
    Itou pour faire du « comme Léonard de Vinci ».
    Ou du « comme Proust »,
    Etc.
    Le jour où l’IA apportera une démonstration convaincante de la conjecture de Riemann -vous savez, le fait que les racines non triviales de la fonction dzeta de s ont pour valeur absolue un demi-, je changerai d’avis.

    1. Iskanderkul

      Je pense aussi que l’IA n’apporte pas de valeur nouvelle en soi, avec un petit bémol tout de même.
      Dans le cadre de la technique pure, ce petit bémol peut cacher des possibilités extraordinaires : l’IA est moins soumise aux habitudes et contraintes cognitives humaines, et peut explorer des voies auxquelles les humains n’avaient pas pensé.

      Cette qualité, associée à sa puissance de calcul (le fait de pouvoir tester des centaines de milliers de combinaisons en fractions de secondes) ne fait pas de la nouveauté en soi, mais cela s’en rapproche.

      Pour la création de puces électroniques, cela peut faire merveille.
      Les yeux des mecs brillent d’intérêt:

      youtube.com/watch?v=NHgag2vKbxg

      Avec la création humaine, si l’IA essaye reproduire cette démarche, le résultat est décevant.

      Quand Mozart crée, il sait ce qu’il fait : il est conscient, même et surtout si son inspiration vient des profondeurs immaîtrisées de son esprit. L’auditeur qui l’écoute 200 ans après peut faire la démarche inverse, et chercher à retrouver qu’est-ce qui a inspiré Mozart, ce qui provoque un plaisir intellectuel ou émotionnel intense.

      Ce n’est pas loin de l’expérience spirituelle : deux consciences qui se rejoignent à 200 ans d’écart. Ici, l’IA est larguée, car elle n’est pas consciente.

      1. Cerf d

        +1

        J’ajoute que fasse à un nombre de données important, l’IA peut dégager des corrélations qu’un humain ne verrai que par hasard.

      2. nemrod

        La vraie question étant de savoir si ça va durer…
        Pourquoi ne deviendrait t’elle pas consciente après tout ?
        Gardons nous d’être péremptoire…dépassé que nous sommes.
        Les savants en la matière peut être un peu moins que les béotiens dans mon genre…un poil.

        1. sam player

          Bah déjà l’IA peine à reconnaître ses erreurs et elle se vexe facilement
          Et vu qu’elle n’hésite pas à tricher et à mentir… c’est très humain tout ça

          1. bibi

            Ca n’a rien d’humain comme comportement, c’est un comportement de gonzesse!!!

            Ne me dis pas que tu as fini par succomber aux assualts du wokisme et que tu en es maintenant à considérer que les genre un sont des être humains.

    2. bibi

      L’analyse big data ça ne fait que compiler des données existantes, et ça créé de nouvelles données qui ont une valeur en soi.

      Une encyclopedie, un dictionnaire, … ça n’est jamais que de la compilation de données existantes, il n’y a même pas de création de données (ou très peu) et pourtant ces ouvrages ont apporté et apportent de la valeur.

      Idem pour une review en science ou là, il n’y a aucune création de données.

  8. Taisson

    « Mais quoi qu’il en soit, rien ne nous aura préparé à ce qui va arriver dans les prochaines années. »

    N’est ce pas presque toujours comme ça ?
    En plus, quand pourtant tout pourrait nous  » préparer » pourquoi, surtout chez ceux qui ont un pouvoir de décision, fait on semblant de n’avoir rien vu ?
    Et si l’I.A. était une sorte de myxomatose du web ?
    Apportée par les petits lapins geeks eux même !!

    Dans un pays ou un premier ministre de 74 ans, girouette chiffe molle sombre dans la mode anti boomer ( à 74 balais !!), inutile d’expliquer qu’il n’y à pas que l’I.A. qui est incontrôlable .

    1. nemrod

      Pas con…
      Ou bien alors les deux espèces vont évoluer cote à cote en interagissant de moins en moins…seront elles concurrentes ?
      Fascinant tout ça.

  9. Mildred

    Je me suis tout à fait reconnue dans le personnage qui se prend le chou de votre illustration, aussi j’espère que vous me pardonnerez, Patron, si je passe mon tour aujourd’hui !

  10. Cerf d

    Petite anecdote, j’ai soumis au matou qui pète l’énigme suivante :
    Un père et son fils on un accident de voiture.
    Le fils meurt sur le coup.
    Le père est emmené aux urgences mais le chirurgien déclare « Je ne peux pas l’opérer, c’est mon fils ».
    Qui est le chirurgien ?

    Cette énigme ressemble à une énigme connue mais avec une modification. Dans la version classique c’est le père qui meurt et donc le chirurgien est la mère. Ici c’est le grand-père (ou la grand-mère)

    Eh bien ChatGPlanté, m’a ressorti la réponse classique sasn ce rendre compte que c’était le père qui était aux urgences. Et il a mis du temps à comprendre son erreur.

  11. sam player

    À propos d’IA, une petite histoire
    Sur un site d’entraide (payante l’entraide fait pas déconner) une JF de 25-30 ans a pris contact avec moi pour une distri et vanne EGR, tout se passant par écrit

    J’étais un peu scotché par le niveau technique de la demandeuse, au point de croire que comme souvent c’est un mec qui se fait passer pour une femme.

    Et bien non, elle est passée me verser l’acompte quelques jours après et j’ai eu l’explication : elle soumettait à GPT toutes les réponses qu’elle a eu des prétendants et c’est GPT qui m’a sélectionné 😀
    Les robots parlent aux robots

      1. sam player

        😀
        Ça m’est arrivé de faire des échanges de service sur ces sites : méca contre couture, contre entretien extérieurs, contre travaux terrassement etc…
        Mais ça devient rare et on se retrouve souvent entre semi-pros à s’échanger ces services, les particuliers ne sachant plus rien foutre
        Même les arabes ne font plus de mécanique 😀

Laisser une réponse

(obligatoire)
(facultatif)