Not lost in translation anymore

Pendant que les politiciens s’agitent puérilement, de moins en moins synchrones avec le reste du monde, ce dernier continue, lui, sa marche tranquille vers l’abaissement concret des frontières entre les hommes. J’ai déjà évoqué, dans deux précédents billets, cette notion de singularité, moment de basculement historique où l’humanité verra émerger une véritable « intelligence » de la part des machines. Aujourd’hui, une nouvelle étape, modeste mais prometteuse, vient d’être franchie dans les technologies de communication entre les peuples.

C’est jeudi dernier qu’un article est assez discrètement paru, décrivant la nouvelle application de traduction Google à la volée. Attention, je ne parle pas ici de la maintenant célèbre traduction Google en ligne, mais de sa version mobile et à partir de la reconnaissance vocale.

L’idée générale est la suivante : en utilisant l’application mobile sur un téléphone Androïd, un utilisateur peut capter et enregistrer les paroles d’une tierce personne, les envoyer, toujours par le téléphone, à Google, qui se charge ensuite de traduire dans un langage cible et de renvoyer le texte résultant pour qu’il puisse être, au choix, lu par l’utilisateur sur son écran ou entendu directement par le téléphone.

En pratique, le son enregistré est envoyé dans un format idoine aux serveurs de Google qui se chargent ensuite et rapidement de découper les phonèmes en accord avec la langue source choisie par l’opérateur du téléphone. La puissance de calcul des serveurs du géant californien (un gros million, tout de même) lui permet d’assurer une assez bonne analyse vocale. Une fois ceci traduit dans un texte à peu près cohérent, la même puissance de calcul et la base statistique établie sur des millions de textes permet d’obtenir un texte traduit à peu près correct, texte renvoyé au téléphone qui peut se charger assez facilement de la synthèse vocale, ou, alternativement, cette synthèse pourra être effectuée là encore par les serveurs avant d’être renvoyée, prête à l’écoute, sur le téléphone.

found in translation ?

Tout de suite, quelques remarques : oui, la qualité de l’analyse vocale est perfectible. On est encore loin de l’oreille humaine.

Oui, la qualité de la traduction à la volée est encore un peu faible. Très suffisante pour les conversations de base où il s’agit essentiellement de demander son chemin, négocier un prix dans une boutique ou d’obtenir des informations de bases de la part d’une personne ne partageant pas la même langue que soi, ce système, on s’en doute n’est pas suffisant et loin s’en faut pour permettre une relation commerciale, diplomatique ou amicale plus poussée…

Oui, le temps de latence générale pour obtenir la traduction est encore suffisamment important pour tuer proprement toute spontanéité dans l’échange.

Et oui, enfin, il est évident que l’interface utilisateur proposée est encore rudimentaire et manque de souplesse. Les manipulations tactiles sont encore importantes pour corriger les approximations que font les machines.

Mais …

Mais on en est encore aux balbutiements.

Prenons, si vous le voulez, quelques instants de recul, pour apprécier d’où l’on vient, avant d’envisager regarder de l’autre côté, et estimer où l’on va et à quel rythme.

Il y a 10 ans, en 2001, Google avait 3 ans et 3 milliards de pages indexées. La quantité de données disponibles n’étaient encore pas suffisante pour ne serait-ce qu’imaginer une traduction purement textuelle de l’anglais vers le français sans que le résultat fasse franchement rire.

Il y a 10 ans, le débit moyen disponible dans la plupart des pays pour l’utilisateur lambda frôlait hardiment les 56 kilobits par seconde.

Il y a 10 ans, il y avait 1 milliards d’abonnés au mobile, mais très rares étaient ceux qui pouvaient accéder à internet avec.


Source

Aujourd’hui, Google a indexé 3000 milliards de pages, les traductions fonctionnent pour une dizaine de langues et les résultats rudimentaires obtenus, s’ils n’ont bien évidemment pas la qualité de traducteurs professionnels, n’en sont pas moins utiles pour les petits travaux de tous les jours : qui n’a jamais acheté sur internet dans un pays étranger, quitte à faire traduire le site ou la correspondance, facture incluse, depuis la langue inconnue vers la sienne, et s’est vu proposé une correspondance largement suffisante pour mener à bien et conclure la transaction commerciale ?

Aujourd’hui, il y a plus de 5 milliards d’abonnements à la téléphonie mobile, et un demi-milliard se connecte à internet ; ces 500 millions de personnes le font en haut débit et sont, potentiellement, des utilisateurs de la technologie proposée par Google. Cette dernière, comme toutes les technologies basées sur les statistiques d’utilisation, s’enrichit et s’enrichira de toutes les expériences qui seront tentées ; autrement dit, chaque nouvelle traduction sera un élément ajouté à la gigantesque base de données permettant d’améliorer les traductions futures. Avec plusieurs centaines de milliers d’essais et corrections par jour, voire par heure, on imagine que, dans 10 ans, le système se sera grandement raffiné.

L’étape suivante apparaît dès lors limpide et certains, comme chez Samsung, y travaillent déjà : la traduction à la volée, sans temps de latence, et avec une qualité bien supérieure.

Ne nous leurrons pas : il faudra encore des années pour que les traductions automatiques soient d’un niveau suffisant pour qu’on envisage sérieusement de se passer de bilingues humains chevronnés. Mais la question n’est plus du tout de savoir si on arrivera, un jour, à un tel niveau. Elle n’est d’ailleurs même plus de savoir quand, puisqu’on peut maintenant compter en années et non en décennies ou en siècles.

La question qui reste réellement est d’envisager les changements sociétaux profonds que cette technologie va offrir.

Une des barrières les plus importantes entre deux pays est en effet celle de la langue. A mesure que celle-ci s’abaisse, on imagine sans mal l’accroissement rapide, voire exponentiel, des relations commerciales, diplomatiques et humaines entre des pays auparavant éloignés. La disparition progressive des barrières douanières a, par exemple, été un excellent exemple de ces multiplications relationnelles fructueuses sur les dernières décennies. D’ailleurs, le fait même que cette technologie ait pris naissance dans un pays où l’innovation est largement encouragée, dans un contexte de mondialisation générale poussé, n’est sans aucun doute pas un hasard.

J’entends déjà les chagrins pleurer sur les métiers de traducteurs, d’interprètes ; oh, il le reste encore de belles années, mais, oui, effectivement, leur métier va, comme beaucoup d’autres sur les cent dernières années, disparaître. Tout comme apparaîtront sans aucun doute des métiers connexes dont on ne sait pas encore comment ils s’intègreront avec cette nouvelle donne.

Mais il apparaît déjà évident que le gain humain d’une telle technologie, qui n’en est encore qu’à ses balbutiements, dépassera probablement ce qu’on est en mesure de concevoir maintenant.

J'accepte les Bitcoins !

1KGn649F1XiWW7oWpiqRpW9reqKysjkaAQ

Vous aussi, foutez Draghi et Yellen dehors, terrorisez l’État et les banques centrales en utilisant Bitcoin, en le promouvant et pourquoi pas, en faisant un don avec !

Commentaires59

  1. Stéphane

    Tout cela est très excitant. L’avenir est plein de promesses! 😀

    Je ne crois que modérément à la traduction totalement instantanée, sans passage par le réseau. La puissance de calcul requise cantonne pour un long moment encore ce genre de possibilités à un outil connecté (smartphone, tablette iPad, etc.)

    Je crois que le métier de traducteur va subsister un moment. Dès qu’il s’agit d’un texte non trivial ou que la signification est importante (comme une notice de médicament) alors on ne peut pas se contenter de traduction automatique.

    C’est presque dommage d’ailleurs: Google propose une traduction relativement médiocre, mais quasi-instantanée. Nombreux seraient les utilisateurs, et moi le premier, à accepter d’attendre une ou deux minutes de calcul pour obtenir un meilleur résultat!

    1. Nombreux seraient les utilisateurs, et moi le premier, à accepter d’attendre une ou deux minutes de calcul pour obtenir un meilleur résultat!

      Ce qui revient à attendre la prochaine génération de processeurs (ou la suivante). Bref, dans une poignée d’années (2015 ?), on aura des traductions textuelles de meilleure qualité.

  2. Gu Si Fang

    L’appli de reco vocale de Google est bluffante. J’ai travaillé avec des spécialistes de ces technos il y a moins de 10 ans, et on était loin, très loin de ce qui se fait actuellement.

    Quelques indices :
    – reconnaître un faible vocabulaire (e.g. « service clients ») est plus facile que reconnaître un large vocabulaire (e.g. « restaurant japonais à Paris 15ème »)
    – reconnaître un locuteur unique, avec entraînement, donne de meilleurs résultats que la reco multi-locuteurs sans entraînement
    – la reco vocale marche mieux dans un bureau calme avec un bon micro que dans la rue, ou dans une voiture, avec un téléphone mobile

    A l’époque, on arrivait à surmonter une seule de ces difficultés à la fois, éventuellement deux. Google a réussi à faire les trois. Résultat, quand je suis dans la rue je peux dire à mon iPhone « salles de cinéma » et il m’affiche la carte (!) des salles à proximité !

    La traduction démarre. On n’en est clairement pas encore au même niveau.

    J’en profite pour signaler une petite appli marrante : la traduction instantanée de texte écrit. Je vais en Espagne et je pointe l’objectif de l’iPhone vers un livre, une affiche ou un panneau indicateur : les mots sont modifiés en temps réel en substituant la traduction des mots dans l’image ! L’application s’appelle WorldLens (et non ce n’est pas Google) :
    http://itunes.apple.com/us/app/word-lens/id383463868?mt=8

    GSF

  3. Aurélien

    Ce serait effectivement une belle avancée collective.
    Individuellement, j’ai juste une réserve sur le côté « paresseux » de la chose, en tout cas dans son éventuelle version aboutie, un peu comme quand je vois mes collègues prendre leur calculette ou ouvrir une feuille excel pour diviser 200 par 4.
    Certains efforts sont bons à produire. Ceux que l’on fait quand on doit communiquer malgré la barrière de la langue en sont.
    Je n’y vois pas non plus la mort des interprètes humains car l’interprétation, justement, est essentielle dans les relations commerciales ou diplomatiques. Ils pourraient être assister par ce genre d’outils et alors se concentrer sur les intentions, les attitudes typiques culturellement et les non-dits.

  4. adnstep

    Application obsolète : grâce à l’Educnat, bientôt, tous nos bambins seront multilingues novlangue/anglais/racaille.

    Quoi le Français ? Désolé, on ne fait pas dans les langues mortes véhiculant les stéréotypes d’une civilisation colonialo-facho-mysogino-impérialiste.

    1. Heime

      L’anglais est une langue qui sait etre simple dans sa grammaire (malheureusement tout aussi complexe que le francais pour l’orthographe) tout en pouvant etre soutenue dans son expression. Elle cumule les concepts d’association d’idée , de precision des mots, et de multiplicité des tournures de phrases. C’est donc une langue riche. Alors pourquoi s’embeter avec les traductions. Parlons tous la meme langue !

      Et que chacun concerve sa langue locale pour le côté « pitoresque » et communautaire. Et tant pis pour les .. anglophones.

      Pour marquer le respect on s’adresse aux gens en langue locale puis on passe en anglais pour pouvoir se comprendre.

      1. kwak chung seok

        Quelle idée répugnante, paresseuse, permettez que je m’y oppose, moi qui cause anglais, espagnol, français, espagnol, norvégien, chinois, albanais et allemand et qui admire chacune de ces langues !

        l’anglais est un espéranto réalisé mais ne peut aspirer à devenir plus que cela.

        1. Crucol

          Espagnol deux fois!!

          personnellement, je parle Français, Anglais, Français, un peu d’allemand, Anglais et Français

          désolé pour le post inutile

          bonne journée,

          Crucol

  5. adnstep

    Sans rapport aucun avec le sujet (désolé de polluer, h16, je vous laisse faire le nettoyage) : je viens de lire sur un forum boursier que :
    1. Les autorités hollandaises avaient demandées aux fonds de pension locaux de se débarrasser de leur stock d’or car ce n’était plus une valeur refuge.
    2. Que JP Morgan venait d’annoncer qu’elle acceptait les lingots d’or en dépôt comme caution de prêts.

    Est-ce vérifié, et y’a-t-il un rapport entre ces deux annonces de prime abord contradictoires ?

    1. Pour le 2, c’est vérifié. Pour le 1, je ne suis pas au courant, mais les autorités hollandaises sont européennes et comme la BCE n’est pas pro-gold, …

  6. fromageplus

    Tout cela est, comme d’habitude, formidablement réjouissant, et furieusement inquiétant en même temps. Avec la démocratisation de ces petites merveilles de technologie, s’accroît la scission entre une élite qui sait en tirer le meilleur, le plus utile, le plus intelligent ; et le reste des gens qui vont se vautrer dans l’imbécillité, l’aliénation, l’inculture, la bêtise, la laideur. Le syndrome René la Taupe a de beaux et longs jours devant lui.

    Globalement, il faut se réjouir, bien entendu, mais n’oublions pas qu’une bonne traduction n’a de sens que si les deux partenaires savent utiliser un minimum leur propre langue… « Wesh gros t’vois hé wallah le coran d’la mecque trop d’la balle cousin nique sa mère », ça va faire bugger Samsung, tout autant que « lé gen y croive k lé appstor c kom lé applestore mdr ».

    Avec la traduction simultanée, j’attends avec impatience le premier incident diplomatique mondial à base de « All your base are belong to us ».

    1. Heimdal

      C’est en effet un progrès, mais je crains que vous n’ayez raison: Quel sera l’intérêt d’apprendre une langue étrangère?

      Il faudra ensuite inventer le traducteur automatique et en temps réel racaille/français: le « Wesh gros t’vois hé wallah le coran d’la mecque trop d’la balle cousin nique sa mère » sorti de la bouche du jeune-plus-ou-moins-déçu deviendra dans l’oreille du recruteur « Après avoir obtenu mon baccalauréat S avec mention très bien, j’ai intégré une classe préparatoire commerciale puis l’ESCP, dont je suis désormais diplômé »

  7. Kuing Yamang

    Sinon vous avez mes traducteurs-interprètes qui marchent bien.. non ? ^^

    L’idéal en fait serait de s’affranchir des appareils externes comme un ordinateur ou un téléphone mobile en se faisant implanter l’interface directement dans l’oreille interne.

      1. NEV

        Mais la Fraônce et ses bisous pourra sans frontière tisser des liens étroits avec la corée du nord, le vietnam, les Wallons de Waterloo (et les francophones aussi, vous savez, ceux qui disent septante et nonante) etc. C’est beau le progrès 🙂

  8. Epicier vénéneux

    Je ne parle qu’anglais et allemand et, déjà, je vois deux problèmes non liés à la technique qui empêcheront toujours une traduction orale totalement instantanée.

    Exemple: je pense que la chromatographie liquide haute performance restera la meilleure technique pour séparer des molécules polaires.

    Ich denke, dass Hochleistungsflüssigkeitschromatografie die beste Technik um polaren Molekülen abzuscheiden bleiben wird.

    Un programme reconnaîtrait très vite le mot Hochleistungsflüssigkeitschromatografie (je pense que Hochleistungsflü- lui suffirait) et le traduirait directement par chromatographie liquide haute performance.
    L’inverse n’est pas vrai: si je dis « chromatographie », le programme ne sait pas exactement de laquelle je parle. Il est obligé d’attendre que je précise « liquide », puis obligé d’attendre que je précise « haute performance ».

    De même, pour la traduction de l’allemand vers le français de la subordonnée, il sera obligé d’attendre la prononciation des verbes abscheiden et bleiben pour pouvoir traduire quelque chose d’intelligible.

    Le décalage théorique serait d’au moins une demi-douzaine de secondes.

    En revanche, pas de souci pour traduire à l’écrit puisque la machine aurait toutes les informations (à savoir le début et la fin de toutes les propositions principale et subordonnées) simultanément.

    S’il y a des linguistes dans l’assistance, il serait intéressant d’avoir leur avis.

  9. Before

    Moi, ça me fait peur tout ça !
    J’espère que le gouvernement va réguler et encadrer toute cette technologie, pour éviter d’avoir des traductions à deux vitesses et pour ne pas laisser apparaître une fracture socio-linguistique…

  10. nordyck

    Troisième volet sur les merveilles de la technique appliquée sur le net et sa démocratisation . C’est très excitant,à tout point de vu,mais à chaque fois la même question me revient:pour qui?
    Et là,je rejoins @fromageplus:René la Taupe a de beaux jour devant-lui. Et puis,il faudrait que le haut débit soit accessibleà tous,ce qui est loin d’être la cas!Dans les grandes et moyennes agglomérations,ce n’est pas toujours le cas,alors en province …
    Je crains que,finalement,ce surplus d’accès à l’info(en tous genres)ne deviennent une rétention de l’information pour ceux qui déjà farfouillent sur le net pour sortir du bourrage de crâne officiel.
    Tant mieux pour eux(nous),dommage pour la propagation des idées,ce qui me semble le plus important .

    1. Essepe

      Un conseil si tu veux « propager des idées »: BOUGE TOI LE CUL ET PROPAGE !

      Et vient pas qualifier pas des services innovants de « surplus d’accès à l’info ».

      1. nordyck

        Je propage,je propage! Pas de problème. Et c’est bien de ne pas se sentir seul. Enfin presque. Car nous ne sommes vraiment pas nombreux sur la blogosphère de la droite libérale,réactionnaire,faschisante,ect… comme de bien entendu.
        Mais pour cela,je laisse la place au Maître des lieux,qui est bien plus doué que ma modeste personne.
        Et pour mon cul,ça va aussdi,ça roule,même !

  11. adnstep

    Traduction Google de « All your base are belong to us » = « Toute votre base sont appartiennent à nous ».

    « For Great Justice » = « Pour la Justice ».

    Test Zero Wing passed.

  12. kwak chung seok

    Et la littérature, elle sera traduisible via google ?
    J’ai du mal à imaginer une traduction de Flaubert en Coréen qui soit purement technique ou mathématique..

    Pour le reste très bien.

    1. Manassas

      C’est peut-être la seule niche où subsisteront les traducteurs professionnels.
      Google n’arrive pas encore à donner une traduction du poème du Jabberwocky de Lewis Caroll par exemple.

  13. Maintien

    Tiens, h16 nous refait le coup de la croyance quasi religieuse en la singularite (appelons un chien un chien), ca faisait longtemps.

    Comme tu le dis, c’est encore une traduction tout a fait rudimentaire, qui n’est finalement qu’une combinaison de differents services : celui de la traduction en ligne, des connections correctes mobiles et de la PDA-isation des telephones (dit smartphones…). Ce n’est rien que de la combinaison de technologies betement disponibles.

    Apres, je ne vois pas le lien entre ca et le fait qu’un jour on aura une traduction parfaite a porte de main. Mettre des chiffres pour expliquer que les ordinateurs sont plus nombreux et plus puissants qu’avant n’a aucune signification. Ca fait des annees que les ordinateurs de multiplient comme des petits pains et que la puissance de calcul sur la planete est en explosion, ce n’est pas pour autant que quoi que ce soit de revolutionnaire soit arrive en informatique depuis longtemps.

    On a pas besoin de plus de puissance de calcul. Elle est deja en surplus, et montre bien les limites de la force brute pour resoudre tous les problemes.

    Plusieurs obstacles s’opposent de toute facon a cet avenir radieux que tu decris:
    – traduire des mots n’a jamais permis de traduire une pensee. C’est un concept de geek qui a des limites des qu’on fait des phrases de plus de 5 mots.
    – Le langage est en constante evolution. Un ordinateur, aussi parfait qu’il soit, ne peut se baser que sur le « passe » du langage. Il est donc forcement en retard d’un train par rapport au monde reel.
    – La traduction est une affaire de contexte, pas de mots. Un meme mot, dans une meme phrase, peut avoir une notion ironique ou sarcastique, suivant le contexte. Reduire le sens de la phrase aux mots c’est completement passer a cote de la plaque.

    Enfin, je te ferai remarquer, qu’avant meme d’esperer que la traduction en ligne progresse pour en arriver au point que tu decris, le truc le plus urgent qui serait utile a une bonne partie de l’humanite, ca serait deja d’avoir une recherche potable sur internet. Depuis l’arrivee de Google, la recherche a peu evolue et on en est toujours a passer trois plombes pour arriver a trouver l’info dont on a besoin. Pourtant la puissance de calcul des serveurs de Google (un million! bah dis donc!) ne change fondamentalement rien au probleme: la recherche sur le net n’evolue quasiment pas, c’est toujours aussi poussif et penible qu’en 2001, a peu de choses pres.

    Alors le concept de la super-singularite-qui-va-changer-le-monde, c’est bien gentil mais y’a aucun fait pour prouver qu’on tend vers ce genre de truc machin-chose. Sans parler du peu de credibilite de l’auteur de la theorie en question…

    1. Je trouve intéressant de constater que tu ne t’exprimes que dans le cas où j’évoque la singularité, et toujours pour y dire que c’est n’importe quoi, avec des arguments un peu légers de surcroît (à commencer par « la recherche sur le net n’evolue quasiment pas depuis 2001 », ce qui est très drôle quand on y connaît vaguement quelque chose).

      1. Maintien

        Oui, je m’exprime simplement sur les conclusions hatives ou je ne suis pas d’accord avec l’opinion uber-enthousiaste exprimee, alors que je suis la plupart du temps d’accord avec tes autres billets. Mais la n’est pas le probleme.

        Les arguments un peu legers ?
        J’attends toujours avec impatience le jour ou on pourra poster une question simple sur Google avec un point d’interrogation et avoir cash UNE ou DEUX liens qui sont 100% en rapport avec la requete. J’ai utilise internet des 1995, bien avant Google, et moi aussi je peux pretendre « y connaitre vaguement quelque chose ». Je fais des recherches complexes sur Google plusieurs fois par semaine, sous plusieurs langues, avec de nombreux mots clefs pour tenter de trouver ce que je cherche, et ca prend beaucoup trop de temps. Si la recherche avait tant evolue que ca, le temps passe a la recherche aurait du etre diminue par 100 avec le super principe de la singularite-qui-s’applique-pas-trop-a-la-realite.

        Mes autres arguments sur le fait que le language n’est pas qu’un simple assemblage de mots tiennent toujours jusqu’a preuve du contraire, et la, j’attends encore des contre-arguments valables qui vont m’expliquer, a moi qui n’y comprend decidemment rien, comment passer ces barrieres. Et non, avoir une grosse base de donnees ne change rien au probleme.

        Enfin, ca n’a sans doute rien a voir, mais je pratique regulierement 4 langues de maniere plus ou moins courante, et la aussi j’ai une petite pretention a « savoir ce dont je parle », hein, mais je ne voudrais pas utiliser ceci pour valider quoi que ce soit. Juste un detail.

        1. Vous tapez à côté de la plaque : comme d’autres ailleurs, vous raisonnez de façon statique (la traduction n’est pas bonne, la recherche n’est pas bonne) mais ne voyez pas l’évolution qui s’est produite sur les 20 dernières années.

          Ainsi, puisque vous « cherchiez » sans google dès 1995 (à ce propos, Internet à l’époque comptait quelques sites en moins), vous avez du noter qu’Altavista proposait des résultats moins bons que ceux de Google. Accessoirement, vous avez aussi du remarquer que Google est leader incontesté de la recherche et que cet avis est partagé par … quelques centaines de millions de personnes (pour ne pas dire milliers). Vous aurez aussi observé qu’entre les traductions qui existaient il y a 20 ans (sur des logiciels coûteux et peu fiables) et ce qui existe maintenant (gratuit et dont le taux de couverture est bien meilleur), il y a un écart notable. Evidemment, pour pratiquer moi-même plusieurs langues, je sais parfaitement que les traductions automatiques sont médiocres ; mais pour avoir utilisé les logiciels pros payés fort chers il y a 10 ans, je peux vous dire qu’il n’y a pas photo : l’amélioration est flagrante.

          Enfin, l’argument utilisé de « language != assemblage de mots » est amusant, mais comme plus aucun traducteur automatique n’utilise ce paradigme depuis fort longtemps, vous détruisez consciencieusement un homme de paille que vous vous êtes vous-même construit. Ni Google ni d’autres ne travaillent ainsi et c’est d’ailleurs pour cela que les résultats qu’ils proposent sont de moins en moins mauvais et de plus en plus pertinents.

          L’informatique a ceci de particulier d’englober tellement de domaines intellectuels différents et ce, de façon de plus en plus rapide, que la plupart des gens qui commentent sont régulièrement complètement à l’ouest, sauf à se tenir vraiment au courant bien au-delà de leur spécialité (réelle ou proclamée). Et le plus intéressant, c’est que plus une personne est spécialiste d’un domaine concerné ou d’une partie de l’informatique, plus sa vision des choses est déformée.

    2. Joe

      Si tu mets dix plombes à trouver ce que tu cherches sur google, c’est que tu ne sais pas chercher. Si pour chercher une actrice dans un film, tu tapes « joli blonde gros seins », c’est pas étonnant que tu ne trouves pas (mais il s’agit peut être d’un acte manqué), si à l’inverse tu tapes « actrice eyes wide shut », Nicole Kidman sort directement en deuxième position, la première étant occupée par le film lui-même (dans lequel tu auras l’ensemble du cast).

      Pour avoir une part de recherche web importante dans mon job, je peux te dire que le choix des mots clés est primordial. Combien de stagiaires viennent me voir en disant qu’ils ne trouvent pas une info, que je trouve (devant leurs yeux ébahis) dès le premier clic ?

  14. Eric

    Le ministere de la Kulture vient d’annoncer que pour contrer cette nouvelle application, une application équivalente serait développée sur Minitel 2.0 avec une connexion 19,200 bits/s et…. 24 nuances de gris !
    Le gouvernement planche actuellement sur la possibilité d’un abonnement illimité, bien qu’en ces temps de crise il pourrait etre fort malvenu de se passer d’une obole sous forme de connexion/minute.

    Interrogé sur cette concurrence féroce susceptible, a moyen terme (!), d’entamer ses PDM, Google n’a pas souhaité réagir.

    Ph34r.

  15. Alex6

    Dans l’immediat l’urgence serait de developper un traducteur d’hommes politique. Certes il faudrait une grosse base de donnee du cote des elus pipoteurs mais la traduction serait tres simples, juste quelques mots; plusdetaxes, plusdimpots et a sec.

  16. maximilien

    C’est clair que ces trois dernières années, on est passé du charabia incompréhensible sur la traduction de pages bateaux à des traductions commençant à être pertinente sur des sites techniques.
    Je suis moi aussi tout excité à l’idée qu’un jour, j’aurais une petite oreillette me traduisant au fur et à mesure ce que raconterait les étrangers qui me parleraient.

  17. Maintien

    Comme je ne peux pas re-repondre au deuxieme commentaire de h16 sur mon post, hop, je cite une des ses phrases en question ci-dessous :

    « Vous tapez à côté de la plaque : comme d’autres ailleurs, vous raisonnez de façon statique (la traduction n’est pas bonne, la recherche n’est pas bonne) mais ne voyez pas l’évolution qui s’est produite sur les 20 dernières années.  »

    On est pas d’accord sur le sujet de toute façon, mais à mon avis c’est toi (permets moi de te tutoyer, et tu peux en faire autant à mon égard, ça me gène pas) qui à côté de la plaque à ce niveau là. Progresser à partir de zéro, ou des paquerettes, ce n’est pas un exploit, c’est naturel, au fur et à mesure que tu injectes des ressources dans n’importe quelle recherche. Par contre, là où je te critique, c’est dans la croyance absurde en cette notion de singularité. Ce n’est pas parce que tu progresses constamment que tu vas atteindre, automatiquement, un état de machine supra-intelligente. Ce n’est pas parce qu’un élève étudie pendant 50 ans de la physique théorique qu’il obtiendra les mêmes capacites intellectuelles qu’Einstein. Même une suite mathématique qui progresse constamment peut avoir un comportement asymptotique. Ce n’est pas parce que la puissance des armes a augmenté de manière exponentielle qu’on va avoir dans les 10 prochaines années une arme qui permet de détruire une galaxie entière d’un coup.

    Il n’y absolument rien qui prouve, dans l’état actuel des connaissances, que la singularité est un concept non-fumeux. Et justement, quand on prétend défendre la pensée scientifique, on évite de mélanger science et science-fiction, et on se base sur des faits.

    The Economist donnait la réplique que cet ahuri de Kurzweil méritait : si l’on suit le principe de la singularité pour les rasoirs jetables, alors on va bientôt avoir des rasoirs à nombre infini de lames sur le marché, puisqu’on est passé à une vitesse quasiment exponentielle de 1 à 5 lames dans les dernières années.

    Sinon h16, ça serait bien d’arrêter de prendre les gens qui commentent pour des crétins finis (je ne suis pas politicien, merci), quand j’ai dit que le langage n’était pas un assemblage de mots, je ne me suis pas arrêté là, j’ai bien mentionné que le problème de la traduction est lié au contexte, et un ordinateur ne peut pas comprendre le saisir, sans repère vis à vis de l’individu, de la société dans laquelle le langage est utilisé, de l’audience visée, du niveau de politesse souhaité, etc… Les quelques paramétrages offerts sont de la pure rigolade, c’est vraiment du gadget qui marche simplement pour les phrases simples et non ambigües.

  18. Curmudgeon

    La traduction automatique a fait et fera des progrès substantiels. Cependant, pour le moment, un des obstacles majeurs à une haute qualité de la traduction automatique, c’est le fait suivant. Le traducteur ou interprète humain ne se contente pas de passer d’un texte à un texte de façon purement linguistique, même en intégrant un gros contexte. Il utilise aussi ses connaissances sur le monde, ses connaissances encyclopédiques.

    Pour faire faire un bond qualitatif à la traduction automatique, il faut donc coupler les logiciels de traduction automatique strictement linguistiques avec a) des banques de données encyclopédiques et b) un module logique autorisant des raisonnements. Ceci est expliqué par Yehoshuah Bar-Hillel dans un article célèbre et ancien : A demonstration of the nonfeasibility of fully automatic high quality translation, 1960 (disponible en ligne). La phrase-clé de bar-Hille est : « a translation machine should not only be supplied with a dictionary but also with a universal encyclopedia. ».

    La constitution d’une telle encyclopédie, amorcée pour certains pans limités du savoir, est une tâche herculéenne. Il faut comprendre que, par « encyclopédie », on entend ici, non pas la copie servile de l’Encyclopedia Britannica ou d’ouvrages super-érudits de ce genre, mais une encyclopédie du savoir standard portant sur des tas de choses de la vie quotidienne, comme de savoir que « Puligny-Montrachet » est une sorte de vin rouge de Bourgogne, que « vin » est une boisson destinée aux humains, que « rouge » est une couleur comparable à celle du sang, que « Bourgogne » est une région de France, que « boisson » est… A partir de là, tout être humain, sachant raisonner, saura conclure que le Puligny-Montrachet est une boisson française, par exemple, chose qui peut être pertinente pour la traduction. Une machine ne pourra pas le faire si elle n’est pas équipée du logiciel et de la banque de données idoines.

    1. Maintien

      Et encore, là, tu ne touches qu’à des objets de la vie courante, des choses tangibles. Quand il s’agit de traduire des abstractions, ce n’est plus des progrès qui sont nécessaires à la traduction automatique, c’est une pensée artificielle, capable de comprendre le sens complet de la phrase, et d’en former une continuité.

      C’est aussi pour ca que les moteurs de recherche sont toujours aussi pourris (oui, c’et mieux qu’il y a 10 ans mais toujours aussi nul d’avoir 20 000 liens qui sortent pour trois mots qu’on balance) : ils ne comprennent pas ce qu’ils « lisent », ils font des statistiques, des regroupements thématiques, du parsage de metas, et une tripotée d’autres choses, mais ils ne comprennent pas intrinsèquement le sens des pages. Ca rend forcement la recherche très fastidieuse.

      Bref, y’a un chemin énorme à parcourir, et ce n’est pas qu’une question de temps, de puissance ou de base de données. Il faut de nouvelles conceptualisations du langage.

    2. Curmudgeon

      Maintien : Pas tellement de nouvelles conceptualisations du langage, strictement, mais plutôt de ce qu’il permet de dire. Pour ce qui est de la déduction, voir les « assistants de preuve » en mathématiques.

  19. Curmudgeon

    La traduction automatique obtient des résultats admirables quand elle opère sur des textes formatés, écrit dans un style très contraint, avec un vocabulaire bien déterminé, sur un domaine bien circonscrit. Par exemple, je peux imposer à des rédacteurs de ne jamais employer une phrase au passif, uniquement à l’actif, mettons.

    Par exemple les bulletins météo, les bulletins d »avalanche.

Laisser un commentaire