Le classement des 15 premiers digg like francophones octobre 2011
October 4th, 2011Le classement est accompagné des habituels commentaires sur les évolutions et tendances diverses.
Le classement est accompagné des habituels commentaires sur les évolutions et tendances diverses.
Pour O’Reilly Radar, Mike Loukides, a publié un court rapport sur la nature de ce qu’il appelle les “produits de données” où il tente de dresser une esquisse d’une taxonomie des services imaginables depuis ce que produisent les données.
La science des données explique-t-il, est en train de donner naissance à de nouveaux types de produits qu’on n’imaginait pas il y a encore quelques années. En fait, les données sont en train de devenir des produits, que ce soit des produits liés aux données elles-mêmes (des données de transports ou de trafic par exemple qui deviennent des services en tant que tels), ou des produits liés à l’activation des données par les utilisateurs (par exemple les produits liés au Quantified Self). Ce que suggère Mike Loukides, c’est que les produits de demain reposeront avant tout sur l’exploitation originale de données.
Nous commençons à nous habituer aux produits virtuels à mesure qu’ils remplacent les produits physiques, explique Mike Loukides. De stockée sur des supports physiques, la musique s’achète désormais de façon numérique. Avec des services comme Spotify, elle est même devenue un produit de données pures. Mais qu’allons-nous vouloir demain ? Des produits qui fournissent des données ? Ou des produits qui offrent des résultats depuis les données ?
L’iPod est pour Mike Loukides le meilleur exemple d’un produit qui livre des données, bien que son application partenaire, iTunes, ne soit rien d’autre qu’un tableur exposant les métadonnées de vos collections. De même la recommandation sociale que l’on trouve sur des sites comme LinkedIn ou Facebook pioche ses recommandations dans les métadonnées de nos relations, en les présentant de manière un peu moins classique qu’une feuille de calcul. Mais ces produits de données demeurent classiques. Ils conservent “l’odeur de données” qui les produisent. Pour Mike Loukides ce sont “des produits de données déclarés”, manifestes, car les données sont clairement visibles dans ce qui nous est délivré.
Pour Mike Loukides, il existe néanmoins d’autres formes de livrables. Des systèmes capables d’analyser des données de trafic pour optimiser votre itinéraire utilisent également des données pour produire un service et des produits. Ford utilise ce type de données couplées à des outils de prédiction de trafic pour optimiser le trajet proposé par des navigateurs GPS expérimentaux qu’il destine à des voitures hybrides. Tous les produits de données ne sont donc pas explicites, beaucoup utilisent des produits de données “secrètes” pour fourbir d’autres services.
En filant l’analogie, la Google Car capable de se déplacer toute seule (et qui utilise une quantité considérable de données y compris les cartes et les images de Google Street View pour calculer l’emplacement des trottoirs, bordures et panneaux… ainsi bien sûr que des données de trafic comme les données que la voiture produit elle-même) est typiquement un produit de données, même si celles-ci ne sont pas visibles dans le résultat final : une voiture qui se déplace toute seule.
Aujourd’hui, une grande chaîne d’hôtel peut voir son métier de nombreuses façons différentes, et se considérer avant tout comme une société de logiciels, qui fournit un produit de données : son système de réservation. C’est un système souvent complexe, qui doit être capable de gérer des milliers de chambres, d’énormes masses de clients, de faire des offres spéciales selon le taux de réservation, etc. Pour l’utilisateur, l’expérience est celle d’un lit confortable, mais la réalité repose sur des masses de données cachées.
“Les produits de données manifestes” ont tendant à dépendre d’une collecte de données ouvertes, avance-t-il encore. LinkedIn ou Facebook ne disposent pas de données qui n’aient été apportées de façons explicites, même s’ils sont en mesure de les combiner de manières inattendues, notamment en les mixant avec d’autres. “Les produits de données secrètes”, non seulement proposent des données invisibles dans les résultats, mais ont également tendance à être collectés de façon invisible. Nous ne pourrions obtenir une voiture qui se conduit toute seule si nous ne devions la nourrir qu’avec nos antécédents de conduite. La Google Car est construite notamment à partir d’un “échappement de données”, c’est-à-dire de données qui proviennent de dispositifs qui recueillent des informations sur nos activités. Ces échappements de données ambiantes, à l’avenir, vont être un réservoir important pour produire de nouveaux “produits de données” : les données sur l’utilisation de l’eau par exemple vont permettre de produire des données sur la localisation des fuites et permettre d’imaginer de nouveaux services.
Les premières générations de produits de données reposaient sur des bases de données uniques, mais les plus récentes, comme la base de données de compétences de LinkedIn, sont composites : elle intègre à la fois les bases de données d’utilisateurs, d’employeurs, d’offres d’emplois, etc. L’intégration de la reconnaissance faciale dans Facebook est un excellent exemple de la puissance des bases de données liées. Alors que l’identification des visages est un problème complexe, la réponse de Facebook de restreindre l’identification a priori aux amis de celui qui l’a prise, permet de lever dans de très nombreux cas l’immensité du problème de l’identification des visages. Le croisement des données permet de résoudre le problème de l’appariement de millions de photos, pour le restreindre à un cercle limité. La solution ne provient pas d’un robot surpuissant, mais de pouvoir apparier les photos au graphe social.
Beaucoup de produits de données actuels sont en fait des moteurs de recommandations utilisant le filtrage collaboratif, estime Mike Loukides. Mais la recommandation est un objectif limité. “Le problème avec la recommandation c’est qu’elle ne cherche qu’à recommander quelque chose que l’utilisateur va apprécier.” Or l’appréciation n’est pas toujours un bon critère. “Genius, sur mon iPad m’a ainsi récemment recommandé d’essayer Zite, parce que dans mes applications je disposais de Flipboard (deux applications qui créent des magazines depuis les recommandations de vos relations sociales sur Facebook ou Twitter, NDT). Certes, j’ai bien aimé Zite, mais j’aurais préféré qu’il me recommande une application pour faire autre chose”. J’ai besoin d’un logiciel qui me raconte des choses nouvelles : des choses que je ne savais pas et que je voudrais, ou dont je pourrais avoir pensé que je n’en voudrais pas alors qu’elles pourraient m’être indispensables, explique-t-il. “Si vous disposez de ForScore, une application qui permet de transformer votre iPad en lecteur de partition de musique et qui indique que vous êtes musicien, alors le système doit pouvoir vous proposer une application comme Magic Fiddle, qui n’a pourtant a priori rien à voir, mais intéressera tout musicien.”
Il faut que la recommandation nous amène à la découverte et pas seulement à la recommandation du similaire. Et de faire référence au livre d’Eli Pariser, The Bubble Filter, une excellente réflexion sur le danger de la personnalisation excessive liée à l’utilisation des médias sociaux…
Pour autant, le filtrage nous est nécessaire, rappelle Mike Loukides. “Essayez de faire des recherches dans Google Chrome en mode privé, qui supprime toute information qui pourrait être utilisée pour personnaliser les résultats de recherche. J’en ai fait l’expérience. Il est difficile d’obtenir des résultats de recherches pertinents lorsque le filtrage n’est pas basé sur la connaissance préalable de vos intérêts. Pour autant, quand les outils que nous utilisons se transforment en parodie de nos goûts, cela dégrade également les résultats. Passer de la recommandation à la découverte est le problème principal auquel nous allons être confronté dans la prochaine génération des “produits de données”.”
Dans les premiers temps des produits de données, nous les avons consultés via nos ordinateurs. Mais ce n’est désormais plus le cas. On écoute de la musique via nos iPod, on lit des livres sur nos Kindle, on joue des vidéos sur nos téléviseurs… Or, les ordinateurs avaient l’avantage de nous faire prendre conscience que les données étaient des données. DJ Patil, spécialiste des données en résidence chez Greylock Partners, affirme que lors de la construction d’un produit de données, il est essentiel d’intégrer des designers dans l’équipe d’ingénierie dès le début. Pour Patil par exemple, Foursquare a réussi parce qu’il a utilisé le GPS d’une manière très simple et c’était autant une décision technique qu’une décision de conception. Les nouvelles interfaces des produits de données travaillent toutes à masquer les données proprement dites pour trouver et faire apparaitre ce que l’utilisateur souhaite. L’iPod a révolutionné l’écoute audio en éliminant les boutons et les commandes pour accéder à sa base de données musicale !
Dans le passé, nos recherches sur Google étaient basées sur des données datant parfois de plusieurs semaines. Désormais, bien souvent, les données doivent être basées sur le “temps humain”, comme le dit Justin Sheehy, de Basho Technologies. L’heure d’arrivée du bus n’a pas de sens si le bus est passé. Faire une prédiction de trafic depuis des données de la veille peut avoir une certaine valeur, mais elle est bien moindre que de la faire depuis des données temps réel. Une Google Car ne pourrait pas circuler depuis les conditions routières d’hier. Prédire l’infection chez un nourrisson prématuré n’est utile que si vous pouvez l’annoncer avant qu’elle devienne apparente pour les observateurs humains, via les données enregistrées en continu par les moniteurs. Pour répondre à l’exigence du temps humain, de nouveaux outillages de données voient le jour, Percolator, Apache Flume, Storm… permettant de produire des données en temps réel, de produire des flux de traitement en contexte.
Mike Loukides conclut en expliquant que les produits de données font de plus en plus partie de nos vies. Mais que les changements à venir seront plus flagrants encore quand ils ne ressembleront plus à des données. Nous allons vers un monde où nos appareils délivreront des résultats de données plus que des données elles-mêmes. Les données qui font fonctionner la Google Car ne nous intéressent pas en tant qu’utilisateurs, estime peut-être un peu rapidement Loukides. Eric Schmidt, le PDG de Google, déclarait en juin dernier : “Google a besoin d’aller au-delà du format de recherche actuel qui est d’entrer une requête pour obtenir une dizaine de résultats. L’idéal serait que nous sachions ce que vous voulez avant de le chercher…”
Cette phrase controversée et quelque peu effrayante capture pourtant l’étape suivante dans l’évolution des données, estime Mike Loukides. Nous ne voulons pas des listes ou des tableurs, nous ne voulons pas de données en forme de données, nous voulons des résultats qui soient en phases avec nos objectifs humains. “Nous avons besoin de produits de données qui tirent leurs puissances de plusieurs sources, qui offrent des résultats dans le temps humains, plutôt que via des procédés discontinus, et plus importants encore, nous avons besoin de produits de données qui nous conduisent de la recommandation à la découverte.”
Dans les années 80-90, vous ne pouviez penser le réseau sans être conscient de sa plomberie. Aujourd’hui, les produits de données se battent pour le même objectif : les consommateurs se moquent d’être conscients qu’ils utilisent des données. Lorsque nous réaliserons que la richesse des produits de données repose sur des données qui n’appellent pas l’attention sur elles, alors nous serons prêts pour la prochaine révolution.
Bien sûr, les propos de Mike Loukides sont à replacer dans leur contexte. Il n’est pas si simple d’affirmer – trop rapidement, cela n’était pas son sujet – que les consommateurs ne s’intéressent pas à la manière dont elles sont assemblées. L’esquisse de taxonomie qu’il propose est encore bien fragile, mais sa tentative d’essayer de comprendre ce que les données produisent et permettent comme nouveaux types de services ou d’objets, est certainement un point de vue fécond pour mieux comprendre les transformations en cours liées à la production de masses de données.
algorithmie, intelligence des données, internet des objets, marketing, opendata, quantifiedself, Web²
La lecture de la semaine, il s’agit d’un article assez étrange du New York Times, intitulé “Dans les petites villes, les ragots pénètrent le web et deviennent nocifs”. On le doit à Arthur Gregg Sulzberger.
Le papier commence par décrire une petite ville du Missouri, Mountain Grove, où on a l’habitude de dire que “tout le monde sait ce que fait tout le monde, et quand quelqu’un ne le sait pas, il a une hypothèse solide”. Dans cette ville de 5 000 habitants, on a récemment cessé de se rendre au café du coin pour échanger les derniers potins, la préférence étant depuis peu donnée au “Mountain Grove Forum“, hébergé par un réseau social du nom de Topix, où les habitants peuvent lire et écrire, de manière anonyme, les messages les plus désagréables concernant les uns et les autres.

Image : Mountain Grove, Missouri, via Google Street View.
Au café du coin, on dit que le forum a provoqué des rixes et des divorces. Le propriétaire voit ce forum comme un “cloaque où grenouille la diffamation”. La femme du cuisinier, quant à elle, a été la cible d’un post intitulé “freak” dans lequel cette mère de deux enfants était qualifiée de pute ex-toxico et malade du SIDA. Rien de cela n’était vrai, les conséquences en revanche furent réelles : des relations ont arrêté de parler au couple, aller à l’épicerie est devenu un enfer, la femme du cuisinier a beaucoup pleuré, pensé au suicide et le couple a décidé de déménager.
La journaliste explique : “L’Amérique rurale – où vit une population plus âgée, plus pauvre et plus reculée – a pris du retard par rapport au reste du pays en ce qui concerne l’Internet. L’usage croissant des médias sociaux y soulève des questions familières sur la diffamation et la vie privée, mais dans les petites villes, cela ne va pas sans complications. Les mêmes sites qui ont été créés comme des lieux d’échanges bienveillants sur les dernières nouvelles et la politique locales sont des ramassis de ragots infondés, remuant le ressentiment dans des communautés où les liens sont profonds, où la mémoire collective remonte loin et où l’anonymat est un concept nouveau.”

Image : Le Mountain Grove Forum.
Christian Sandvig, un professeur de l’université de l’Illinois explique à la journaliste qu’à la génération précédente, alors même que la technologie avait évolué, beaucoup d’habitants de l’Amérique profonde restaient accros aux lignes de téléphoniques partagées qui permettaient aux voisins d’entendre les conversations des uns et des autres. Ce même professeur ajoute : “Il y a quelque chose dans la culture rurale qui semble pousser les gens à tenir leurs conversations en public”.
Or, un site comme Topix qui est assez peu fréquenté par les urbains, voit son audience croître dans les Appalaches, dans le sud rural, et a trouvé une niche inespérée dans des communautés de quelques centaines ou quelques milliers de personnes. Et si l’on constate que les propos négatifs qui sont mis en ligne semblent se dissiper naturellement parmi les habitants des grandes villes, mais ils s’enroulent comme des pelotes de fils barbelés dans des petites villes où les insultes ne sont pas facilement oubliées. Des forums ont été fermés par des autorités locales, des procès ont eu lieu et même, à Austin dans l’Indiana, une femme s’est tuée, avec ses trois enfants. Quelques heures avant, elle avait écrit sur le site où son divorce était un sujet de conversation : “Il est maintenant temps d’ôter toute cette douleur”.
Et le journaliste de citer plusieurs exemples de ces réseaux sociaux locaux qui sont devenus des lieux de diffamation entre voisins.
Du côté de Topix, le site qui héberge certains de ces forums, on observe ce détournement de l’usage prévu initialement. Le site se voulait un agrégateur d’informations hyperlocales avec des pages séparées pour toutes les communautés du pays. Mais sa croissance a principalement eu lieu dans les petites villes et les commentaires sur la vie locale se sont changés en ragots. Ce qui est intéressant, c’est l’interprétation qui est faite par l’entreprise : elle se dédouane derrière la liberté d’expression. L’un des dirigeants explique que les commentaires sont drôles, qu’ils transforment les ragots privés en ragots publics, qu’ils offrent une plateforme pour les gens qui ont des choses négatives à exprimer, et que tout cela est bon pour le business. Ce même dirigeant raconte que l’entreprise a tenté de retirer tous les commentaires négatifs, mais a cessé en constatant que plus personne n’allait visiter le site. Il ajoute que ces forums peuvent jouer un rôle journalistique en permettant de dénoncer certaines choses et de discuter de la politique locale. 9 % pour des posts ne sont pas affichés parce qu’un logiciel les détecte comme insultant (notamment parce qu’ils sont racistes), 3 autres % sont retirés suite à des plaintes… Il n’empêche, le site regorge de messages qui dépassent les limites, ce dont les dirigeants se moquent parce que le responsable légal n’est pas Topix mais celui qui a rédigé le billet. L’entreprise dit recevoir une demande par jour de la justice pour qu’un post soit identifié en vue de poursuite.
A Mountain Grove, la petite ville du Missouri mentionnée au début de l’article, la femme traitée de pute toxicomane explique qu’elle n’a pas assez d’argent pour porter plainte. Et même si elle le faisait, ça ne changerait rien : “Dans une petite ville, explique-t-elle les rumeurs ont la vie longue.”
Xavier de la Porte
Xavier de la Porte, producteur de l’émission Place de la Toile sur France Culture, réalise chaque semaine une intéressante lecture d’un article de l’actualité dans le cadre de son émission.
L’émission du 1er octobre 2011 était consacrée aux web studies, l’étude du web à l’université, en compagnie de Vincent Lemire, maître de conférences en histoire contemporaine et responsable pédagogique du Master Cultures et Métiers du Web de l’université de Marne-La-Vallée et trois de ses étudiants Perrine Guinel, qui a travaillé sur “La figure du hacker” ; Vincent Bremond, sur “Proxi-web et web solidaire” et Leny Gourven sur “Encyclopédisme et Wikipédia”.
citelabo, communauté, habitat connecté, hyperlocal, identités actives, réseaux sociaux, vie privée, villes2.0, web local
La NASA vient de lancer le Space Apps Challenge, un concours d’applications open source susceptibles d’aider à la résolution des grands problèmes planétaires, comme le changement climatique ou l’économie mondiale.
Une équipe de l’université de Californie s’est montrée en mesure de reconstruire ce que voit un sujet en se basant sur ses scans cérébraux.
Selon une étude menée par Jack Goncalo, professeur au département de comportement organisationnel à l’université Cornell, Jennifer S. Mueller de l’université de Pennsylvanie et Shimul Melwani de l’université de Caroline du Nord, nous avons tendance à avoir un parti pris contre les idées créatives et ce, même quand on les désire ardemment. Alors qu’elles sont le moteur de l’innovation, les organisations, les institutions et leurs responsables ont tendances assez uniformément à les rejeter, même lorsque la créativité est le moteur essentiel de leur existence.

Image : Est-ce que le monde traditionnel des affaires est en guerre contre la créativité ?, par OpenSourceWay.
Pire, les gens ont tendance à ne pas les reconnaitre et à être mal à l’aise quand ils y sont confrontés. En fait, constate l’étude, les idées créatives ont plutôt tendances à générer un sentiment d’incertitude qui rend la plupart des gens mal à l’aise. Ils ont tendance à les rejeter au profit d’idées purement pratiques et éprouvées. Pire notre partialité vis-à-vis des idées créative est si subtile, qu’elle nous empêche bien souvent de les reconnaître. Dans les expériences menées par le professeur Goncalo, les cobayes avaient ainsi une réaction négative quand on leur présentait une innovation comme une chaussure de course équipée d’un tissu pour refroidir le pied et réduire les ampoules, alors qu’à priori, on devrait plutôt faire bon accueille à une pareille révolution !
Alors que les gens affirment explicitement apprécier les idées créatives, bien souvent, ils les considèrent négativement et ont tendance à les rejeter, comme on écarte du revers de la main un nouveau produit parce qu’on ne le connaît pas ou qu’on doute de ses effets. Cela ne veut bien sûr pas dire que toute idée qui vous rend mal à l’aise est une solution créative – les mauvaises idées sont toujours des mauvaises idées -, mais que vous devriez vous y reprendre à deux fois quand vous avez tendance à rejeter une idée…
“L’incertitude que les idées créatives génèrent en nous, nous rend moins capables de reconnaître la créativité quand on en a le plus besoin”, concluent les chercheurs (via Science Daily).
Une étude précédente (.pdf) de Jack Goncalo et Jennifer S. Mueller montrait déjà que les plus créatifs talents d’une entreprise sont majoritairement perçus comme de piètres leaders. Le créatif fait un piètre manager car aux yeux de ses subordonnés : un leader crédible doit être sérieux plutôt qu’original. Les stéréotypes ont décidément la vie dure.
économie comportementale, économie de l'attention, cognition, innovation sociale, management, neurosciences
Alors que le débat sur les faux avis de consommateurs est vif sur le web francophone depuis juillet, que les pouvoirs publics intentent des procédures, et que l’Afnor vient de lancer une mission de concertation pour trouver des parades, il pourrait être intéressant d’écouter les propos d’un spécialiste.
Panagiotis Ipeirotis (blog), à la tête du projet EconoMining de l’école d’affaires Leonard Stern de la New York University, étudie depuis longtemps la valeur de la réputation en ligne et regarde l’influence qu’ont les critiques de consommateurs sur nos décisions. A l’occasion de la conférence Strata 2011, sur les BigData, il est revenu sur ses dernières recherches en la matière (vidéo, présentation), indique Christopher Mims pour la Technology Review.
Sur Amazon, explique-t-il, les consommateurs sont – assez logiquement – prêts à payer un peu plus un produit pour l’acheter à un revendeur ayant une bonne réputation. Mais ce qui est plus surprenant, c’est que passé le nombre d’avis favorable d’un revendeur ou le nombre de transactions qu’il a accomplies, la critique des autres utilisateurs affecte également les ventes, et pas forcément dans le sens que l’on pense.
Par exemple, on pourrait penser que la critique positive d’un utilisateur sur un produit du type “très bon appareil photo” devrait augmenter la réputation et les ventes du produit… Pourtant, il semble que ce ne soit pas le cas. Iperotis a même quantifié cet effet. Une critique de ce style a plutôt tendance de réduire la vente de 0,2 % !
Pourquoi ? Parce que les utilisateurs prennent les critiques en contexte : les critiques simples ne leur semblent pas pertinentes pour encourager leur achat pas plus que les compliments faciles. Au contraire, les critiques négatives, argumentées et bien écrites, ont tendance à favoriser les ventes d’un produit, car elles donnent confiance à l’acheteur : “si c’est le pire que ce produit peut faire, alors il doit être suffisant pour moi”.
“Les critiques négatives, qu’elles soient sur des hôtels ou des jeux vidéos, permettent à l’utilisateur de mesurer le risque qu’il prend”, explique Ipeirotis. A l’inverse, des commentaires qui paraissent positifs comme “l’emballage est bien” ou le “vendeur est très bon” ont plutôt tendance à avoir un impact négatif sur les ventes.
Autre chose que constate Ipeirotis, c’est la disparité entre ce dont les consommateurs parlent dans leurs critiques et ce qui fait basculer l’achat. Ainsi, pour les appareils photo, les utilisateurs évoquent souvent la qualité du zoom, mais en fait, la durée de vie de la batterie a souvent plus d’influence dans la décision d’achat.
Ipeirotis a également constaté que la grammaire et l’expression ont une influence. Zappos dépenserait d’ailleurs quelques milliers de dollars à faire améliorer l’expression des critiques de ses produits via le Mechanical Turk d’Amazon dans le but d’améliorer les ventes de ses produits. Et Ipeirotis de conclure : “il ne suffit pas de regarder ce que les gens disent, il faut également mesurer ce que les gens font”.
Signalons en complément que sur son blog, il livre une bibliographie commentée des meilleures recherches existantes sur le sujet des critiques de consommateurs. Précieux.
intelligence des données, marketing, psychologie
On l’a vu dans l’article précédent, les frontières de la vie artificielle sont assez difficiles à définir. Si, par bien de côtés, celle-ci se rapproche de la biologie théorique, une autre de ses tendances aborde l’ensemble des systèmes complexes autour de quelques principes de base. A commencer par la notion d’émergence, de bottom up : l’idée que des systèmes complexes puissent être générés spontanément par l’interaction entre une multitude d’agents. Ce principe d’émergence peut s’appliquer à n’importe quel phénomène décentralisé et collectif. En premier lieu, à l’esprit humain et ses productions. Et bien sûr, aux sociétés.
Le colloque Ecal s’est ainsi intéressé, pour une bonne part, à l’évolution du langage. Et ce, par un biais surprenant : la robotique.
Spécialisé dans cette étude, le Computer Science Laboratory, sous la houlette de Luc Steels, mène depuis plusieurs années des travaux sur l’évolution du langage au sein d’une population d’agents robotiques.
Luc Steels a commencé ses expériences par un travail nommé les “Talking Heads” ; pas le groupe de rock, mais un système par lequel deux robots inventent collaborativement un langage afin de communiquer à propos du monde extérieur. Le procédé a été appelé le “jeu de langage”.
D’après Steels et ses associés, les “jeux de langages” nous permettent d’observer la naissance de la grammaire. Une telle théorie va à l’encontre des idées de nombre de linguistes. La plupart d’entre eux pense en effet, sous l’influence de Noam Chomsky, que les structures linguistiques sont d’ores et déjà codées dans le cerveau, qu’il existe un organe de la parole déjà constitué. Les différentes “langues” parlées sur la planète ne seraient que des adaptations somme toute cosmétiques de ce langage cérébral fondamental.
De fait, les adeptes de la biolinguistique tiennent pour acquis que les structures du langage sont implantées dans notre cerveau. Pour eux, nous a expliqué Steels, l’essentiel du travail du linguiste va consister à étudier la transmission : comment le cerveau de l’enfant reçoit les signaux codés de ses parents (la “langue maternelle”) et les intègre via les structures innées qu’il possède. Mais comment le langage est-il né ? Par la sélection naturelle ? Pour certains linguistes, le langage est un système trop complexe pour être le produit de la sélection naturelle darwinienne.
Toutefois, précise Luc Steels, il existe un aspect du langage que la plupart des biolinguistes ignorent : pour que la parole naisse, il faut être deux. Avant d’étudier les structures du langage, il faut donc réfléchir à la nature d’une communication, et sur ce que peut être une communication réussie. Le langage n’est donc pas quelque chose qui se trouve à l’intérieur de chaque individu, mais une création collective qui s’opère lors de la communication.
Restait à le démontrer. C’est à cela que s’activent les “linguistes artificiels”.
Pour ce faire, ils vont élaborer des “jeux de langage”. Ces derniers sont très simples : deux robots, munis de capteurs et de caméras se trouvent dans le même environnement. L’un des deux montre un objet et le désigne en créant un mot de son cru. Le second peut alors le comprendre et utiliser le mot à son tour. Petit à petit, les deux machines s’entendront sur les termes à employer pour décrire leur environnement et les intégreront à leur vocabulaire commun. Évidemment, les choses se compliquent assez vite : va pour de simples mots, mais qu’en est-il des catégories ? Si le robot 1 dit “flub” en montrant une balle rouge, désigne-t-il l’objet “balle” ou la couleur rouge ? Après le vocabulaire, c’est la grammaire qu’il faut constituer. C’est à nombre de ces problèmes qu’a été consacré l’atelier d’Ecal du 8 août dernier : comment créer, par des jeux de langages, les différentes manières d’exprimer le temps, par exemple ? Ou comment des systèmes nerveux qui perçoivent différemment les choses, par exemple les couleurs, peuvent-ils s’entendre sur le mot “jaune”. Comment les mots peuvent-ils s’accorder entre eux ?
Pourquoi les expériences de jeux de langages du CSL font-elles partie du domaine de la “vie artificielle” et non du paysage de “l’intelligence artificielle” ? Une des raisons théoriques évidentes en est que le langage y est vu comme un système vivant, une création collective et décentralisée dans la grande lignée des systèmes émergents explorés par les tenants de la vie artificielle. L’autre raison est plus sociologique, comme l’a rappelé Steels lors de son introduction à l’atelier sur le langage : la communauté de la vie artificielle était simplement plus ouverte à ces idées nouvelles. On retrouve une caractéristique importante de la vie artificielle en tant que communauté : celle de constituer un pont entre diverses disciplines souvent trop fermées sur leurs méthodes et leur domaine d’étude.
Vidéo : Extrait vidéo de la conférence inaugurale de Luc Steels à l’exposition Cultures del Canvi, à Santa Monica, le 10 décembre 2009, sur le thème de la création de leur propre langage par les robots.
L’évolution du langage n’est pas la seule incursion de la vie artificielle dans l’univers de la culture. Nombreuses sont les expériences qui se sont succédé dans le domaine des “sociétés artificielles” ou dans celui de l’intelligence collective.
Au colloque Ecal, Ziad Kobti a ainsi présenté un système multi-agents permettant de modéliser la division du travail au sein d’un groupe. Différents agents logiciels aux compétences diverses entrent en compétition/coopération dans un environnement au sein duquel ils effectuent différents travaux. Selon leurs niveaux de capacités, ils se spécialiseront peu à peu dans une tâche donnée, quoique (c’est encore une de ces découvertes contre-intuitives propres aux systèmes multi-agents), pas forcément dans la tâche où ils sont le meilleur.
La grande question avec ces sociétés artificielles est celle de la “vie artificielle” : de même qu’il est finalement difficile de déduire d’une boucle de Langton ou d’un jeu de la vie des phénomènes propres à des systèmes biologiques précis, quelles conclusions peut-on tirer de ces systèmes formels quant à la vie de sociétés réelles ?
Il faut alors que les auteurs de ces modèles se confrontent aux “big data’” issues des données réelles. Kobti est ainsi partie prenante du “Village Ecodynamics Project”. Ce projet “d’archéologie computationnelle” cherche à comprendre le déclin brutal de la population indienne du Mesa Verde aux alentours de 1200. Les raisons de cette dépopulation restent en effet assez mystérieuses. Apparemment, les autochtones possédaient assez de maïs pour subsister, ce qui évacue les explications simplistes de type famine.
On pourrait penser qu’il s’agit d’une application marginale, mais ce genre de chose est typique de l’histoire des civilisations : la mystérieuse disparition de la première civilisation Maya en est un cas d’école, ainsi que le brusque effondrement de l’Ancien Empire égyptien. En biologie on trouve aussi des extinctions de masse. Cette sorte d’évènement critique est une des caractéristiques des “systèmes émergents” étudiés par les chercheurs en vie artificielle. L’exemple classique en est ce tas de sable où l’on rajoute délicatement un grain après l’autre; jusqu’au moment où, pouf, tout s’écroule !
Les chercheurs du Village Ecodynamics Project ont créé une application (aller vers le milieu de la page pour trouver l’adresse de téléchargement) pour permettre à tout un chacun de jouer avec les paramètres de cette société indienne virtuelle. Mais il s’agit d’un programme un peu ancien qui n’intègre pas les modèles présentés au colloque de Paris.
L’abstract d’un article sur le sujet, – malheureusement indisponible aux non-abonnés – mentionne également que “Les archéologues affirment que les mondes virtuels constituent le meilleur moyen de tester des hypothèses complexes. Le domaine est également poussé par l’industrie des loisirs, car la technologie employée est la même que celle utilisée dans les jeux vidéos et les effets spéciaux, et de nombreuses universités ont récemment adopté des programmes de modélisation 3D”.
La vie artificielle aurait donc un impact sur les technologies actuelles ? Jusqu’ici, les travaux dont nous avons parlé appartenaient à la recherche fondamentale, ou concernaient des technologies dont la maturation apparaît comme encore lointaine. Mais peut-être qu’elle pourrait servir aujourd’hui… Reste à voir à quoi !
biotechnologies, humanités numériques, langage, NBIC, vie artificielle
La lecture de la semaine, il s’agit d’un prolongement de notre discussion avec Paul Jorion il y a quinze jours, discussion autour du rôle des ordinateurs dans la crise financière. Et voici que le quotidien anglais The Guardian mettait en ligne, sur le blog de l’anthropologue et journaliste Joris Luyendijk qui s’intéresse aux milieux financiers, le témoignage d’un informaticien qui travaille dans la finance à Londres.
“Je suis ingénieur avec une formation solide en mathématiques. J’ai coécrit le programme de notre système de high frequency trading [le high frequency trading est un mode d'achat et de vente d'actions ultrarapide, effectué donc par des ordinateurs, il représente aux alentours de 60% du volume des transactions sur les marchés américains et aux alentours de 40% sur les marchés européens, NDT], on l’appelle le “moteur”. J’arrive au bureau vers 7h, avant l’ouverture des marchés. Mon équipe et moi devons vérifier, et revérifier, tous nos systèmes avant que ne commencent les transactions. Vu leur nombre chaque jour, il est important de s’assurer que tout est en ordre avant et après les prises de position. Pendant la journée, notre équipe surveille le “moteur” pendant les achats et les ventes, des milliers des fois. Notre déjeuner dure 10 mn, le temps qu’il faut pour traverser la rue, grignoter un sandwich et rentrer.

Image : Le Royal Stock Exchange de Londres par Aurélien Guichard.
Il faut voir les mouvements du marché comme des vagues. Notre société est comme un surfeur qui essaie de prendre une vague, de la chevaucher un court moment, et de la quitter avant qu’elle ne casse. Chaque jour, nos ordinateurs achètent et vendent des actions des dizaines de milliers de fois, les détenant pendant un temps très court, parfois moins d’une minute. Aucun être humain, ou aucun groupe d’êtres humains ne pourraient assurer le volume de transactions qu’assurent les ordinateurs dans le même laps de temps, et dans le monde entier. Ces choses-là n’ont jamais été faites par des humains, et sont aujourd’hui effectuées par des ordinateurs. Tout cela est nouveau.
Nous passons notre temps à chercher des bugs, des perturbations ou les signes d’une activité incorrecte. Si le “moteur”» dysfonctionne ne serait-ce qu’une seconde, le nombre de transactions effectué pendant ce temps est si énorme qu’il est essentiel de le surveiller d’aussi près que possible. La marque d’un bon programme n’est pas seulement son fonctionnement pendant des opérations normales, mais sa manière de réagir à des événements inattendus. Il est important de s’assurer qu’il y a plusieurs niveaux de sécurité prévus à l’intérieur du programme lui-même.
La journée devient un peu plus tendue vers 16h30, à l’heure où le marché ferme. Une fois que le marché est clos, aucune erreur ne peut être corrigée avant le prochain jour d’ouverture, ça peut vite coûter très cher.
Les coups de stress ont lieu quand la machine fait quelque chose d’inhabituel et que vous n’arrivez pas à savoir si c’est un bug interne ou quelque chose qui se passe sur les marchés. Pour des programmeurs comme moi, l’humilité est essentielle. Vous devez toujours assumer vos erreurs. Si vous êtes arrogant que vous avez tendance à blâmer un bug du monde extérieur, il est probable que vous passerez à côté d’un bug à l’intérieur de votre système.
Qu’est-ce que la réussite dans le business du high-frequency trading ? D’une certaine manière, c’est de la force brute. Plus vite va votre ordinateur, plus vite votre programme peut agir. On parle là de millisecondes, donc même la vitesse de la lumière a du sens. Un autre paramètre est la qualité du programme lui-même. Une partie de mon travail consiste à essayer de l’améliorer constamment, faire en sorte qu’il soit plus rapide, plus efficace.
Les améliorations dans la logique du programme donnent les meilleurs résultats. Même si vous utilisez un ordinateur plus gros et que vous doublez la vitesse d’exécution du code, le programme ne sera jamais aussi rapide que si vous n’aviez pas à exécuter cette ligne de code.
Il y a ensuite le programme lui-même, la black box qui décide ce qu’il faut acheter ou vendre et quand il faut l’acheter ou le vendre. La notion clé, ce sont les corrélations. On prend toutes les données concernant un ensemble d’actions du marché londonien, les actions que nous avons décidé d’échanger. Cet ensemble de données pèse à peu près 3 Giga, et il consiste en chaque mouvement de l’action pendant cette journée. On appelle ces mouvements des “tiques”. On analyse les modèles de ces tiques pour notre ensemble d’actions et on cherche les corrélations. Par exemple, quand Vodaphone monte, Deutsche Telecom monte probablement aussi, parce qu’ils sont dans le même secteur. Ça, c’est une corrélation simple. Notre modèle contient des centaines de variables, et chaque jour, on cherche de nouveaux modèles.
C’est une tâche extrêmement compliquée, et qui n’a rien à voir avec l’analyse de la valeur ou de la solidité d’une entreprise en particulier. Notre travail consiste à projeter dans le futur des modèles d’échange passés.
Il y a aussi des choses bizarres. L’une est ce qu’on appelle le black swan, le “cygne noir”, c’est un événement jamais vu, un fait sans précédent, et qui, du fait qu’il échappe aux modèles passés, ne peut pas avoir été pris en compte par notre programme.
L’autre chose bizarre, c’est qu’il y a aujourd’hui plus de sociétés comme la nôtre et donc, quand on analyse les mouvements d’un marché, on doit tenir compte des activités de ces sociétés et les inclure dans notre modèle. Mais pendant ce temps, ces sociétés font la même chose et on entre dans une configuration où ils savent que nous savons qu’ils savent.
Je me considère simplement comme très chanceux de vivre à notre époque. Qu’est-ce que j’aurais fait il y a 100 ans avec mes compétences en math ? Ou dans 100 ans ? C’est pile le bon moment de l’Histoire pour être fort en math. Et le je le suis.”
Xavier de la Porte
Xavier de la Porte, producteur de l’émission Place de la Toile sur France Culture, réalise chaque semaine une intéressante lecture d’un article de l’actualité dans le cadre de son émission.
L’émission du 24 septembre 2011 était consacrée aux 10 ans du Cube d’Issy-les-Moulineaux, ce lieu d’exposition tout entier consacré aux Arts numériques, en compagnie de Nils Aziosmanoff, son président, et Stéphanie Fraysse-Ripert, sa directrice, accompagnés par l’un des nombreux artistes passés par ce lieu, Hugo Verlinde.
immatériel, intelligence des données, monnaie, pdlt, programmation, Web²
Sur le blog de Tom Roud, discussion concernant les mérites du nouveau moteur de recherche Wolfram|Alpha, qui s’inscrit à la suite du logiciel Mathematica et tient sans doute plus de l’intelligence artificielle…
Après une première expérience de scénographie participative lors d’une exposition sur les nanotechnologies, le Centre de culture scientifique de Grenoble démarre un nouveau projet sur les technologies ubiquitaires nommé FUTU (”Fabriquons les Usages des Technologies Ubiquitaires”). Cette fois, les ateliers participatifs et le débat public seront des préalables à l’exposition organisée d’ici 2011.
Dans un article académique qui vient juste d’être publié, Renato P. dos Santos de l’Université Luthérienne du Brésil avance que les lois de la physique dans l’univers de Second Life ne sont pas exactement les nôtres, pour que leur rendu soit plus “réaliste”. Loin d’être un frein à l’utilisation pédagogique de Second Life, c’est une opportunité excellente pour l’enseignement des sciences et de la physique en particulier.
Bestiario.org est une petite, jeune et très dynamique entreprise créant des “espaces digitaux pour la création collective de connaissance”. Autour du slogan “rendre le complexe compréhensible”, ils combinent art et science pour créer des sites interactifs en Flash utilisant la théorie des graphes, la topologie, la simulation physique et la visualisation géométrique et géographique.
reCAPTCHA est la mise en pratique d’une idée fascinante, qu’ils appellent “human computation” (pouvoir de calcul humain ?). C’est une petite rupture dans notre vision de l’ordinateur : au lieu d’essayer d’améliorer les machines pour en faire des équivalents humains, tâche peut être simplement impossible à long terme, on utilise la puissance d’internet pour mettre en réseau des hommes afin de résoudre les problèmes complexes insolubles par la puissance de calcul brute des ordinateurs.

Tout d’abord pour ceux qui ne le savent pas l'AFNIC est l'office français d'enregistrement des noms de domaine .fr et .re (domaines de la France et de l'Île de la Réunion).
L'AFNIC se positionne également comme fournisseurs de solutions techniques et de services de registre mais cette association est à but non lucratif.
Le FR :
Venons-en au sujet principal, né le 2 septembre 1986 le .fr vient de souffler ses 25 bougies, des années au cours desquelles des professionnels du web ont travaillé assidument pour le développement du .fr, ce travail en amont a permis à l’AFNIC de devenir un acteur incontournable sur l’internet français.
Afin de célébrer cette date une soirée sera organisé au premier étage de la tour Eiffel, un concours est organisé par l’AFNIC :
Cible : Particulièrement les entrepreneurs, designers et développeurs de sites internet français étant attirés par un projet en relation avec le web.
Etapes :
1) (Du 01 au 30 septembre) Inscrire votre projet sur la plateforme dans l’une des trois catégories suivantes :
a) Design et créativité
b) Interaction et navigation
c) Contenu et éditorialité
d) Technologie et innovation
2) (Du 01 au 30 septembre) Partager votre candidature avec vos réseaux et connaissances afin qu’ils vous aident à augmenter vos chances de victoire en votant pour votre projet.
3) (04 octobre) Les 3 projets meilleurs projets de chaque catégorie seront retenus avant une délibération d’un jury d’expert qui désignera les 4 gagnants, il y aura également un prix du coup de cœur dans chaque catégorie.
4) (11 octobre) Remise des prix durant la soirée VIP de la tour Eiffel, soirée qui se veut être chic et avec un esprit french touch. En plus des prix offerts, les vainqueurs auront la chance de se voir offrir un habillage dans la newsletter de Stratégie Reed Business Information pendant une semaine.
Pour avoir de plus amples informations sur ce concours et s’y inscrire rendez-vous sur http://www.thefrenchreconnection.fr/ .
Article rédiger avec l’annonceur

Tags: AFNIC
Continuez votre lecture sur des articles similaires