“L’écran qui lit en vous” : devine-t-il ce que j’en pense ?

J’ai découvert ce matin l’actualité “L’écran qui lit en vous” publiée sur le site Inria national. 

Pour ceux qui ne l’ont pas lu (peu nombreux, sans doute…), ce texte parle de Kinect et d’interfaces cerveau-machine.

Je suis assez sidéré par son contenu. Pour moi, il cumule plusieurs défauts importants :

  • Il ne dit rien qui n’ait déjà été dit par la communication de Microsoft, le Figaro (cité dans le texte) ou la myriade de textes en ligne consacrés à Kinect.
  • Il ne fait aucun lien entre Kinect et les recherches menées par Inria.
  • Surtout, il véhicule des idées générales sur l’Interaction Homme-Machine qui ne correspondent pas (nécessairement) à celles de la communauté. En tout cas, pas aux miennes.

Explications…

“L’écran qui lit en vous”

Un écran est un périphérique de sortie. Il ne fait pas grand chose d’autre. On pourrait éventuellement dire que la machine lit en nous grâce à des périphériques d’entrée. Mais même dit comme ça, ce serait sans doute exagéré (voir plus bas).

“Les ordinateurs sont très obéissants mais ils nous imposent encore un dialogue par souris et claviers interposés.”

Depuis quelques années, un certain nombre d’interfaces tactiles sont apparues…

Surtout, la phrase sous-entend que la souris et le clavier ne sont pas de bons dispositifs pour l’interaction homme-machine. Le fait est qu’ils ne sont pas apparus par hasard (voir ici, par exemple) et qu’en 40 ans, on n’a pas trouvé de meilleur compromis puissance/simplicité.

On ne peut pas laisser entendre que le clavier et la souris sont mauvais sans préciser pourquoi ou pour quoi.

“Plus intuitives et innovantes, les consoles de jeux, elles, ont pris de l’avance : elles « comprennent » lorsque l’on fait un simple geste devant une petite caméra. Du coup, on peut jouer au tennis, sans raquette, en agitant les bras face à sa télé.”

Le caractère “intuitif” d’une chose est subjectif, variable dans le temps et non nécessairement lié à l’utilité de la chose. Conduire une voiture, au début, ce n’est pas intuitif. Mais c’extrêmement utile et ça fini par le devenir (intuitif).

Evidemment, n’importe quel dispositif d’entrée qui sort aujourd’hui est innovant par rapport à la souris (années 1960) et le clavier (années 1900).

Les consoles de jeu ne “comprennent” pas ce qu’on fait. Elle réagissent à nos mouvements. C’est très différent. Si elles comprenaient, elles sauraient qu’elles ne doivent pas réagir quand au milieu d’une partie, je sors mon téléphone de ma poche ou je prends un verre sur la table.

” le Kinect de Microsoft, qui permet de jouer ainsi en faisant toutes sortes de mouvements, est l’objet technologique qui aura été adopté le plus rapidement au monde ! En 4 mois, il s’en est vendu plus de 10 millions d’exemplaires dont 400.000 en France”

Ces chiffres datent d’il y près d’un an. Les derniers chiffres qui circulent (ici) sont autour de 18 millions pour le monde.

Ce chiffre paraît important mais il faut le relativiser en tenant compte de la taille du marché du jeu vidéo (ici ou ) et de la position de Microsoft. 

Trente et un jeux Nintendo et cinq de la série “Call of duty” (Activision) auraient dépassé les 10 millions de copies vendues. Le dernier “Call of duty” (Modern Warfare 3) aurait été vendu à 6,5 millions d’exemplaires le jour de sa sortie. Il aurait généré 1 milliard de $ de revenus en 16 jours. Microsoft n’aurait produit que deux jeux dépassant les 10 millions d’unités (Kinect Adventures et Hallo 3).

“les PC vont bientôt pouvoir en tirer parti”

Les PCs pouvaient en tirer parti depuis le début. Simplement, Microsoft ne voulait pas que son utilisation se développe hors de la plate-forme Xbox. Ils assuraient donc un support minimum et interdisaient les usages commerciaux hors Xbox.

Ce qui change à partir du 1er février 2012, c’est que Microsoft a maintenant un “business model” pour la plate-forme PC et plus seulement pour la plate-forme Xbox. Dire “les PC vont bientôt pouvoir en tirer parti”, c’est juste reprendre leur rhétorique commerciale. 

“on trouve sur Internet des dizaines d’initiatives du même genre. En France, selon Le Figaro, plusieurs tests sont en cours, dont un avec la SNCF pour des services aux voyageurs.”

C’est assez navrant de voir qu’on en est à lire le Figaro pour savoir de quoi il faut parler sur les pages web d’Inria.

On trouve plus de 1600 mentions de “Kinect” sur inria.fr. En cherchant un peu, on peut sans doute trouver des choses réalisées par des équipes Inria qui mériteraient d’être montrées (ici, par exemple).

“La communication avec les machines va enfin devenir naturelle… Mieux : de nouvelles évolutions sont à l’étude et l’on parle déjà d’une reconnaissance des émotions sur le visage de l’utilisateur ou d’interaction avec des hologrammes.”

Parler de communication plutôt que d’interaction sous-entend là encore un certain rapport à la machine (plutôt vue comme un partenaire qu’un outil). Communiquez vous avec votre four micro-ondes ? Où l’utilisez-vous ? Le vocabulaire utilisé n’est pas neutre.

Le terme “naturel” ne veut pas dire grand chose. Ecouter ou lire Bill Buxton (ici ou ) ou Don Norman à ce sujet, par exemple (ici), ou ce que j’ai moi-même écrit ici ou .

La fin de la phrase est de la science fiction. Pour une idée de ce qu’on sait faire en termes d’hologrammes, voir ici par exemple. On est loin du holodeck de Star Trek.

“Commander par la pensée… ça marche déjà !”

Tout ce qui est dit dans cet encart est à relativiser.

Pour détecter que je cesse de taper des pieds, il y a des moyens beaucoup plus simples que le port d’un casque bardé d’électrodes (e.g. micro ou caméra, au choix).

Je sais peu de choses sur les recherches dans le domaine des interfaces cerveau-machine, mais il me semble qu’on ne sait détecter de manière fiable que peu de signaux et ce dans des conditions très contrôlées. On sait quelle lettre d’un clavier vous voulez taper… si on sait que vous êtes en train de vouloir taper sur un clavier et que vous ne faites rien d’autre en même temps. Il me semble qu’on est très loin de pouvoir utiliser ces techniques au quotidien en remplacement des souris/claviers. Rien ne dit que ce sera un jour possible. Des chercheurs ont d’ailleurs mis en garde contre des promesses exagérées dans ce domaine (ici).

Bon, cette actualité aura au moins eu le mérite de me décider à ressusciter ce tumblr…

Pour finir, une citation de Steve Hodges :

The keyboard and mouse are going to become obsolete just like the pencil did

Femmes et mathématiciennes

Devinette. Qui a dit :

Je déplore que les femmes ne soient pas plus représentées en mathématiques car cela diminue forcément le spectre imaginatif de la communauté

Réponse : Jean-Michel Ghidaglia, directeur scientifique de La Recherche, dans le numéro de janvier 2010. La phrase termine sa réponse à une lectrice qui trouvait le numéro “Le pouvoir des Mathématiques” trop masculin. Juste avant, il dit :

Pour ce numéro, nous avons pris contact avec plusieurs jeunes collègues mathématiciennes brillantes, mais elles n’étaient pas disponibles. Leur faible nombre fait qu’elle sont très sollicitées.

Est-ce qu’il n’y a que moi que ça choque ?

About natural user interfaces, again

This page on oblong’s website explains how they shot the famous gesture interactions seen in Minority Report:

You adapt the gestural language from the Luminous Room work. You train the actors to use this language. They become adept, even though it is partly an exercise in mime. The production will shoot the actors performing gestural tasks in front of an enormous transparent screen, but the screen will be blank, a prop. Graphics will be composited onto the screen in post-production. You understand that for a sense of causality to emerge the actors must be able to clearly visualize the effects of their gestural work. You assemble a training video showing this.

So much for “natural interaction”… (check this other post as well)

Update (#1): Aurélien Tabard pointed me at this quote from Douglas Engelbart in Thierry Bardini’s Bootstrapping:

When interactive computing in the early 1970s was starting to get popular, and they [researchers from the AI community] start writing proposals to NSF and to DARPA, they said well, what we assume is that the computer ought to adapt to the human […]  and not require the human to change or learn anything. And that was just so just soantithetical to me. It’s sort of like making everything to look like a clay tablet so you don’t have to learn to use paper.

Update (#2): Thomas Baudel suggested this quote from Douglas Adams’s Hitch Hiker’s Guide to the Galaxy:

The machine was rather difficult to operate. For years, radios had been operated by means of pressing buttons and turning dials; then, as the technology became more sophisticated, the controls were made touch sensitive … now all you had to do was wave your hand in the general direction of the components and hope. It saved a lot of muscular expenditure of course, but meant you had to stay infuriatingly still if you wanted to keep listening to the same programme.

This quote was actually in “CHARADE: Remote Control of Objects using Free-Hand Gestures”, a 1993 CACM paper written by Thomas and Michel Beaudouin-Lafon. The legend says that this work also served as inspiration for the Luminous Room…

“Vive aussi l’IHM”, dédicace de Gérard Berry sur l’exemplaire de “Penser, modéliser et maîtriser le calcul informatique” qu’il ma donné ce soir

Vive aussi l’IHM”, dédicace de Gérard Berry sur l’exemplaire de “Penser, modéliser et maîtriser le calcul informatique” qu’il ma donné ce soir

About ‘Intuitive’ and ‘natural’ user interfaces

I’ve recently tried to explain to several people why I think we shouldn’t talk about “natural user interfaces”. Doing so, I mentioned Jef Raskin’s book “The humane interface: new directions for designing interactive systems”. Here’s what Raskin said about the words intuitive and natural (page 150):

Many interface requirements specify that the resulting product be intuitive, or natural. However, there is no human faculty of intuition, as the word is ordinarily meant; that is, knowledge acquired without prior exposure to the concept, without having to go through a learning process, and without having to use rational thought. When an expert uses what we commonly call his intuition to make a judgement, with a speed and accuracy that most people would find beyond them, we find that he has based his judgement on his experience and knowledge. Often, experts have learned to use methods and techniques that nonexperts do not know. Task experts often use cues of which others are not aware or that they do not understand. Expertise, unlike intuition, is real.

When users say that an interface is intuitive, they mean that it operates just like some other software or method with which they are familiar. Sometimes, the word is used to mean habitual, as in “The editing tools become increasingly intuitive over time.” Or, it can mean already learned, as was said of a new aircraft navigation device: “Like anything, it can be learned, but it would take a lot of experience to do it intuitively” (Collins 1994).

Another word that I try to avoid in discussing interfaces is natural. Like intuitive, it is usually not defined. An interface feature is natural, in common parlance, if it operates in such a way that a human needs no instruction. This typically means that there is some common human activity that is similar to the way the feature works. However, it is difficult to pin down what is meant by similar. Similarities or analogies can occur in many ways. Certainly, that the cursor moves left when a mouse is pushed to the left and right when the mouse is pushed to the right is natural. Here, the term natural equates to very easily learned. Although it may be impossible to quantify naturalness, it is not too difficult to quantify the learning time.

Update : check this other post as well