Évaluation et notation : des critères ou des principes ?

Pierre Windecker, Lycée Édouard-Branly, Nogent-sur-Seine

 

Je pars d’une généralité : évaluer une copie, et même la noter, ce n’est pas un acte qui résulte d’un jugement déterminant, mais d’un jugement réfléchissant. Ce qui veut dire que l’universel, ici, reste immanent au singulier, ou que le juge (le correcteur) n’en finit jamais de subsumer le législateur. Rien de plus clair pour le montrer que ce qui se passe dans les commissions de bac : des principes d’évaluation sont toujours supposés (on ne note pas au hasard ou selon l’humeur); ils sont constamment invoqués et donc exposés au cours des échanges ; pourtant, il serait absurde de vouloir les transformer en une liste de règles qu’on pourrait imposer comme une grille de correction.

On voit là tout de suite le danger qu’il y a à assimiler les principes de la correction à des « critères », du moins si l’on entend par critères un trousseau de règles graduées qu’il faudrait appliquer aux copies d’élèves. En ce sens, ce serait plutôt principes versus critères. Quand on parle de critères, on oublie que la correction d’une copie fait jouer entre elles trois singularités : 1) le sujet : l’importance des « critères » peut varier selon le sujet ; 2) la copie elle-même : la signification et l’importance relative des « critères » dépendent de son orientation, de son style et de son contenu philosophiques ; 3) le correcteur enfin : certes, tous les correcteurs ensemble devraient pouvoir se comporter comme un correcteur unique, mais ce « sens commun » postulé repose sur les principes d’un jugement qui reste personnel, non sur des règles qui permettraient de programmer une machine à corriger.

C’est une expérience qu’on fait tout le temps dans les commissions : les convergences heureusement de plus en plus fortes dans la notation ne sont pas explicables par la référence à des critères, et les divergences qui peuvent subsister ne sont solubles dans des critères. La définition nominale de ceux-ci est partagée par tous les collègues, sans exception. C’est seulement, si l’on peut dire, leur définition réelle, c’est-à-dire leur interprétation dans l’application qui permet de comprendre quand on s’accorde ou quand on ne s’accorde pas.

C’est pourquoi chercher à expliciter davantage les critères de l’évaluation dans l’espoir de progresser encore dans la convergence des notes n’est pas seulement insuffisant. Cela a toujours un effet trompeur, puisque l’enjeu d’une évaluation juste ne se situe précisément pas là. La seule question qui compte vraiment est de savoir s’il est possible de dégager un (ou des) principe(s) capable(s) d’orienter l’application de ces critères[1].

Je voudrais, pour ouvrir la discussion, vous en proposer trois, dans un ordre nécessaire.

 

1) Le premier principe, subjectif, est celui de l’appel à un sens commun, ou de la collégialité de l’évaluation et de la notation.

Les commissions de bac ne sont pas seulement pour nous une épreuve de vérité pratique (où nous essayons de satisfaire à l’équité républicaine), mais aussi théorique (où se décide la compréhension philosophique que nous devons avoir des principes de l’évaluation et de la notation).

Pourquoi ? Parce nous ne pouvons plus, dans le contexte des commissions, conserver l’illusion que le rapport à l’objet, aux copies, serait immédiat. L’échange entre collègues confère à l’existence d’une subjectivité qui juge bien plus qu’une visibilité : une réalité, une actualité. Ces réunions obligent à se considérer soi-même et à considérer les autres, dans la reconnaissance de la singularité de chacun, comme membres de plein droit d’un collège des professeurs de philosophie. Cette identification collégiale est donc le premier principe de toute évaluation possible des travaux des élèves.

On peut s’amuser (on ne peut plus sérieusement, bien sûr) à donner de ce principe une formulation d’allure kantienne : tous les jugements d’évaluation et tous les actes de notation dont la maxime est incompatible avec le principe de la collégialité sont injustes. C’est un principe purement subjectif. Non seulement au moment de l’examen, mais en réalité toute l’année, nous nous plaçons, chaque fois que nous corrigeons les copies de nos élèves, sous cette postulation d’un sens commun des professeurs de philosophie. Nos exigences les plus légitimes ne pourraient jamais, sinon, se distinguer en droit d’humeurs personnelles. Souvent, sans doute, elles ne le pourraient pas davantage en fait, car l’expérience semble prouver que les plus gros obstacles à la justesse de notre évaluation et de notre notation ne viennent pas du tout de la diversité des voies que peut prendre notre raison, mais du fait que, sans que nous nous en rendions compte, nos âmes en tirent parti pour alimenter leurs passions.

 

2) Deuxième principe, objectif : les « critères » invoqués dans l’évaluation ne sont pas des règles; ils sont eux-mêmes des principes, de simples principes régulateurs. Cela veut dire que leur interprétation demeure indéfinie et doit pouvoir aller jusque dans le sens d’une contrariété apparente.

1) Les critères d’évaluation sont seulement régulateurs. Tant qu’on ne considère qu’eux, leur sens est clair. Mais ce sens est mis en jeu dans leur application, et celle-ci demeure indéfinie, non pas au sens où elle serait arbitraire, mais en ce sens précis qu’il n’y a jamais de critère objectif pour savoir comment appliquer les critères, mais seulement la possibilité subjective d’en appeler aux conditions d’un sens commun. On ne doit donc jamais considérer leur dénombrement comme entier, ni leur définition comme arrêtée. Ils sont comme la règle en plomb de Lesbos évoquée par Aristote, qui épouse les contours du bâtiment.

Cette indéfinition n’est pas un simple affaiblissement des exigences relatives à la certitude et à l’exactitude. L’attente de garanties plus grandes serait inappropriée ici à l’objet lui-même, qu’elle conduirait à manquer et à maltraiter (c’est le problème des grilles d’évaluation). Et elle pousserait à désespérer d’une autre sorte de justesse à laquelle il est pourtant tout à fait possible d’atteindre.

2) On affirme toujours, à juste titre, la nécessité d’une « pondération » des critères. Je voudrais ajouter à cela deux thèses.

* La pondération (ou modération) d’un principe dans son application n’est pas seulement réciproque, elle est également réfléchie : elle ne lui vient pas seulement des autres principes, mais de lui-même.

** Réciproque ou réfléchie, la pondération (ou modération) d’un principe comporte toujours la possibilité qu’il faille l’interpréter dans un sens qui lui est apparemment contraire.

 Pensons à d’autres « principes » que ceux de la correction. « Rien de trop », dit-on, mais il faut comprendre aussi par là qu’on ne doit jamais être excessif dans la modération. Le principe de précaution n’aurait aucune portée véritable s’il ne justifiait pas certaines prises de risque, nécessaires pour parer un danger qui pourrait être incomparablement plus grand. Le principe machiavélien de la hâte dans l’action politique serait absurde s’il ne comprenait pas d’avance qu’il y a des cas où l’on doit se précipiter dans la temporisation.

Certes, dans tous ces exemples, une seule des interprétations-applications contraires possibles du principe en indique le sens véritable. Mais là est justement le danger : cette ostension permanente de la direction fondamentale crée une attente, elle suggère un schème d’application unilatéral et rigide qui mène à fausser le sens du principe.

C’est le grand danger que l’on encourt quand on fétichise les « critères » dans l’évaluation des travaux des élèves. On ne se contente généralement pas alors de privilégier indûment un critère par rapport à d’autres. On s’arrête, en outre, à l’interprétation de ce critère la plus bêtement rectiligne, la plus alignée dans le sens du sens.

Pourtant, il peut arriver que la prise en charge du sujet soit plus radicale alors qu’elle paraît moins précise. Que la progression soit plus méthodique, alors que la rigueur même du cheminement conduit à quelques zigzags imprévus. Qu’une réelle culture philosophique soit présente, alors qu’elle garde un tour doxographique. Que le travail d’élaboration et de distinction des questions ou des concepts soit plus juste alors qu’il est moins explicite.

À vrai dire, il pourrait bien n’y avoir entre les deux présentations (réflexive ou réciproque) de la pondération des principes, et notamment de leur interprétation « contrariante », qu’une distinction de raison. Mais envisager la pondération réflexive permet de comprendre qu’un principe ne « perd » jamais rien à être limité et contrarié : il se sauve au contraire en faisant la preuve de la capacité réflexive qui lui permet de s’approprier entièrement les restrictions et oppositions qui semblent d’abord lui venir du dehors.

 On en conclut que tout critère d’évaluation, pourvu qu’il soit philosophiquement sensé, doit être tenu pour valable, mais à la condition absolue que se réfléchissent en lui les limitations les plus « contrariantes » qu’on pourrait lui opposer, qu’elles lui viennent d’une interprétation de lui-même ou de la prise en compte d’un autre critère.

 

3) Troisième principe, relatif à la notation

Peu à peu s’est dégagée l’idée que l’échelle de notation devait se caler sur les seuils de l’examen (candidat refusé, convoqué au contrôle, reçu, reçu avec telle mention, etc.). Ce qui donne aux notes la signification suivante :

= ou < 7 : notes réservées aux copies franchement insuffisantes (dont = ou < 5 : notes réservées aux copies qui sont sans aucun rapport avec les normes de l’examen).

8 ou 9 : copies insuffisantes, mais qui justifient un contrôle oral.

10 ou 11 : copies tout juste moyennes.

12 ou 13 : copies qui témoignent de certaines qualités. 14 ou 15 : bonnes copies.

Etc.

Mais quelle doit être la signification philosophique de ces évaluations ?

Là encore, considérer les choses seulement a parte objecti ne permet pas de s’y retrouver. L’objet, ici, apparaît en effet sous une forme double, à la fois comme ce qu’il est et comme ce qu’il doit être. Mais mesurer la copie par rapport à un idéal revient à être attentif à ce qui n’est pas dedans (c’est la définition du mépris selon Spinoza). Et la mesurer par rapport à la moyenne des autres revient à être attentif à ce qu’il y a dans les autres. Tel est le paradoxe : une perspective purement objectiviste sur une copie consiste toujours à ne pas chercher ce qui est dedans.

Là encore, la seule chose qui puisse nous guider, c’est de saisir ce que le jugement cherche à réfléchir de lui-même dans une copie et, réciproquement, ce qu’il cherche à réfléchir en lui-même d’une copie pour l’apprécier. Or ce que nous cherchons dans une copie, c’est toujours la manière dont elle témoigne d’un certain travail, qu’il faut entendre non seulement comme un effort scolaire, mais aussi comme un véritable travail philosophique sur soi-même. Ce que disent les correcteurs dans les réunions est à cet égard éclairant : une formule qui revient très souvent est qu’une copie convenable (donc = ou > 12 d’après l’échelle proposée ci-dessus) est celle que le candidat n’aurait certainement pas pu écrire en début d’année, avant d’avoir « fait de la philosophie ». Toute la notation peut être comprise à partir de là.

 

Discussion à l’issue de la table ronde


[1] Cf. sur ce site de l’APPEP des comptes-rendus de commissions de bac établis par la Régionale de Caen, un article de Francis Aubertin intitulé Correction, évaluation et notation des dissertations, un article de Pierre Windecker intitulé « Le problème de l’évaluation et de la notation des dissertations et des explications de texte philosophiques« .