FAQ Perl

Les variables auxquelles aucune valeur n'a été affectée sont néanmoins initialisées automatiquement par l'interpréteur PERL. La valeur implicite d'initialisation est une valeur spécifique nommée undef. La valeur 'undef' est une valeur un peu magique :

dans des opérations arithmétiques, elle vaut zéro,
dans les opérations de chaînes de caractères, elle équivaut à la chaîne vide, mais attention, toutefois car son usage provoque des affichages de messages d'avertissement si les "warnings" sont actifs (use warnings; ou option -w du shebang),
il ne faut pas la tester de manière classique avec les opérateurs de comparaison (voir plus loin), mais au moyen d'une fonction spécifique : defined () qui retourne vrai si la variable est définie et faux si elle vaut undef,
il est possible de l'affecter soi-même à une variable déjà définie, soit par une affectation $variable=undef; soit par une fonction undef($variable);

Quelles opérations peut-on réaliser sur ces variables ? Les principaux opérateurs arithmétiques sont disponibles. Ainsi, il est possible d'utiliser :

+ pour l'addition ($a = $b + 75;),
- pour la soustraction (l'opérateur - existe aussi en version "unaire", pour signifier un nombre négatif) ($a = -75 -$b;),
* pour la multiplication ($a = $b * $c;),
/ pour la division ($a = 83 / 17;),
% pour le modulo (reste de la division entière) ($b = 83 % 17;),
** pour l'exponentiation (l'élévation à une puissance, comme $a = $b ** 3;)
++ est un opérateur (unaire) de pré- ou post incrémentation de la variable sur laquelle il porte (++$a ou $a++),
-- est un opérateur (unaire) de pré- ou post décrémentation de la variable sur laquelle il porte (--$a ou $a--),

Il existe aussi des opérateurs spécifiques aux traitements sur les chaînes de caractères :

. (le point) est l'opérateur de concaténation de chaînes ($a = "abcd" . "efgh";).
x est l'opérateur de répétition qui répète la chaîne le précédant autant de fois qu'indiqué par le nombre suivant ($a = "*" x 40; pour obtenir quarante étoiles).
=~ est l'opérateur de mise en correspondance avec une expression rationnelle (gros chapitre du langage qui sera abordé ultérieurement).

Certains opérateurs sont qualifiés de "binaires bit à bit" :

~ pour la négation bit à bit ($i = ~ $j;)
<< est un opérateur de décalage bit à bit vers la gauche ($a = $b lt;lt; 3;),
>> est un opérateur de décalage bit à bit vers la droite ($a = $b >> 3;),
& effectue un ET bit à bit entre ses opérandes ($zero = 0x36 & 0xC9;),
| pour un OU bit à bit ($deux_cent_cinquante_cinq = 0x36 | 0xC9;),
^ pour un OU EXCLUSIF entre deux valeurs,

Il existe aussi des opérateurs de test, de comparaison, et ces opérateurs existent sous deux formes, selon que l'on souhaite comparer des nombres entiers ou bien des chaînes de caractères :

== ou eq pour tester l'égalité numérique ou alphabétique,
< ou lt pour l'infériorité stricte,
<= ou le pour l'infériorité,
> ou gt pour la supériorité stricte,
=> ou gt pour la supériorité,
!= ou ne pour la différence.
<=> ou cmp sont des opérateurs spéciaux de comparaison, qui retournent -1, 0 et 1 selon lequel de leurs opérandes est le plus grand,

Et enfin, des opérateurs logiques complètent la panoplie :

&& ou and permettent de réaliser la conjonction entre deux conditions (le ET logique),
|| ou or permettent de réaliser la disjonction entre deux conditions (le OU logique),
xor permet de réaliser une disjonction exclusive (le XOR logique),
! ou not permettent de réaliser la négation d'une condition.

La différence entre les opérateurs logiques similaires vient, entre autres, des différences de priorité. Ils ne sont cependant pas toujours utilisés dans le même contexte. Notamment, l'usage des opérateurs logique dans le style C (&&, ||) avec des listes (sujet abordés plus loin) risque de poser problème. Dans ce cas, l'usage des opérateurs en toutes lettres est plus sûr. Il existe encore d'autres opérateurs, dont les plus utiles sont :

?: qui permet de réaliser un choix entre deux valeurs, selon le test d'une condition ($i = ($a == $b)?$a:$b; $i vaudra $a si $a et $b ont la même valeur, $b s'ils sont différents).
, qui procède à l'évaluation de son membre de droite, puis à celle du membre de gauche, avant de garder le résultat de la dernière évaluation (ça parait compliqué et inutile, comme ça, mais quand on maîtrise bien, ça peut réellement être très puissant) ($i = ($j=100),($k=50); fait que $i et $j valent 100, $k vaut 50).

Et il existe aussi des formes abrégées des principaux opérateurs réfléchis (même variable présente des deux côtés de l'affectation). Ces opérateurs posent les mêmes difficultés de maintenance ou de compréhension du code qu'en C. On trouve : +=, -=, *=, /=, .=, <<=, etc.

$racine="programm"; $_1e_pers_sing="Je ${racine}e"; $_2e_pers_sing="Tu ${racine}es"; $_3e_pers_sing="Il ${racine}e"; $_1e_pers_plur="Nous ${racine}ons"; $_2e_pers_plur="Vous ${racine}ez"; $_3e_pers_plur="Ils ${racine}ent";