> Tech > En résumé

En résumé

Tech - Par Renaud ROSSET - Publié le 24 juin 2010
email

Voici les principaux points à considérer en matière d’expressions régulières.

  • Tous les moteurs des expressions régulières ne sont pas égaux. Ces moteurs sont généralement de deux types : NFA (nondeterministic finite automation) ou DFA (deterministic finite automation). Chacun d’eux offre certaines fonctions. Ainsi, les DFA n’offrent pas la capture

de parenthèses comme celles qui servent à isoler le nom local et les noms de domaines dans notre expression régulière de e-mail. Il faut donc consulter la documentation pour savoir quel moteur est utilisé dans votre cas et pour vérifier si les métacaractères fonctionnent comme ils devraient.

  • Surveillez en permanence et notez la performance générale. La plupart des expressions régulières sont efficaces en traitement de texte. Mais, si l’on n’y prend garde, elles peuvent devenir des dévoreuses de mémoire et de CPU. Ainsi, quand une expression régulière doit choisir entre différentes actions, face à des quantificateurs et des alternatives, par exemple, elle peut revenir en arrière et essayer autant de permutations que nécessaire pour obtenir une correspondance. En donnant trop de choix à une expression régulière, on court le risque de ne plus jamais la revoir. En fait, les règles d’or concernant les expressions régulières sont à peu près les mêmes que pour tout autre développement de logiciel : comprendre vos données, écrire votre code avec soin et tester, tester, tester.
  • Suivez de près la performance dans des applications interactives. Lors du premier appel d’une méthode Java dans un job, on subira un certain overhead dû à la mise en place de la JVM (Java Virtual Machine) et à quelques autres tâches d’intendance. Les appels suivants s’effectueront plus rapidement. Si vous créez vous-mêmes REGEX, vous verrez cela en action. La première correspondance peut demander entre 20 et 30 secondes, tandis que les correspondances suivantes aboutiront presque immédiatement. Dans le cas d’une application interactive, cela signifie que chaque utilisateur subit un certain overhead, plus ou moins tolérable selon la tâche en question.
  • Le CCSID (Coded Character Set Identifier) de votre machine peut affecter la manière dont le moteur d’expressions régulières interprète les métacaractères et les littéraux. Un CCSID de valeur 37 semble raisonnable. Même avec ces contraintes, les expressions régulières sont très utiles pour un développeur RPG. De plus, les techniques utilisées pour les amener dans RPG ouvrent de multiples possibilités aux développeurs, outre le strict traitement des expressions régulières.
  • Explorez cela et prenez-y du plaisir.

    Téléchargez cette ressource

    Reporting Microsoft 365 & Exchange

    Reporting Microsoft 365 & Exchange

    Comment bénéficier d’une vision unifiée de vos messageries, protéger vos données sensibles, vous conformer aisément aux contraintes réglementaires et réduire votre empreinte carbone ? Testez la solution de reporting complet de l’utilisation de Microsoft 365 et Exchange en mode Cloud ou on-premise.

    Tech - Par Renaud ROSSET - Publié le 24 juin 2010

    A lire aussi sur le site

    Revue Smart DSI

    La Revue du Décideur IT