Auparavant, les data scientists et autres experts de la donnée développaient et entrainaient des modèles au sein d'une plateforme ou d'un cadre spécifique fourni par une entreprise ou un service. L’arrivée du Bring Your Own Model (BYOM) a renversé ce statu quo en permettant l’importation de modèles pré-entraînés dans un environnement ou une plateforme spécifique en vue de leur déploiement et de leur intégration, un pas de géant pour le Machine Learning et l’Intelligence Artificielle. Toutefois, il n’y a pas que pour les data scientists que cette pratique est avantageuse, les entreprises, elles aussi, ont également beaucoup à gagner.
Les atouts cachés du Bring Your Own Model pour les entreprises
Pierre Maussion, Senior Solution Engineer chez Teradata livre son expertise sur le sujet.
Le savant mélange du BYOM et des bases de données
Les entreprises ayant recours à une base de données fortement parallélisée ont tout intérêt à tirer parti du BYOM. Déjà, parce qu’elles bénéficient de la capacité de calcul de la parallélisation et de la puissance de ces systèmes, pour une exécution encore plus efficace. En outre, en exécutant le modèle sur les données pendant la phase dite de scoring ou encore d’inférence, il n’est pas nécessaire de déplacer les données vers un modèle extérieur. Résultat : l’exécution du modèle se fait alors plus rapidement sans latence, et de manière plus sécurisée, le déplacement de données sensible pouvant notamment augmenter les risques de failles de sécurité.
C’est également un gain précieux en termes de coût pour les entreprises, puisque l’exécution du modèle directement dans la base de données permet de rentabiliser l’infrastructure existante. Celle-ci a d’ailleurs été conçue pour répondre à certaines exigences en matière de traitement de la donnée. Elle est donc suffisamment dimensionnée pour exécuter plusieurs milliers de modèles en parallèle.
Dernier point, mais non des moindres, c’est précisément en tirant parti du BYOM sur une base de données que ces modèles vont pouvoir être mis à l’échelle. Auparavant, les entreprises implémentaient des modèles par segments de clients, sauf que deux clients au sein d’un même segment pouvaient avoir des spécificités différentes. Aujourd’hui, les bases de données sont telles qu’il est possible d’exécuter et de gérer plusieurs modèles en parallèle, soit autant de segments qu’il existe de typologie de clients. L’exécution de ces milliers de modèles en parallèle permet à l’entreprise d’en retirer une très grande valeur.
Une réponse à la crise des talents
Auparavant, la majorité des data scientists en entreprise utilisait SAS. Aujourd’hui, les profils recrutés utilisent davantage Python, pouvant alors nécessiter une mise à niveau en matière de compétences pour les analystes et, pour les entreprises, de nouveau recrutement et une évolution de leur stratégie de data science.
Or, avec le BYOM, que le data scientist ait une préférence pour SAS ou Python, chacun utilise le langage, les librairies et l’interface de leur choix. Aucune adaptation n’est requise pour développer un modèle. Certes, si les cycles de développement diffèrent selon la technologie choisie, dans les deux cas, l’opérationnalisation des modèles sera identique. C’est justement cette uniformisation qui va rendre plus rapide et facile le développement de nouveaux modèles, leur mise en production ainsi que le suivi post-production.
Les entreprises n’ont alors pas à renouveler leurs équipes de data scientists, ce qui peut parfois être fastidieux, et peuvent tirer parti du meilleur des deux technologies, SAS et Python.
Innover en continu
Qui dit BYOM, dit open source. Or, en s’ouvrant sur le monde open source, les entreprises ont à leur disposition une très grande communauté et un large choix de librairie. Avec des millions d’algorithmes disponibles, tous en constante évolution, il n’existe quasiment plus aucune limite en termes de possibilités d’algorithmes, de librairies et de versions. Quelle conséquence pour les organisations ? Elles peuvent être à la pointe de l’innovation à tout moment.
Si les data scientists peuvent avoir l’impression de perdre du temps en mettant à jour en continu leurs algorithmes selon les dernières librairies, ce temps est vite rattrapé lors de la mise en production, qui, elle, est très rapide. En effet, avec le BYOM, il n’est pas nécessaire de tout réécrire au moment de cette mise en production.
C’est également un gain de temps précieux si l’entreprise décide de changer d’outil analytique ou de plateforme de données – les algorithmes ne sont pas propriétaires d’une solution et le passage de l’une à l’autre est très facile, car il n’est pas nécessaire de tout réécrire avec des fonctionnalités équivalentes. Les entreprises sont alors moins dépendantes des solutions technologiques choisies et elles peuvent facilement changer, en remplacer certaines, car, grâce à BYOM, la technologie ne fait qu’exécuter le modèle.
Les bénéfices du BYOM ne sont donc pas réservés uniquement aux data scientists. Sécurité, performance, rapidité, investissements rentabilisés sont parmi les principaux avantages de cette méthode pour les entreprises, qui ont alors la garantie de maximiser les compétences de ses experts de la donnée et d’innover en continu. Des arguments de taille qui peuvent jouer dans un contexte économique incertain, où chaque entreprise est à la recherche de plus de compétitivité.
Téléchargez cette ressource
Sécuriser votre système d’impression
Longtemps sous-estimée, la sécurisation d’un système d’impression d’entreprise doit être pleinement prise en compte afin de limiter le risque de fuite d’informations sensibles. Voici les 3 principales précautions à prendre.
Les articles les plus consultés
- Databricks lève 1 milliard de dollars !
- L’utilisation des données pour survivre !
- Stockage autonome, Evolutivité & Gestion intelligente, Pure Storage offre de nouvelles perspectives aux entreprises
- ActiveViam fait travailler les data scientists et les décideurs métiers ensemble
- La blockchain en pratique