Les défis des bases de données d’aujourd’hui

Depuis plusieurs décennies, les bases de données informatiques sont au coeur de l’informatisation des organisations. Difficile de parler informatisation sans prévoir une base de données.

Avec l’évolution de la technologie, plusieurs défis des bases de données se présentent. Commentons quelques-uns d’eux, cités par Jean-Luc Hainaut dans son ouvrage Bases de données, que nous avons consulté avec tout intérêt. Voici donc les principaux défis :

– Multiplicité des types de données : Les données prennent aujourd’hui des formes très variées, souvent bien éloignées des simples formats. C’est par exemple les données multimédias (images, vidéo, musique), géographiques (GPS), historiques, aux données semi-structurées (textes, documents, formulaires).

– L’information incorrecte et incomplète : Nous sommes submergés d’informations, souvent de piètre qualité. Cette observation est également vraie pour les bases de données, dont le contenu comporte souvent de nombreuses données erronées. Comment les exploiter avec rigueur et précision. Comment produire de l’information correcte à partir de données imprécises, voire incorrectes ?

– Les volumes et les performances : Les plus grandes bases de données comportaient en 1969 500.000 enregistrements [Bachman, 1969]. Elles en contiennent aujourd’hui plusieurs centaines de milliards, ont un taux de croissance journalier de plusieurs téraoctets et sont réparties sur des milliers de serveurs. Comment mémoriser, gérer et exploiter ces données, en toute sécurité et en offrant aux utilisateurs des temps de réponse acceptables ?

– Accès aisé par des non-informaticiens : L’explosion des demandes exige que l’utilisateur puisse accéder aux données, sans passer par l’intermédiaire d’ informaticien. Quelles technologies, quelles interfaces et quelles compétences vont amener ces utilisateurs à l’autonomie nécessaire ?

– Maintenance et évolution : Comme tous les composants des systèmes d’information, les bases de données évoluent, au gré de l’évolution des besoins des utilisateurs. Ce processus est complexe. En effet, une base de données est utilisée par plusieurs milliers de programmes, de sorte que toute modification de la structure des données exigera la modification de milliers de programmes et d’écrans d’interface avec les utilisateurs.

Le manque de documentation décrivant les formats et la signification des structures de données constitue ici un défi majeur.

– Les données distribuées et nomades : Le modèle d’une base de données sous la forme d’un système unique localisé sur une machine n’est plus approprié aux exigences actuelles.  Les données sont aujourd’hui distribuées sur plusieurs machines communicantes, qui vont des gros serveurs aux smartphones et tablettes. Les techniques de gestion et d’exploitation centralisées ne sont plus suffisantes, d’autant que certaines parties de la base de données sont nomades, intermittentes, dupliquées et partiellement autonomes.

– Les bases de données et le web : Le web constitue une extraordinaire base de données. On est loin cependant des concepts classiques des bases de données qui nous sont familiers : mode de stockage, formats de données, SGBD, délocalisation anonyme du stockage et des traitements (cloud computing), langages de consultation et de gestion, intégrité, sécurité, résistance aux pannes, tout est fondamentalement différent. Comment unifier web et bases de données ? Comment interfacer le web avec les bases de données ? 

– Les données décisionnelles : Aux bases de données traditionnelles, s’ajoutent les bases de données d’aide à la décision, spécialement conçues pour l’analyse de données, généralement de très grande taille (BigData). Ces données font l’objet de traitements statistiques particulièrement lourds.

– Les O/RM : L’émergence des outils de développement de programmes dits Object/ Relational Mapping (tels EJB et Hibernate) incitent naturellement à modéliser les besoins des utilisateurs sous la forme de classes d’objets. De celles-ci, les outils sont capables de dériver de manière automatique les structures d’une base de données permettant de stocker les données persistantes des objets de ces classes. Cette pratique entraîne souvent de multiples problèmes de qualité et d’évolutivité de la base de données

Retour en haut