dimanche 15 février 2015

Nouveau Livre Blanc signé Afnor nomalisation sur les données massives / big data

Le Comité d'orientation stratégique (COS) information et communication d'Afnor, organe de gouvernance de la normalisation du domaine de l'information (les TC46 et  CN46 bien connus de mes chers lecteurs !) a commandité un rapport sur l'état de l'art et les recommandations pour la normalisation du sujet (pas facile !) Big Data ou données massives ou encore nommé Megadonnées !

La définition extraite de la documentation de l'IUT-T précise que les Big Datas se caractérisent par :

  1. [bien évidemment] les volumes pour lesquels on parle de Tera voire de Peta octets,
  2. la rapidité à laquelle sont produites les données (génération, transmission, stockage, effacement quand applicable)
  3. la variété des données qui sont structurées comme non structurées (texte, données de capteurs, images, son, vidéo, données issues des réseaux sociaux, bases de données, etc.)
  4. et enfin la véracité, dernier point mais non des moindre, puisque des décisions sont prises sur la confiance accordée à ces données.
Deux remarques sont exposées :

  1. d'une part la nécessité d'une gouvernance pour favoriser le suivi et réponse aux simples questions comme "qui est producteur de la donnée ? qui en qualifie la qualité ? quel est le circuit de validation en place ? d'où la recommandation de la nomination d'un chief data officer (CDO)
  2. d'autre part l'intérêt de disposer rapidement de cadres normatifs pour 2 principaux sujets : A/ standardiser le processus de pseudonymisation (réversibilité comprise), B/ normaliser les nouveaux langages d'exploitation et de requête comme les langages NoSQL (alternatives aux standards SQL 
Lecture recommandée dans tous les cas ! de ce remarquable document qui complète les points de réflexion et d'action qui parsème aujourd'hui encore insuffisamment la route de l'exploitation efficace des données massives !