Une étude de Markess International
Les entreprises face à l’explosion des données non structurées
Avec l'essor du numérique, l'information est de plus en plus disponible sous forme dématérialisée et non structurée, multi-sources et multi-formats. La multiplicité des sources et des formats corrélée à la croissance accélérée du volume des informations à manipuler exige désormais la mise en place de solutions spécifiques permettant de mieux accéder, rechercher, analyser, sécuriser et diffuser celles-ci afin d'en faciliter et d'en améliorer l'usage, le partage, la restitution et l'exploitation en interne. C'est une des conclusions d'une enquête réalisée par le cabinet Markess International auprès d'un échantillon de 200 entreprises et organisations publiques basées en France.
Selon cette enquête, il apparaît que les informations traitées, utilisées et gérées au quotidien par les collaborateurs :
- Résident le plus souvent dans des bases de données et/ou des applications métier (dont des ERP/PGI) ;
- Sont enregistrées dans un format non structuré. Il s'agit généralement d'informations présentes dans des e-mails, pages web, supports audio ou vidéo... ;
- Sont localisées à l'extérieur de l'organisation Il s'agit de bases de données externes, d'extranets ou de plates-formes tierces en accès sécurisé, de sites web publics et autres sources d'informations publiques accessibles via internet ;
- Se trouvent sur le poste de travail et ne sont pas partagées avec les autres collaborateurs.
Dans ce contexte, les solutions permettant la gestion de l'information d'entreprise (aussi dénommée Outre-Atlantique « EIM » pour « Enterprise Information Management ») présentent de nombreux atouts pour les responsables dans les organisations : gain de temps, gain en efficacité, meilleure gestion de la connaissance et accès facilité aux multiples sources d'informations... Mais la mise en œuvre de ces outils est retardée par différents parmi lesquels : la faible conscience des perspectives offertes, le manque de capacité pour faire vivre les outils, les difficultés à formaliser le besoin, le manque de décisionaire, le prix des solutions ou encore les modifications dans l'organisation engendrée par la mise en œuvre de ces outils.

La gestion de l'information comprend dans son périmètre différents domaines, certains convergeant aujourd'hui entre eux, et qui concernent :
- L'accès à l'information, son agrégation et sa restitution grâce à une ou des solutions de type moteur de recherche d'entreprise (« enterprise search »), de portail et de veille ;
- La gestion de documents et de contenus avec des solutions de type « ECM » (Enterprise Content Management) ou de GED (Gestion Electronique de Document) ;
- Le décisionnel avec des solutions de type « business intelligence », l'analyse et le traitement de l'information avec des solutions de data mining, de text mining, d'analyse statistique, d'extraction et transformation (de type « ETL » pour « Extract-Transform-Load »), de gestion des connaissances (ou de knowledge management - « KM »).
89% des personnes interrogées indiquent avoir déjà mis en place au moins une solution couvrant tout ou partie du périmètre de la gestion d'information d'entreprise, certaines étant plus privilégiées que d'autres selon la typologie de l'organisation (secteur d'activité, taille, dimension internationale, pressions réglementaires, culture, systèmes déjà existants en interne, etc.).
Les solutions d'accès et de recherche d'information de plus en plus plébiscitées
Parmi les différentes solutions rentrant dans le périmètre de la gestion d'information d'entreprise, La cabinet Markess s'est plus particulièrement intéressé aux solutions d'accès et de recherche de type « search » en entreprise (à ne pas confondre avec celles largement diffusées dans le grand public et accessibles via le web).
Dans les organisations interrogées mentionnant déjà recourir ou ayant l'intention de recourir d'ici 2010 à ce type de solution, 3 grandes catégories sont identifiées et peuvent coexister au sein d'une même organisation :
- Solution dite de « desktop search » qui couvre le poste de travail du collaborateur (47%). Il s'agit le plus souvent de solutions gratuites de type Copernic Desktop Search, Exalead one:desktop, Google Desktop, Microsoft Windows Desktop Search... ;
- Solution intégrée dans d'autres solutions ou applications existantes : solutions de GED (44%), applications métier (21%) et applications décisionnelles (16%) ;
- Solution d'accès et de recherche spécifique (22% des cas) qui s'apparente à une plate-forme transverse à une entité métier ou à l'ensemble de l'organisation. Elle couvre aussi bien des informations internes qu'externes à l'organisation quelle que soit leur localisation (poste de travail, bases de données, applications métier, sites web, messagerie...) et permet ainsi un accès unifié à un ensemble d'informations.
La hausse des budgets dédiés à la mise en oeuvre, au déploiement et à l'exploitation de solutions de gestion de l'information démontre l'intérêt réel des organisations interrogées dans ce domaine et des investissements qu'elles sont prêtes à consentir : 51% d'entre elles évoquent en effet des budgets en croissance d'ici 2010.
Vers des solutions transverses
« Dans la majorité des organisations, l'information est encore gérée en silo ou en mode cloisonné, commente Hélène Mouiche, chargé d'études chez Markess. Les organisations recourent le plus souvent à plusieurs solutions ou systèmes différents sans lien entre eux. Or, elles prennent progressivement conscience des enjeux associés à une bonne gestion de l'information dans son ensemble. La demande devrait progressivement basculer vers des solutions transverses à l'ensemble de l'organisation ou à certains métiers, et intégrant des couches de « search » capables de gérer de multiples sources d'information avec un niveau de sécurisation en adéquation avec les pré-requis internes. Ce qui implique inéluctablement la convergence de certaines solutions entre elles ».
Le marché français des logiciels et services liés aux solutions de gestion d'information d'entreprise, qui se compose des 3 grands segments que sont le décisionnel et le traitement de l'information, la gestion de contenu (GED/ECM) et l'accès à l'information avec notamment les moteurs de recherche d'entreprise, est estimé par Markess à 1,9 milliard d'euros en 2008 et devrait atteindre 2,4 milliards d'euros en 2010.

Les commentaires
La définition du périmètre du marché de l'EIM est assez "osée".
Il me semble, en effet, que autant les 3 marchés GED/CM, Search et KM/Veille sont très proches et que les mêmes outils peuvent répondre aux besoins de ces 3 segments, autant les technologies décisionnelles et analytiques sont très différentes et les outils distincts.
Il me semble que dans ce dernier domaine, les outils sont capables d'analyser des données structurées (des data), mais sont loin de pouvoir gérer des données non structurées (des informations). Les acteurs dans ce domainene sont d'ailleurs pas les acteurs en place ( SAS, Cognos, IBM ou MSoft), mais plutot des startup faisant appel à des technologies de traitement des évènements (Comining) ou de sémantique/linguistique/text mining (Mondeca, Temis, Lingway...)
Alain Risbourg
Par Alain Risbourg le 18/03/2008 à 03:04
Très surpris par le début de l'article et les notions floues autour des données non-structurées. Pourtant c'est très clair: une donnée structurée appartient à une base de données, une donnée semi-structurée correspond par exemple à un système de messagerie et les données non-structurées qui représentent tout le reste des données sont de "simples" fichiers comme une image, un fichier son MP3, une vidéo AVI, un feuille Excel... la structure est interne et non dépendante de relations extérieures, le fichier se suffit à lui-même. IDC indique d'ailleurs dans une étude de Mars 2007 que 80% des données créées, gérées, manipulées, stockées, capturées... sur la planète sont non-structurées.
Par Philippe NICOLAS le 13/03/2008 à 06:32
Les 10 derniers articles mis en ligne
- Comment intégrer Sap Solution Manager dans la gouvernance du SI ?
Benjamin Rouger est Chef de projet SAP Solution Manager chez KPF - Applications mobiles : 50 milliards de téléchargements d'ici 2012
- Citrix supporte Microsoft RemoteFX et lance XenDesktop 4 Feature Pack 1
- Colloque de l’Arcep sur la neutralité des réseaux
- Vers une augmentation des dépenses en semi-conducteurs
- SAP BusinessObjects XI 3 Web Intelligence
- Grammaires des conduites à projet
- Quelles seraient les conséquences du départ de Chine de Google ?
- Wikipedia s'ouvre à la vidéo en format libre
- Secteur IT : la confiance est de retour




































le 19/03/2010 à 12:29