Métier archiviste numérique spécialisé big data

Les archivistes numériques spécialisés en big data classifient, cataloguent et conservent des données numériques dans des bibliothèques de données. Ils/Elles évaluent et appliquent les normes relatives aux métadonnées pour les contenus numériques et mettent à jour les données obsolètes et les systèmes existants.

Types de personnalités

Métiers connexes bibliothèque

  • Archiviste
  • Bibliothécaire
  • Directeur de bibliothèque
  • Documentaliste
  • Employé de bibliothèque
  • Technicien de bibliothèque

Connaissances

  • Langages de requête

    Le domaine des langages informatiques standardisés pour la récupération d’informations provenant d’une base de données et de documents contenant les informations nécessaires.

  • Base de données

    La classification des bases de données, à savoir leur objet, leurs caractéristiques, leur terminologie, leurs modèles et leur utilisation, tels que les bases de données XML, les bases de données orientées documents et les bases de données en texte intégral.

  • Outils d’extraction de transformation et de chargement

    Les outils destinés à l’intégration d’informations provenant de multiples applications, créées et entretenues par des organisations, en une structure de données cohérente et transparente.

  • Systèmes de gestion de base de données

    Les outils de création, de mise à jour et de gestion de bases de données, tels qu’Oracle, MySQL et Microsoft SQL Server.

  • Outils de développement de bases de données

    Les méthodologies et outils utilisés pour créer une structure logique et physique de bases de données, telles que les structures de données logiques, les diagrammes, les méthodes de modélisation et les relations entre entités.

  • Modèles de données

    Les techniques et les systèmes existants utilisés pour structurer les éléments de données et montrer les relations entre eux, ainsi que les méthodes d’interprétation des structures de données et des relations entre elles.

  • Langage de requête Cadre de Description des Ressources

    Les langages de requête tels que SPARQL qui sont utilisés pour extraire et manipuler des données stockées au format du système RDF (Resource Description Framework).

  • Informatique décisionnelle

    Outils utilisés pour transformer de grandes quantités de données brutes en informations commerciales pertinentes et utiles.

Aptitudes

  • Gérer les métadonnées de contenu

    Appliquer des méthodes et des procédures de gestion du contenu pour définir et utiliser des concepts de métadonnées, tels que les données de création, afin de décrire, d’organiser et d’archiver des contenus tels que des documents, des fichiers vidéo et audio, des applications et des images.

  • Gérer les instructions à l’intention d’utilisateurs d’archives

    Élaborer des lignes directrices stratégiques relatives à l’accès du public à des archives (numériques) et à l’utilisation prudente des documents qu’elles contiennent. Communiquer les lignes directrices aux visiteurs d’archives.

  • Analyser des mégadonnées

    Collecter et évaluer des données chiffrées en grandes quantités, notamment à des fins d’identification de modèles entre les données.

  • Se conformer aux réglementations juridiques

    Veiller à être correctement informé des réglementations juridiques qui régissent une activité spécifique et se conformer à ses règles, à ses politiques et à sa lois.

  • Gérer les données

    Gérer tous les types de ressources de données tout au long de leur cycle de vie en procédant à l’interconnexion, à l’analyse, à la normalisation, à la résolution d’identité, au nettoyage, à l’amélioration et au contrôle des données. Veiller à ce que les données soient adaptées à l’usage prévu, en utilisant des outils de TIC spécialisés pour répondre aux critères de qualité des données.

  • Faire respecter les exigences en matière de saisie des données

    Maintenir les conditions d’entrée des données. Suivre les procédures et appliquer les techniques de programmation des données.

  • Gérer la classification des données sur les TIC

    Superviser le système de classification utilisé par une organisation pour organiser ses données. Attribuer un propriétaire à chaque concept ou ensemble de concepts de données et déterminer la valeur de chaque élément de données.

  • Maintenir la sécurité d’une base de données

    Maîtriser un large éventail de contrôles de sécurité de l'information afin d'assurer une protection maximale des bases de données.

  • Maintenir les performances d’une base de données

    Calculer les valeurs des paramètres de la base de données. Mettre en œuvre de nouvelles versions et exécuter des tâches de maintenance régulières telles que la mise en place de stratégies de sauvegarde et la suppression de la fragmentation de l’index. Évaluer les produits matériels et les systèmes d’exploitation.

  • écrire la documentation d’une base de données

    Élaborer des documents contenant des informations sur la base de données qui présentent un intérêt pour les utilisateurs finals.

  • Gérer des archives numériques

    Créer et tenir à jour des bases de données et archives informatiques, en intégrant les tout derniers développements dans le domaine des technologies de stockage des informations électroniques.

  • Gérer une base de données

    Appliquer des plans et des modèles de conception de bases de données, définir des dépendances de données, utiliser des langues de requête et des systèmes de gestion de bases de données (SGBD) pour développer et gérer des bases de données.

Connaissances et aptitudes facultatives

concevoir les spécifications de sauvegarde des bases de données microsoft access mysql intégrer des données tic ibm infosphere information server xquery appliquer des politiques de sécurité de l’information informatica powercenter db2 n1ql confidentialité de l’information objectstore openedge database ibm informix linq suivre les tendances technologiques filemaker gérer des systèmes de collecte de données ldap oracle warehouse builder convertir des documents du format analogique au format numérique postgresql pentaho data integration concevoir un schéma de base de données sql server mdx normaliser les données évaluation de la qualité de données ca datacom/db structure de l’information effectuer des sauvegardes faire une présentation en direct oracle data integrator transférer des données existantes teradata database développer un flux de travaux sap data services oracle relational database techniques de présentation visuelle ibm infosphere datastage sql server integration services qlikview expressor statistiques sparql

Source: Sisyphus ODB