Métier scientifique des données

Les spécialistes des données trouvent et interprètent des sources de données riches, gèrent de grandes quantités de données, fusionnent des sources de données, assurent la cohérence des séries de données et créent des visualisations pour aider à comprendre les données. Ils établissent des modèles mathématiques à l’aide de données, présentent et communiquent des informations et des connaissances en matière de données aux spécialistes et aux scientifiques de leur équipe et, le cas échéant, à un public non spécialisé, et recommandent des moyens d’appliquer les données.

Types de personnalités

Connaissances

  • Langages de requête

    Le domaine des langages informatiques standardisés pour la récupération d’informations provenant d’une base de données et de documents contenant les informations nécessaires.

  • Traitement analytique en ligne

    Les outils en ligne qui analysent, globalisent et présentent des données multidimensionnelles afin de permettre aux utilisateurs d’extraire et de visualiser de manière interactive et sélective les données depuis des points de vue spécifiques.

  • Exploration de données

    Le recours aux méthodes d’intelligence artificielle, à l’apprentissage machine, aux statistiques et aux bases de données pour extraire du contenu à partir d’un ensemble de données.

  • Catégorisation de l’information

    Le processus consistant à classer des informations en catégories et à montrer les relations entre les données à des fins clairement définies.

  • Langage de requête Cadre de Description des Ressources

    Les langages de requête tels que SPARQL qui sont utilisés pour extraire et manipuler des données stockées au format du système RDF (Resource Description Framework).

  • Techniques de présentation visuelle

    Les techniques de représentation visuelle et d’interaction, telles qu’histogrammes, nuages de points, graphiques de surface, arborescences et graphiques de coordonnées parallèles, qui peuvent être utilisées pour présenter des données chiffrées et non chiffrées, afin de renforcer la compréhension humaine de ces informations.

  • Extraction de l’information

    Les techniques et les méthodes utilisées pour obtenir et extraire des informations provenant de documents et de sources numériques non structurés ou semi-structurés.

  • Modèles de données

    Les techniques et les systèmes existants utilisés pour structurer les éléments de données et montrer les relations entre eux, ainsi que les méthodes d’interprétation des structures de données et des relations entre elles.

  • Statistiques

    L’étude de la théorie, des méthodes et des pratiques statistiques, telles que la collecte, l’organisation, l’analyse, l’interprétation et la présentation des données. Les statistiques traitent de tous les aspects des données, y compris la planification de la collecte de données pour ce qui est de la conception des enquêtes et des expériences, afin de prévoir et de planifier des activités liées au travail.

Aptitudes

  • Traiter des échantillons de données

    Collecter et sélectionner un ensemble de données provenant d’une population par une procédure statistique ou autre.

  • Effectuer un nettoyage de données

    Détecter et corriger les enregistrements corrompus de séries de données, veiller à ce que les données deviennent et restent structurées conformément aux lignes directrices.

  • Concevoir un schéma de base de données

    Élaborer un système de base de données en suivant les règles du système de gestion des bases de données relationnelles afin de créer un groupe logiquement organisé d’objets tels que des tableaux, des colonnes et des processus.

  • Développer des applications de traitement des données

    Créer un logiciel personnalisé pour le traitement des données en sélectionnant et en utilisant le langage de programmation informatique approprié pour qu’un système informatique puisse produire les résultats demandés sur la base des entrées attendues.

  • Interpréter des données actuelles

    Analyser des données collectées auprès de sources telles que les données de marché, les documents scientifiques, les exigences et les questionnaires des clients qui sont actuels et à jour afin d’évaluer le développement et l’innovation dans des domaines d’expertise.

  • Mettre en œuvre des processus de qualité des données

    Appliquer des techniques d’analyse, de validation et de vérification de données afin de vérifier l’intégrité de la qualité des données.

  • Créer des traitements de données

    Utiliser des outils de TIC pour appliquer des processus mathématiques, algorithmiques ou autres processus de manipulation de données afin de créer des informations.

  • Exécuter des calculs mathématiques et analytiques

    Appliquer des méthodes mathématiques et utiliser les technologies de calcul pour effectuer des analyses et élaborer des solutions à des problèmes spécifiques.

  • Construire des systèmes de recommandation

    Construire des systèmes de recommandation basés sur de grands ensembles de données en utilisant des langages de programmation ou des outils informatiques pour créer une sous-classe de système de filtrage de l'information qui vise à prévoir la qualification ou la préférence qu’un utilisateur donne à un élément.

  • Fournir une présentation visuelle des données

    Créer des représentations visuelles de données telles que des graphiques ou des diagrammes afin de faciliter la compréhension.

  • Gérer des systèmes de collecte de données

    Élaborer et gérer les méthodes et les stratégies utilisées pour optimiser la qualité et l’efficacité statistique des données lors de la collecte des données, afin de garantir l’optimisation des données collectées en vue d’un traitement ultérieur.

  • Normaliser les données

    Réduire les données à leur forme de base précise (formes normales) afin d’obtenir des résultats tels que la minimisation de la dépendance, l’élimination de la redondance, l’augmentation de la cohérence.

  • Communiquer les résultats d’analyse

    Rédiger des documents de recherche ou tenir des présentations pour rendre compte des résultats d’un projet de recherche et d’analyse, en précisant les procédures et les méthodes d’analyse qui ont permis l’obtention des résultats et en expliquant les possibles interprétations des résultats.

  • Collecter les données

    Collecter des données en concevant et en appliquant des méthodes de recherche et d’échantillonnage.

Connaissances et aptitudes facultatives

données non structurées sparql procéder à l’extraction de données créer des modèles de données définir les critères de qualité des données mdx n1ql gérer la classification des données sur les tic linq ldap informatique décisionnelle gérer l’architecture des données gérer les données intégrer des données tic évaluation de la qualité de données xquery

Source: Sisyphus ODB