Profesión científico de datos / científica de datos

Los científicos de datos detectan e interpretan fuentes de datos ricas, gestionan grandes cantidades de datos, fusionan fuentes de datos, garantizan la coherencia de los conjuntos de datos y crean visualizaciones a fin de ayudar a la comprensión de los datos. Se basan en modelos matemáticos que utilizan datos, presentan y comunican información y conclusiones sobre datos a especialistas y científicos en su equipo y, si fuera necesario, a un público no especializado, y recomiendan formas de aplicar los datos.

Científico de datos/científica de datos: Puestos vacantes

Encuentra el trabajo de tus sueños en talent.com, uno de los mayores portales de empleo del mundo.

Puestos vacantes: talent.com

Tipos de personalidades

Conocimientos

  • Procesamiento analítico en línea

    Las herramientas en línea que analizan, agregan y presentan datos multidimensionales que permiten a los usuarios extraer y visualizar datos de manera interactiva y selectiva, y ver los datos desde puntos de vista específicos.

  • Técnicas de presentación visual

    Las técnicas de representación visual e interacción, como los histogramas, los gráficos de dispersión, gráficos de superficie, diagramas de árbol y gráficos de coordenadas paralelas, que pueden utilizarse para presentar datos numéricos y no numéricos, con el fin de reforzar la comprensión humana de esta información.

  • Extracción de datos

    Los métodos de inteligencia artificial, aprendizaje automático, estadísticas y bases de datos utilizados para extraer contenido de un conjunto de datos.

  • Modelos de datos

    Las técnicas y sistemas existentes utilizados para estructurar los datos y mostrar las relaciones entre ellos, así como los métodos para interpretar las estructuras y las relaciones de los datos.

  • Extracción de información

    Las técnicas y los métodos utilizados para obtener y extraer información de documentos y fuentes digitales no estructurados o semiestructurados.

  • Lenguaje de consulta del sistema de descripción de recursos

    Los lenguajes de consulta, como SPARQL, que se utilizan para extraer y manipular datos almacenados en el formato Marco de Descripción de Recursos (RDF).

  • Lenguajes de consulta

    El campo de los lenguajes informáticos normalizados para la recuperación de información de una base de datos y de documentos que contengan la información necesaria.

  • Estadística

    El estudio de la teoría, los métodos y las prácticas estadísticos como recopilación, organización, análisis, interpretación y presentación de datos. Se ocupa de todos los aspectos de los datos, incluida la planificación de la recogida de datos desde el punto de vista de la creación de encuestas y experimentos para pronosticar y planificar actividades de índole laboral.

  • Categorización de la información

    El proceso de clasificación de la información en categorías y de la indicación de la relación que guardan entre sí los datos para algunos fines claramente definidos.

Capacidades

  • Ejecutar cálculos matemáticos analíticos

    Aplicar métodos matemáticos y utilice tecnologías de cálculo para realizar análisis y buscar soluciones a problemas específicos.

  • Establecer procesos de datos

    Utilizar herramientas de TIC para aplicar procesos de manipulación de datos matemáticos, algorítmicos o de otro tipo, con el fin de crear información.

  • Compilar sistemas de recomendación

    Compilar sistemas de recomendación basados en grandes conjuntos de datos utilizando lenguajes de programación o herramientas informáticas para crear una subclase de sistema de filtrado de información que persiga predecir la calificación o preferencia que un usuario otorga a un elemento.

  • Informar de los resultados de los análisis

    Elaborar documentos de investigación o hacer presentaciones para informar de los resultados de un proyecto de investigación y análisis realizado, indicando los procedimientos y métodos de análisis que han dado lugar a los resultados, así como las posibles interpretaciones de los resultados.

  • Gestionar sistemas de recopilación de datos

    Desarrollar y gestionar los métodos y estrategias utilizados para maximizar la calidad de los datos y la eficiencia estadística en la recopilación de datos, a fin de garantizar que los datos recabados estén optimizados para su posterior tratamiento.

  • Aplicar procesos de calidad de datos

    Aplicar técnicas de análisis de calidad, validación y verificación de calidad de los datos para comprobar la integridad de la calidad de los datos.

  • Realizar una limpieza de datos

    Detectar y corregir los registros corruptos de los conjuntos de datos, y asegurarse de que los datos se conviertan y mantengan estructurados conforme a las directrices.

  • Manejar muestras de datos

    Recopilar y seleccionar un conjunto de datos de una población mediante un procedimiento estadístico u otro procedimiento definido.

  • Reunir datos de TIC

    Recopilar datos mediante el diseño y aplicación de métodos de búsqueda y muestreo.

  • Proporcionar presentaciones visuales de datos

    Crear representaciones visuales de datos, como gráficos o diagramas, que faciliten su comprensión.

  • Diseñar esquema de base de datos

    Redactar un sistema de bases de datos mediante las normas del sistema de gestión de las bases de datos (RDBMS), a fin de crear un grupo de objetos dispuestos lógicamente, como tablas, columnas y procesos.

  • Interpretar datos actuales

    Analizar los datos recopilados a partir de fuentes como los datos de mercado, los documentos científicos, los requisitos de los clientes y los cuestionarios actuales y actualizados, con el fin de evaluar el desarrollo y la innovación en ámbitos de especialización.

  • Normalizar datos

    Reducir los datos a su forma fundamental precisa (formularios normales) para lograr resultados como la minimización de la dependencia, la eliminación de la redundancia y el aumento de la coherencia.

  • Desarrollar aplicaciones de procesamiento de datos

    Crear un software personalizado para el procesamiento de datos, seleccionando y utilizando el lenguaje de programación informático adecuado para que un sistema de TIC produzca los datos solicitados sobre la base de las entradas esperadas.

Conocimientos y capacidades optativas

sparql ldap gestionar la clasificación de datos de las tic datos no estructurados crear modelos de datos xquery mdx integrar datos de las tic n1ql gestionar datos inteligencia empresarial definir los criterios de la calidad de los datos efectuar la extracción de datos linq gestionar arquitecturas de datos informáticos evaluación de la calidad de los datos

Source: Sisyphus ODB