Profesión científico de datos / científica de datos
Los científicos de datos detectan e interpretan fuentes de datos ricas, gestionan grandes cantidades de datos, fusionan fuentes de datos, garantizan la coherencia de los conjuntos de datos y crean visualizaciones a fin de ayudar a la comprensión de los datos. Se basan en modelos matemáticos que utilizan datos, presentan y comunican información y conclusiones sobre datos a especialistas y científicos en su equipo y, si fuera necesario, a un público no especializado, y recomiendan formas de aplicar los datos.
Científico de datos/científica de datos: Puestos vacantes
Encuentra el trabajo de tus sueños en talent.com, uno de los mayores portales de empleo del mundo.
Puestos vacantes: talent.comTipos de personalidades
Conocimientos
- Procesamiento analítico en línea
Las herramientas en línea que analizan, agregan y presentan datos multidimensionales que permiten a los usuarios extraer y visualizar datos de manera interactiva y selectiva, y ver los datos desde puntos de vista específicos.
- Técnicas de presentación visual
Las técnicas de representación visual e interacción, como los histogramas, los gráficos de dispersión, gráficos de superficie, diagramas de árbol y gráficos de coordenadas paralelas, que pueden utilizarse para presentar datos numéricos y no numéricos, con el fin de reforzar la comprensión humana de esta información.
- Extracción de datos
Los métodos de inteligencia artificial, aprendizaje automático, estadísticas y bases de datos utilizados para extraer contenido de un conjunto de datos.
- Modelos de datos
Las técnicas y sistemas existentes utilizados para estructurar los datos y mostrar las relaciones entre ellos, así como los métodos para interpretar las estructuras y las relaciones de los datos.
- Extracción de información
Las técnicas y los métodos utilizados para obtener y extraer información de documentos y fuentes digitales no estructurados o semiestructurados.
- Lenguaje de consulta del sistema de descripción de recursos
Los lenguajes de consulta, como SPARQL, que se utilizan para extraer y manipular datos almacenados en el formato Marco de Descripción de Recursos (RDF).
- Lenguajes de consulta
El campo de los lenguajes informáticos normalizados para la recuperación de información de una base de datos y de documentos que contengan la información necesaria.
- Estadística
El estudio de la teoría, los métodos y las prácticas estadísticos como recopilación, organización, análisis, interpretación y presentación de datos. Se ocupa de todos los aspectos de los datos, incluida la planificación de la recogida de datos desde el punto de vista de la creación de encuestas y experimentos para pronosticar y planificar actividades de índole laboral.
- Categorización de la información
El proceso de clasificación de la información en categorías y de la indicación de la relación que guardan entre sí los datos para algunos fines claramente definidos.
Capacidades
- Ejecutar cálculos matemáticos analíticos
Aplicar métodos matemáticos y utilice tecnologías de cálculo para realizar análisis y buscar soluciones a problemas específicos.
- Establecer procesos de datos
Utilizar herramientas de TIC para aplicar procesos de manipulación de datos matemáticos, algorítmicos o de otro tipo, con el fin de crear información.
- Compilar sistemas de recomendación
Compilar sistemas de recomendación basados en grandes conjuntos de datos utilizando lenguajes de programación o herramientas informáticas para crear una subclase de sistema de filtrado de información que persiga predecir la calificación o preferencia que un usuario otorga a un elemento.
- Informar de los resultados de los análisis
Elaborar documentos de investigación o hacer presentaciones para informar de los resultados de un proyecto de investigación y análisis realizado, indicando los procedimientos y métodos de análisis que han dado lugar a los resultados, así como las posibles interpretaciones de los resultados.
- Gestionar sistemas de recopilación de datos
Desarrollar y gestionar los métodos y estrategias utilizados para maximizar la calidad de los datos y la eficiencia estadística en la recopilación de datos, a fin de garantizar que los datos recabados estén optimizados para su posterior tratamiento.
- Aplicar procesos de calidad de datos
Aplicar técnicas de análisis de calidad, validación y verificación de calidad de los datos para comprobar la integridad de la calidad de los datos.
- Realizar una limpieza de datos
Detectar y corregir los registros corruptos de los conjuntos de datos, y asegurarse de que los datos se conviertan y mantengan estructurados conforme a las directrices.
- Manejar muestras de datos
Recopilar y seleccionar un conjunto de datos de una población mediante un procedimiento estadístico u otro procedimiento definido.
- Reunir datos de TIC
Recopilar datos mediante el diseño y aplicación de métodos de búsqueda y muestreo.
- Proporcionar presentaciones visuales de datos
Crear representaciones visuales de datos, como gráficos o diagramas, que faciliten su comprensión.
- Diseñar esquema de base de datos
Redactar un sistema de bases de datos mediante las normas del sistema de gestión de las bases de datos (RDBMS), a fin de crear un grupo de objetos dispuestos lógicamente, como tablas, columnas y procesos.
- Interpretar datos actuales
Analizar los datos recopilados a partir de fuentes como los datos de mercado, los documentos científicos, los requisitos de los clientes y los cuestionarios actuales y actualizados, con el fin de evaluar el desarrollo y la innovación en ámbitos de especialización.
- Normalizar datos
Reducir los datos a su forma fundamental precisa (formularios normales) para lograr resultados como la minimización de la dependencia, la eliminación de la redundancia y el aumento de la coherencia.
- Desarrollar aplicaciones de procesamiento de datos
Crear un software personalizado para el procesamiento de datos, seleccionando y utilizando el lenguaje de programación informático adecuado para que un sistema de TIC produzca los datos solicitados sobre la base de las entradas esperadas.
Conocimientos y capacidades optativas
sparql ldap gestionar la clasificación de datos de las tic datos no estructurados crear modelos de datos xquery mdx integrar datos de las tic n1ql gestionar datos inteligencia empresarial definir los criterios de la calidad de los datos efectuar la extracción de datos linq gestionar arquitecturas de datos informáticos evaluación de la calidad de los datosSource: Sisyphus ODB