Beruf Datenwissenschaftler / Datenwissenschaftlerin
Datenwissenschaftler finden und interpretieren reichhaltige Datenquellen, verwalten große Datenmengen, führen Datenquellen zusammen, sorgen für die Konsistenz der Datensätze und erstellen Visualisierungen, um die Daten zu veranschaulichen. Sie erstellen anhand der Daten mathematische Modelle, präsentieren und vermitteln datenbezogene Erkenntnisse an Experten und Wissenschaftler in ihrem Team sowie ggf. an eine nicht fachkundige Öffentlichkeit und geben Empfehlungen zur Verwendung der Daten ab.
Datenwissenschaftler/Datenwissenschaftlerin: Stellenausschreibungen
Finden Sie den Job Ihrer Träume auf talent.com, einem der weltweit größten Jobportale.
Stellenausschreibungen: talent.comPersönlichkeitstyp
Wissen
- Datenmodelle
Zum Strukturieren der Datenelemente und Aufzeigen der Beziehungen zwischen ihnen verwendete Techniken und vorhandene Systeme sowie Methoden zum Interpretieren von Datenstrukturen und -beziehungen.
- Data-Mining
Methoden der künstlichen Intelligenz, des maschinellen Lernens und der Statistik sowie Datenbankmethoden, mit denen Inhalte aus einem Datensatz extrahiert werden.
- Visuelle Darstellungstechniken
Techniken der visuellen Darstellung und Interaktion, wie z. B. Histogramme, Streudiagramme, Oberflächendiagramme, Kacheldiagramme und parallele Koordinaten, die zur Darstellung abstrakter numerischer und nicht numerischer Daten verwendet werden können, um das menschliche Verständnis dieser Informationen zu verbessern.
- Informationsextraktion
Für das Eruieren und die Extraktion von Informationen aus unstrukturierten oder halbstrukturierten digitalen Dokumenten und Quellen verwendete Techniken und Methoden.
- Resource-Description-Framework-Abfragesprache
Die Abfragesprache (z. B. SPARQL ), die zur Abfrage und Manipulation von Daten verwendet werden, die im Format „Resource Description Framework“ (RDF) gespeichert sind.
- Statistik
Fachgebiet der statistischen Theorie, Methoden und Praktiken, z. B. Erhebung, Organisation, Auswertung, Auslegung und Darstellung von Daten. Statistik befasst sich mit allen Aspekten von Daten, einschließlich der Planung der Datenerhebung in Bezug auf die Konzeption von Umfragen und Experimenten zur Prognose und Planung arbeitsbezogener Tätigkeiten.
- Online Analytical Processing
Online-Tools zur Analyse, Aggregation und Präsentation multidimensionaler Daten, die es Nutzern ermöglichen, Daten interaktiv und selektiv zu extrahieren und unter speziellen Gesichtspunkten anzuzeigen.
- Abfragesprachen
Das Feld der standardisierten Computersprachen für das Auffinden von Informationen in einer Datenbank und von Dokumenten, die die benötigten Informationen enthalten.
- Informationskategorisierung
Der Prozess der Einstufung der Informationen in Kategorien und die Darstellung der Beziehungen zwischen den Daten für einige klar definierte Zwecke.
Fertigkeiten
- Daten normalisieren
Reduzieren von Daten auf ihre genaue Stammform (Normalform), um Ergebnisse wie Minimierung der Abhängigkeit, Beseitigung von Redundanzen, Erhöhung der Konsistenz zu erzielen.
- IKT-Daten sammeln
Sammeln von Daten durch Entwicklung und Anwendung von Such- und Stichprobenverfahren.
- Empfehlungsdienst einrichten
Erstellung von Empfehlungssystemen auf der Grundlage großer Datensätze mithilfe von Programmiersprachen oder Computertools zur Bildung einer Unterklasse des Systems zur Filterung von Informationen, mit dem das Rating oder die Präferenz, die ein Nutzer vergibt, vorhergesagt wird.
- Datenprozesse etablieren
Verwendung von IKT-Werkzeugen, um mathematische, algorithmische oder andere Datenmanipulationsprozesse anzuwenden, um Informationen zu erstellen.
- Datenbereinigung durchführen
Erkennung und Korrektur beschädigter Daten in Datensätzen, Gewährleistung, dass die Daten gemäß Vorgaben strukturiert werden und diese Struktur beibehalten wird.
- Datenverarbeitungsanwendungen entwickeln
Erstellung einer maßgeschneiderten Software für die Verarbeitung von Daten durch Auswahl und Verwendung der entsprechenden Programmiersprache, damit ein IKT-System den gewünschten Output auf Basis des erwarteten Inputs erzeugen kann.
- Datenqualitätsverfahren anwenden
Anwendung von Qualitätsanalysen, Validierungs- und Verifizierungstechniken auf Daten, um die Integrität der Datenqualität zu überprüfen.
- Aktuelle Daten interpretieren
Zur Bewertung von Entwicklung und Innovation in den Fachgebieten Daten wie Marktdaten, wissenschaftliche Unterlagen, Kundenanforderungen und aktuelle Fragebögen analysieren.
- Visuelle Darstellung von Daten liefern
Anfertigen visueller Darstellungen in Form von Schaubildern oder Diagrammen, um das Verständnis von Daten zu erleichtern.
- Datenproben gewinnen
Erfassung und Auswahl einer Datenmenge aus der Grundgesamtheit mittels statistischer oder anderer definierter Verfahren.
- Datenbankschema konzipieren
Entwickeln eines Datenbankschemas nach den Regeln relationaler Datenbank-Managementsysteme (Relational Database Management System – RDBMS), um eine logische Gruppe von Objekten (wie Tabellen, Spalten und Prozesse) zu erstellen.
- Analyseergebnisse berichten
Erstellung von Forschungsunterlagen oder Präsentationen zur Meldung der Ergebnisse eines durchgeführten Forschungs- und Analyseprojekts unter Angabe der Analyseverfahren und -methoden, die zu den Ergebnissen geführt haben, sowie möglicher Auslegungen der Ergebnisse.
- Datenerhebungssysteme verwalten
Entwickeln und Verwalten von Methoden und Strategien zur Maximierung der Datenqualität und der statistischen Effizienz bei der Datenerhebung, um sicherzustellen, dass die erhobenen Daten für die Weiterverarbeitung optimiert sind.
- Analytisch-mathematische Berechnungen durchführen
Anwendung mathematischer Methoden und Nutzung von Berechnungstechnologien zur Durchführung von Analysen und zur Erarbeitung von Lösungen für spezifische Probleme.
Mögliche Kenntnisse und Fähigkeiten
business-intelligence datenqualitätskriterien festlegen xquery iuk-datenarchitektur verwalten unstrukturierte daten datenmodelle erstellen bewertung der datenqualität mdx daten verwalten linq data-mining durchführen ikt-datenklassifizierung steuern n1ql ldap ikt-daten integrieren sparqlSource: Sisyphus ODB