Beruf Datenwissenschaftler / Datenwissenschaftlerin

Datenwissenschaftler finden und interpretieren reichhaltige Datenquellen, verwalten große Datenmengen, führen Datenquellen zusammen, sorgen für die Konsistenz der Datensätze und erstellen Visualisierungen, um die Daten zu veranschaulichen. Sie erstellen anhand der Daten mathematische Modelle, präsentieren und vermitteln datenbezogene Erkenntnisse an Experten und Wissenschaftler in ihrem Team sowie ggf. an eine nicht fachkundige Öffentlichkeit und geben Empfehlungen zur Verwendung der Daten ab.

Möchten Sie wissen, welche Art von Karriere und welche Berufe am besten zu Ihnen passen? Absolvieren Sie unseren kostenlosen Holland-Code-Berufstest und finden Sie es heraus.

Persönlichkeitstyp

Wissen

  • Datenmodelle

    Zum Strukturieren der Datenelemente und Aufzeigen der Beziehungen zwischen ihnen verwendete Techniken und vorhandene Systeme sowie Methoden zum Interpretieren von Datenstrukturen und -beziehungen.

  • Data-Mining

    Methoden der künstlichen Intelligenz, des maschinellen Lernens und der Statistik sowie Datenbankmethoden, mit denen Inhalte aus einem Datensatz extrahiert werden.

  • Visuelle Darstellungstechniken

    Techniken der visuellen Darstellung und Interaktion, wie z. B. Histogramme, Streudiagramme, Oberflächendiagramme, Kacheldiagramme und parallele Koordinaten, die zur Darstellung abstrakter numerischer und nicht numerischer Daten verwendet werden können, um das menschliche Verständnis dieser Informationen zu verbessern.

  • Informationsextraktion

    Für das Eruieren und die Extraktion von Informationen aus unstrukturierten oder halbstrukturierten digitalen Dokumenten und Quellen verwendete Techniken und Methoden.

  • Resource-Description-Framework-Abfragesprache

    Die Abfragesprache (z. B. SPARQL ), die zur Abfrage und Manipulation von Daten verwendet werden, die im Format „Resource Description Framework“ (RDF) gespeichert sind.

  • Statistik

    Fachgebiet der statistischen Theorie, Methoden und Praktiken, z. B. Erhebung, Organisation, Auswertung, Auslegung und Darstellung von Daten. Statistik befasst sich mit allen Aspekten von Daten, einschließlich der Planung der Datenerhebung in Bezug auf die Konzeption von Umfragen und Experimenten zur Prognose und Planung arbeitsbezogener Tätigkeiten.

  • Online Analytical Processing

    Online-Tools zur Analyse, Aggregation und Präsentation multidimensionaler Daten, die es Nutzern ermöglichen, Daten interaktiv und selektiv zu extrahieren und unter speziellen Gesichtspunkten anzuzeigen.

  • Abfragesprachen

    Das Feld der standardisierten Computersprachen für das Auffinden von Informationen in einer Datenbank und von Dokumenten, die die benötigten Informationen enthalten.

  • Informationskategorisierung

    Der Prozess der Einstufung der Informationen in Kategorien und die Darstellung der Beziehungen zwischen den Daten für einige klar definierte Zwecke.

Fertigkeiten

  • Daten normalisieren

    Reduzieren von Daten auf ihre genaue Stammform (Normalform), um Ergebnisse wie Minimierung der Abhängigkeit, Beseitigung von Redundanzen, Erhöhung der Konsistenz zu erzielen.

  • IKT-Daten sammeln

    Sammeln von Daten durch Entwicklung und Anwendung von Such- und Stichprobenverfahren.

  • Empfehlungsdienst einrichten

    Erstellung von Empfehlungssystemen auf der Grundlage großer Datensätze mithilfe von Programmiersprachen oder Computertools zur Bildung einer Unterklasse des Systems zur Filterung von Informationen, mit dem das Rating oder die Präferenz, die ein Nutzer vergibt, vorhergesagt wird.

  • Datenprozesse etablieren

    Verwendung von IKT-Werkzeugen, um mathematische, algorithmische oder andere Datenmanipulationsprozesse anzuwenden, um Informationen zu erstellen.

  • Datenbereinigung durchführen

    Erkennung und Korrektur beschädigter Daten in Datensätzen, Gewährleistung, dass die Daten gemäß Vorgaben strukturiert werden und diese Struktur beibehalten wird.

  • Datenverarbeitungsanwendungen entwickeln

    Erstellung einer maßgeschneiderten Software für die Verarbeitung von Daten durch Auswahl und Verwendung der entsprechenden Programmiersprache, damit ein IKT-System den gewünschten Output auf Basis des erwarteten Inputs erzeugen kann.

  • Datenqualitätsverfahren anwenden

    Anwendung von Qualitätsanalysen, Validierungs- und Verifizierungstechniken auf Daten, um die Integrität der Datenqualität zu überprüfen.

  • Aktuelle Daten interpretieren

    Zur Bewertung von Entwicklung und Innovation in den Fachgebieten Daten wie Marktdaten, wissenschaftliche Unterlagen, Kundenanforderungen und aktuelle Fragebögen analysieren.

  • Visuelle Darstellung von Daten liefern

    Anfertigen visueller Darstellungen in Form von Schaubildern oder Diagrammen, um das Verständnis von Daten zu erleichtern.

  • Datenproben gewinnen

    Erfassung und Auswahl einer Datenmenge aus der Grundgesamtheit mittels statistischer oder anderer definierter Verfahren.

  • Datenbankschema konzipieren

    Entwickeln eines Datenbankschemas nach den Regeln relationaler Datenbank-Managementsysteme (Relational Database Management System – RDBMS), um eine logische Gruppe von Objekten (wie Tabellen, Spalten und Prozesse) zu erstellen.

  • Analyseergebnisse berichten

    Erstellung von Forschungsunterlagen oder Präsentationen zur Meldung der Ergebnisse eines durchgeführten Forschungs- und Analyseprojekts unter Angabe der Analyseverfahren und -methoden, die zu den Ergebnissen geführt haben, sowie möglicher Auslegungen der Ergebnisse.

  • Datenerhebungssysteme verwalten

    Entwickeln und Verwalten von Methoden und Strategien zur Maximierung der Datenqualität und der statistischen Effizienz bei der Datenerhebung, um sicherzustellen, dass die erhobenen Daten für die Weiterverarbeitung optimiert sind.

  • Analytisch-mathematische Berechnungen durchführen

    Anwendung mathematischer Methoden und Nutzung von Berechnungstechnologien zur Durchführung von Analysen und zur Erarbeitung von Lösungen für spezifische Probleme.

Mögliche Kenntnisse und Fähigkeiten

business-intelligence datenqualitätskriterien festlegen xquery iuk-datenarchitektur verwalten unstrukturierte daten datenmodelle erstellen bewertung der datenqualität mdx daten verwalten linq data-mining durchführen ikt-datenklassifizierung steuern n1ql ldap ikt-daten integrieren sparql