Sprungmarken

Servicenavigation

Hauptnavigation

Sie sind hier:

Hauptinhalt

Data Science and Big Data

Steckbrief
‣ nächster Start 5. Februar 2021
‣ Bewerbungsschluss 2. November 2020
‣ Dauer 10 Präsenztage
‣ Kosten 6.900 EUR (zahlbar in 3 Raten)
‣ Veranstaltungsort Zentrum für HochschulBildung
Hohe Str. 141
44139 Dortmund
‣ Teilnehmerbegrenzung

16 Teilnehmer

Wissenschaftliche Leitung

Prof. Dr. Claus Weihs, Lehrstuhlinhaber Computergestützte Statistik, Fakultät Statistik TU Dortmund

Termine 2021
Tag 1+2: 5. & 6. Februar 2021
Tag 3+4+5: 18. - 20. März 2021
Tag 6+7+8: 6. - 8. Mai 2021
Tag 9: 11. Juni 2021
Präsentation & Zertifikatsübergabe 6. November 2021
R

Dortmunder R Kurse


Passend zum "Data Science and Big Data" Zertifikatskurs bietet die Fakultät Statistik in Zusammenarbeit mit dem zhb Bereich Weiterbildung Tagesseminare zur Weiterbildung in der Progammiersprache R an. Die Kurse sind auch als Inhouse-Schulungen buchbar.

Weitere Informationen zu den R-Kursen

Ziele des Studiums

Erwerb von modernen Kenntnissen in Theorie und Praxis von Data Science und Big Data-Analytics

  • Befähigung zur Umsetzung datenwissenschaftlicher Anforderungen im Berufsleben
  • Erweiterung des Netzwerks zu Data Science
  • Demonstration der eigenen Fähigkeiten in einem anspruchsvollen Projekt während der Zertifikatsarbeit

 

Ihr Nutzen

Durch Ihr Studium erarbeiten Sie sich ausführliche moderne Kenntnisse in Theorie und Praxis von Data Science- und Big Data-Projekten. Die Lehreinheiten dienen Ihnen zur Einführung in neueste Erkenntnisse zu Management und Analyse großer Datenmengen und zum Üben dieser Methoden am Rechner mit realen Datensätzen. Die Übungen und Hausaufgaben fördern Ihre Fähigkeit, datenwissenschaftliche Anforderungen im Berufsleben praktisch umzusetzen. Im Rahmen Ihres 9-monatigen Kurzstudiums erweitern Sie Ihr Netzwerk mit Teilnehmenden, Dozentinnen und Dozenten und fachlichen Leitungen entscheidend. Nach bestandener Abschlussprüfung erhalten Sie ein aussagekräftiges Universitätszertifikat. Damit bauen Sie Ihre Kompetenzen nachweislich aus.

 

Hier erfahren Sie, welche weiteren Leistungen Sie im Zertifikatsstudium erhalten und welche organisatorischen Rahmenbedingungen Sie erwarten können.

 

Zielgruppe

Das Zertifikatsstudium richtet sich an alle Personen, die über einen natur-  oder ingenieurwissenschaftlich/ statistische Studienhintergrund verfügen oder aufgrund ihrer mehrjährigen Berufserfahrung mit  Fragestellungen zum Thema Datenanalyse vertraut sind.

Mögliche Berufsgruppen sind:

  • Data Analyst
  • Consultant/ Unternehmensberater
  • Business Analyst
  • Software-Entwickler

Sehen Sie hier, wie sich unsere bisherigen Studiengruppen zusammensetzen und was ehemalige Teilnehmerinnen und Teilnehmer über das Zertifikatsstudium sagen.

 

Studienumfang und -dauer

Die Studienzeit umfasst einschließlich der Prüfungsleistungen ca. 9 Monate mit einem Studienumfang von insgesamt ca. 300 Arbeitsstunden, d.h. im Durchschnitt ca. 8 h pro Woche. Das Studium ist berufsbegleitend.

Die Studienmodule dauern jeweils von Donnerstag oder Freitag bis Samstag. Sie  bestehen aus der Diskussion von Hausaufgaben (Übungen donnerstags) und aus 2 Lehreinheiten inkl. begleitender Präsenzübungen (freitags und samstags).

Die Unterrichtssprache ist Deutsch. In einigen Veranstaltungen werden die Unterlagen auf Englisch zur Verfügung gestellt.

In der Übung zu Modulelement 3 wird eine Fallstudie vorgestellt, die von den Teilnehmenden analysiert werden soll. Die Fallstudie dient als Vorbereitung auf die Zertifikatsarbeit, sie ist aber weniger umfangreicht. Die Erstellung der Fallstudie ist verpflichtend.

  

Prüfungsleistungen

Im Verlauf des Studiums müssen zwei Prüfungsteile absolviert werden:

  • Erstellung einer Zertifikatsarbeit, wenn möglich auf der Basis von „eigenen“ Daten
  • Präsentation und Diskussion der Zertifikatsarbeit

 Die Erstellung der Fallstudie ist ebenfalls verpflichtend, allerdings nicht notenrelevant für die abschließende Zertifikatsprüfung.

 

Abschluss

Nach erfolgreichem Abschluss erhalten die Teilnehmenden ein Zertifikat der Technischen Universität Dortmund, Fakultät Statistik.

 

Bewerbung

Eine Bewerbung ist bis zum 02. November 2020 möglich.

Für eine Bewerbung senden Sie bitte folgende Unterlagen an das zhb:

  • vollständig ausgefülltes Bewerbungsformular
  • beglaubigte Kopie Ihres Hochschulzeugnisses oder Nachweis der dreijährigen beruflichen Tätigkeit

Die Teilnehmerplätze werden bei Erfüllen der Zulassungsvoraussetzungen nach Eingang der Anmeldung vergeben. Bitte haben Sie Verständnis, dass die Prüfung der Zulassungsvoraussetzungen je nach Qualifikation einige Zeit in Anspruch nehmen kann.

Eine Stornierung nach Ablauf der gesetzlichen Widerrufsfrist von 2 Wochen ist gegen eine Bearbeitungsgebühr von 300,- Euro möglich. Bei Stornierungen zwei Wochen nach Bewerbungsschluss  oder bei vorzeitigem Abbruch der Weiterbildung wird der volle Betrag fällig.

Mit Ihrer Anmeldung stimmen Sie den AGB des Vereins Wissenschaftliche Weiterbildung an der TU Dortmund e.V. zu.

 

Teilnahmevoraussetzung

Teilnehmen kann, wer

  • ein erfolgreich abgeschlossenes Hochschulstudium mit überwiegend mathematisch/informatisch-statistischen Inhalten, oder
  • eine mindestens dreijährige berufliche Tätigkeit in einem für das Studium relevanten Bereich

vorweisen kann.

 

Übersicht Termin und Studieninhalte Data Science 2021

 

Modul Raum Inhalt Zeitraum/Blöcke Wochentag
Dozent/innen

Element 1:

Datenmanagement  

zhb
Hohe Straße 141
Einführung & Informationssysteme 05.02.2021 Freitag Weihs
Teubner
zhb
Hohe Straße 141
Bearbeitung großer Datenmengen mit R 06.02.2021 Samstag Ganztags: Lang & Surmann
zhb
Hohe Straße 141
Diskussion der Übung zu Modul 1 18.03.2021 Donnerstag

Vormittag: Teubner
Nachmittag: Lang & Surmann

Element 2:

Datenwissenschaft Theorie  

zhb
Hohe Straße 141
Clustern & Regression 19.03.2021 Freitag

Vormittag: Ickstadt
Nachmittag: Rahnenführer

zhb
Hohe Straße 141
Klassifikation & Einführung in Paket mlr 20.03.2021 Samstag Weihs (Unterstützung Horn)
zhb
Hohe Straße 141
Diskussion der Übungen zu Modul 2 06.05.2021 Donnerstag

Vormittag: Ickstadt
Nachmittag: Horn

Element 3:

Präsentation und Praxis  

zhb
Hohe Straße 141
Statistische Versuchsplanung und Datenvisualisierung 07.05.2021 Freitag

Vormittag: Pauly oder Ramosaj
Nachmittag: Geppert

zhb
Hohe Straße 141
Fallstudie Big Data Analyse 08.05.2021 Samstag Ganztags: Ickstadt & Weihs
zhb
Hohe Straße 141
Diskussion des Big Data Fallszenarios 11.06.2021 Freitag

Vormittag: Ramosaj & Geppert
Nachmittag: Ickstadt

Element 4:

Abschlussarbeit 

Einzelberatung: Beratung zur Erstellung der Zertifikatsabschlussarbeit Individuelle Koordination mit Prüfer/in Betreuer (Professoren der TU)
zhb
Hohe Straße 141
Präsentation und Zertifikatsübergabe 06.11.2021 Samstag

 

 

Stundeneinteilung

 

Uhrzeit
09:00 - 10:30 Uhr 2 Unterrichtsstunden/Vorlesung
15 Minuten Pause
10:45 - 12:15 Uhr 2 Unterrichtsstunden/Vorlesung
1 Stunde Mittagspause
13:15 - 14:45 Uhr 2 Unterrichtsstunden/Vorlesung
15 Minuten Pause
15:00 - 16:30 Uhr 2 Unterrichtsstunden/Vorlesung

 

Veranstaltungszeiten

Die Seminare und Übungen dauern von 9:00 - 16:30 Uhr. Am Eröffnungstag werden einige organisatorische Informationen über das Zertifikatsstudium erläutert. Daher dauert der Eröffnungstag von 9:00 - 17:30 Uhr. Mittags gibt es eine einstündige Mittagspause.

 

Kurzvorstellung des Dozententeams des Weiterbildenden Studiums

Das Dozententeam des weiterbildenden Studiums besteht aus renomierten Wissenschaftlerinnen und Wissenschaftlern, die an der TU Dortmund in den Fachgebieten Statistik, Informatik und Journalistik tätig sind. Die Fakultät Statistik an der TU Dortmund, gegründet 1973, ist die einzige eigenständige Fakultät für Statistik im deutschsprachigen Raum.

 

Modulinhalte

Sie verwenden einen Screenreader und haben Anzeigeprobleme: Gesamte Modulübersicht ein-/ausblenden

Tag 1: Informationssysteme

  • Begriff Datenbanksysteme
  • Relationales Datenmodell
  • SQL - Structured Query Language
  • Data Warehousing: Architektur, Entwicklungsprozess, Bus Matrix
  • Modellierung mittels Star Schema, Fakten, Dimensionen
  • Anfragen an Star Schemata mit SQL und mit SQL OLAP-Erweiterungen
  • No-SQL Systeme: MapReduce, Anfragesprachen für MapReduce-Systeme

Tag 2: Bearbeitung großer Datenmengen in R

  • Kurzeinführung in die Software R und Rstudio
  • Daten- und Kontrollstrukturen
  • Ein- und Ausgabe größerer Datenmengen
  • Datenbankanbindungen
  • Analyse großer Daten mit dem Paket data.tabl
  • Funktionale Programmierung: MapReduce
  • Explizte Parallelisierung mit Paketen parallel und snow
  • Parallelisierung auf HPC Clustern

Tag 3: Übung zu Modulinhalten

Tag 4: Datenanalyse Clusteranalyse

  • Statistische Grundlagen der deskriptiven Datenanalyse
  • Abgrenzung Clusteranalyse - Klassifikation
  • Distanzmaße und Ähnlichkeitsmaße
  • Hierarchisches Clustern
  • Partitionierende Clusteralgorithmen
  • Bestimmung der Clusteranzahl
  • Variablenselektion
  • Big Data Analysen: Clustern großer Datenmengen, CAST und DBSCAN

Datenanalyse Regression

  • Lineare Modelle, Verallgemeinerte Lineare Modelle
  • Schätzverfahren
  • Residualanalyse
  • Diagnostische Plots
  • Variablenselektion
  • Interpretation
  • Big Data Analysen: penalisierte Regressionsverfahren, Bayes-Verfahren, Unterraumeinbettung und Sampling
  • Evaluation: Vorhersage, Qualitätsmaße, Test

Tag 5: Datenanalyse Klassifikation

  • Datenunabhängige Verfahren
  • Bayes-Verfahren
  • Diskriminanzanalyse
  • Logistische Regression
  • Entscheidungsbäume
  • SVM
  • Ensemble Verfahren
  • Evaluation: Resampling, Interpretation, Vorhersage, Konfusionsmaße, Tuning, Variablenselektion, Dimensionsreduktion, Modellselektion
  • Big Data: viele Variablen, viele Beobachtungen

Tag 6: Übung zu Modulinhalten

Tag 7: Visualisierung

  • Grundlagen
  • Visualisierung metrisch skalierter Merkmale
  • Visualisierung kategorieller Merkmale
  • Visualisierung räumlicher Strukturen
  • Visualisierung von Zusammenhängen
  • Visualisierung bei großen Datensätzen

Statistische Versuchsplanung

  • wichtigste Prinzipien der experimentellen Versuchsplanung und deren Analyse
  • Vermittlung grundlegender Verfahren und Modelle für die Planung von Experimenten
  • Fallzahlplanung für eine ausreichende Power und anschließende statistische Analysemethoden
  • allgemeine Guidelines (faktorielles Prinzip, Randomisierung, Blockbildung) zur Planung von Experimenten

Tag 8: Fallstudie mit großem Datensatz

  • Analyse eines Datensatzes mit CRISP-DM Prozessmodell
  • Strategien und Technologien zur Analyse riesiger Datenmengen

Tag 9: Übung: Besprechung der Fallstudie

Zertifikatsarbeit (bring your own data), schriftliche Ausarbeitung eines Big-Data Falls und mündliche Disputation mit anschließender Diskussion

Dozenten: alle

Zwischen den Präsenztagen: Übungsaufgaben zur eigenständigen Bearbeitung
Reflexions- und Transferfähigkeit der Teilnehmenden steht im Vordergrund

Weitere Informationen finden Sie in diesem Modulhandbuch

 

Weiterführende Literatur

Weihs, C., Ligges, U. (2016): Datenwissenschaftler: Gefragte Köpfe dank Big-Data-Hype; ManagementKompass 01, 2016: Data Science; S. 29-31

 

Tagesseminare "Dortmunder R Kurse" auf Anfrage

Mehr Weiterbildungen im Bereich Data Science finden Sie in unserem Bereich Seminare/Workshops

 

Das Studium wird in Trägerschaft des Vereins ‚Wissenschaftliche Weiterbildung an der TU Dortmund e.V.’ durchgeführt.



Nebeninhalt

Kontakt

Dr. Jörg Teichert
Leiter Bereich Weiterbildung
Tel.: 0231 755-6639
M.A. Reha. Wiss. Kirsten Klute
Tel.: 0231 755-6636

 

Ansprechpartner für inhaltliche Fragen

Dr. Daniel Horn

Tel: (0231) 755 8236

 

Dozententeam

Weitere Informationen zum Dozententeam finden Sie hier.

 

Downloads

 

In Kooperation mit der Fakultät Statistik

StatistikLogo