Navigation

Lehrveranstaltungen

Stundenplan (Wintersemester 2020/21)

 

Bis auf wenige Ausnahmen finden alle Lehrveranstaltungen im Wintersemester weiterhin als online-Kurse statt. Die Formate unterscheiden sich je nach Lehrveranstaltung. Bitte melden Sie sich rechtzeitig für den jeweiligen StudOn-Kurs an, um weitere Informationen zu erhalten. Soweit Präsenztermine in Form von Videkonferenzen oder Chats angesetzt werden, liegen diese im angekündigten Zeitslot der Veranstaltung (siehe oben).

Weitere Informationen zur Lehre im WS 2020/21.

Folien der Einführungsveranstaltung WS 2019/20.

Lehrveranstaltungen WiSe 2020/21 (in Bearbeitung)

Die Einführungsveranstaltung für Erstsemester wird kurz vor Beginn des Vorlesungszeitraums als Videoaufzeichnung bereitgestellt. Ein erster Präsenztermin findet am Montag, 02.11.2020, in mehreren Gruppen zwischen 14–18 Uhr im CIP-Pool (Bismarckstr. 12, Raum 0.320) statt (weitere Informationen).

Das HS Computerlinguistik hat dieses Semester das Thema Multi-Task Learning for Document Analysis. Es wird als Projektseminar in Kooperation mit dem Pattern Recognition Lab des Departments Informatik durchgeführt und findet voraussichtlich als reine als Online-Lehrveranstaltung statt. Präsenztermine (Vorlesungen und Tutorials, Diskussionen, Projektpräsentationen) finden regelmäßig mittwochs 10–12 Uhr statt.

Wie üblich kann das Seminar als HS praktisch oder als HS theoretisch belegt werden, um Verzögerungen im Studienablauf zu vermeiden. Bitte melden Sie sich rechtzeitig für den zugehörigen StudOn-Kurs an.

Webinar-Vorträge oder alternative Angebote (z.B. Podcasts) im Rahmen des Oberseminars Computerlinguistik werden im Kalender der Korpus- und Computerlinguistik sowie über den Mailverteiler des Lehrstuhls angekündigt.

Bis auf weiteres finden die Sprechstunden von Prof. Evert nur per Telefon oder Videokonferenz statt, während der Vorlesungszeit üblicherweise montags 10–12 Uhr. Bitte vereinbaren Sie einen Termin per e-Mail.

Wörter, Texte & Frequenzen: statistische Analyse von Sprachdaten

Lecturers

Details

Time and place:

  • Tue 10:00-12:00, Room 02.313

Prerequisites / Organizational information

Grundlegende Statistik- und Programmierkenntnisse werden vorausgesetzt, Erfahrung mit R ist nicht nötig.

Technische Voraussetzungen: eigener Rechner, Mikrofon, Lautsprecher oder Headset, idealerweise Webcam

Das Seminar findet größtenteils online statt (Screencasts, Zoom & asynchrone Kommunikation).

Es werden aber auch vereinzelte Präsenztermine angeboten, gerade zum Kennenlernen von R und RStudio am Anfang des Semesters.

Content

Seien es nun stilometrische Analysen, die Auswertung von Korpusrecherchen oder die Analyse von Social-Media-Beiträgen unter sozialwissenschaftlichen Gesichtspunkten: Auch wenn man eigentlich mit Text arbeitet, kommt man um Statistik oft nicht herum.

Sprachdaten bringen besondere statistische Herausforderungen mit sich, die in Einführungskursen in der Regel nur angeschnitten werden. Wir wollen uns im Seminar aber nicht nur damit beschäftigen, sondern auch ganz grundlegend mit statistischer Modellierung: Wie wählt man das passende statistische Verfahren aus? Wie wählt man die Prädiktorvariablen aus, die ins Modell eingehen sollen? Wie misst man die Güte eines Modells, und wie interpretiert man das Modell richtig? Wie lassen sich Modelle robust konstruieren, sodass sie verlässlichere Vorhersagen liefern? Wie geht man mit Interaktionen, Nichtlinearität und abhängigen Daten um? Wie wählt man unter mehreren möglichen Modellen das beste aus?

Dabei spielt natürlich stets auch die Visualisierung der Daten eine wichtige Rolle.

Eigene Daten und Fragestellungen können gerne eingebracht werden!

Grober und unvollständiger Themenüberblick:

  • Einführung in R / Auffrischung
  • Häufigkeitsverteilungen von Sprachdaten
  • Visual data exploration: ggplot, Plotly & Shiny
  • Statistische Modelle: Genauigkeit und Interpretierbarkeit, Test- und Trainingsdaten, Kreuzvalidierung
  • Klassifikationsprobleme (logistische Regression, SVMs, Entscheidungsbäume und Random Forests)
  • Modellieren für Fortgeschrittene (u.a. Umgang mit Nichtlinearität und mit abhängigen Daten)
  • Unüberwachtes Lernen: Clustering, Dimensionsreduzierung und Co.

Recommended Literature

Wickham, Hadley / Grolemund, Garrett (2017): R for Data Science. [Online: https://r4ds.had.co.nz/index.html ]

Ismay, Chester / Kim, Albert Y. (2020): Statistical Inference via Data Science. A ModernDive into R and the Tidyverse. [Online: https://moderndive.com/index.html ]

James, Gareth / Witten, Daniela / Hastie, Trevor / Tibshirani, Robert (2013): An Introduction to Statistical Learning. [Online: http://faculty.marshall.usc.edu/gareth-james/ISL/ ]

Additional information

Keywords: Statistik, Korpuslinguistik, Visualisierung, Datenanalyse, Regression, Modellierung

Weitere Empfehlungen folgen.

  • Arbeitstechniken der Computerlinguistik

    • Thu 10:15-11:45, Room 0.320 Bismarckstr. 12
    • Thu 12:15-13:45, Room 0.320 Bismarckstr. 12
  • Übung Grundlagen der Computerlinguistik 1

    • Mon 14:15-15:45, Room 0.320 Bismarckstr. 12
    • Mon 16:15-17:45, Room 0.320 Bismarckstr. 12
  • Computerlinguistische Werkzeuge und Infrastrukturen

    Auch für EMLex-Studierende (Basismodul B3-9); Die Veranstaltung findet online statt.

    • Wed 14:15-15:45, Room Zoom-Meeting
  • Sprechstunden zu Grundlagen der Informatik

    Chat / Virtuelle Meetings. Mehr Infos im StudON unter https://www.studon.fau.de/crs3319683.html

    • Thu 16:15-17:00
    • Fri 11:00-11:45
    • Wed 10:15-11:00
    • Tue 15:00-15:45
    • Wed 8:15-9:00
    • Thu 13:00-13:45
    • Tue 10:15-11:00
    • Tue 12:15-13:00
    • Fri 8:15-9:00
    • Mon 14:15-15:00
    • Fri 15:00-15:45
    • Mon 9:00-9:45
    • Tue 11:00-11:45
    • Fri 10:15-11:00
    • Thu 12:15-13:00
    • Tue 9:00-9:45
    • Wed 9:00-9:45
    • Thu 17:00-17:45
    • Mon 15:00-15:45
    • Tue 14:15-15:00
    • Fri 14:15-15:00
    • Tue 8:15-9:00
    • Wed 11:00-11:45
    • Fri 9:00-9:45
    • Tue 13:00-13:45
    • Mon 8:15-9:00
  • Sprechstunden zu Grundlagen der Informatik

    Chat / Virtuelle Meetings. Mehr Infos im StudON unter https://www.studon.fau.de/crs3319683.html

    • Fri 10:15-11:00
    • Tue 11:00-11:45
    • Mon 9:00-9:45
    • Fri 15:00-15:45
    • Wed 8:15-9:00
    • Tue 15:00-15:45
    • Wed 10:15-11:00
    • Thu 16:15-17:00
    • Fri 11:00-11:45
    • Fri 8:15-9:00
    • Mon 14:15-15:00
    • Tue 12:15-13:00
    • Tue 10:15-11:00
    • Thu 13:00-13:45
    • Wed 11:00-11:45
    • Tue 8:15-9:00
    • Tue 13:00-13:45
    • Mon 8:15-9:00
    • Fri 9:00-9:45
    • Mon 15:00-15:45
    • Thu 17:00-17:45
    • Thu 12:15-13:00
    • Wed 9:00-9:45
    • Tue 9:00-9:45
    • Fri 14:15-15:00
    • Tue 14:15-15:00