Teaching

 

2010
Title: Übungen zu Repräsentation und Verarbeitung multimodaler Dokumente (SS 2010)  
Lehrende: Alexander Mehler & Ulli Waltinger & Peter Menke  
Info:

Die Übung zur Vorlesung 'Texttechnologie' führt in die Entwicklung von texttechnologischen Algorithmen ein. Es geht darum, anhand konkreter Textkorpora die verschiedenen Aufgabenbereiche der Texttechnologie praxisnah einzuüben. Auf diese Weise sollen die Studierenden in die Lage versetzt werden, eigene texttechnologische Aufgabestellungen algorithmisch zu charakterisieren und softwaretechnisch zu lösen.

 
Link:

eKVV: http://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=16965464 StudIP: https://elearning.uni-bielefeld.de/studip/

 
2009
Title: Übungen zu Texttechnologie (WS 2009)  
Lehrende: Alexander Mehler & Ulli Waltinger  
Info:

Die Übung zur Vorlesung 'Texttechnologie' führt in die Entwicklung von texttechnologischen Algorithmen ein. Es geht darum, anhand konkreter Textkorpora die verschiedenen Aufgabenbereiche der Texttechnologie praxisnah einzuüben. Auf diese Weise sollen die Studierenden in die Lage versetzt werden, eigene texttechnologische Aufgabestellungen algorithmisch zu charakterisieren und softwaretechnisch zu lösen.

 
Link:

eKVV: http://ekvv.uni-bielefeld.de/kvv_publ/publ/Lehrende_Veranstaltungen.jsp?personId=4258708 StudIP: https://elearning.uni-bielefeld.de/studip/

 
2008
Title: Project Seminar "Digital terminology dictionary" (SS 2008)  
Lehrende: Maik Stührenberg & Ulli Waltinger  
Info:

Das Projektseminar knüpft an die Arbeit der Teilprojekte A2 und A4 der DFG-Forschergruppe "Texttechnologische Informationsmodellierung" an und verfolgt zwei Projektziele: die Entwicklung eines webbasierten Fachsprachenlexikons und die Implementierung einer Architektur zur Manipulation multipel annotierter Daten.

Die Projektarbeit soll den Studierenden einen Einblick in die angewandte Computerlinguistik und Texttechnologie gewähren, indem beginnend mit der Materialsammlung, -aufbereitung (Tokenisierung, Lemmatisierung, Filterung) eine auf Wortkokkurrenzen aufbauende Darstellung von Fachsprachen entwickelt wird, die anschließend durch eine Schnittstelle für Benutzer zugänglich gemacht werden soll. Durch die Projektarbeit soll eine Brücke zwischen dem texttechnologischen Wissen und seiner praktischen Anwendung geschlagen werden. Das Projektseminar bietet einen Einstieg in die praktische Linguistik, indem den Studierenden die Möglichkeit gegeben wird, eine praxisorientierte texttechnologische Aufgabe in Gruppenarbeit zu bewältigen.

Das Projektseminar ist in eine Folge von teils aufeinander aufbauenden Teilprojekten gegliedert. Dabei sollen weitestgehend bereits existierende Tools zur Bewältigung der Aufgaben wieder verwendet werden. Programmierarbeit erfordert die Berechnung statistischer Maße. Als Programmiersprachen kommt neben Java auch XSLT zur Verarbeitung XML-annotierte Daten zum Einsatz. Die Teilaufgaben gliedern sich im Einzelnen wie folgt:

  1. Parsen der Rohdaten (Java/C+)
  2. Berechnung der Kookkurrenzen und Annotation der Daten (Java/C+/XML/XSLT)
  3. Modellierung einer Datenbank/eines Repräsentationsformats zur Speicherung der Daten (RDBMS/native XML DBMS/XQuery)
  4. Erarbeitung von Methoden zur Verarbeitung multipel annotierter Daten
  5. Visualisierung (PHP/XSLT/XHTML)

In den ersten Sitzungen findet eine Einführung in die Programmiersprache Java statt, in der alle nötigen Grundlagen für die einzelnen Projekte vermittelt werden. Programmierkenntnisse für die Projektarbeit sind nicht zwingend erforderlich. Kenntnisse in den anderen verwendeten Techniken wie XML/XSLT werden bei Bedarf vermittelt. Alle Projektgruppen werden an die Thematik zur Bearbeitung und Lösung der Projektaufgaben herangeführt.

Für den Erwerb eines Leistungsnachweises ist neben der aktiven Teilnahme das erfolgreiche Bearbeiten eines Teilprojekts (in Einzel- oder Gruppenarbeit) nebst zugehöriger Dokumentation erforderlich. Seminarunterlagen und Seminarplan werden in Stud.IP bereit gestellt.

 
Link:

eKVV: http://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=230138 StudIP: https://elearning.uni-bielefeld.de/studip/

 
2007
Title: Categorization at Web 2.0 (SS 2007)
Course: Session for Alexander Mehler (Informationsstrukturierung)
Info: Introduction to Web-Classification; What is the Web 2.0; Applications in Web 2.0; How is information structured on the web;

Title: Introduction to WordNet and Lexical Chaining (SS 2007)
Course: Session for Alexander Mehler (Informationsstrukturierung)
Info: Introduction to WordNet/GermaNet; What are semantic networks; What is lexical chaining; Applications for lexical chaining;

Title: Project Seminar "Digital terminology dictionary" (SS 2007)  
Lehrende: Olga Pustylnikov & Ulli Waltinger  
Info:

Das Projektseminar "Digitales Fachsprachenlexikon" knüpft an die Arbeit des A4-Teilprojekts der DFG-Forschergruppe "Texttechnologische Informationsmodellierung" an und hat die Entwicklung eines webbasierten Fachsprachenlexikons zum Ziel. Analog zu dem Leipziger Wortschatzprojekt (http://wortschatz.uni-leipzig.de/) sollen für im Web vertretene Fachsprachen und Genres je eigene Lexika erstellt werden.

Die Projektarbeit soll den Studierenden einen Einblick in die angewandte Computerlinguistik gewähren, indem beginnend mit der Materialsammlung, -aufbereitung (Tokenisierung, Lemmatisierung, Filterung) eine auf Wortkookkurrenzen aufbauende Darstellung webbasierter Fachsprachen entwickelt wird, die anschließend durch eine webbasierte Schnittstelle (mittels PHP und MySQL) für Benutzer zugänglich gemacht werden soll. Durch die Projektarbeit soll eine Brücke zwischen dem texttechnologischen Wissen und seiner praktischen Anwendung geschlagen werden. Das Projektseminar bietet einen Einstieg in die praktische Linguistik, indem den Studierenden die Möglichkeit gegeben wird, eine praxisorientierte texttechnologische Aufgabe in Gruppenarbeit zu bewältigen.

Das Projektseminar ist in eine Folge von teils aufeinander aufbauenden Teilprojekten gegliedert. Dabei sollen weitestgehend bereits existierende Tools zur Bewältigung der Aufgaben wiederverwendet werden. Dazu ist jeweils eine eingehende Tool-Recherche notwendig sowie Programmierarbeit zur Aufbereitung der Daten. Programmierarbeit erfordert ferner die Berechnung statistischer Maße. Als Programmiersprachen kommt neben Java (und wahlweise auch C++) PHP zur Programmierung der webbasierten Schnittstelle zum Einsatz. Die Teilaufgaben gliedern sich im Einzelnen wie folgt:

  1. Erstellung fachspezifischer Korpora als Startpunkt des Erstellungsprozesses (geringe Vorkenntnisse erforderlich): - Auswahl und Download relevanter Websites - Vereinheitlichung der Zeichencodierung
  2. Aufbereitung der Korpora (Tokenisierung, Lemmatisierung) (Programmierarbeit für Formatanpassungen und Konvertierungen): - Recherche und Einbindung existierender Programme zur Tokenisierung und Lemmatisierung des Rohkorpus
  3. Selektion der fachspezifischen Termini (Programmieraufwand zur Berechnung von Maßen aus der Statistik): - Recherche und Einbindung geeigneter Tools und Methoden - Möglicher Ansatz: Wortverteilungen/Inverse Dokumentfrequenz:
  4. Berechnung der Kookkurrenzen und Annotation der Daten (Anpassung der Datenformate, evtl. Berechnung von Maßen): - Einbindung existierender Tools soweit möglich - Anpassung der Datenformate
  5. Modellierung einer relationalen Datenbank zur Repräsentation der Daten (DB- und SQL-Kenntnisse von Vorteil): - Modellierung einer Datenbank für Repräsentation der Lexika - Ansprechpartner für andere Projekte zur DB-Anbindung
  6. Visualisierung (PHP/Html ¿ Kenntnisse im Zusammenhang mit SQL): - Programmierung einer PHP-basierten Webschnittstelle zur Verfügbarmachung und Visualisierung der Daten

In der ersten Sitzung findet eine Einführung in die Programmiersprache Java statt, in der alle nötigen Grundlagen für die einzelnen Projekte vermittelt werden. Programmierkenntnisse für die Projektarbeit sind nicht zwingend erforderlich. Alle Projektgruppen werden an die Thematik zur Bearbeitung und Lösung der Projektaufgaben herangeführt.

Für den Erwerb eines Leistungsnachweises ist neben der aktiven Teilnahme das erfolgreiche Bearbeiten eines Teilprojekts (in Einzel- oder Gruppenarbeit) nebst zugehöriger Dokumentation erforderlich. Seminarunterlagen und Seminarplan werden in Stud.IP bereit gestellt.

 
Link: eKVV: http://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=3672588 StudIP: https://elearning.uni-bielefeld.de/studip/  
Last Update: 04.07.2010
Template by Boris Kaiser