Korpuslinguistik und Excel

Videoserie zum kompletten Ablauf eines empirischen Forschungsprojekts basierend auf den BYU-Corpora.

Videos entstanden im Rahmen des Seminars „Digital Data in English Linguistics“ am Department of English and Linguistics der JGU Mainz in Kooperation mit dem Institut für England- und Amerikastudien der Goethe Universität Frankfurt. Gefördert durch das Gutenberg Lehrkolleg der Johannes Gutenberg-Universität Mainz. Begleitet durch das Zentrum für Audiovisuelle Produktion, Mainz.

Überblick über unsere Korpus-Videos

Video 0 gibt einen Überblick über die Video-Reihe.
 

1. BYU-Korpus-Suchsyntax

In diesem Video lernen wir die BYU Korpora kennen und wie man einfache Suchen darin vornimmt.
 

2. Suche nach Mehrwortsequenzen in den BYU-Korpora

Dieser Screencast zeigt, wie man aus Beispielen ableitet, wie eine Konstruktion aufgebaut ist und daraus schlussfolgert, nach was man im Korpus suchen muss. Das Video zeigt auch, wie man einen Suchbefehl so formuliert, dass man keine relevanten Tokens „verpasst“, aber auch so, dass man nicht zu viel Rauschen miterfasst.
 

3. Arbeiten mit den BYU-Korpora — Einstellungen unter „Sections“ und „Options“

Dieser Screencast zeigt folgendes zu den Einstellungsmöglichkeiten der BYU-Korpora:

Sections

  • ein Subkorpus auswählen
  • mehrere Subkorpora auswählen
  • mehrere Subkategorien auswählen, die sich gegenseitig bedingen

Options

  • Wie überprüfe ich, ob ich genug Hits habe anzeigen lassen?
  • Unterschied zwischen „Group by Words“ und „Group by Lemma“

 

4. Einstellungen in den BYU-Korpora - Display Options

Dieser Screencast zeigt, für welche linguistischen Fragestellungen sich die Anzeigeoptionen „List“, „Chart“ und „Compare“ der BYU-Korpora eignen und auf was wir achten sollten.
 

5. Daten aus den BYU-Korpora in Excel importieren

Dieser Screencast zeigt:

Copy und Paste direkt in Excel

  • Bei welchen Daten funktioniert copy und paste?

Zwischenschritt über einen Editor

  • Welche Software ist geeignet?
  • Unsichtbare Zeichen anzeigen lassen
  • Kodierung einstellen oder überprüfen

Daten öffnen in Excel

  • Kodierung einstellen
  • Trennzeichen einstellen
  • Dezimaltrennzeichen einstellen

 

6. Aufbau von Tabellen in Excel

Dieser Screencast zeigt:

Aufbau von Tabellen in Microsoft Excel

  • Das eine-Zeile-ein-Datenpunkt-Prinzip

Formatierung von Tabellen

  • Transponieren
  • Spalten linksbündig/rechtsbündig formatieren
  • Spalten löschen
  • Spalten an eine andere Stelle kopieren

Daten als Tabelle definieren

  • Unterschied zwischen „Tabelle“ und „Bereich“
  • Spalten zur Tabelle hinzufügen
  • Filterfunktionen/Sortierfunktionen
  • Spalten ausfüllen (auch mit Hilfe von Sortierung)

 

7. Prozentrechnung und Normalisieren

Dieser Screencast zeigt:

Rechnen in Excel

  • Summenberechnung mit „+“ und mit Summenfunktion
  • Bedeutung von . und , im englischen und im deutschen Zahlensystem

Prozentrechnung in Excel

  • Grundprinzip der Prozentrechnung
  • Prozente als Dezimalzahlen
  • Berechnung von Prozenten in Excel
  • Formatierung von Prozenten in Excel

Normalisieren

  • Warum ist normalisieren notwendig?
  • Berechnung in Excel
  • Begriffe: absolut und relativ

 

8. Pivot-Tabellen

Dieser Screencast zeigt:

Voraussetzungen + Erstellung

  • Kurz: Wie muss meine Tabelle beschaffen sein, damit ich darauf basierend eine Pivot-Tabelle erstellen kann?
  • Pivot-Tabelle einfügen

Einstellungen

  • Was bedeuten die 4 Felder im Bedienelement der Pivot-Tabelle?
  • Wie fülle ich die Felder?
  • Praktische Beispiele: Welche Elemente muss ich in die Tabelle aufnehmen, um verschiedene Fragestellungen zu beantworten?

Zahlen

  • Unterschied zwischen „Anzahl“ und „Summe“ bei der Auswertung in Pivot-Tabellen
  • Warum ist es sinnvoller Kategorien in Wörtern zu kodieren als sie als Zahlen zu kodieren?