Projekt II Projektbeschreibung - Lehrstuhl für Wirtschaftsinformatik

Friedrich-Schiller-Universität Jena · Postfach · 07737 Jena
Wirtschaftswissenschaftliche Fakultät
Lehrstuhl
für Wirtschaftsinformatik
Carl-Zeiss-Strasse 3
D-07743 Jena
Univ.-Prof.
Dr. Johannes Ruhland
Telefon: 0 36 41/94 33 10
Telefax: 0 36 41/94 33 12
E-Mail: J.Ruhland@wiwi.
uni-jena.de
Jena, 05.10.2015
Projekt II: „Sportverband“
Projektbeschreibung
Die Lahman Baseball Datenbank ist eine der umfangreichsten öffentlich zugänglichen
Sportdatenbanken weltweit. Sie enthält Spielstatistiken und Mannschaftsinformationen der USamerikanischen Baseballligen aus den Jahren 1871-2012. Die Aufgabe Ihres Teams ist die
Administration der Datenbank für den amerikanischen Baseball-Verband Major League Baseball
(MLB). Die MLB verbindet vielfältige Interessen mit der Betreuung und Pflege der Datenbank.
Neben historischen und aktuellen Spielstatistiken sollen auch Informationen zu Mannschaften,
Spielern und Managern bereitgehalten werden.
1. Datenbankentwurf
1.1.
ERD-Modellierung
Die Baseball-Datenbank besteht aus zahlreichen Tabellen mit vielen Spalten. Dies macht es
sowohl für Administratoren als auch für Endanwender schwer. Deshalb ist es wichtig, eine
übersichtliche Darstellung in Form eines Datenbankentwurfs (ERD) bereitzustellen.
Erstellen Sie mithilfe eines Visualisierungsprogramms (z. B. Dia) ein Entity-RelationshipDiagramm, das die Tabellen der Datenbank möglichst treffend abbildet. Beachten Sie dabei
folgende Schritte:
• Identifizierung von Entitäts- und Beziehungstypen
• Festlegung der Kardinalitäten
1.2.
Datenbankschema
Der Baseballverband möchte in Zukunft auch Informationen zu Baseball-Stadien, Spielen und
Schiedsrichtern erfassen. Welche Spalten sind für die Tabellen relevant? Welche Beziehungen
bestehen zwischen den Tabellen. Legen Sie für Spaltenwerte Datentypen und ggf. Primär- oder
Fremdschlüsseleigenschaften fest. Erstellen Sie die spezifizierten Tabellen in der Datenbank
eines Ihrer Teammitglieder („dbub##“) (ggf. mit Beispieldaten).
1.3.
Schwächen der Datenmodellierung
Weist die Lahman Baseball Datenbank Modellierungsschwächen auf? Wenn ja, welche?
2. SQL-Abfragen
Der Baseball-Verband (MLB) hat verschiedene Fragen an die Datenbank. Loggen Sie sich auf
dem Datenbankserver ein und führen Sie auf der „Baseball-Datenbank“ folgende SQL-Befehle
durch.
2.1. Spieler, Manager, Teams
• Liste aller Teams, die jemals Ligasieger waren
• Franchisenamen aller aktiven Teams
• Vor-, Nach- und Spitzname aller lebenden Spieler
• Anzahl der Siege aller aktiven Chicagoer Teams in Spielserien
• Welche Spieler haben nicht in einer College-Mannschaft gespielt?
• Durchschnittliche Verweildauern von Spielern an den verschiedenen Colleges
• Die 10 Vereine mit den größten Gehaltsunterschieden im Jahr 1990
• Lassen Sie sich eine Liste aller aktiven Spieler ausgeben, die angibt, ob Spieler im
letzten Jahr „selten“ (unterdurchschnittliche Anzahl an Spieleinsätzen) oder „häufig“
(durchschnittliche bis überdurchschnittliche Anzahl an Spieleinsätzen) gespielt haben
• Liste aller Spieler und die von ihnen gewonnenen Preise (playerID und awardID)
• Welche Spieler haben im kommenden Monat Geburtstag?
• Wie müssten Sie den Befehl ändern, wenn Sie die Abfrage dauerhaft bereitstellen
wollen?
2.2 Spielstatistik
• Ermitteln Sie die durchschnittliche „Dominance Rate“ (Strikeouts pro Spiel) für jeden
Pitcher
• Ermitteln Sie die „Batting Average“ (Hits / at bat) für jeden Batter der New York Yankees
in den Jahren 2000 – 2012
• Welches Team hat seit dem Jahr 2000 die meisten Spiele gewonnen?
2.3 eigene Kennzahlen
Überlegen Sie sich mindestens 3 weitere spielstatistische Kennzahlen, die für die Mitglieder des
Baseball-Verbandes relevant sein könnten. Formulieren Sie passende SQL-Abfragen!
3. Präsentation und Verwaltung von Datenbankinformationen
Bearbeiten Sie eine der beiden Teilaufgaben (entweder A oder B).
A. Excel
Stellen Sie in Excel eine Verbindung zum MSSQL Server her und importieren Sie Daten der
„Baseball-Datenbank“. Erstellen Sie verschiedene (Pivot)-Tabellen und Grafiken, die Aufschluss
über die Performance von Spielern, Teams und Colleges geben.
B. Weboberfläche
Erstellen Sie eine Weboberfläche mit Datenbankanbindung, die für die Administration und
Präsentation der Daten geeignet ist.
4. Daten- und Wissensmanagement
Der Verbandschef der Major Baseball League möchte die Mittel für die Betreuung und Pflege der
Datenbank kürzen, da er Zweifel an ihrem Mehrwert hegt. Welche Argumente führen Sie an, um
die Wichtigkeit der Datenbank zu unterstreichen? In welchen Bereichen ist Sie dem Verband von
Nutzen?
Schicken Sie Ihre Ergebnisse bis zum 31.01.2015 an [email protected]. Die Lösung sollte
folgende Bestandteile enthalten:
• ERD-Diagramm
• SQL-Befehle für die Erstellung der Tabellen
• SQL-Befehle für die Abfrage der Datenbank
• Excel-File mit Auswertungen oder Dateien für die Weboberfläche
Viel Erfolg!
Quellen
http://www.seanlahman.com
http://mlb.mlb.com