Was ist Kulturinformatik? Kulturwissenschaften Kulturinformatik in

Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Otto-Friedrich-Universität Bamberg
Teil 1
Die Vorlesung im Kontext der Kulturinformatik
Digitale Bibliotheken
Information und Wissen
Teil 2
Information communities
Prof. Dr. Christoph Schlieder
18. Oktober 2005 – Vorlesung 1
Teil 3
Wissen
Schlieder: Digitale Bibliotheken
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Was ist Kulturinformatik?
Kulturwissenschaften
Kulturinformatik
` Angewandte Informatik der
Kulturwissenschaften
` Kurzform für
„kulturwissenschaftliche
Informatik“
` Ähnlich wie Bioinformatik für
biowissenschaftliche
Informatik steht
… im Plural
Kulturinformatik?
Minerva: robot museum guide
Schlieder: Digitale Bibliotheken
Seite 01-3
` 'Kulturwissenschaften'
befassen sich "mit Kultur als
dem Inbegriff aller
menschlichen Arbeit und
Lebensformen,
einschließlich
naturwissenschaftlicher
Entwicklungen"
` Frühwald, Jauß, Koselleck,
Mittelstraß, Steinwachs
(1991)
` Semantische
Infomationsverarbeitung
Ansätze
` Bedeutung aus Struktur
` Bedetung aus Kontext
` Bedeutung aus Verhalten
Einige Kulturwissenschaften
Seite 01-4
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Technologien
Digitale Bibliotheken
Geoinformatik
Mobile Computing
` Text- und Bildarchive
` Content Management
` Fokus auf geschichtswiss.
Anwendungen
Semantische Analyse
` „Inhalt“,„Bedeutung“
automatisch erschließen
Archäologie
Vor- und Frühgeschichte
Geschichte
Kunstgeschichte
Denkmalpflege
Bauforschung
Volkskunde
Ethnologie
Pädagogik
(Kultur)geographie
…
Schlieder: Digitale Bibliotheken
Kulturinformatik in Bamberg
Methodischer Zugang
Seite 01-2
Semantische
Informationsverarbeitung
Digitale Bibliotheken
Content Management
Schlieder: Digitale Bibliotheken
Prof. C. Schlieder, Universität Bamberg
Wintersemester 2005-06
Seite 01-5
GIS Science
` Geoinformationssysteme
` Mobile Computing
` Fokus auf geowiss.
Anwendungen
Schlieder: Digitale Bibliotheken
Visualisierung einer Website
Internet Cartographer (Inventix)
Seite 01-6
Digitale Bibliotheken
Vorlesung 01 - 1
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Bachelor Angewandte Informatik
Lehrveranstaltung
ECTS
Prüfung
Termin
KuIn-1: Semantische
Informationsverarbeitung
6
1,5 h
schriftlich
WS
WPF Diplom
Lehrveranstaltung
SWS
LVA
TPL
TE
a
Kulturinformatik I: Semantische
Informationsverarbeitung
4
V/Ü
1,5
WS
4
V/Ü
1,5
SS
1,5
WS
KuIn-2:
Geoinformationssysteme
6
1,5 h
schriftlich
SS
b
Kulturinformatik II:
Geoinformationssysteme
KuIn-3:
Digitale Bibliotheken I
3
1h
schriftlich
WS
c
Kulturinformatik III:
Digitale Bibliotheken
4
V/Ü
KuIn-4:
Praktikum Digitale Bibliotheken
3
15 m
mündlich
WS
d
Hauptseminar Kulturinformatik
wechselnde Themen – freiwillig
(2)
HS
Σ
Der Wahlpflichtbereich umfasst 42 ECTS. Aus dem Fach
Kulturinformatik stammen min. 6 und max. 18 ECTS.
Schlieder: Digitale Bibliotheken
Seite 01-7
12
4,5
Schlieder: Digitale Bibliotheken
Seite 01-8
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
NF Magister
Literaturempfehlung
Lehrveranstaltung
SWS
LVA
TPL
TE
a
Kulturinformatik I: Semantische
Informationsverarbeitung
4
V/Ü
Klausur
WS
b
Kulturinformatik II:
Geoinformationssysteme
4
V/Ü
Klausur
SS
c
Kulturinformatik III:
Digitale Bibliotheken
4
V/Ü
Klausur
WS
d
Kulturinformatik IV:
Bild- und Sprachverarbeitung
4
V/Ü
Klausur
SS
e
Hauptseminar Kulturinformatik
wechselnde Themen – freiwillig
2
HS
Schein
WS/
SS
Σ
SS
18
Schlieder: Digitale Bibliotheken
Seite 01-9
Lehrbuch
` Arms, W. (2000)
` Digital Libraries
` Cambridge, MA: MIT Press
ISBN 0-262011-80-8
` Online-Ausgabe unter
www.cs.cornell.edu/
wya/DigLib/
Inhaltliche Abdeckung
` Guter Ausgangspunkt für
Rechercheaufgaben in den
Übungen
Schlieder: Digitale Bibliotheken
Seite 01-10
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Teil I: Anforderungen und Funktionen
Teil II: Dokumente und Inhalte
V1
Information und Wissen
V6
Textdokumente und E-Bücher
V2
Architektur digitaler Bibliotheken
V7
Videoarchivierung
V3
Archivierung und Indexierung
V8
Grafikdokumente
V4
Suchfunktionen
V9
Struktur und Semantik
V5
Nutzung digitaler Bibliotheken
V10
Metadaten
Schlieder: Digitale Bibliotheken
Prof. C. Schlieder, Universität Bamberg
Wintersemester 2005-06
Seite 01-11
Schlieder: Digitale Bibliotheken
Seite 01-12
Digitale Bibliotheken
Vorlesung 01 - 2
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Teil III: Semantik und Kommunikation
V11
Topic Maps
V12
Semantische Modellierung
V13
Webkommunikation
V14
Semantic Web
V15
Zukunft digitaler Inhalte
Teil 1
Die Vorlesung im Kontext der Kulturinformatik
Teil 2
Information communities
Teil 3
Wissen
Schlieder: Digitale Bibliotheken
Seite 01-13
Schlieder: Digitale Bibliotheken
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Digitale Bibliothek
Vorläufige Definition
` In Anlehnung an Arms
(2000) Formulierung von
der „managed collection“
` eine zielorientiert geführte
Sammlung von Information
Folgefragen
Seite 01-14
Praxisbeispiel
An informal definition of a digital
library is a managed collection of
information, with associated
services, where the information is
stored in digital formats and
accessible over a network.
Digitales Dombauarchiv
` IT-Unterstützung für das
Monitoring umweltrelevanter
Gebäudeschäden
` Vor Ort dokumentieren, im
Archivkontext auswerten
Anforderungen
Arms (2000)
` Was gilt als Informationssammlung? Antwort in
dieser Vorlesung
` Orientierung an welchen
Zielen? siehe Vorlesung 2
` Integration von Information
Communities: Dombauhütte,
Hochbauamt, Denkmalpflege,
Kunstgeschichte, …
St. Stephan, Passau
Schlieder: Digitale Bibliotheken
Seite 01-15
Schlieder: Digitale Bibliotheken
Seite 01-16
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Digitales Dombauarchiv
Zwei komplementäre Systeme
Denkmalpflege
` Vor Ort dokumentieren, im
Archivkontext auswerten
Mobile
Mapping
System
Mobile Kartierung
` Schadenskartierung durch
unterschiedliche Personen,
wobei Teile mehrfach erfasst
werden
` Steinmetze, Denkmalpfleger
und Kunsthistoriker sammeln
unterschiedliche Information.
Geometrie- und
Sachdaten erfassen
?
Auswertung
von Karten
Schlieder: Digitale Bibliotheken
Prof. C. Schlieder, Universität Bamberg
Wintersemester 2005-06
Digital
Archive
System
Seite 01-17
Kartierungsglossar
Schlieder: Digitale Bibliotheken
Erzeugen von
Metadaten
Semantische
Suche
Seite 01-18
Digitale Bibliotheken
Vorlesung 01 - 3
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Flexible Datenmodellierung
Technologiegenerationen
Kartierungsglossare
` verschiedene
Fachterminologien zur
Erfassung von Sachdaten
können modelliert werden
International Committee for
Documentation of the International
Council of Museums (ICOM-CIDOC)
Raumbezugssysteme
1994
2002
?
` Raumbezugssysteme
verschiedener Genauigkeit
können verwendet werden
Relationales Modell
Objekt-orientiertes Modell
Formal-ontologisches Modell
Kartierungsglossar
Schlieder: Digitale Bibliotheken
Seite 01-19
` Textdokumente:
Volltextsuche
` Rasterdokumente:
merkmalsbasierte Bildsuche
` Vektordokumente:
geometrische Suche
Semantische Suche
` Generalisierung,
Spezialisierung und
Assoziation von Konzepten
Seite 01-20
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Suche in Textdaten
Information Retrieval
Schlieder: Digitale Bibliotheken
Suche in Nicht-Textdaten
Anfrage
` Finde Dokumente, die
relevant sind bezüglich
Krustenbildung @
Westfassade
` Allgemeine Struktur
concept @ location
` Semantische Transformation, z.B. Spezialisierung:
Sinterschicht @
Westturmfassade
Beispiel
` Testfläche für eine
Konservierungsmaßnahme
auswählen.
` Drei benachbarte Steine
(A, B, C), die alle bereits
ergänzt wurden (D, E, F)
und die alle durch eine
chemische Erosionsfläche
(G) betroffen sind
F
A
G
AB
E
C
D
Konfiguration von 7 Objekten
Schlieder: Digitale Bibliotheken
Seite 01-21
Schlieder: Digitale Bibliotheken
Seite 01-22
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Fachwissenschaftliche Konzepte
Begriffliche Klassifikation
Konzept
` Einfachste Form der
Regularität ist die
begriffliche Klassifikation
` Begriffe werden der
Informatik häufig als
Konzepte bezeichnet von
engl. concept
Instanz
` Konzepte sind als Menge
von Instanzen definiert
` Begriff C ` X
X Menge aller Phänomene
C “Sinterbildung”
Schlieder: Digitale Bibliotheken
Prof. C. Schlieder, Universität Bamberg
Wintersemester 2005-06
Sinterbildung
Sonderbaufläche
Phänomene
positive Beispiele
negative Beispiele
Seite 01-23
Flächennutzungsplan
www.bamberg.de/stadtplanungsamt/
Schlieder: Digitale Bibliotheken
Kartographische
Signaturen
Fachwissenschaftliches
Konzept
Seite 01-24
Digitale Bibliotheken
Vorlesung 01 - 4
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Information communities
Zwei komplementäre Ansätze
Landwirtschaft
Modellieren
` Brache: Fläche, auf der
keine oder nur bestimmte
Arten angebaut werden
` Was Wissen darstellt, d.h.
welches die relevanten
Regularitäten sind, wird
explizit modelliert.
` Mitwirkung von Experten
des Anwendungsbereichs
` Methoden aus der
Wissensrepräsentation
` KI-1 Teil II
Naturschutz
` Brache: Fläche, die aus
der landwirtschaftlichen
Nutzung genommen ist
ATKIS
` Brachland: „Flächen, die
seit längerem nicht mehr
nach ihrer ursprünglichen
Zweckbestimmung genutzt
werden.“
Schlieder: Digitale Bibliotheken
Seite 01-25
` Begriffe haben in
verschiedenen Information
Communities verschiedene
Bedeutung.
` Wissen, d.h. Regularitäten,
die sich bei der Problemlösung bewähren, wird
automatisch erzeugt.
` Regularitäten sind Experten
oft unbekannt (data mining)
` Methoden des maschinellen
Lernens
` KI-1 Teil III
Schlieder: Digitale Bibliotheken
Seite 01-26
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
B Kurz gefragt ^
Grundproblem
Lernen
Bibliographische Antwort
Dokumente
` Gibt es zumindest für die
Informationsobjekte im
Digitalen Dombauarchiv
(oder Stadtplanungsamt)
ein übergreifendes
Verständnis?
` Anders gefragt:
Was sind Dokumente?
Dokument
` Das prototypische
Dokument in Bibliotheken
ist die Monographie
` Aus der bibliographischen
Erfassung ergibt sich, was
die Identität einer
Monographie ausmacht
IFLA
International Federation of
Library Associations and Institutions
` seit 1927 als Internationaler
Verband Bibliothekarischer
Vereine tätig (www.ifla.org)
Schlieder: Digitale Bibliotheken
Seite 01-27
` Austausch bibliographischer
Daten, um eine mehrfache
Katalogisierung zu
vermeiden
Aktivitäten der IFLA
` 1973-2003 UBCIM:
Universal Bibliographic
Control and International
MARC
` seit 2003 ICABS:
IFLA - CDNL Alliance for
Bibliographic Standards
Seite 01-28
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Katalogisierung
Shared Cataloguing
Schlieder: Digitale Bibliotheken
Bibliographic Records
&245 Campus strategies for libraries
and electronic information/Caroline
Arms, editor.
&260 {Bedford, Mass.} : Digital Press,
c1990.
&300 xi, 404 p. : ill. ; 24 cm.
&440 EDUCOM strategies series on
information technology
&504 Includes bibliographical
references (p. {373}-381).
&020 ISBN 1-55558-036-X : $34.95
Modellierung
` IFLA study group (1998)
Functional Requirements for
Bibliographic Records
` Untersucht bibliographische
Praxis mit der ER-Analysemethode aus der Datenmodellierung
` www.ifla.org/VII/s13/frbr/
frbr.pdf
The aim of this study was to produce
a framework that would provide a
clear, precisely stated, and commonly
shared understanding of what it is that
the bibliographic record aims to
provide information about
IFLA study group (1998)
MARC Austauschformat (Auschnitt)
nach Arms (2000)
Schlieder: Digitale Bibliotheken
Prof. C. Schlieder, Universität Bamberg
Wintersemester 2005-06
Seite 01-29
Schlieder: Digitale Bibliotheken
Seite 01-30
Digitale Bibliotheken
Vorlesung 01 - 5
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Ontologisches Modellieren
Semi-formale Ontologie
` Die FRBR (Functional
Requirements for
Bibliographic Records)
sind eine ontologische
Modellierung, wenngleich
mit einfachen Mitteln
Bibliographische Ontologie
An ontology is an explicit account
of a shared understanding.
Uschold & Gruninger (1996)
Allgemeine Struktur
Gruppe 2
Gruppe 1
Gruppe 3
` Konzepte zur Beschreibung
von bibliographischen Daten
werden unterteilt in drei
Gruppen
` Beschreibung von Inhalten
und deren Form.
` work, expression,
manifestation, item
Formale Ontologie
` Präzisiert Fachterminologien z.B. mit Beschreibungslogiken
` KI-1 Vorlesung 8 und 9
Ontologische Modellierung
Schlieder: Digitale Bibliotheken
Seite 01-31
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Beispiele
1
realized
through
n
1
content
work
expression
manifestation
exemplified
by
n
item
n
embodied
in
n
w1 Henry Gray’s Anatomy of
the human body
e1 text and illustrations for
the first edition
e2 text and illustrations for
the second edition
e3 text and illustrations for
the third edition
IFLA Functional Requirements
for Bibliographic Records
Seite 01-33
w1 J. S. Bach’s The art of the
fugue
e1 the composer’s score for
organ
e2 an arrangement for
chamber orchestra by
Anthony Lewis
w1 Jules et Jim motion picture
e1 the original French
language version
e2 the original with English
subtitles added
form
Schlieder: Digitale Bibliotheken
Seite 01-34
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
work vs. expression
` Unterscheiden zwischen der
geistigen Schöpfung (work)
und den verschiedenen
Textfassungen (expression)
Seite 01-32
Kultur-, Geschichts- und Geowissenschaften
Schlieder: Digitale Bibliotheken
Modellierungsziel
` Beschreibung von Kontext
` concept, object, event,
place
Schlieder: Digitale Bibliotheken
Inhalt vs. Form
The entities defined as work
(a distinct intellectual or artistic
creation) and
expression (the intellectual or
artistic realization of a work)
reflect intellectual or artistic
content.
The entities defined as
manifestation (the physical
embodiment of an expression of
a work) and
item (a single exemplar of a
manifestation), on the other
hand, reflect physical form.
` Beschreibung der für Inhalte
Verantwortlichen
` person, corporate body
Inhalt digitaler Bibliotheken
Anwendung
` Häufig ist bei Übersetzungen nicht bekannt, auf
welche Textfassung sie sich
beziehen
` Ein Verweis auf work ist
möglich, nicht aber auf
expression
Dokumente
` Es hat sich noch keine Bezeichnung für die in digitalen Bibliotheken verfügbar
gehaltenen Informationseinheiten etabliert
` Statt item wie in den FRBR
der IFLA heißt es u.a. auch
document, digital material,
library object
Several digital library
researchers have attempted to
define a general hierarchy of
terms that can be applied to all
works and library objects.
This is a bold and useful
objective, but fraught with
difficulties.
Arms (2000)
Schlieder: Digitale Bibliotheken
Prof. C. Schlieder, Universität Bamberg
Wintersemester 2005-06
Seite 01-35
Schlieder: Digitale Bibliotheken
Seite 01-36
Digitale Bibliotheken
Vorlesung 01 - 6
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Inhalt digitaler Bibliotheken (2)
Content
` Sichtweise der
Medienproduktion
` Media asset: Material wie
Bilder, Texte, Videoclips,
das publiziert werden kann
` Creative content: Werk,
d.h. urheberrechtlich
geschütztes Material
Verwandte Technologien
Querverbindungen
Inhalt
` Content management
Knowledge management
Digital library
Information retrieval (IR)
Document management“
Semantic web
Kulturinformatik
Wissen
Information
Web-visibility
Daten
Text
Meaning
Bild
Ton
Medium
Medieninformatik
` Sichtweise der
Semantischen IT
Schlieder: Digitale Bibliotheken
Seite 01-37
` Anzahl der Treffer einer
Google-Suche im Oktober
2003 zu Stichworten aus
dem Umfeld „Digital
Libraries“
Content
Management
6,4 Mio
Knowledge
Management
4,3 Mio
IR
1,9 Mio
Digital
Library
2,7 Mio
0,9
1,2
Schlieder: Digitale Bibliotheken
Semantic
Web
Document
Management
Seite 01-38
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Co-Visibilität im Web
Co-Visibilität im Web
Oktober 2004
Oktober 2004
Schlieder: Digitale Bibliotheken
Seite 01-39
Schlieder: Digitale Bibliotheken
Seite 01-40
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Co-Visibilität im Web
Co-Visibilität im Web
Oktober 2004
Oktober 2005
Schlieder: Digitale Bibliotheken
Prof. C. Schlieder, Universität Bamberg
Wintersemester 2005-06
Seite 01-41
Schlieder: Digitale Bibliotheken
Seite 01-42
Digitale Bibliotheken
Vorlesung 01 - 7
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Co-Visibilität im Web
Teil 1
Die Vorlesung im Kontext der Kulturinformatik
Teil 2
Information communities
Teil 3
Wissen
Oktober 2005
Schlieder: Digitale Bibliotheken
Seite 01-43
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Genügen Bits?
Grenzen des Informationsbegriffs
Wahrheitswert
1 Bit
falsch
Der Sonnenschirm
ist rot-weiß
gestreift.
Text
1 kByte
Bild
1 MByte
Schlieder: Digitale Bibliotheken
Seite 01-45
` Eine Regularität, eine
formale Struktur, die S auf
kompakte Weise beschreibt
` z.B. Entscheidungsbaum
` Der Informationsbegriff der
Informationstheorie
beschreibt Speicherbedarf
` Dieser an der Struktur (bzw.
Syntax) orientierte Begriff
von Information darf nicht
mit dem in Alltag und
Wissenschaft häufiger
verwendeten semantischen
Informationsbegriff
verwechselt werden
Es wird wohl noch ein Jahrhundert
Grundlagenforschung zu leisten
sein bis wir eine Theorie der
Information haben, die unserem
Alltagsbegriff entspricht.
Nievergelt, J. (2003). Informatik
zwischen Vision und Illusion.
Informatik Spektrum, 26, 402-405
Schlieder: Digitale Bibliotheken
Seite 01-46
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Daten
Muster (= Information)
Speicherbedarf
Kultur-, Geschichts- und Geowissenschaften
Information als Regularität
` Eine Menge von
Sachverhalten S
` z.B. positive
Trainingsbeispiele für
Lernalgorithmus
Seite 01-44
Kultur-, Geschichts- und Geowissenschaften
Informationsparadox
` Der in Bit gemessene
Informationsgehalt eines
Bildes ist höher als der
eines Textes, der
wesentliche Bildinhalte
beschreibt
` Dieser Informationsgehalt
ist wiederum höher als das
eine Bit, das benötigt wird,
um festzuhalten, ob
Aussage des Textes wahr
oder falsch ist.
Schlieder: Digitale Bibliotheken
Daten, Information, Wissen
Information
outlook
sunny
cloudy
rain
humidity
+
wind
high
normal
strong
weak
–
+
–
+
Schlieder: Digitale Bibliotheken
Prof. C. Schlieder, Universität Bamberg
Wintersemester 2005-06
Seite 01-47
` Eine Regularität (eine
formale Struktur), die eine
Menge von Sachverhalten
auf kompakte Weise
beschreibt
Wissen
` Eine Regularität, die
interessant ist, d.h. folgende
Merkmale besitzt
Schlieder: Digitale Bibliotheken
Interessante
Information
` Validität: generalisiert über
die Trainingsmenge hinaus
` Neuheit: durch bekannte
Muster nicht abgedeckt
` Nützlichkeit: für Handlungen
mit hohem Nutzen relevant
` Verständlichkeit: begreiflich
für Entscheidungsträger
Seite 01-48
Digitale Bibliotheken
Vorlesung 01 - 8
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Schritt 1: Nicht-lineares Lesen
Kommunikation
www.digiville.com/gazette/ TNelson/
Hypertext
Schritt 2: Jeder publiziert
` Xanadu: ein weltweites Netz
von sich gegenseitig
referenzierenden Texten:
` Ted Nelson prägt den
Begriff Hypertext für eine
nicht-lineare Verknüpfung
von Texten
` Many-to-many
Massenkommunikation
` Akteure publizieren
Nachrichten „to whom it
may concern“
Skalierungsproblem
` Very large-scale process:
> 100 million messages
` Einfache technische
Koordinationsmechanismen
(black-board architecture)
funktionieren nicht mehr.
ComputerLib
` Nelson (1979). Computer
Lib and Dream machines
Schlieder: Digitale Bibliotheken
Seite 01-49
Schlieder: Digitale Bibliotheken
Usenet discussion groups
www.computer-museum.ru/images/ histsoft/
` Vannevar Bush (1945).
As we may think.
Atlantic Monthly 176
` www.csi.uottawa.ca/~dduchi
er/misc/vbush/awmt.html
Schlieder: Digitale Bibliotheken
Seite 01-51
Schlieder: Digitale Bibliotheken
` Google begann im August
2000 mit der Archivierung
Seite 01-52
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Usenet Discussion Groups
Persistenz
Seite 01-50
Lehrstuhl für Angewandte Informatik in den
Technische Lösung?
` 700 Mio Nachrichten
` 150 Mio pro Jahr (2001)
` Relation zw. Nachrichten
` message
— reference →
message
Kultur-, Geschichts- und Geowissenschaften
` „publication has been
extended far beyond our
present ability to make real
use of the record“
Umfang
Publizieren
Lehrstuhl für Angewandte Informatik in den
Selektionsproblem
` Begonnen 1979 und durch
alle Technologiegenerationen fortgesetzt (Usenet,
Internet, WWW)
` Relation zwischen Akteuren
` sender
— message →
receiver
Kultur-, Geschichts- und Geowissenschaften
Komplexität von Kommunikation
Geschichte
Senden
Selektionsproblem
Publizieren
Erste Erwähnung
May1981
Mar 1982
Apr 1982
Feb 1983
Jul 1983
Jan 1985
Oct 1991
Aug 1991
Mar 1993
Mar 1998
Schlieder: Digitale Bibliotheken
Prof. C. Schlieder, Universität Bamberg
Wintersemester 2005-06
Microsoft
MTV
Sun Microsystems
Fax machine
Madonna
Y2K problem
Linux
WWW
Mosaic
Google
Seite 01-53
` Jemandem ist ein Argument
gegen den göttlichen
Ursprung der Schöpfung
eingefallen, das er anderen
mitteilen möchte.
Discussion group
` Unter 100.000 Usenet
discussion groups wählt er
alt.agnosticism als den
besten Platz für die
Veröffentlichung seines
Arguments
Schlieder: Digitale Bibliotheken
Discussion thread
` Er muss nun entscheiden,
zu welchem der 69.000
Threads er beiträgt
` Seine Wahl fällt auf “15
Answers to Creationist
Nonsense” mit mehr als
1.000 Nachrichten
Message
` Die Nachricht wird als
Kommentar zu Sverker
Johansson Nachricht
veröffentlicht
Seite 01-54
Digitale Bibliotheken
Vorlesung 01 - 9
Lehrstuhl für Angewandte Informatik in den
Lehrstuhl für Angewandte Informatik in den
Kultur-, Geschichts- und Geowissenschaften
Kultur-, Geschichts- und Geowissenschaften
Qualitätsproblem
B Kurz gefragt ^
Digitale Bibliothek
` Zu den Zielen digitaler wie
herkömmlicher Bibliotheken
gehört die
Qualitätssicherung.
` In dieser Hinsicht
unterscheidet sich das Web
erheblich von beiden.
Qualität
www.sfn.unimuenchen.de/
hexenverfolgung
www.
kirchenopfer.
de
Schlieder: Digitale Bibliotheken
Prof. C. Schlieder, Universität Bamberg
Wintersemester 2005-06
Seite 01-55
` Wie funktioniert
Qualitätssicherung in der
wissenschaftlichen
Literatur?
` Welche Rolle spielen die
refereed journals in diesem
Prozess?
` Arms, W. (2002).
Quality control in scholarly
publication on the web,
The Journal of Electronic
Publishing, 8, Issue 1
Schlieder: Digitale Bibliotheken
Pre-publication server
arXiv.org
Seite 01-56
Digitale Bibliotheken
Vorlesung 01 - 10