Fedora – eine Open Source Software für Institutionelle Repositorien

Fedora ist ein Akronym für

  • Flexible
  • Extensible
  • Digital
  • Object and
  • Repository
  • Architecture

Fedora wird von der Cornell University (Ithaca, New York) und der University of Viginia mit finanzieller Unterstützung der Andrew W. Mellon Foundation und der Moore Foundation entwickelt. 2008 wurde die Non-Profit-Organisation  Fedora Commons gegründet mit dem Ziel, nachhaltige Technologien für die Verwaltung, Veröffentlichung und Bewahrung digitaler Inhalte zu entwickeln:

"Fedora Commons is the home of the unique Fedora open source software, a robust integrated repository-centered platform that enables the storage, access and management of virtually any kind of digital content."

Fedora hat den Anspruch ein Software-System zu sein, mit dessen Hilfe sich unterschiedlichste, komplexe Anwendungen wie beispielsweise institutionelle Repositorien, digitale Archive, CMS, digitale Bibliotheken oder Lösungen im Bereich des ePublishings realisieren lassen.

Technische Daten

Aktuelle Version: 3.0
Lizenz:  Educational Community License, Version 2.0, April 2007
Systemplattform und Voraussetzungen: OS Independent;  Java SE Development Kit (JDK) 5.0;  McKoi SQL Database 1.0.3 / MySQL / Oracle 9i / PostgreSQL ; Tomcat 5.5.23;  Apache
 Fedora Installation and Configuration Guide

Fedora-Datenmodell und Architektur

Fedora stellt eher eine Repository-Architektur als ein fertiges System bereit.
Das Fedora Repository ist in seinem Kern komplett objektorientiert. Das zugrunde gelegte Datenmodell nennt sich " Fedora Digital Object Model". Es erlaubt sowohl die Speicherung beliebiger digitaler Objekte (Metadaten + Textdateien, Bilder, Videos, Webseiten etc.), als auch die ausschließliche Speicherung von Objekt-Metadaten.
Ein Fedora-Objekt beschreibt dabei jeweils den Inhalt (Daten u. Metadaten) und die darauf anwendbaren Funktionen und Dienste und besteht aus den drei Teilen:

  1. Objekt-Identifier
  2. System-Eigenschaften
  3. Datenstrom /-ströme
    • Drei reservierte Datenströme
      • DC (Dublin Core): Objektmetadaten
      • AUDIT: Änderungen am Objekt werden dokumentiert
      • RELS-EXT: Relationen zu anderen Objekten werden beschrieben
    • Datenströme für benutzergenerierte Objekte (Dokumente)

Auf die Fedora-Objekte kann über verschiedener Anwendungen zugegriffen werden:

  • mittels Anwendungen auf der Client-Seite
  • durch Webbrowser
  • durch Batch-Programme
  • durch Server Applikationen

Diese Anwendungen wiederum greifen über integrierte APIs ( Application Programming Interface) auf die Repository-Inhalte/Objekte? zu:

  • API-A - Fedora Access Service (SOAP): ACCESS
  • API-A-LITE - Fedora Access Service (REST): SEARCH (Zugang zu den Objekten und Verteilung der Objekte)
  • API-M - Fedora Management Service (SOAP): MANAGE (für die Erstellung und Wartung der Objekte)
  • OAI-PMH Provider Interface

"Generell stellen Benutzer Anfragen an das Repository wie beispielsweise zum Einfügen von Objekten (ingest objects), zum Durchsuchen der Datenbestände des Repository (search repository) oder zum Anzeigen von Objekten (access objects) via Client-Anwendung oder Web Browser. Die Anfragen werden durch Web Services am Frontend des Systems an dessen Kern vermittelt. Das Backend kann ebenfalls aus einer Reihe von  Web Services bestehen, die zusätzliche, selbst-definierbare Funktionen ausführen können, die der Benutzer mit seiner Anfrage angefordert hat. Die verarbeiteten Daten werden, nachdem alle erforderlichen Transformationen durchgeführt sind, als Ergebnis der Anfrage an den Benutzer zurückgesendet. Dies geschieht ebenfalls durch die Web Services am Frontend des Systems." (Onken 2005, 23)

Objektbeziehungen und Ontologien (RDF, RDF-S)

Fedora-Objekte können zueinander auf vielerlei Weise in Beziehung treten:

Fedora-ObjektRelationFedora-Objekt
FotoalbumAistMitgliedVonFotoalbumsammlungZ
AufsatzAistTeilVonSammelwerkZ
DokumentAistRezensionVonAufsatzZ
QuelleAistPrimärtextVonSekundärquelleZ
.........

In der  Fedora Relationship Ontology (einfaches RDF-Schema) ist eine Menge allgemeiner Relationen für die Erstellung eines Fedora-Objekt-Netzwerkes definiert, die bei Bedarf angepasst werden kann. Es besteht jedoch ebenso die Möglichkeit, eine eigene Ontologie für die Beschreibung der Fedora-Objekt-Beziehungen zu definieren.
Als Grundlage der Beschreibung der Objekt-Relationen dient dabei  RDF, eine Auszeichnungssprache für Metadaten. RDF ist ein "Rahmenwerk" zur Beschreibung und zum Austausch von Metadaten und deren Beziehungen und bildet das semantisches Fundament. Ein RDF-Statement (triple) setzt sich dabei aus den Teilen Subjekt (resource), Prädikat/Eigenschaft (property) und Objekt (value) zusammen. Das  RDF-Schema stellt dann die Möglichkeit bereit, Begriffe und die damit verbundenen Elemente semantisch zueinander in Beziehung zu setzen.

Funktionalitäten

Standard-Funktionalitäten

  • Service-oriented architecture
    • Framework and Services
    • Core Repository Service
  • Repository access and management via web services
    • API-A - Fedora Access Service (SOAP)
    • API-A-LITE - Fedora Access Service (REST)
    • API-M - Fedora Management Service (SOAP)
    • API-M-LITE - Fedora Management Service (REST) (a work in progress)
    • REST API - Fedora REST API (experimental)
    • Basic Search - Repository Search via API-A-Lite (REST)
    • Basic OAI - Simple OAI-PMH Provider (REST)
    • RISearch - Resource Index Search (REST)
  • Versioning
  • XML-based Ingest and Export (FOXML/Fedora digital object model; METS)
  • XML-based Digital Object Storage
  • Basic Search
  • Basic OAI Provider Interface
  • RDF-based Resource Index with Search
  • Security Architecture - XACML-based Policy Enforcement
    • Writing XACML Policies for Fedora
    • Policy Validation Utility
    • Reload Policies Utility
  • Server Command Line Utilities
  • Repository Rebuilder Utility
  • Journaling Module
  • Reporting Utility

 Standard Repository Features

Neue Funktionalitäten (Version 3.0)

  1. Introduction of the Content Model Architecture
  2. Fedora REST API.
  3. Mulgara Support
  4. Migration Utilities
  5. Relational Index Simplification
  6. Dynamic Behaviors
  7. Error Reporting Improvement
  8. Multiple Owners Per Digital Object
  9. Java 6 Compatibility
  10. Relationships API
  11. Fedora Object XML Schemas Revised
    • FOXML 1.1 XSD Schema
    • FOXML 1.1 Schematron Rules
    • Fedora METS Extension 1.1 XSD Schema
    • Fedora METS Extension 1.1 Schematron Rules
  12. Atom Support
  13. Messaging Support
  14. Saxon 8 & XSLT2 Support
  15. Bundled Tomcat Updated to 5.5.26
  16. MIME Type and FORMAT_URI Updates
  17. Admin GUI Using Templates for CMA Objects
  18. Basic Content Model-Based Validation
  19. RELS-EXT Validation Relaxed
  20. Batch Modify Utility MIME Restriction Relaxed
  21. Basic Performance Test Suite

 New Features and Enhancements

Support

Installationen in Deutschland

 Initiative "Digital Peer Publishing NRW"
 eSciDoc (Max-Planck-Gesellschaft und FIZ Karlsruhe)
 ePIC (electronic Publication Information Center), Alfred-Wegner-Institut für Polar- und Meeresforschung, Bremerhaven

 Fedora Dokumentation
 Installations- und Konfigurationsanleitung
 Tutorial: Introduction to Fedora 3.0
 Tutorial: Creating Fedora Objects using the Content Model Architecture
 Bastian Onken: Prototypenentwicklung und ökonomischer Leistungsvergleich von OAI- und Web Service-orientierten Architekturen zur Realisierung von Repositories für Publikationen in einer wissenschaftlichen Großforschungseinrichtung, 2005.
 Dobratz, Susanne (2007): Open-Source-Software zur Realisierung von Institutionellen Repositorien -- Überblick. In: Zeitschrift für Bibliothekswesen und Bibliographie, Jg. 54, H. 4-5, S. 199–206.
 Jeggle, Open Source Software in der Archivierung, 2005.
 Folien der RIRI 2008
 Fedora Performance and Scalability Wiki

AddComment?

Attachments