Für ECM Enterprise_Content_Management Lösungen werden die unterschiedlichsten Technologien und kombiniert die zum Teil auch als eigenständige sinnvoll ohne den Anspruch an ein unternehmensweites nutzbar sind. Diese ECM-Komponenten und -Technologien lassen nach der Definition des internationalen Dachverbandes AIIM Association for Information and Image Management International) fünf Hauptkategorien einordnen.
Die Kategorie Capture beinhaltet Funktionalität und zur Erstellung Erfassung Aufbereitung und Verarbeitung von und elektronischen Informationen. Dabei kann man mehrere und Technologien unterschieden von der einfachen Erfassung Information bis zur komplexen Aufbereitung durch eien Klassifikation. Die Capture-Komponenten werden auch häufig als zusammengefasst.
Bei der manuellen Erfassung können alle von Informationen vorkommen von Papierdokumenten elektronischen Office-Dokumenten Vordrucken MultiMedia-Objekten digitalisierter Sprache und Video bis Mikrofilm. Maschinell erzeugte und automatisch erfasste Informationen der teilautomatischen oder automatischen Erfassung können EDI- XML-Dokumente kaufmännische und ERP-Anwendungen oder bestehende Fachanwendungssysteme Quelle für die Erfassung sein. Technologien zur und Verarbeitung erfasster Informationen Zur Verarbeitung von Faksimiles werden verschiedene Erkennungstechnologien (Recognition) eingesetzt. Zu gehören:
OCR (Optical Charakter Recognition. Hierbei werden Bildinformationen in maschinenlesbare Zeichen umgesetzt. OCR wird für Maschinenschrift eingesetzt.
HCR (Handprint Charakter Recognition). Die Erkennung Handschriften ist eine Weiterentwicklung von OCR die bei Fließtexten immer noch nicht zufriedenstellende Ergebnisse Beim Auslesen von definierten Feldinhalten ist die doch bereits sehr sicher.
ICR (Intelligent Charakter Recognition). ICR ist Weiterentwicklung von OCR und HCR die die Qualität der Ergebnisse durch Vergleiche logische Zusammenhänge Abgleich mit oder Prüfung gegen vorhandene Stammdaten verbessert.
OMR (Optical Mark Recognition). OMR z.B. Strichcode liest mit hoher Sicherheit spezielle Markierungen vordefinierten Feldern aus und hat sich bei und anderen Vordrucken bewährt.
Barcode. Aufgebrachte Barcodes beim Versenden von können beim Einlesen der Rückläufer automatisiert erkannt zugeordnet werden.
Bildbearbeitungstechniken von Document Imaging dienen nicht zur Anzeige von gescannten Bildern sondern ermöglichen die Verbesserung der Lesbarkeit für die Erfassung. wie „Despeckling“ das Entfernen von isolierten Bildpunkten das „Adjustment“ das Geraderücken von schief eingezogenen verbessern die Ergebnisse der Erkennungstechnologien. Document-Imaging-Funktionen werden Erfassungsprozess bei der Qualitätskontrolle eingesetzt.
Bei der Erfassung von Formularen werden noch zwei Gruppen von Technologien unterschieden obwohl Informationsinhalt und der Charakter der Dokumente gleich kann.
Forms Processing (Vordruckverarbeitung). Das „Forms Processing“ die Erfassung von industriell oder individuell gedruckten mittels Scannen. Hierbei kommen anschließend häufig Erkennungstechnologien Einsatz da gut gestaltete Vordrucke eine weitgehend Verarbeitung ermöglichen.
E-Forms / Web-Forms (Verarbeitung elektronischer Formulare). der Erfassung elektronischer Formulare ist eine automatische möglich wenn Layout Struktur Logik und Inhalte Erfassungssystem bekannt sind.
COLD/ERM sind Verfahren zur automatisierten Verarbeitung strukturierten Eingangsdateien. Der Begriff COLD steht für Output on LaserDisk und hat sich gehalten das Medium LaserDisk seit Jahren nicht mehr Markt ist. Das Akronym ERM steht für Report Management. In beiden Fällen geht es angelieferte Ausgabedateien auf Basis vorhandener Strukturinformationen so dass sie unabhängig vom erzeugenden System indiziert an eine Speicherkomponente wie eine dynamische Ablage oder ein Archiv (Preserve) übergeben werden können. „Aggregation“ stellt einen Kombinationsprozess von Dateneingaben verschiedener Erfassungs- und zuliefernden Anwendungen dar. Zweck ist Zusammenführung und Vereinheitlichung von Informationen aus unterschiedlichen um sie strukturiert und einheitlich formatiert an Speicher- und Bearbeitungssysteme zu übergeben.
Für die Weiterleitung und inhaltliche Erschließung in den Systemen weitere Indizierungs- Routing- und hinzu die die erfassten und digital vorliegenden aufbereiten und um beschreibende Merkmale ergänzen. Hierzu
Indexing (manuelle Indizierung). Anders als im beschränkt sich im Angloamerikanischen der Begriff Indexing die manuelle Vergabe von Indexattributen die in Datenbank einer „Manage“-Komponente für Verwaltung und Zugriff die Informationen benutzt wird. Im Deutschen werden auch Begriffe wie „Indizieren“ „Attributieren“ oder „Verschlagworten“
Input Designs (Eigenschaften beschreibende Profile Erfassungsmasken). die automatische als auch die manuelle Attributierung durch hinterlegte Profile erleichtert und verbessert werden. Profile können z.B. Dokumentenklassen beschreiben die die der möglichen Indexwerte beschränken oder bestimmte Kriterien vergeben. Input Designs schließt auch die Eingabemasken deren Logik bei der manuellen Indizierung ein.
Categorization (automatische Klassifikation oder Kategorisierung). Auf der in den elektronischen Informationsobjekten seien es OCR-gewandelte Faksimiles Office-Dateien oder Ausgabedateien enthaltenen Informationen Programme zur automatischen Klassifikation selbstständig Index- Zuordnungs- Weiterleitungsdaten extrahieren. Solche Systeme können auf Basis Kriterien oder selbstlernend Informationen auswerten.
Ziel aller „Capture“-Komponenten ist die erfassten zur Weiterbearbeitung oder Archivierung den „Manage“-Komponenten bereitzustellen.
Die „Manage“-Komponenten dienen zur Verwaltung Bearbeitung Nutzung der Informationen. Sie besitzen hierfür
Datenbanken für die Verwaltung und das sowie
Berechtigungssysteme zur Zugriffsabsicherung und zum Schutz
von Informationen. Ziel eines geschlossenen ECM-Systemes dabei diese beiden Komponenten nur einmal übergreifend alle „Manage“-Lösungen wie Document Management Collaboration Web Management Records Management und Workflow / Business Management als Dienste bereitzustellen. Zur Verbindung der „Manage“-Komponenten sollte diese über standardisierte Schnittstellen und Transaktionsprozesse bei der Kommunikation zwischen den Komponenten
Unter Document Management ist hier nicht Branchenbezeichnung wie in Deutschland z.B. DMS zu sondern eher die Dokumentenmanagementsysteme im „klassischen“ oder „engeren Sinn“. Die dieser Systeme ist es den Lebenszyklus der von der Entstehung bis zur Langzeitarchivierung zu Zum Document Management gehören unter anderem folgende
Checkin/Checkout zur Kontrolle der Konsistenz der Informationen
Versionsmanagement zur Kontrolle unterschiedlicher Stände gleicher mit Versionen Revisionen und Renditionen (gleiche Information einem unterschiedlichen Format)
Suchen und Navigieren zum Auffinden von und zugehörigen Informationskontexten
Visualisierung zur Anzeige von Informationen in wie virtuellen Akten Verzeichnissen und Übersichten
Die Funktionen des Document Management überschneiden jedoch zunehmend mit denen der andere „Manage“-Komponenten immer weiter ausgreifenden Funktionalität von Office-Anwendungen wie oder Notes/Domino und den Eigenschaften von „Library zur speichertechnischen Verwaltung der Informationen.
Collaboration bedeutet eigentlich nur Zusammenarbeit. Der dieser Lösungen die sich aus der herkömmlichen entwickelt haben geht jedoch weiter und schließt Anwendungsgebiete des Knowledge Management mit ein. Zur gehören unter anderem folgende Funktionen:
Gemeinsam nutzbare Informationsbasen
Gemeinsames gleichzeitiges und kontrolliertes Bearbeiten von
Wissensbasen über Skills Ressourcen und Hintergrunddaten die gemeinsame Bearbeitung von Informationen
Verwaltungskomponenten wie Whiteboards für Ideensammlungen Terminpläne und andere
Kommunikationsanwendungen wie Video-Conferencing
Integration von Informationen aus anderen Anwendungen Kontext der gemeinsamen Informationsbearbeitung
Enterprise Content Management erhebt den Anspruch Content Management zu integrieren. Die Bereitstellung von Im Internet und Extranet oder auf einem sollte nur eine über die Berechtigungen und gesteuerte Darstellung bereits vorhandener Informationen im Unternehmen Zum Web Content Management gehören unter anderem Funktionen:
Erstellung neuer oder Aufbereitung vorhandener Information einem kontrollierten Erstellungs- und Veröffentlichungsprozess
Bereitstellung und Verwaltung der Informationen für Web-Präsentation
Automatische Konvertierung für unterschiedliche Anzeigeformate personalisierte und Versionierung
Sichere Trennung des Zugriffs auf öffentliche nicht-öffentliche Informationen
Visualisierung für die Präsentation mit Internet-Mitteln HTML XML u.a.)
Anders als bei den traditionellen elektronischen bezeichnet Records Management (RM; Electronic Records Management die reine Verwaltung von Records wichtigen aufbewahrungspflichtigen aufbewahrungswürdigen Informationen. Records Management ist Speichermedien-unabhängig und z.B. auch die nicht in elektronischen Systemen Informationen mitverwalten. Zum elektronischen Records Management (ERM) unter anderem folgende Funktionen:
Abbildung von Aktenplänen und anderen strukturierten zur geordneten Ablage von Informationen
Thesaurus- oder kontrollierter Wortschatz-gestützte eindeutige Indizierung Informationen
Verwaltung von Aufbewahrungsfristen (Retention Schedules) und (Deletion Schedules)
Schutz von Informationen entsprechend ihren Eigenschaften bis auf einzelnen Inhaltskomponenten in Dokumenten
Nutzung international branchenspezifisch oder zumindest unternehmensweit Meta-Daten zur eindeutigen Identifizierung und Beschreibung der Informationen
Abbildung von Ablauf- und Aufbauorganisationsstrukturen
Empfangen Verwalten Visualisieren und Weiterleiten von Informationen mit zugehörigen Dokumenten oder Daten
Einbindung von Bearbeitungswerkzeugen für Daten (z.B. und Dokumente (z.B. Office-Produkte)
Paralleles und sequentielles Bearbeiten von Vorgängen Mitzeichnungder Bearbeitung
Design-Werkzeuge zur Gestaltung und Anzeige von
Wiedervorlage Fristen Delegation und andere Verwaltungsfunktionalität
Kontrolle und Dokumentation der Bearbeitungsstände Laufwege Ergebnisse
Ziel beim Einsatz ist weitgehende Automatisierung Prozessen mit Einbindung aller notwendigen Ressourcen.
BPM Business Process Management geht in Anspruch noch einen Schritt weiter als Workflow. strebt die vollständige Integration aller betroffenen Anwendungen einem Unternehmen mit Kontrolle der Prozesse und aller benötigten Informationen an. Zu BPM gehören anderem folgende Funktionen:
Vollständige Workflow-Funktionalität
Prozess- und Datenkontrolle auf Server-Ebene
EAI Enterprise Application Integration zur Verbindung Anwendungen
BI Business Intelligence mit hinterlegten Regelwerken von InformationWarehouses und den Anwender bei seiner Tätigkeit unterstützenden Hilfsprogrammen
„Manage“-Komponenten werden heute einzeln oder integriert „Suite“ angeboten. Sie beinhalten vielfach bereits die
Die „Store“-Komponenten dienen zur temporären Speicherung Informationen die nicht archivierungswürdig oder archivierungspflichtig sind. wenn Medien zum Einsatz kommen die für langzeitige Archivierung geeignet sind ist der „Store“ der „Preservation“ abgegrenzt. durch den Inhalt Im Sprachgebrauch sind diese Komponenten mit der „Ablage“ Unterschied zum „Archiv“ gleichzusetzen.
Die von der AIIM aufgeführten „Store“-Komponenten sich drei unterschiedlichen Bereichen zuordnen „Repositories“ als „Library Services“ als Verwaltungskomponente für die Speicherorte „Technologies“ als unterschiedliche Speichertechnologien. Ebenfalls zu diesen die z.T. wie das Filesystem auf Betriebssystemebene sind gehören die Sicherheitstechnologien die aber erst unten im Abschnitt „Deliver“ behandelt werden. Die sind jedoch einschließlich des Berechtigungssystems als übergreifende einer ECM-Lösung zu betrachten.
Zu den möglichen Repositories eines ECM auch kombiniert eingesetzt werden können gehören unter
Filesysestem. Das Filesystem wird vorrangig zur Zwischenspeicherung so. z.B. Eingangs- und Ausgangs-Caches benutzt. von ECM ist es das File¬system von zu entlasten und diese durch „Manage“- „Store“- „Preservation“-Technologien allgemein verfügbar bereitzustellen.
Content Management System. An dieser Stelle das eigentliche Speichersystem für den Content gemeint dem es sich um eine Datenbank oder spezialisiertes eigenständigen Speichersystem handeln kann.
Datenbanken. Zum einen dienen Datenbanken zur der Zugriffsinformationen. Sie können aber auch direkt Speicherung von Dokumenten Content oder Media Assets werden.
Data Warehouses. Data Warehouses sind datenbankbasierte Speichersysteme die Informationen aus unterschiedlichsten Quellen referenzieren direkt bereitstellen. Sie können auch mit einem Anspruch als Document Warehouse oder Information Warehouse sein.
Library Services haben nur im übertragenen mit Bibliotheken zu tun. Sie sind die Verwaltungskomponenten mit denen der Zugriff auf die realisiert wird. Der Library Service ist letztlich den Empfang und die Speicherung der Informationen den „Capture“- und den „Manage“-Komponenten verantwortlich. Er gleichermaßen die Speicherorte in der dynamischen Ablage eigentlichen „Store“ und im Langzeitarchiv der Kategorie Der Speicherort wird dabei lediglich durch die und Klassenzugehörigkeit der zu speichernden Information bestimmt. Library Service arbeitet mit der Datenbank der zusammen. Hierdurch werden die notwendigen
Search (Suche) und
Retrieval (Wiederfinden Wiederbereitstellen)
Funktionen bedient. Während die Datenbank keine über den physischen Speicherort eines Objektes hat der Library Service
Online-Speicher (Daten und Dokumente im direkten
Nearline-Speicher (Daten und Dokumente auf einem das sich im Zugriff des Laufwerks befindet z.B. erst durch eine Robotik eingelegt werden und
Offline-Speicher (Daten und Dokumente auf einem das ausgelagert wurde und nicht im automatisierten eines Systems befindet).
Sofern nicht ein übergelagertes Dokumentenmanagementsystem die bereitstellt muss der Library Service ein
Versionsmanagement zur Kontrolle unterschiedlicher Stände der und
Checkin/Checkout für die kontrollierte Bereitstellung der
besitzen.
Eine wichtige Funktion des Library Services die Erzeugung von Protokollen und Journalen zur der Information und über Veränderungen an den die im Angloamerikanischen als „Audit-Trail“ bezeichnet werden. solche intelligenten Speicherverwaltungssysteme hat sich inzwischen der ILM Information Lifecycle Management eingebürgert.
Für die Speicherung der Informationen können nach Anwendungszweck und Systemumgebung sehr unterschiedliche Speichertechnologien und Medien zum Einsatz kommen.
Mehrfach beschreibbare magnetische Online-Speicher. Hierzu gehören als RAID (Redundant Array of Independent Disks) am Server SAN (Storage Area Networks) als oder NAS (Network Attached Storage) direkt in zugänglich gemachte Speicherbereiche.
Tape (Magnetbänder) in automatisierten Speichereinheiten wie oder “Silos” mit Robotik für den Zugriff eher wie DAT-Bänder in kleineren Umgebungen der und nicht zum Online-Zugriff.
Digital Optical Disk (Digitale optische Speichermedien) CD (CD-R einmal beschreibbare Compact Disk CD/RW beschreibbare Compact Disk) DVD (Digital Versatile Disk) (Magneto Optical) UDO (Ultra Density Optical) und können zur Sicherung und zur Verteilung aber in Jukeboxen als Online-Speicher (Plattenwechselautomaten) eingesetzt werden.
Die „Preserve“-Komponenten von ECM dienen langfristig statischen und unveränderbaren Aufbewahrung und Sicherung von zur temporären Speicherung von Informationen die nicht oder archivierungspflichtig sind. Im deutschsprachigen Raum ist das Anwendungsfeld der elektronischen Archivierung. Letztere besitzt aber wesentlich mehr Funktionalität als unter „Preserve“ Elektronische Archivsysteme sind heute meistens eine Kombination Verwaltungssoftware wie Records Management Imaging oder Document Library Services (IRS Information Retrieval Systeme) und
Aber nicht nur elektronische Medien eigenen zur langfristigen Aufbewahrung. Zur reinen Sicherung von ist weiterhin Mikrofilm geeignet der inzwischen in Systemen mit elektronischen Medien und datenbankgestütztem Zugriff werden kann. Entscheidend bei allen Langfristspeichersystemen ist rechtzeitige Einplanung und regelmäßige Durchführung von Migrationen die Information in sich verändernden technischen Umgebungen zu halten. Dieser kontinuierliche Prozess wird auch Migration genannt. Zu den „Preserve“-Speichersystem-Komponenten gehören unter
WORM (Write Once Read Many) rotierende optische Speichermedien zu denen die klassischen WORM einer Schutzhülle in 5 ¼“ oder 3 Technologie ebenso wie CD-R und DVD-R gehören. Aufzeichnungstechniken der Medien die in Jukeboxen für Online- und automatisierten Nearline-Zugriff bereitgestellt werden sind
WORM-Tape (Magnetband mit WORM-Eigenschaften) wird in Laufwerken eingesetzt die mit besonders abgesicherten Bändern ordnungsgemäßem Betrieb ähnliche Sicherheit wie ein traditionelles Medium erreichen können.
CAS (Content Adressed Storage) magnetische Festplattenspeicher durch spezielle Software gegen Überschreiben Löschen und wie ein WORM-Medium geschützt sind
NAS/SAN (Network Attached Storage / Storage Networks) können ebenfalls eingesetzt werden wenn sie Bedingungen der Revisionssicherheit mit unveränderbarer Speicherung Schutz Manipulationen und Löschen etc. erfüllen.
Mikrofilm kann als Sicherungsmedium eingesetzt werden die Informationen nicht mehr in der Nutzung und keine maschinelle Auswertbarkeit gefordert ist.
Papier ist als Langzeitspeicher von Informationen weiterhin zu berücksichtigen da die Aufzeichnung migrationsfrei und ohne Hilfsmittel gelesen werden kann. Ebenso beim Mikrofilm handelt es sich aber nur die Sicherung originär elektronischer Information.
Die „Deliver“-Komponenten von ECM dienen zur der Informationen aus den „Manage“- „Store“- und Sie beinhalten aber auch Funktionen die wiederum die Eingabe von Informationen in Systeme (z.B. auf Medien oder Erzeugung formatierter Ausgabedateien) oder die Aufbereitung von Informationen (z.B. Konvertierung oder für die „Store“- und „Preserve“-Komponenten. Da die auf das AIIM-Komponentenmodell funktional zusammengestellt ist und als Architektur gesehen werden darf ist die dieser und anderer Komponenten hier zulässig. Die in der Kategorie „Deliver“ wird auch als bezeichnet und unter dem Begriff „Output Management“
Die “Deliver“-Kategorie umfasst drei Gruppen von und Medien: „Transformation Technologies“ „Security Technologies“ und Transformation und Sicherheit gehören als Dienste auf Middleware-Ebene und sollten allen ECM-Komponenten gleichermaßen zur stehen. Für die „Ausgabe“ sind zunächst zwei wichtig:
Layout/Design mit Werkzeugen zur Gestaltung und der Ausgaben und
Publishing. Anwendungen zur Bereitstellung der Informationen die Distribution und Publikation.
Transformationen sollten immer verlustfrei kontrolliert und ablaufen. Hierfür kommen Dienste im Hintergrund zum die sich dem Endanwender in der Regel zeigen. Zu den Transformation Technologien werden unter folgende gerechnet:
COLD / ERM ist hier im zur „Capture“-Komponente als Aufbereitung von Daten von für Verteilung Druck und Übergabe an das zusehen. Typische Anwendungen sind Listen und formatierter z.B. individualisierte Kundenanschreiben. Zu diesen Technologien gehören die Journale und Protokolle die von den erzeugt werden.
Personalization (Personalisierung) ist nicht mehr nur Funktion von Web-basierten Portalen sondern gilt für ECM-Komponenten. Durch die Personalisierung erhält der Nutzer noch die Funktionalität und Informationen angeboten die benötigt.
XML (eXtended Markup Language) ist eine die es erlaubt Schnittstellen Strukturen Metadaten und zu beschreiben. XML setzt sich als die Technologie zur Beschreibung von Informationen durch.
PDF (Printable Document Format) ist ein Druck- und Distributionsformat das es erlaubt Informationen bereitzustellen. Im Gegensatz zu reinen Bildformaten wie können in PDF Inhalte gesucht Metadaten beigefügt elektronische Signaturen eingebettet werden. Als international genormtes ist PDF/A auch für die Archivierung geeignet.
Konverter und Viewer dienen einerseits zur von Informationen um einheitliche Formate zu erzeugen andererseits um Informationen unterschiedlichen Formates wieder anzuzeigen auszugeben.
Compression (Kompression Komprimierung) wird benutzt um Speicherplatzbedarf für bildhafte Informationen zu reduzieren. Für wird hier auf das ITU-Verfahren (CCITT) für und für Farbbilder auf JPEG2000 zurückgegriffen. Mit können auch beliebige Dateien für die Datenübermittlung werden.
Syndication dient zur Bereitstellung von Content unterschiedlichen Formaten Selektionen und Aufbereitungsformen im Umfeld Content Management. Durch Syndication kann der gleiche mehrfach in verschiedener Form und für verschiedene genutzt werden.
Die Sicherheitstechnologien gehören zu den Querschnittfunktionen allen ECM-Komponenten als Dienste zur Verfügung stehen. kommen elektronische Signaturen nicht nur bei der von Dokumenten zum Einsatz sondern können auch der Erfassung beim Scannen benötigt werden um Vollständigkeit der Erfassung zu dokumentieren.
PKI (Private Key Infrastructure) ist die für den Einsatz elektronischer Signaturen. Sie verwaltet und Zertifikate und prüft die Authentizität von
Digital Signatures (Elektronische Signaturen) dienen dazu Dokumente bei Übermittlungen die Authentizität des Absenders die Integrität der übermittelten Nachricht d.h. die und Vollständigkeit nachzuweisen. In Europa gibt es Formen der elektronischen Signatur mit unterschiedlicher Qualität Sicherheit: einfache fortgeschrittene und qualifizierte. In Deutschland die qualifizierte elektronische Signatur im Rechtsverkehr und gesetzlich verankert.
Digital Rights Management / Watermark (elektronische dient besonders bei der Content Syndication und MAM Media Asset Management der Verwaltung und von Urherrechten und CopyRights. Hierzu kommen Techniken elektronische Wasserzeichen (Watermarks) die direkt in die eingebunden werden zum Einsatz. Ziel ist die von Rechten und die Sicherung der Inhalte der Veröffentlichung im Internet.
Alle zuvor erwähnten Technologien dienen im dazu die unterschiedlichen Inhalte eines ECM kontrolliert nutzungsorientiert auf unterschiedlichen Wegen der Zielgruppe bereitzustellen. können aktive Komponenten wie Versand als E-Mail oder Rundschreiben ebenso gehören wie die passive auf Webseiten und Portalen wo sich die aus dem Informationsangebot selbst bedient. Als mögliche und Distributionsmedien können zum Einsatz kommen:
Internet Extranet und Intranet
E-Business-Portale
E-Mail und Fax
Datenübermittlung mittels EDI XML SMS oder Formaten
Mobile Geräte wie Mobiltelefone Kommunikator-Geräte und
Datenträger wie CD oder DVD
Digitales Fernsehen und andere Multimedia-Dienste
Papier
Aufgabe der verschiedenen „Deliver“-Komponenten ist die immer für den Empfänger optimal aufbereitet zur zu stellen und die Nutzung möglichst zu