Charakteristikum |
Typische Werte |
Packungsdichte – entfernter Prozentsatz |
2-4 fach besser als ZIP bei bekannten Formaten |
PostScript |
80% |
PDF (Adobe Portable Document Format) |
50% |
Texte |
80% |
HTML / XML |
70% |
Java / Binärdateien |
70% |
Geschwindigkeit
Kompression – |
3 MB/Sekunde; ähnlich ZIP |
Geschwindigkeit
Dekompression – |
5 MB/Sekunde; ähnlich ZIP |
Speicherbedarf |
ab 20 MB (deutlich bessere Packungsdichte bei mehr Speicher) |
Betriebssysteme |
MS-Windows NT, 2k, XP, 2003, Unix (Linux, Solaris); weitere auf Wunsch |
Technologie |
Keine flachen Zuordnungslisten von Wörtern zu Bitcodes, sondern Graphen (Zustandsübergangsgraphen, Finite State Transducer) |
Besondere technologische Stärke |
· Erfassung von (Teil-)Strukturen, z.B.: Eine URL besteht häufig aus http://www.name.com / .de · Korrektes Erfassen des Anfanges, von Zwischenteilen und des Endes von Strukturen, z.B.: nach <center> wird auch </center> als HTML-Tag erwartet. Dazwischen sollte natürlichsprachiger Text stehen · Erkennung, wann neue Namen eingeführt werden, z.B. durch typedef bei C/C++ oder def in PostScript · Automatisches Lernen von Datenstrukturen · Dynamisch zur Laufzeit austauschbare Graphstrukturen, die jeweils ein spezialisiertes Datenformat optimal packen können |
Charakteristika / Vorteile durch Densifier®: · Effiziente Suche in gespeicherten Daten möglich · Leichte Integration in Programme, einfache Kompression von Strukturen und Objekten in Programmiersprachen · Effizienteres Arbeiten mit vorkomprimierten Daten: Teilweise sogar schnelleres Arbeiten als ohne Kompression, da direkt auf komprimierten „Tokens“ gearbeitet wird, also weniger Daten betrachtet werden · Schneller wahlfreier Zugriff auf einzelne Datensätze und kleinste Informationseinheiten · Schnellere Dekompression, da nur wirklich benötigte Informationen entpackt werden · Schutz von Daten gegen das Auslesen: · Praktisch: Daten nur schwer auslesbar (Dazu muss nämlich zuerst das Datenkompressionsverfahren verstanden und meist neuprogrammiert werden) · Juristisch: Dekompression durch Dritte verletzt Kompressionspatente (Entweder entwickeln und patentieren wir ein eigenes Verfahren für Sie oder Sie nutzen den Schutz durch unsere Patente) · Datenkompresssion ist eine von Experten empfohlene Vorstufe der Datenverschlüsselung · Bisherige Anwendungen: MS Office 97 / MS Office 2000, 2003, XP, Adobe PDF-Dateien, Corel DRAW! und viele Datenbanken nutzen Kompression: wegen obiger Vorteile |
|
Anwendungsgebiete: · Datenübertragung im Netzwerk: Der Netzwerk-Datendurchsatz kann durch Kompression um ein Vielfaches gesteigert werden · Schutz von Daten gegen Hacker: Enthält Ihre Anwendung firmenspezifisches Know-How - z.B. eigene Datensätze, grafische oder lexikalische Daten? Je komplexer das verwandte Kompressionsverfahren, desto schwieriger wird der Datenklau. Mit textuellen und strukturierten, insbesondere lexikalischen Daten lässt sich dank Datenkompression sogar schneller arbeiten. · Zugangs- und Nutzerkennungen: Werden in Ihr Programm persönliche Daten oder andere Daten eingegeben, die vor Einsicht durch andere Nutzer geschützt werden sollen? Datenkompression und evtl. anschließende Verschlüsselung lösen das Problem. Durch Kompression und Versehen mit einer Checksumme machen Sie Hackern das Auslesen und Manipulieren Ihrer Daten beliebig schwer. · Geheime Parameter/Funktionen/Algorithmen: Haben Sie eigene Verfahren / Algorithmen entwickelt? Durch Datenkompression können Sie genauso eigene Funktionen (etwa zum Abfragen eines Kopierschutzes) wie auch Ihre Parameter für einen Algorithmus vor dem Erkennen durch Debuggen/Disassemblieren schützen. · Schützenswerte Herstellerdaten: Bieten Sie dem Nutzer zusätzliche freischaltbare Daten - etwa ein Zusatzlexikon? Durch Datenkompression und eine evtl. nachgeschaltete Verschlüsselung schützen Sie Ihre Daten wirksam. · Wenn Verschlüsselung keine Alternative ist: Verschlüsselung erfordert es, dass der Schlüssel einem Angreifer nicht bekannt ist. Um lokale Daten abzurufen, etwa von Synonymwörterbuch oder Grammatikkorrektur, muss dann entweder ein Passwort fest im Programm abgespeichert werden oder Benutzer müssen gezwungen werden, bei jedem Aufruf das Passwort erneut einzugeben. Für diese Lösung muss außerdem die Datenbasis für jeden Nutzer angepasst werden (Vorverschlüsselung oder Hinterlegung eines individuellen ergänzenden Schlüssels). Hier ist ein undurchsichtiges Datenkompressionsprogramm weit günstiger. · Wie die bekannten Verfahren können unsere Methoden natürlich auch zur Kompression von Dateien (Textdateien, Webseiten, binäre Daten), Festplatten und Speicherbereichen eingesetzt werden. |
|
Lieferbare Programmier-Komponenten |
|
· Software Development Kit mit Dokumentation auf Englisch, Format: · Objekt-Bibliothek oder · DLL (Dynamic Link Library; nur für MS-Windows) |
·
4980,- EUR einmalig
je Plattform für alle Komponenten, 100,- EUR je installiertem Rechner |
Das Ziel dieses Entwicklungsprojektes: Automatisch Lade-/Speicherroutinen für Kompression oder Verschlüsselung zu den eigenen Programmen hinzufügen. Dieses soll einfach durch Einfügen einer Zeile ins Makefile oder die Projektdatei geschehen. Sogar dieser einzige Schritt kann noch von einem Installationsprogramm erledigt werden.
Funktionsweise: Der Programmquelltext in C++ wird automatisch von einem Präprozessor analysiert, um Datenelemente in Klassen zu finden. Deren Typ ist damit bekannt und damit können direkt die Funktionen zum Lesen/Schreiben dieser Daten generiert werden. Falls dies gewünscht ist gleich mit Kompression und/oder Verschlüsselung. Im Wesentlichen handelt es sich dabei um obiges Verfahren zur Kompression strukturierter Daten, das aber automatisiert angewendet wird. Die generierten Funktionen werden entweder direkt als Quellcode eingefügt oder als Aufrufe zu Funktionen der mitgelieferten Bibliotheken. Auch die Verwendung zur Kompression strukturierter Daten oder zur Verschlüsselung mit den neuen Twofish oder dem Rijndael-Verfahren, dem DES-Nachfolger und AES-Standard, ist möglich.
Charakteristikum |
Typische Werte |
Packungsdichte – entfernter Prozentsatz |
2-4 fach besser als ZIP bei bekannten Formaten |
Zeichen(ketten) / Strings |
80% |
Ganze Zahlen / Integer |
50% |
Fließkommazahlen |
80% |
allgemeine Puffer |
50% |
Geschwindigkeit
Kompression – |
4 MB/Sekunde; ähnlich ZIP |
Geschwindigkeit
Dekompression – |
6 MB/Sekunde; ähnlich ZIP |
Speicherbedarf |
ca. 0,5 MB |
Betriebssysteme |
MS-Windows 95/98/NT, XP, 2003, Unix (Linux, Solaris); weitere auf Wunsch |
Kompression |
Neue Compris Intelligence-Technologie der Kompression strukturierter Daten |
Verschlüsselung |
Public-Key-Verfahren: Schlüsselaustausch mit RSA; Blockverschlüsselung mit dem brandneuen Rijndael, dem DES-Nachfolger-Standard AES |
Steganographie (Verbergen der Daten) |
Patentiertes & prämiertes TextHide-Verfahren zum Verbergen von Informationen in Text, Verfahren zum Verbergen in Bildern, Klängen (WAV) und, komprimierten Daten / ZIP-Dateien |
Wasserzeichentechnologie |
In Texten, Bildern, Klängen, komprimierten Daten/ZIP-Dateien (wie Steganographie) |
Verfügbare Kombinationen |
Speichern/Laden allein oder mit Kompression und/oder Verschlüsselung und/oder Verbergen der Infos in Text oder Bildern und/oder Wasserzeichentechnologie – alle Kombinationen verfügbar |
Technologie |
Keine flachen Zuordnungslisten von Wörtern zu Bitcodes, sondern Graphen (Zustandsübergangsgraphen, Finite State Transducer); Das Ganze optimal angepasst an das jeweilige Programm; Zeiger-Strukturen werden als Graphen abgebildet. Diese Zusammenhänge erlauben wiederum eine bessere Kompression |
Besondere technologische Stärke |
· Erkennung, wenn neue Namen eingeführt werden, z.B. durch class, struct, DEFINE, const, typedef bei C/C++ · Automatisches Lernen von Datenstrukturen · Dynamisch zur Laufzeit austauschbare Graphstrukturen, die jeweils ein spezialisiertes Datenformat optimal packen können |
Charakteristika / Vorteile: · 10%-50% Zeit- und Kostenersparnis bei der Erstellung aller C++-Programme · Problemloser Datenaustausch zwischen verschiedenen Betriebssystemversionen eines Programms, weniger Portierungsaufwand · Effiziente Suche in gespeicherten Daten möglich · Leichte Integration in Programme, einfache Kompression von Strukturen und Objekten in Programmiersprachen · Effizienteres Arbeiten mit vorkomprimierten Daten: Teilweise sogar schnelleres Arbeiten als ohne Kompression, da direkt auf komprimierten „Tokens“ gearbeitet wird, also weniger Daten betrachtet werden · Schneller wahlfreier Zugriff auf einzelne Datensätze und kleinste Informationseinheiten · Schnellere Dekompression, da nur wirklich benötigte Informationen entpackt werden |
|
Lieferbare Programmier-Komponenten |
Preis |
· Software Development Kit für einfaches Speichern mit Dokumentation auf Deutsch/Englisch · Allgemeine & strukturierte Datenkompression
· Verschlüsselung (Twofish & RSA) · Steganographie (Verbergen, Wasserzeichen) |
·
2980,- EUR
je installiertem Rechner oder Nutzer (bei Servern) ·
945,- EUR
Aufpreis je Rechner/Nutzer · 345,- EUR Aufpreis je Rechner/Nutzer · 345,- EUR Aufpreis jeweils für Text, Grafiken, ZIP-Dateien, Klänge |
Verfügbar |
geplant für 2005 |
Informationen & Fragen: Densifier@compris.com
www.compris.com | | Datenkompression | | Kontakt/Karte | | Über Compris |