Densifier®: Kompression strukturierter Daten - stark verbesserte Packungsdichte

Strukturierte Daten können durch unsere Lösung sehr stark komprimiert und auch in komprimierter Form einfach und schnell durchsucht werden.

Densifier® Software zur Kompression strukturierter Daten – stark verbesserte Packungsdichte

Charakteristikum

Typische Werte

Packungsdichte – entfernter Prozentsatz

2-4 fach besser als ZIP bei bekannten Formaten

PostScript

80%

PDF (Adobe Portable Document Format)

50%

Texte

80%

HTML / XML

70%

Java / Binärdateien

70%

Geschwindigkeit Kompression –
Pentium IV 3 GHz

3 MB/Sekunde; ähnlich ZIP

Geschwindigkeit Dekompression –
Pentium IV 3 GHz

5 MB/Sekunde; ähnlich ZIP

Speicherbedarf

ab 20 MB (deutlich bessere Packungsdichte bei mehr Speicher)

Betriebssysteme

MS-Windows NT, 2k, XP, 2003, Unix (Linux, Solaris); weitere auf Wunsch

Technologie

Keine flachen Zuordnungslisten von Wörtern zu Bitcodes, sondern Graphen (Zustandsübergangsgraphen, Finite State Transducer)

Besondere technologische Stärke

·        Erfassung von (Teil-)Strukturen, z.B.: Eine URL besteht häufig aus http://www.name.com / .de

·        Korrektes Erfassen des Anfanges, von Zwischenteilen und des Endes von Strukturen, z.B.: nach <center> wird auch </center> als HTML-Tag erwartet. Dazwischen sollte natürlichsprachiger Text stehen

·        Erkennung, wann neue Namen eingeführt werden, z.B. durch typedef bei C/C++ oder def in PostScript

·        Automatisches Lernen von Datenstrukturen

·        Dynamisch zur Laufzeit austauschbare Graphstrukturen, die jeweils ein spezialisiertes Datenformat optimal packen können

Charakteristika / Vorteile durch Densifier®:

·        Effiziente Suche in gespeicherten Daten möglich

·        Leichte Integration in Programme, einfache Kompression von Strukturen und Objekten in Programmiersprachen

·        Effizienteres Arbeiten mit vorkomprimierten Daten: Teilweise sogar schnelleres Arbeiten als ohne Kompression, da direkt auf komprimierten „Tokens“ gearbeitet wird, also weniger Daten betrachtet werden

·        Schneller wahlfreier Zugriff auf einzelne Datensätze und kleinste Informationseinheiten

·        Schnellere Dekompression, da nur wirklich benötigte Informationen entpackt werden

·        Schutz von Daten gegen das Auslesen:

·        Praktisch: Daten nur schwer auslesbar (Dazu muss nämlich zuerst das Datenkompressionsverfahren verstanden und meist neuprogrammiert werden)

·        Juristisch: Dekompression durch Dritte verletzt Kompressionspatente (Entweder entwickeln und patentieren wir ein eigenes Verfahren für Sie oder Sie nutzen den Schutz durch unsere Patente)

·        Datenkompresssion ist eine von Experten empfohlene Vorstufe der Datenverschlüsselung

·        Bisherige Anwendungen: MS Office 97 / MS Office 2000, 2003, XP, Adobe PDF-Dateien, Corel DRAW! und viele Datenbanken nutzen Kompression: wegen obiger Vorteile

Anwendungsgebiete:

·        Datenübertragung im Netzwerk: Der Netzwerk-Datendurchsatz kann durch Kompression um ein Vielfaches gesteigert werden

·        Schutz von Daten gegen Hacker: Enthält Ihre Anwendung firmenspezifisches Know-How - z.B. eigene Datensätze, grafische oder lexikalische Daten? Je komplexer das verwandte Kompressionsverfahren, desto schwieriger wird der Datenklau. Mit textuellen und strukturierten, insbesondere lexikalischen Daten lässt sich dank Datenkompression sogar schneller arbeiten.

·        Zugangs- und Nutzerkennungen: Werden in Ihr Programm persönliche Daten oder andere Daten eingegeben, die vor Einsicht durch andere Nutzer geschützt werden sollen? Datenkompression und evtl. anschließende Verschlüsselung lösen das Problem. Durch Kompression und Versehen mit einer Checksumme machen Sie Hackern das Auslesen und Manipulieren Ihrer Daten beliebig schwer.

·        Geheime Parameter/Funktionen/Algorithmen: Haben Sie eigene Verfahren / Algorithmen entwickelt? Durch Datenkompression können Sie genauso eigene Funktionen (etwa zum Abfragen eines Kopierschutzes) wie auch Ihre Parameter für einen Algorithmus vor dem Erkennen durch Debuggen/Disassemblieren schützen.

·        Schützenswerte Herstellerdaten: Bieten Sie dem Nutzer zusätzliche freischaltbare Daten - etwa ein Zusatzlexikon? Durch Datenkompression und eine evtl. nachgeschaltete Verschlüsselung schützen Sie Ihre Daten wirksam.

·        Wenn Verschlüsselung keine Alternative ist: Verschlüsselung erfordert es, dass der Schlüssel einem Angreifer nicht bekannt ist. Um lokale Daten abzurufen, etwa von Synonymwörterbuch oder Grammatikkorrektur, muss dann entweder ein Passwort fest im Programm abgespeichert werden oder Benutzer müssen gezwungen werden, bei jedem Aufruf das Passwort erneut einzugeben. Für diese Lösung muss außerdem die Datenbasis für jeden Nutzer angepasst werden (Vorverschlüsselung oder Hinterlegung eines individuellen ergänzenden Schlüssels). Hier ist ein undurchsichtiges Datenkompressionsprogramm weit günstiger.

·        Wie die bekannten Verfahren können unsere Methoden natürlich auch zur Kompression von Dateien (Textdateien, Webseiten, binäre Daten), Festplatten und Speicherbereichen eingesetzt werden.

Lieferbare Programmier-Komponenten

Preis

·        Software Development Kit mit Dokumentation auf Englisch, Format:

·        Objekt-Bibliothek oder

·        DLL (Dynamic Link Library; nur für MS-Windows)

·        4980,- EUR einmalig je Plattform für alle Komponenten, 100,- EUR je installiertem Rechner
– keine Patent-Lizenzgebühren –

 


 

Densifier®: Persistenz, Kompression und Verschlüsselung für die eigenen Programmquelltexte

 

Das Ziel dieses Entwicklungsprojektes: Automatisch Lade-/Speicherroutinen für Kompression oder Verschlüsselung zu den eigenen Programmen hinzufügen. Dieses soll einfach durch Einfügen einer Zeile ins Makefile oder die Projektdatei geschehen. Sogar dieser einzige Schritt kann noch von einem Installationsprogramm erledigt werden.

 

Funktionsweise: Der Programmquelltext in C++ wird automatisch von einem Präprozessor analysiert, um Datenelemente in Klassen zu finden. Deren Typ ist damit bekannt und damit können direkt die Funktionen zum Lesen/Schreiben dieser Daten generiert werden. Falls dies gewünscht ist gleich mit Kompression und/oder Verschlüsselung. Im Wesentlichen handelt es sich dabei um obiges Verfahren zur Kompression strukturierter Daten, das aber automatisiert angewendet wird. Die generierten Funktionen werden entweder direkt als Quellcode eingefügt oder als Aufrufe zu Funktionen der mitgelieferten Bibliotheken. Auch die Verwendung zur Kompression strukturierter Daten oder zur Verschlüsselung mit den neuen Twofish oder dem Rijndael-Verfahren, dem DES-Nachfolger und AES-Standard, ist möglich.

 

Charakteristikum

Typische Werte

Packungsdichte – entfernter Prozentsatz

2-4 fach besser als ZIP bei bekannten Formaten

Zeichen(ketten) / Strings

80%

Ganze Zahlen / Integer

50%

Fließkommazahlen

80%

allgemeine Puffer

50%

Geschwindigkeit Kompression –
Pentium IV 3 GHz

4 MB/Sekunde; ähnlich ZIP

Geschwindigkeit Dekompression –
Pentium IV 3 GHz

6 MB/Sekunde; ähnlich ZIP

Speicherbedarf

ca. 0,5 MB

Betriebssysteme

MS-Windows 95/98/NT, XP, 2003, Unix (Linux, Solaris); weitere auf Wunsch

Kompression

Neue Compris Intelligence-Technologie der Kompression strukturierter Daten

Verschlüsselung

Public-Key-Verfahren: Schlüsselaustausch mit RSA; Blockverschlüsselung mit dem brandneuen Rijndael, dem DES-Nachfolger-Standard AES

Steganographie (Verbergen der Daten)

Patentiertes & prämiertes TextHide-Verfahren zum Verbergen von Informationen in Text, Verfahren zum Verbergen in Bildern, Klängen (WAV) und, komprimierten Daten / ZIP-Dateien

Wasserzeichentechnologie

In Texten, Bildern, Klängen, komprimierten Daten/ZIP-Dateien (wie Steganographie)

Verfügbare Kombinationen

Speichern/Laden allein oder mit Kompression und/oder Verschlüsselung und/oder Verbergen der Infos in Text oder Bildern und/oder Wasserzeichentechnologie – alle Kombinationen verfügbar

Technologie

Keine flachen Zuordnungslisten von Wörtern zu Bitcodes, sondern Graphen (Zustandsübergangsgraphen, Finite State Transducer); Das Ganze optimal angepasst an das jeweilige Programm; Zeiger-Strukturen werden als Graphen abgebildet. Diese Zusammenhänge erlauben wiederum eine bessere Kompression

Besondere technologische Stärke

·        Erkennung, wenn neue Namen eingeführt werden, z.B. durch class, struct, DEFINE, const, typedef bei C/C++

·        Automatisches Lernen von Datenstrukturen

·        Dynamisch zur Laufzeit austauschbare Graphstrukturen, die jeweils ein spezialisiertes Datenformat optimal packen können

Charakteristika / Vorteile:

·        10%-50% Zeit- und Kostenersparnis bei der Erstellung aller C++-Programme

·        Problemloser Datenaustausch zwischen verschiedenen Betriebssystemversionen eines Programms, weniger Portierungsaufwand

·        Effiziente Suche in gespeicherten Daten möglich

·        Leichte Integration in Programme, einfache Kompression von Strukturen und Objekten in Programmiersprachen

·        Effizienteres Arbeiten mit vorkomprimierten Daten: Teilweise sogar schnelleres Arbeiten als ohne Kompression, da direkt auf komprimierten „Tokens“ gearbeitet wird, also weniger Daten betrachtet werden

·        Schneller wahlfreier Zugriff auf einzelne Datensätze und kleinste Informationseinheiten

·        Schnellere Dekompression, da nur wirklich benötigte Informationen entpackt werden

Lieferbare Programmier-Komponenten

Preis

·        Software Development Kit für einfaches Speichern mit Dokumentation auf Deutsch/Englisch

·        Allgemeine & strukturierte Datenkompression

 

·        Verschlüsselung (Twofish & RSA)

·        Steganographie (Verbergen, Wasserzeichen)

·        2980,- EUR je installiertem Rechner oder Nutzer (bei Servern)

·        945,- EUR Aufpreis je Rechner/Nutzer

·        345,- EUR Aufpreis je Rechner/Nutzer

·        345,- EUR Aufpreis jeweils für Text, Grafiken, ZIP-Dateien, Klänge

Verfügbar

geplant für 2005

 



Informationen & Fragen: Densifier@compris.com



www.compris.com  | Datenkompression  | Kontakt/Karte  | Über Compris