VOLLTEXTSUCHE
Pressearchiv
PR-COM Beratungsgesellschaft für strategische Kommunikation GmbH
Pressemitteilung

IT-Dienstleister prego bietet umfassende Dokumentenanalyse "as a Service"

Der IT-Dienstleister prego services hat mit "Heimdall" ein neues System für die kontextsensitive Analyse unstrukturierter Texte entwickelt.
(PM) Saarbrücken/Ludwigshafen, 16.12.2014 - Die neue Lösung "Heimdall" von prego ermöglicht es, Texte aus unterschiedlichsten Dateitypen wie .doc, .pdf, .txt oder .csv zu durchsuchen und zu analysieren. Dazu entfernt das System zunächst alle für die Indexierung irrelevanten Stoppwörter wie Artikel, Konjunktionen und Präpositionen, korrigiert Rechtschreibfehler und reduziert die verbleibenden Wörter auf ihre Stammform. Danach verschlagwortet es die Dokumente und ordnet ähnliche Wörter, etwa "Haus" und "Gebäude", entsprechenden Äquivalenzklassen zu. Anschließend werden sie in eine In-Memory-Datenbank geschrieben, die es erlaubt, die Texte sehr schnell zu durchsuchen und in Echtzeit statistisch auszuwerten.

Durch dieses Verfahren setzt sich Heimdall deutlich von herkömmlichen Volltextsuchen ab. Im Gegensatz zu ihnen findet die Lösung in Dokumenten auch Inhalte, die der Suchanfrage ähnlich sind, aber andere Begriffe und Formulierungen aufweisen. Außerdem kann die Software so genannte Kollokationen darstellen – also aufzeigen, mit welchen anderen Begriffen ein gesuchtes Wort besonders häufig gemeinsam auftritt. Dabei lässt sich die Lösung in den unterschiedlichsten Themenbereichen einsetzen. Um auch von fachspezifischen Begriffen die Stammformen zu produzieren, können Wortbibliotheken aus allen erdenklichen Gebieten in das System geladen werden – seien es Rechtswissenschaften, Medizin, Ingenieurwesen oder IT.

Mit seiner neuen Lösung kann prego umfassende Auswertungs-Services anbieten. Möchte ein Unternehmen beispielsweise seine Wissensdatenbank optimieren, findet der IT-Dienstleister mit Heimdall Dokumente, die ähnliche Informationen enthalten und deshalb konsolidiert und zusammengefasst werden können. Das Aufzeigen der Kollokationen ermöglicht es dem Auftraggeber außerdem nachzuvollziehen, welche Themenschwerpunkte in der Wissensdatenbank bereits ausreichend abgedeckt sind und wo es eventuell noch Lücken gibt.

Zu den zahlreichen weiteren Anwendungsmöglichkeiten zählen das Aufspüren von Musterverträgen, die von Gesetzesänderungen betroffen sind, oder die Plagiatssuche im wissenschaftlichen Umfeld. Hierbei findet Heimdall nicht nur Passagen, die Wort für Wort übernommen sind, sondern auch solche, die zur Verschleierung umformuliert wurden, aber identische Inhalte aufweisen. In sämtlichen Fällen müssen die Auftraggeber ihre Dokumente nicht zwingend an den IT-Dienstleister übergeben. Da Heimdall nur lesenden Zugriff benötigt, kann das System je nach Sicherheitsanspruch und vorhandenen Schnittstellen auch direkt an die Dokumente andocken.

"Die Dokumente der Unternehmen bergen meist das gesammelte Wissen ihrer Mitarbeiter", sagt Stefan Schreiber, Teamleiter Application Support bei prego services in Ludwigshafen. "Mit Heimdall haben wir eine neuartige und leistungsfähige Lösung entwickelt, die ihnen dabei hilft, auf dieses Wissen zurückzugreifen, neue Zusammenhänge zu erkennen oder Probleme zu identifizieren."

Diese Presseinformation kann auch unter www.pr-com.de/pregoservices abgerufen werden.
PRESSEKONTAKT
PR-COM GmbH
Frau Hanna Greve
Zuständigkeitsbereich: Account Director

+49-89-59997-756
ZUM AUTOR
ÜBER PREGO SERVICES

prego services in Saarbrücken und Ludwigshafen entwickelt und betreibt skalierbare, sichere und zukunftsfähige IT- und Businesslösungen für den Mittelstand. Das Angebot des Unternehmens umfasst branchenunabhängig die Bereiche ...
PRESSEFACH
PR-COM Beratungsgesellschaft für strategische Kommunikation GmbH
Nußbaumstraße 12
80336 München
zum Pressefach
Anzeige
PRESSEARCHIV
Anzeige
BUSINESS-SERVICES
© novo per motio KG