Textextraktion mittels mindUp Web-Crawler/Spider
Adaptives Web-Crawler bzw- Spider-System für das automatisierte Abrufen von Web-Inhalten und die vollautomatische Extraktion von strukturiertem Wissen.
Web-Crawler Eigenschaften:
- Skalierbar für jede Anwendungsgröße
- Viele Millionen Web-Seiten täglich
- Beliebige Extraktionsaufgaben möglich (Extraction Agent)
- Adaptive Scanning (Domain-Scanning)
- Bot-Conformity (berücksichtigt "robots.txt")
- Webfarming
Daten aus dem Internet - jetzt Anfrage starten
mindUp beherrscht die Erkennung von Web-Inhalten bis zur Perfektion. Sei es die Extraktion von Produktinformationen (Immobilienanzeigen, Autoanzeigen) zur Generierung von Marktdaten oder Preisvergleichen. Die Crawler-Technologie von mindUp gepaart mit der Inhaltsextraktion erlaubt viele Einsatzbereiche.
Weitere Anwendungsbereiche sind:
Scouting
Autokategorisierung
Datenprüfung / Validierung