Ein Satz von regulatorischen Reporting-Services wurde für einen bedeutenden deutschen Börsen-Betreiber definiert. Die Services
offerieren deren Benutzern Funktionalitäten, die ihre Verpflichtungen unter
MiFID II abdecken: OTC (Over-the-Counter) trade reporting für marktweite Transparenzerzeugung, Systematische Internaliser Services für
Nutzern mit systematischen und substantiellen Handelsaktivitäten auf eigene Rechnung und beste Ausführungs-Services,
um Informationen und Leistungsindikatoren für die
gute Qualität der Ausführungen im Kundenauftrage nachzuweisen.
Natural Language Processing:
Informations-Extraktion aus Texten
Neuartige "Machine Learning" Methoden (Conditional Random Fields, RNN) und eher "klassische" Methoden des Natural Language Processing (NLP)
- NER- und POS-Kennzeichnungen, reguläre Ausdrücke zum
"chunking" & "chinking" auf Basis des NLTK - sind kombiniert worden. Zielsetzung ist,
automatisch strukturierte Informationen (entities, process steps,...) aus unstrukturierten Texten zu extrahieren.
Während jede dieser beiden Methodologies separat eine Präzision
in der 90 plus Prozentregion ergibt, ergibt sich durch die Kombination noch einmal ein klar überlegenes Resultat.
Data Analytics:
Bilderkennung mittels Deep Learning
Eine "Machine Learning" - Anwendung ist für einen bedeutenden deutschen Online-Händler konzipiert und entwickelt worden.
Nach dem Training auf Basis eines Satzes an Bildern ist die Anwendung in der Lage, einzelne Objekte in den digitalisierten Bildern zu identifizieren.
Wie zum Beispiel die Hose einer gewissen Farbe und eines gewissen Stils, die von einer der Personen im Bilde getragen wird...
"Deep learning" - Algorithmen (Convolutional Neural Networks = CNN) werden für solche Zwecke herangezogen.
Heutzutage können "Cutting Edge Frameworks" wie Caffe, Theano und Tensorflow sowie modernste Hardware (GPUs) dazu dienen,
hunderttausende von Bilder zu verarbeiten und in den Bildern enthaltene
Bild-Informationen automatisch zu extrahieren.
Open Source Tools:
Spark, Hadoop
Spark und Hadoop sind geeignete Open Source Werkzeuge, um parallele, verteilte Berechnungen
in einem Projekt für einen bedeutenden deutschen Online-Händler zu realisieren.
Die Zielsetzung ist, die Masse von vorliegenden Webdaten effizient zu durchsuchen. Einer der Zwecke: eine Datenanlyse
zur Vorhersage von Kundenverhalten (Abbruch eines Kaufes u. ä), bzw. um Betrugsversuche vorherzusagen.
Für robuste Daten - Analytik & smarte IT - Infrastruktur
Die Unternehmensberatung mit einem einzigen Ziel: den Kunden helfen, ihre Geschäftsziele durch den Einsatz von state-of-the-art IT
zu realisieren. Zwei Schwerpunkte und daher zwei miteinander verbundene Gesellschaften:
Die Kunden: DAX-Unternehmen,
große Unternehmen aus dem Finanzsektor, vor allem Banken.
In jüngerer Zeit kommen vermehrt mittelständische Kunden aus Industrie, Energiewirtschaft und
Logistik hinzu.