Contextual OVK – OS Data Solutions

Kontextbezogene Targeting-Lösung zur Ableitung von IAB Kategorien

Der Online-Vermarkterkreis (OVK) im Bundesverband Digitale Wirtschaft (BVDW) e. V. ist die Interessenvertretung der Online-Display-Vermarkter am deutschen Werbemarkt. Sie setzen sich für die Stärkung des nationalen Online-Werbemarktes und die Erhaltung seiner Angebotsvielfalt ein. Gemeinsam mit den Marktpartnern entwickeln und fördern sie Standards und Regelwerke, um Orientierung zu liefern und Markttransparenz herzustellen.

Eine neu erarbeitete Vorgabe in Hinblick auf diese Ziele ist die Offenlegung detaillierter Informationen zum Contextual Crawler. Dazu zählen unter anderem Merkmale und Funktionsweise des Produktes sowie Informationen zum Datenschutz. Darüber hinaus soll ein Abgleich der Kategoriezuordnung des Crawlers im Vergleich zu einer manuellen Zuordnung anhand eines definierten URL Sets als Beweis für die Funktionsweise dienen.

Produktübersicht

Unser Produkt konzentriert sich auf kontextbezogenes Targeting mittels eines Systems, das Webinhalte aufnimmt und auf Basis ihrer Relevanz und ihres Inhalts in IAB Content Kategorien einteilt. Dabei wird die URL einer Website über eine automatisierte Schnittstelle an den Categorization Service gesendet. Dort wird anschließend der Seiteninhalt gecrawlt und gespeichert. Der eigens entwickelte Contextual Classifier leitet IAB-Kategorien der Website ab und ordnet diese zu.

Warum der IAB Contextual Classifier der OS Data Solutions?

Standardisiert: Der Service entspricht dem durch den OVK im BVDW entwickelten Standard für die einheitliche Kategorisierung von Inhalten.
Kompetent: Ein Team aus über 40 Data Engineers, Data Architects und Data Scientists entwickelt den Contextual Classifier kontinuierlich weiter.
Kooperativ: Neben Ströer vertrauen bereits Media Impact und die AdAlliance unserem Service.

Hauptmerkmale unseres Services

Bewährte Infrastruktur in der Google Cloud: Unsere Lösung ist sicher, skalierbar und zuverlässig. Wir halten uns an höchste Sicherheitsstandards, speichern Daten in Europa mit Multi-Tenant-Fähigkeit und Einhaltung aller EU-Vorschriften.
Reaktionsschnell: Unser System ist in der Lage, neue URLs spätestens innerhalb einer Minute nach Erhalt zu kategorisieren. Diese Reaktionszeit bedeutet eine nahezu Echtzeit-Responsivität des Services.
Integer: Wir setzen ethische und respektvolle Web-Crawling-Praktiken um.
Qualität: Das Modell des Classifiers arbeitet mit einem neuronalen Netz, welches für jede IAB-Kategorie einen Score für die Passgenauigkeit zum Inhalt einer Website ausgibt. Erst ab einem bestimmten Score wird eine Kategorie auch zum Targeting genutzt. Der Classifier nutzt dabei einen ständig wachsenden Trainingsdatensatz an Websites, der höchste Genauigkeit und kontinuierliche Verbesserung der Kategorisierung gewährleistet.
Kontinuierliche Verbesserung und Anpassung: Unser Modell wird als Teil unserer kontinuierlichen Verbesserung der Datenerfassung, -verarbeitung und Modellbildung alle 3-6 Monate neu trainiert.
Zukunftssicher: Der Classifier funktioniert ohne die Nutzung von Identifiern und ist damit unabhängig von Entwicklungen rund um den Wegfall/Rückgang von 3rd-Party-Cookies.
Standardisierung Implementierung der IAB-Content Taxonomie: Der Classifier verwendet die IAB-Content-Taxonomie (Version 2.2). Damit ist sichergestellt, dass die Kategorisierung mit dem anerkannten Industriestandard übereinstimmt.

Wie der Service funktioniert

Anfrage und Cache-Prüfung: Wenn der Classifier eine API-Anfrage zu einer URL erhält, prüft das System den Cache, um zu ermitteln, ob für die URL bereits Kategorien existieren. Ist dies der Fall, werden die Kategorien direkt zurück gegeben.
Auslösen des Crawlers: Falls die URL noch nicht kategorisiert wurde, wird eine Anfrage an die API des Services gesendet, die den Crawler auslöst.
Crawling und Datenbereinigung: Die Website wird vom System gecrawlt. Die gesammelten Daten durchlaufen einen Bereinigungsprozess, bei dem Werbung und irrelevante Informationen entfernt werden. Die bereinigten Daten werden dann für das Kategorisierungsmodell vorbereitet.
Kontextbezogene Kategorisierung: Die bereinigten Daten werden in das Modell eingespeist, welches Vorhersagen für die IAB-Kategorien der Website erstellt.
Antwort auf die zweite Anfrage: Bei Erhalt einer zweiten Anfrage für dieselbe URL (in der Regel innerhalb einer Minute) wird die vom Modell mit hoher Konfidenz ermittelten Kategorien zurück gegeben.

Market Benchmarking

Wir sind aktiv im Dialog mit Publishern und Werbetreibenden, um unsere Lösung kontinuierlich mit dem Markt abzugleichen. Dies gewährleistet, dass unsere Lösung wettbewerbsfähig bleibt und die best practices der Branche integriert werden.

Transparenz und Veröffentlichung von Ergebnissen

Wir setzen uns für Transparenz ein und veröffentlichen unsere Kategorisierungsergebnisse auf unserer Website. Somit stellen wir unseren Kunden und der Branche klare und zugängliche Informationen über unsere Leistung bereit.

Datenschutz und -sicherheit

Zusätzlich zur Blockierung von Kategorien, die vom IAB als sensibel eingestuft werden, haben wir proaktiv eine breitere Palette von als sensibel eingestuften Kategorien des BVDW (Bundesverband Digitale Wirtschaft) blockiert.

Insbesondere stellen wir für diese Themen keine einzelnen Kategorien zur Verfügung. Stattdessen fassen wir diese Kategorien in einer übergeordneten Kategorie „Sensitive Topics“ zusammen. Diese Praxis unterstreicht unseren Ansatz, die Privatsphäre der Nutzer zu respektieren und dabei die Qualität und Wirksamkeit unseres kontextbezogenen Targetings zu erhalten.

Sensitive Topics, umfassen ein breites Spektrum von Themen, darunter:

Gesundheitsbezogene Themen: Von allgemeinen Themen wie Allergien bis hin zu spezifischeren Zuständen wie Hormonstörungen, Diabetes und Schlafstörungen.
Persönliche und sensible Lebensfragen: Themen wie Adoption und Pflege, reproduktive Gesundheit, persönliche Schulden und psychische Gesundheit.
Spirituellen und religiösen Überzeugungen: Einschließlich Agnostizismus, Astrologie und große Weltreligionen wie Christentum, Islam, Buddhismus usw.

Der vorgeschriebene Abgleich der Kategorisierung des Contextual Crawlers zu einer manuellen Zuordnung anhand einer Liste von 100 URLs ergibt eine Übereinstimmung von rund 94%. Das Ergebnis zeigt, dass unser Classifier sehr zuverlässig funktioniert.

Haben wir Dein Interesse geweckt und Du hast individuelle Fragen oder wünscht weitere Informationen? Unsere Experten helfen Dir gerne innerhalb kürzester Zeit weiter.

Schreibe eine Mail an sales@osdatasolutions.de