Usługa agregacji udostępnia dostawcom technologii reklamowych statystyki skuteczności, które pomagają zwiększać skuteczność kampanii u klientów.
Ten dokument zawiera:
- Kluczowe terminy i pojęcia
- Jak działa usługa do agregacji, aby dostarczać szczegółowych danych o konwersjach i danych dotyczących zasięgu na podstawie nieprzetworzonych raportów, które można agregować
- Przetwarzanie w partiach raportów zbiorczych – przegląd koncepcji
- Omówienie pojęć związanych z komponentami Cloud
Dla kogo jest przeznaczony ten dokument?
Ta strona pomaga dostawcom technologii reklamowych i deweloperom zrozumieć, jak nasze interfejsy API umożliwiają skuteczne pomiary reklam z zachowaniem prywatności.
W tym dokumencie zakładamy, że znasz interfejsy Private Aggregation API, Attribution Reporting API, Protected Audience API, Shared Storage API i Trusted Execution Environments.
Kluczowe terminy i pojęcia
Zanim przejdziesz dalej, zapoznaj się z najważniejszymi terminami:
Słowniczek
- Technologia reklamowa
-
Platforma reklamowa to firma, która świadczy usługi w zakresie wyświetlania reklam.
- Raporty zbiorcze
-
Aggregatable reports are encrypted reports sent from individual user devices. These reports contain data about cross-site user behavior and conversions. Conversions (sometimes called attribution trigger events) and associated metrics are defined by the advertiser or ad tech. Each report is encrypted to prevent various parties from accessing the underlying data.
- Uwzględnianie danych w raportach zbiorczych
-
rozproszona księga znajdująca się w obu koordynatorach, która śledzi przypisany budżet prywatności i egzekwuje regułę „Bez duplikatów”. Jest to mechanizm ochrony prywatności, który działa w ramach koordynatorów i zapewnia, że żadne raporty nie są przekazywane przez usługę agregacji poza przydzielony budżet prywatności.
Więcej informacji o strategiach grupowania danych w związku z raportami podlegającymi agregacji
- Dane budżetowe w raporcie zbiorczym
-
Odwołania do budżetu, które zapewniają, że poszczególne raporty nie są przetwarzane więcej niż raz.
- Usługa do agregacji
-
Usługa obsługiwana przez firmę zajmującą się technologiami reklamowymi, która przetwarza raporty podlegające agregacji, aby utworzyć raport podsumowania.
Więcej informacji o usłudze agregacji znajdziesz w artykule i pełnej wersji warunków.
- Potwierdzenie
-
Mechanizm uwierzytelniania tożsamości oprogramowania, zwykle za pomocą funkcji szyfrowania skrótów lub podpisów. W przypadku propozycji usługi agregacji weryfikacja polega na sprawdzeniu, czy kod działający w usłudze agregacji obsługiwanej przez firmę zajmującą się technologią reklamową jest zgodny z kodem open source.
- Bonding
- Koordynator
-
Podmioty odpowiedzialne za zarządzanie kluczami i rachunkowość raportów podlegających agregacji. Koordynator prowadzi listę haszy zatwierdzonych konfiguracji usługi agregacji i konfiguruje dostęp do kluczy odszyfrowywania.
- Szum i skalowanie
-
szum statystyczny dodawany do raportów zbiorczych podczas procesu agregacji w celu zachowania prywatności i zapewnienia, że raporty końcowe zawierają anonimowe informacje pomiarowe.
Dowiedz się więcej o mechanizmie addytywnym generującym szum, który jest oparty na rozkładzie Laplace’a.
- Źródło zgłoszenia
-
Podmiot, który otrzymuje raporty podlegające agregacji, czyli Ty lub zespół ds. technologii reklamowej, który wywołał interfejs Attribution Reporting API. Raporty umożliwiające agregację są wysyłane z urządzeń użytkowników do znanego adresu URL powiązanego z miejscem pochodzenia raportu. Źródło raportowania jest wyznaczane podczas rejestracji.
- Shared ID
-
Obliczona wartość, która składa się z
shared_info
,reporting_origin
,destination_site
(tylko w przypadku Attribution Reporting API),source_registration-time
(tylko w przypadku Attribution Reporting API),scheduled_report_time
oraz wersji.Wiele raportów, które mają te same atrybuty w polu
shared_info
, powinno mieć ten sam identyfikator współdzielony. Udostępnione identyfikatory odgrywają ważną rolę w raportowaniu w raportach agregowalnych. - Raport zbiorczy
-
Typ raportu interfejsów Attribution Reporting API i Private Aggregation API. Raport podsumowania zawiera zagregowane dane o użytkownikach i może zawierać szczegółowe dane o konwersjach z dodanym szumem. Raporty podsumowujące składają się z raportów zbiorczych. Zapewniają one większą elastyczność i bogatszy model danych niż raportowanie na poziomie zdarzenia, co jest szczególnie przydatne w przypadku niektórych zastosowań, np. wartości konwersji.
- Zaufane środowisko wykonawcze (TEE)
-
Bezpieczna konfiguracja sprzętu i oprogramowania komputera, która umożliwia podmiotom zewnętrznym sprawdzenie dokładnych wersji oprogramowania działającego na urządzeniu bez obawy przed ujawnieniem. Środowiska TEE umożliwiają podmiotom zewnętrznym sprawdzenie, czy oprogramowanie działa dokładnie tak, jak twierdzi deweloper, i nic więcej.
Aby dowiedzieć się więcej o zasadach TEE używanych w propozycjach dotyczących Piaskownicy prywatności, przeczytaj informacje o interfejsie Protected Audience API i informacje o usłudze agregacji danych.
Proces obsługi usługi agregacji
Usługa do agregacji generuje raporty podsumowujące z szczegółowymi danymi o konwersjach i zasięgu na podstawie nieprzetworzonych raportów podlegających agregacji. Proces generowania raportu składa się z tych kroków:
- Przeglądarka pobiera klucz publiczny, aby generować zaszyfrowane raporty.
- Zaszyfrowane raporty z możliwością agregacji są wysyłane na serwer dostawcy technologii reklamowej.
- Serwer dostawcy technologii reklamowej zbiera raporty (w formacie avro) i przesyła je do usługi do agregacji.
- Pracownik agregujący pobiera zagregowane raporty w celu ich odszyfrowania.
- Pracownik agregacji pobiera klucze odszyfrowywania od koordynatora.
- Proces agregacji odszyfrowuje raporty na potrzeby agregacji i dodawania szumu.
- Usługa księgowania raportów agregacji sprawdza, czy jest wystarczający budżet na potrzeby prywatności, aby wygenerować raport podsumowujący dla podanych raportów agregacji.
- Usługa do agregacji przesyła ostateczny raport podsumowujący.
Na diagramie poniżej przedstawiono działanie usługi do agregacji, od momentu otrzymania raportów z internetu i urządzeń mobilnych do momentu utworzenia przez tę usługę raportu podsumowującego.
Podsumowując, interfejs Attribution Reporting API lub Private Aggregation API generuje raporty z wielu instancji przeglądarki. Chrome pobiera klucz publiczny, który jest zmieniany co 7 dni, z usługi hostingu kluczy w koordynatorze, aby szyfrować raporty przed ich wysłaniem do źródła raportowania technologii reklamowych. Źródło raportowania dostawcy technologii reklamowej zbiera i konwertuje przychodzące raporty do formatu avro, a potem wysyła je do usługi do agregacji. Gdy żądanie zbiorcze zostanie wysłane do usługi do agregacji, usługa ta pobiera klucze odszyfrowywania z usługi hostingu kluczy, odszyfrowuje raporty, agreguje je i zaciemnia, aby utworzyć raport podsumowujący, o ile jest wystarczający budżet na ochronę prywatności.
Więcej informacji o przygotowywaniu raportów możliwych do agregacji znajdziesz w sekcji dotyczącej implementacji.
grupowanie raportów zbiorczych.
Proces raportowania nie byłby kompletny bez pomocy wyznaczonego serwera pochodzenia raportów, który został określony podczas procesu rejestracji. Źródło raportu odpowiada za zbieranie, przekształcanie i zbiorcze grupowanie raportów podlegających agregacji oraz przygotowanie ich do wysłania do usługi do agregacji w Google Cloud lub Amazon Web Services. Dowiedz się więcej o przygotowywaniu raportów możliwych do zsumowania.
Komponenty Cloud
Usługa agregacji składa się z kilku komponentów usług w chmurze. Aby zainicjować i skonfigurować wszystkie niezbędne komponenty usługi w chmurze, używasz dostarczonych skryptów Terraform.
Usługa frontendu
Zarządzana usługa w chmurze: Cloud Function (Google Cloud) / API Gateway (Amazon Web Services)
Usługa frontendu to bezserwerowa brama, która jest głównym punktem wejścia do wywołań interfejsu Aggregation API służących do tworzenia zadań i pobierania stanu zadań. Odpowiada on za otrzymywanie żądań od użytkowników usługi agregacji, sprawdzanie parametrów wejściowych i inicjowanie procesu planowania zadania agregacji.
Usługa frontendu ma 2 dostępne interfejsy API:
Punkt końcowy | Opis |
---|---|
createJob |
Ten interfejs API uruchamia zadanie usługi agregacji. Aby uruchomić zadanie, potrzebuje informacji takich jak identyfikator zadania, szczegóły miejsca na dane wejściowe, szczegóły miejsca na dane wyjściowe i źródło raportowania. |
getJob |
Ten interfejs API zwraca stan zadania o określonym identyfikatorze. Zawiera informacje o stanie zadania, takie jak „Otrzymano”, „W toku” lub „Ukończono”. Jeśli zadanie zostało ukończone, zwraca również jego wynik, w tym komunikaty o błędach, które wystąpiły podczas jego wykonywania. |
Zapoznaj się z dokumentacją interfejsu API usługi agregacji.
Kolejka zadań
Zarządzana usługa w chmurze: Pub/Sub (Google Cloud) / Amazon SQS (Amazon Web Services)
Kolejka zadań to kolejka wiadomości zawierająca żądania zadań dla usługi agregacji. Usługa frontendu wstawia żądania zadań do kolejki, które są następnie wykorzystywane przez pracowników agregacji, którzy je przetwarzają.
Cloud Storage
Zarządzana usługa w chmurze: Google Cloud Storage (Google Cloud) / Amazon S3 (Amazon Web Services).
Pliki wejściowe i wyjściowe używane przez usługę agregacji, takie jak zaszyfrowane pliki raportów i raporty podsumowujące, są przechowywane w chmurze.
Baza danych metadanych zadań
Zarządzana usługa w chmurze: Spanner (Google Cloud) / DynamoDB (Amazon Web Services)
Baza danych metadanych zadań służy do przechowywania stanu zadań agregacji i śledzenia go. Zapisywanie metadanych, takich jak czas utworzenia, czas zgłoszenia, czas aktualizacji i stan (np. Otrzymano, W toku lub Gotowe). W miarę wykonywania zadań instancje robocze do agregacji aktualizują bazę danych metadanych zadań.
Zasób roboczy agregacji
Zarządzana usługa w chmurze: Compute Engine z przestrzenią poufnej (Google Cloud) lub Amazon Web Services EC2 z Nitro Enclave (Amazon Web Services).
Pracownik agregacji przetwarza żądania zadań w kole zadań i odszyfrowuje zaszyfrowane dane wejściowe za pomocą kluczy pobieranych z usługi Key Generation and Distribution Service (KGDS) w koordynatorze. Aby zminimalizować opóźnienie przetwarzania zadań, instancje robocze agregacji przechowują klucze odszyfrowywania w pamięci podręcznej przez 8 godzin i używają ich w przetwarzanych zadaniach.
Procesy agregacji działają w środowisku Trusted Execution Environment (TEE). Worker obsługuje tylko jedno zadanie naraz. Możesz skonfigurować wiele instancji roboczych do przetwarzania zadań równolegle, ustawiając konfigurację automatycznego skalowania. Jeśli jest używane, autoskalowanie dynamicznie dostosowuje liczbę instancji roboczych do liczby wiadomości w kolejce zadań. Minimalną i maksymalną liczbę instancji roboczych do automatycznego skalowania możesz skonfigurować w pliku środowiska Terraform. Więcej informacji o autoskalowaniu znajdziesz w tych skryptach Terraform: Amazon Web Services lub Google Cloud.
Procesy robocze agregacji wywołują usługę księgowania raportów podlegających agregacji w celu księgowania raportów podlegających agregacji. Ta usługa zapewnia, że zadania są wykonywane tylko wtedy, gdy nie przekroczono limitu budżetu prywatności. (zobacz regułę „Brak duplikatów”). Jeśli budżet jest dostępny, na podstawie zbiorczych danych o wysokiej zmienności jest generowany raport podsumowujący. Dowiedz się więcej o rachunkowości w raportach możliwych do zsumowania.
Pracownicy agregacji aktualizują metadane zadań w bazie danych metadanych zadań. Te informacje obejmują kody zwrotne zadań i liczniki błędów raportów w przypadku częściowych błędów raportów. Użytkownicy mogą pobrać stan za pomocą interfejsu getJob
job state retrieval API.
Szczegółowe informacje o usłudze agregacji znajdziesz w tym artykule.
Dalsze kroki
Teraz, gdy już wiesz, jak działa usługa agregacji, postępuj zgodnie z przewodnikiem na temat wdrażania, aby wdrożyć własną instancję za pomocą Google Cloud lub Amazon Web Services.