Принцип работы

Служба агрегации предоставляет рекламным специалистам аналитические данные, необходимые для повышения эффективности кампаний с клиентами.

В этом документе рассматриваются :

Для кого предназначен этот документ?

Эта страница поможет специалистам по рекламе и разработчикам понять, как наши API обеспечивают эффективное измерение рекламы с сохранением конфиденциальности.

В этом документе предполагается, что вы знакомы с API частного агрегирования , API отчетов об атрибуции , API защищенной аудитории , общим хранилищем и доверенными средами выполнения .

Ключевые термины и понятия

Прежде чем продолжить, ознакомьтесь с ключевыми терминами:

Глоссарий

Рекламные технологии

Рекламная платформа — это компания, которая предоставляет услуги по доставке рекламы.

Агрегируемые отчеты

Агрегированные отчеты — это зашифрованные отчеты, отправляемые с отдельных пользовательских устройств. Эти отчеты содержат данные о поведении пользователей и конверсиях на разных сайтах. Конверсии (иногда называемые событиями-триггерами атрибуции) и связанные с ними показатели определяются рекламодателем или рекламным специалистом. Каждый отчет зашифрован, чтобы предотвратить доступ различных сторон к базовым данным.

Узнайте больше об агрегированных отчетах .

Агрегированный отчетный учет

Распределенный реестр, расположенный в обоих координаторах, который отслеживает выделенный бюджет конфиденциальности и обеспечивает соблюдение правила «Нет дубликатов» . Это механизм сохранения конфиденциальности, расположенный и управляемый координаторами, который гарантирует, что никакие отчеты не пройдут через Службу агрегирования сверх выделенного бюджета конфиденциальности.

Узнайте больше о том, как стратегии пакетной обработки связаны с агрегируемыми отчетами .

Агрегированный отчет по бухгалтерскому бюджету

Ссылки на бюджет, обеспечивающий обработку отдельных отчетов не более одного раза.

Агрегация услуг

Служба, управляемая рекламными технологиями, которая обрабатывает агрегированные отчеты для создания сводного отчета.

Подробнее о предыстории Службы агрегирования читайте в нашем пояснении и в полном списке терминов .

Подтверждение

Механизм аутентификации идентичности программного обеспечения, обычно с помощью криптографических хешей или подписей. Для предложения услуги агрегации аттестация сопоставляет код, работающий в вашей службе агрегации, управляемой рекламными технологиями, с открытым исходным кодом.

Подробнее об аттестации читайте .

Вклад в облигации
Координатор

Субъекты, ответственные за управление ключами и учет агрегированной отчетности. Координатор ведет список хешей утвержденных конфигураций службы агрегации и настраивает доступ к ключам расшифровки.

Шум и масштабирование

Статистический шум, который добавляется к сводным отчетам во время процесса агрегирования, чтобы сохранить конфиденциальность и гарантировать, что окончательные отчеты содержат анонимную информацию об измерениях.

Узнайте больше об аддитивном механизме шума , который основан на распределении Лапласа .

Отчет о происхождении

Объект, который получает агрегированные отчеты — другими словами, вы или рекламная технология, которая называется API отчетов по атрибуции. Агрегированные отчеты отправляются с пользовательских устройств на известный URL-адрес, связанный с источником отчетов. Источник отчетности указывается во время регистрации.

Общий идентификатор

Вычисляемое значение, состоящее shared_info , reporting_origin , destination_site (только для API отчетов об атрибуции), source_registration-time (только для API отчетов об атрибуции), scheduled_report_time и версии.

Несколько отчетов с одинаковыми атрибутами в shared_info должны иметь один и тот же общий идентификатор. Общие идентификаторы играют важную роль в учете агрегированных отчетов.

Узнайте больше о доверенных серверах .

Сводный отчет

Тип отчета API отчетов об атрибуции и API частного агрегирования. Сводный отчет включает в себя агрегированные данные о пользователях и может содержать подробные данные о конверсиях с добавлением шума. Сводные отчеты состоят из совокупных отчетов. Они обеспечивают большую гибкость и предоставляют более богатую модель данных, чем отчеты на уровне событий, особенно для некоторых вариантов использования, таких как значения конверсий.

Надежная среда выполнения ( TEE )

Безопасная конфигурация компьютерного оборудования и программного обеспечения, позволяющая внешним сторонам проверять точные версии программного обеспечения, работающего на компьютере, не опасаясь раскрытия информации. TEE позволяют внешним сторонам проверять, что программное обеспечение делает именно то, что заявляет производитель программного обеспечения, — ни больше, ни меньше.

Чтобы узнать больше о TEE, используемых в предложениях Privacy Sandbox, прочтите пояснение к службам API защищенной аудитории и объяснение службы агрегации .

Рабочий процесс службы агрегации

Aggregation Service генерирует сводные отчеты с подробными данными о конверсии и охвате из необработанных агрегируемых отчетов. Поток генерации отчетов состоит из следующих шагов:

  1. Браузер извлекает открытый ключ для создания зашифрованных отчетов .
  2. Зашифрованные агрегированные отчеты отправляются на серверы рекламных технологий.
  3. Сервер рекламных технологий формирует пакеты отчетов (в формате avro ) и отправляет их в службу агрегации.
  4. Агрегирующий работник извлекает агрегированные отчеты для расшифровки.
  5. Агрегирующий работник получает ключи дешифрования от координатора.
  6. Aggregation Worker расшифровывает отчеты для агрегации и шумоподавления .
  7. Служба учета агрегированных отчетов проверяет, имеется ли достаточный бюджет конфиденциальности для формирования сводного отчета по заданным агрегированным отчетам.
  8. Служба агрегации представляет итоговый сводный отчет.

На следующей диаграмме показана работа службы агрегации с момента получения отчетов с веб-сайта и мобильных устройств до момента создания сводного отчета службой агрегации.

Сквозной поток услуг агрегации.
Сквозной поток услуг агрегации

Подводя итог, API отчетов об атрибуции или API частного агрегирования генерируют отчеты из нескольких экземпляров браузера. Chrome получает открытый ключ, который ротируется каждые семь дней, от службы хостинга ключей в координаторе, чтобы шифровать отчеты перед их отправкой в ​​источник отчетов рекламных технологий. Источник отчетов рекламных технологий собирает и преобразует входящие отчеты в формат avro и отправляет их в службу агрегации. Когда затем в службу агрегации отправляется пакетный запрос, она извлекает ключи дешифрования из службы хостинга ключей, расшифровывает отчеты, агрегирует и шумит их для создания сводного отчета, если для их создания достаточно бюджета конфиденциальности.

Подробнее о том, как подготовить агрегированные отчеты, читайте в разделе «Внедрение».

Агрегируемые отчеты пакетной обработки

Поток отчетов не был бы полным без помощи назначенного сервера источника отчетов, который вы указали во время процесса регистрации . Источник отчетов отвечает за сбор, преобразование и пакетирование агрегированных отчетов, а также за их подготовку к отправке в вашу службу агрегации в Google Cloud или Amazon Web Services. Узнайте больше о том, как подготовить ваши агрегированные отчеты .

Облачные компоненты

Aggregation Service состоит из нескольких компонентов облачного сервиса. Вы используете предоставленные скрипты Terraform для предоставления и настройки всех необходимых компонентов облачного сервиса.

Облачные компоненты сервиса агрегации.
Облачные компоненты сервиса агрегации.

Фронтенд-сервис

Управляемый облачный сервис: облачная функция (Google Cloud) / API Gateway (Amazon Web Services)

Frontend Service — это бессерверный шлюз, который является основной точкой входа для вызовов API агрегации для создания и извлечения состояния задания. Он отвечает за получение запросов от пользователей Aggregation Service, проверку входных параметров и инициирование процесса планирования задания агрегации.

Frontend Service имеет два доступных API:

Конечная точка Описание
createJob Этот API запускает задание Aggregation Service. Для запуска задания требуется такая информация, как идентификатор задания, сведения о входном хранилище, сведения о выходном хранилище и источник отчета.
getJob Этот API возвращает статус задания, имеющего указанный идентификатор задания. Он предоставляет информацию о состоянии задания, например, «Получено», «В процессе» или «Завершено». Если задание завершено, он также возвращает результат задания, включая любые сообщения об ошибках, возникшие во время выполнения задания.

Ознакомьтесь с документацией API службы агрегации .

Очередь заданий

Управляемый облачный сервис: Pub/Sub (Google Cloud) / Amazon SQS (Amazon Web Services)

Очередь заданий — это очередь сообщений, содержащая запросы заданий для Aggregation Service. Frontend Service вставляет запросы заданий в очередь, которые затем потребляются Aggregation Workers, которые их обрабатывают.

Облачное хранилище

Управляемый облачный сервис: Google Cloud Storage (Google Cloud) / Amazon S3 (Amazon Web Services)

Входные и выходные файлы, используемые службой агрегации, такие как зашифрованные файлы отчетов и выходные сводные отчеты, хранятся в облачном хранилище.

База данных метаданных вакансий

Управляемый облачный сервис: Spanner (Google Cloud) / DynamoDB (Amazon Web Services)

База данных метаданных заданий используется для хранения и отслеживания статуса заданий агрегации. Она записывает метаданные, такие как время создания, запрошенное время, время обновления и состояние, такое как Received, In Progress или Finished. Aggregation Workers обновляют базу данных метаданных заданий по мере выполнения заданий.

Агрегирующий рабочий

Управляемый облачный сервис: Compute Engine с конфиденциальным пространством (Google Cloud) / Amazon Web Services EC2 с Nitro Enclave (Amazon Web Services).

Агрегационный работник обрабатывает запросы на задания в очереди заданий и расшифровывает зашифрованные входные данные с помощью ключей, которые он получает из службы генерации и распределения ключей (KGDS) в координаторах. Чтобы минимизировать задержку обработки заданий, агрегационные работники кэшируют ключи расшифровки на период в восемь часов и используют их во всех обрабатываемых заданиях.

Агрегирующие рабочие процессы работают в экземпляре Trusted Execution Environment (TEE) . Рабочий процесс обрабатывает только одно задание за раз. Вы можете настроить несколько рабочих процессов для параллельной обработки заданий, установив конфигурацию автоматического масштабирования. При использовании автоматическое масштабирование динамически регулирует количество рабочих процессов в соответствии с количеством сообщений в очереди заданий . Вы можете настроить минимальное и максимальное количество рабочих процессов для автоматического масштабирования через файл среды Terraform. Более подробную информацию об автоматическом масштабировании можно найти в этих скриптах Terraform: Amazon Web Services или Google Cloud .

Aggregation Workers вызывают Aggregatable Report Accounting Service для агрегированного отчетного учета. Эта служба гарантирует, что задания будут выполняться только в том случае, если не превышен лимит бюджета конфиденциальности. (См. правило «Нет дубликатов» .) Если бюджет доступен, с использованием шумных агрегатов формируется сводный отчет. Ознакомьтесь с дополнительными подробностями об агрегированном отчетном учете .

Aggregation Workers обновляют метаданные задания в базе данных метаданных заданий. Эта информация включает коды возврата заданий и счетчики ошибок отчетов в случае частичных сбоев отчетов. Пользователи могут получить состояние с помощью API извлечения состояния задания getJob .

Более подробное описание службы агрегации см. в этом пояснении .

Следующие шаги

Теперь, когда вы знаете, как работает служба агрегации, следуйте руководству по началу работы , чтобы развернуть собственный экземпляр через Google Cloud или Amazon Web Services.