집계 서비스는 광고 기술에 고객의 캠페인 효과를 개선하는 데 필요한 실적 통계를 제공합니다.
이 문서에서는 다음을 다룹니다.
- 주요 용어 및 개념
- 집계 가능한 원시 보고서에서 자세한 전환 데이터와 도달범위 측정을 제공하는 집계 서비스의 작동 방식
- 집계 가능한 보고서 일괄 처리 개념 개요
- Cloud 구성요소 개념 개요
이 문서의 대상
이 페이지에서는 광고 기술 및 개발자가 Google API를 통해 효과적이고 개인 정보를 보호하는 광고 측정을 실행하는 방법을 이해하는 데 도움이 됩니다.
이 문서에서는 Private Aggregation API, Attribution Reporting API, Protected Audience API, Shared Storage, Trusted Execution Environments에 대해 알고 있다고 가정합니다.
주요 용어 및 개념
계속하기 전에 핵심 용어를 숙지하세요.
용어 설명
- 애드테크
-
광고 플랫폼은 광고 게재를 위한 서비스를 제공하는 회사입니다.
- 집계 가능한 보고서
-
집계 가능한 보고서는 개별 사용자 기기에서 전송된 암호화된 보고서입니다. 이 보고서에는 교차 사이트 사용자 행동 및 전환에 관한 데이터가 포함됩니다. 전환 (기여 분석 트리거 이벤트라고도 함) 및 관련 측정항목은 광고주 또는 광고 기술에서 정의합니다. 각 보고서는 여러 당사자가 기본 데이터에 액세스하지 못하도록 암호화됩니다.
- 집계 가능한 보고서 회계
-
할당된 개인 정보 보호 예산을 추적하고 '중복 없음' 규칙을 적용하는 두 코디네이터에 모두 있는 분산 원장입니다. 이는 개인 정보 보호 메커니즘으로, 조정자 내에 위치하고 실행되며 할당된 개인 정보 보호 예산을 초과하는 보고서가 집계 서비스를 통과하지 않도록 합니다.
- 집계 가능한 보고서 회계 예산
-
개별 보고서가 두 번 이상 처리되지 않도록 하는 예산 참조입니다.
- Aggregation Service
-
집계 가능한 보고서를 처리하여 요약 보고서를 생성하는 광고 기술 운영 서비스입니다.
- 증명
-
일반적으로 암호화 해시 또는 서명을 사용하여 소프트웨어 ID를 인증하는 메커니즘입니다. 집계 서비스 제안서의 경우 증명은 광고 기술 운영 집계 서비스에서 실행되는 코드를 오픈소스 코드와 일치시킵니다.
- 참여 결합
- 코디네이터
-
키 관리 및 집계 가능한 보고서 회계를 담당하는 법인입니다. 조정자는 승인된 집계 서비스 구성의 해시 목록을 유지하고 복호화 키에 대한 액세스를 구성합니다.
- 노이즈 및 확장
-
개인 정보를 보호하고 최종 보고서에서 익명화된 측정 정보를 제공하기 위해 집계 프로세스 중에 요약 보고서에 추가되는 통계적 노이즈입니다.
라플라스 분포에서 가져온 덧셈 노이즈 메커니즘에 대해 자세히 알아보세요.
- 신고 출처
-
집계 가능한 보고서를 수신하는 항목입니다. 즉, 개발자 또는 Attribution Reporting API를 호출한 광고 기술입니다. 집계 가능한 보고서는 사용자 기기에서 보고 출처와 연결된 잘 알려진 URL로 전송됩니다. 보고 출처는 등록 중에 지정됩니다.
- 공유 ID
-
shared_info
,reporting_origin
,destination_site
(Attribution Reporting API만 해당),source_registration-time
(Attribution Reporting API만 해당),scheduled_report_time
, 버전으로 구성된 계산된 값입니다.shared_info
필드에서 동일한 속성을 공유하는 여러 보고서는 공유 ID가 동일해야 합니다. 공유 ID는 집계 가능한 보고서 회계에서 중요한 역할을 합니다. - 요약 보고서
-
Attribution Reporting API 및 Private Aggregation API 보고서 유형입니다. 요약 보고서에는 집계된 사용자 데이터가 포함되며 노이즈가 추가된 세부 전환 데이터가 포함될 수 있습니다. 요약 보고서는 집계 보고서로 구성됩니다. 특히 전환 가치와 같은 일부 사용 사례의 경우 이벤트 수준 보고보다 더 유연하고 더 풍부한 데이터 모델을 제공합니다.
- 신뢰할 수 있는 실행 환경 (TEE)
-
외부 당사자가 노출될 위험 없이 머신에서 실행 중인 소프트웨어의 정확한 버전을 확인할 수 있는 컴퓨터 하드웨어 및 소프트웨어의 보안 구성입니다. TEE를 사용하면 외부 사용자가 소프트웨어가 소프트웨어 제조업체가 주장하는 것과 정확히 일치하는지 확인할 수 있습니다.
개인 정보 보호 샌드박스 제안에 사용되는 TEE에 관해 자세히 알아보려면 Protected Audience API 서비스 설명 및 집계 서비스 설명을 참고하세요.
집계 서비스 워크플로
집계 서비스는 집계 가능한 원시 보고서에서 세부적인 전환 및 도달범위 데이터의 요약 보고서를 생성합니다. 보고서 생성 흐름은 다음 단계로 구성됩니다.
- 브라우저가 공개 키를 가져와 암호화된 보고서를 생성합니다.
- 암호화된 집계 가능한 보고서가 광고 기술 서버로 전송됩니다.
- 광고 기술 서버는 보고서 (avro 형식)를 일괄 처리하여 집계 서비스로 전송합니다.
- 집계 작업자는 집계된 보고서를 가져와 복호화합니다.
- 집계 작업자는 코디네이터에서 복호화 키를 가져옵니다.
- 집계 작업자는 집계 및 노이즈 제거를 위해 보고서를 복호화합니다.
- 집계 가능한 보고서 회계 서비스는 지정된 집계 가능한 보고서의 요약 보고서를 생성하기에 충분한 개인 정보 보호 예산이 있는지 확인합니다.
- 집계 서비스가 최종 요약 보고서를 제출합니다.
다음 다이어그램은 웹 및 휴대기기에서 보고서가 수신된 시점부터 집계 서비스에서 요약 보고서가 생성되는 시점까지 집계 서비스가 작동하는 방식을 보여줍니다.
요약하면 Attribution Reporting API 또는 Private Aggregation API는 여러 브라우저 인스턴스에서 보고서를 생성합니다. Chrome은 보고서를 광고 기술 보고 출처로 전송하기 전에 보고서를 암호화하기 위해 코디네이터의 키 호스팅 서비스에서 7일마다 순환되는 공개 키를 가져옵니다. 광고 기술 보고 출처는 수신되는 보고서를 수집하여 avro 형식으로 변환하고 집계 서비스로 전송합니다. 그런 다음 집계 서비스에 일괄 요청이 전송되면 집계 서비스는 키 호스팅 서비스에서 복호화 키를 가져와 보고서를 복호화하고, 요약 보고서를 만들기에 충분한 개인 정보 보호 예산이 있는 한 보고서를 집계하고 노이즈를 제거하여 요약 보고서를 만듭니다.
구현 섹션에서 집계 가능한 보고서를 준비하는 방법을 자세히 알아보세요.
집계 가능한 보고서 일괄 처리
등록 프로세스 중에 지정한 지정된 보고 출처 서버의 도움이 없다면 보고 흐름이 완료되지 않습니다. 보고 출처는 집계 가능한 보고서를 수집, 변환, 일괄 처리하고 Google Cloud 또는 Amazon Web Services의 집계 서비스로 전송할 수 있도록 준비합니다. 집계 가능한 보고서를 준비하는 방법을 자세히 알아보세요.
Cloud 구성요소
집계 서비스는 여러 클라우드 서비스 구성요소로 구성됩니다. 제공된 Terraform 스크립트를 사용하여 필요한 모든 클라우드 서비스 구성요소를 프로비저닝하고 구성합니다.
프런트엔드 서비스
관리형 클라우드 서비스: Cloud Function (Google Cloud) / API Gateway (Amazon Web Services)
프런트엔드 서비스는 작업 생성 및 작업 상태 검색을 위한 Aggregation API 호출의 기본 진입점인 서버리스 게이트웨이입니다. 집계 서비스 사용자의 요청을 수신하고, 입력 매개변수를 검증하고, 집계 작업 예약 프로세스를 시작합니다.
프런트엔드 서비스에는 다음과 같은 두 가지 API가 있습니다.
엔드포인트 | 설명 |
---|---|
createJob |
이 API는 집계 서비스 작업을 트리거합니다. 작업을 트리거하려면 작업 ID, 입력 스토리지 세부정보, 출력 스토리지 세부정보, 보고 출처와 같은 정보가 필요합니다. |
getJob |
이 API는 지정된 작업 ID가 있는 작업의 상태를 반환합니다. '수신됨', '진행 중', '완료됨'과 같은 작업 상태에 관한 정보를 제공합니다. 작업이 완료되면 작업 실행 중에 발생한 오류 메시지를 포함하여 작업 결과도 반환합니다. |
Aggregation Service API 문서를 확인하세요.
작업 대기열
관리형 클라우드 서비스: Pub/Sub (Google Cloud) / Amazon SQS (Amazon Web Services)
작업 큐는 집계 서비스의 작업 요청이 포함된 메시지 큐입니다. 프런트엔드 서비스는 작업 요청을 큐에 삽입하고, 이를 처리하는 집계 작업자가 이를 사용합니다.
클라우드 스토리지
관리형 클라우드 서비스: Google Cloud Storage (Google Cloud) / Amazon S3 (Amazon Web Services)
집계 서비스에서 사용하는 입력 및 출력 파일(예: 암호화된 보고서 파일, 출력 요약 보고서)은 Cloud Storage에 보관됩니다.
작업 메타데이터 데이터베이스
관리형 클라우드 서비스: Spanner (Google Cloud) / DynamoDB (Amazon Web Services)
작업 메타데이터 데이터베이스는 집계 작업의 상태를 저장하고 추적하는 데 사용됩니다. 생성 시간, 요청 시간, 업데이트 시간과 같은 메타데이터와 수신됨, 진행 중, 완료됨과 같은 상태를 기록합니다. 집계 작업자는 작업이 진행됨에 따라 작업 메타데이터 데이터베이스를 업데이트합니다.
집계 작업자
관리형 클라우드 서비스: 비공개 공간이 있는 Compute Engine (Google Cloud) / Nitro Enclave가 있는 Amazon Web Services EC2 (Amazon Web Services)
집계 작업자는 작업 대기열에서 작업 요청을 처리하고, 코디네이터의 키 생성 및 배포 서비스 (KGDS)에서 가져온 키를 사용하여 암호화된 입력을 복호화합니다. 집계 작업자는 작업 처리 지연 시간을 최소화하기 위해 8시간 동안 복호화 키를 캐시하고 처리하는 작업 전반에서 이를 사용합니다.
집계 작업자는 신뢰할 수 있는 실행 환경 (TEE) 인스턴스 내에서 작동합니다. 작업자는 한 번에 하나의 작업만 처리합니다. 자동 확장 구성을 설정하여 여러 작업자가 작업을 동시에 처리하도록 구성할 수 있습니다. 자동 확장이 사용되면 작업 큐의 메시지 수에 따라 작업자 수가 동적으로 조정됩니다. Terraform 환경 파일을 통해 자동 확장에 대한 최소 및 최대 작업자 수를 구성할 수 있습니다. 자동 확장에 관한 자세한 내용은 Amazon Web Services 또는 Google Cloud Terraform 스크립트를 참고하세요.
집계 작업자는 집계 가능한 보고서 회계를 위해 집계 가능한 보고서 회계 서비스를 호출합니다. 이 서비스는 개인 정보 보호 예산 한도가 초과되지 않은 경우에만 작업이 실행되도록 합니다. ('중복 없음' 규칙 참고) 예산을 사용할 수 있으면 노이즈가 있는 집계를 사용하여 요약 보고서가 생성됩니다. 집계 가능한 보고서 회계에 대해 자세히 알아보세요.
집계 작업자는 작업 메타데이터 데이터베이스에서 작업 메타데이터를 업데이트합니다. 이 정보에는 작업 반환 코드와 부분 보고서 실패의 경우 보고서 오류 카운터가 포함됩니다. 사용자는 getJob
작업 상태 검색 API를 사용하여 상태를 가져올 수 있습니다.
집계 서비스에 관한 자세한 내용은 이 설명서를 참고하세요.
다음 단계
집계 서비스의 작동 방식을 알았으므로 시작 가이드에 따라 Google Cloud 또는 Amazon Web Services를 통해 자체 인스턴스를 배포하세요.