구글 애널리틱스를 사용하다보면 사용자의 성별, 연령 등이 파악되어 나옵니다.
물론 모든 웹사이트의 방문자에 대해서 파악할 수 있는 것은 아니고
일부만 파악이 가능한데, 그 일부도 어떤 방식으로 데이터를 수집하여 파악하는지가 궁금합니다.
 
그 방법을 알아야 데이터에 대한 신뢰도를 판단할 수 있을 테니까요.
이에 대한 구글 애널리틱스 자체 도움말에는 아래와 같은 안내가 나와 있습니다.

--------------------------------------
데이터 수집
광고 기능을 지원하기 위해 애널리틱스를 업데이트하면 애널리틱스가 아래의 소스로부터 인구통계 및 관심분야 데이터를 수집합니다.

01. 외부 DoubleClick 쿠키. 웹 브라우저 활동에만 적용됩니다. 이 쿠키가 있으면 애널리틱스가 쿠키에 있는 모든 인구통계 및 관심분야 정보를 수집합니다.

02. Android 광고 ID. 앱 활동에만 적용됩니다. Android 앱에서 광고 ID를 수집하도록 애널리틱스 추적 코드를 업데이트하면 애널리틱스가 사용자의 앱 활동과 연결된 인구통계 및 관심분야 정보가 포함된 ID에 기반해 익명의 ID를 생성합니다.

03. 광고주를 위한 iOS ID(IDFA). 앱 활동에만 적용됩니다. iOS 앱에서 IDFA를 수집하도록 애널리틱스 추적 코드를 업데이트하면 애널리틱스가 사용자의 앱 활동과 연결된 인구통계 및 관심분야 정보가 포함된 IDFA에 기반해 익명의 ID를 생성합니다.

DoubleClick 쿠키 또는 익명의 ID가 없거나 포함되는 활동 프로필이 없으면 애널리틱스에서 인구통계 및 관심분야 정보를 수집할 수 없습니다. 그 결과 인구통계 및 관심분야 데이터가 일부 집단의 사용자에게만 제공될 수 있으며, 전체 트래픽 구성을 반영하지 않을 수 있습니다. 개요 보고서의 그래프와 세션 항목의 첫 번째 행에는 해당 데이터의 전체 대비 비율이 표시됩니다(예: 연령 - 전체 세션의 41.39%).