Variant 3.0 — Catalog
표준 데이터셋
카탈로그
즉각적인 ML 인제스션을 위해 사전 검증되고, 익명화 및 구조화된 데이터 원형입니다. 고성능 훈련 파이프라인에 최적화되어 있습니다.
SYSTEM ACTIVE
음성 세션 데이터셋
실제 환경에서의 인간 상호작용 고해상도 녹음 데이터입니다. 화자 분리 및 감정 톤 마커가 포함되어 있습니다.
Source
실제 환경 세션
Format
JSONL / WAV
Metadata
풍부한 문맥 태그
Processing
화자 분리
앱 사용 세션 데이터셋
세밀한 클릭스트림 및 내비게이션 로그입니다. 사용자 의도 예측 및 의사결정 경로 분석에 최적화되어 있습니다.
Source
행동 이벤트
Format
JSONL / PARQUET
Structure
의사결정 경로 중심
Schema
Unifiedv2
Uncounted는 표준화된 데이터셋만 제공합니다. 커스텀 데이터 구축은 진행하지 않습니다.
DOC_ID: 994-A
REV: 3.0
LAST_UPDATE: 2023-10-24
모든 데이터셋은 규정을 준수하는 파트너십을 통해 소싱되며, GDPR 및 CCPA 규정에 따라 PII(개인식별정보)가 제거됩니다. 사용은 내부 모델 학습 및 검증 목적으로 엄격히 제한됩니다. 재배포는 금지됩니다.