개인에겐 데이터 자산을, 기업에겐 적법한 고품질 학습데이터를. 양측 동의 기반과 개인정보 자동 가림 97.5%으로 매수자가 즉시 학습에 투입할 수 있는 데이터 공급 생태계를 구축합니다.
고품질 학습데이터 확보는 AI 산업의 가장 큰 병목입니다. 기존 조달 방식은 한계에 도달했습니다.
AI 기업은 실생활 음성 데이터가 필요하지만, 적법하게 확보할 수 있는 경로가 극히 제한적입니다.
자사 고객 통화 데이터의 직접 학습은 개인정보보호법 위반. 웹 크롤링도 저작권 분쟁이 급증하고 있습니다.
공개 텍스트 학습 자원이 2026~2032년 사이 소진될 전망. 비텍스트 원천 다변화가 시급합니다.
글로벌 AI 데이터 투자 166억 달러(2024) 기록. 데이터 확보 비용이 모델 개발비를 추월하는 추세입니다.
휴대전화에서 통화 파일 자동 탐색 → 양측 동의 → 서버에서 개인정보 자동 가림. 통화 음성은 양측 동의가 완료될 때까지 서버로 절대 전송되지 않으며, 휴대전화 갤러리는 그대로 유지됩니다.
방치된 자동녹음 파일을 안전하게 자산화하고, 데이터 공유에 대한 정당한 보상을 받으세요.
스마트폰 속 자동녹음 파일을 자동으로 탐지하고, 품질·유효발화·중복을 분석합니다. 터치 한 번이면 시작.
본인 + 상대방 양측 동의 완료 시점까지 통화 음성은 휴대폰 갤러리에 그대로 보존. 동의 후에만 서버에서 비식별 처리. 한국인터넷진흥원·개인정보보호법 정합.
공유를 허용한 데이터에 대해 투명한 기여도 산정 + 매수자 매출 분배. 1년에 한 분당 최대 ₩300만 (세금 부담 적은 구간, 매년 1월 초기화).
용도별로 사전 분류된 데이터 패키지. 추가 전처리 없이 AI 학습에 바로 활용하세요.
| 코드 | 패키지명 | 분량 / 단가 | 설명 | 주요 수요처 |
|---|---|---|---|---|
| UC-A1 |
시드 (원본 음성)
파일럿 단위
|
6시간 / 건당 ₩100,000~500,000 시드 단계 무료 검증 |
개인정보 자동 가림 처리된 원본 음성 파일(WAV). 다양한 발화자·환경·잡음 포함. | 음성→글자 변환 · 글자→음성 변환 모델 사전 검증 |
| UC-A2 |
성장 (원본 음성)
시간당 거래
|
60시간 또는 600시간 시간당 ₩200,000~600,000 최신 데이터일수록 높은 단가 |
사용자 입력 라벨 부착 가능. 대화 맥락 메타데이터 포함. 비독점 5~10회 판매. | AI 콜센터 · 대화 AI 컨택센터 솔루션 |
| UC-A3 |
규모 (원본 음성)
대량 단위
|
6,000시간 시간당 ₩600,000~2,000,000 희소 분야 프리미엄 |
대화 의도(요청/응답/확인 등) + 감정 강도 라벨. 세션 단위 데이터 포맷. | 대규모 언어모델(LLM) · AI 에이전트 파인튜닝용 |
| UC-LLM |
지시문 학습 데이터
4단계 가공
|
6,000시간 시간당 ₩1,000,000~2,000,000 자동 분류·요약·질의응답 |
통화 메타데이터 + 자동 분류·요약·질의응답 가공 데이터. 지시문 튜닝 포맷. | 대규모 언어모델 미세조정 한국어 지시문 학습 |
※ 단가는 시드 단계 추정 범위. 매수 의향서 1건 확보 후 정식 단가 확정. 최신 데이터일수록 높은 단가 (최신 ₩600,000 > 한 분기 전 ₩500,000 > 세 분기 전 ₩300,000).
스튜디오, 크라우드소싱, 웹 크롤링 — 기존 데이터 조달 방식의 한계를 넘어섭니다.
| 비교 항목 | 스튜디오 녹음 | 크라우드소싱 | 웹 크롤링 | UNCOUNTED |
|---|---|---|---|---|
| 실생활 자연 대화 | ✕ | ▲ | ✕ | ✓ 실제 통화·대면 |
| 법적 동의 완비 | ✓ | ▲ 부분적 | ✕ | ✓ 양측 동의 |
| 화자·환경 다양성 | 제한적 | ▲ | ✕ | ✓ 전 연령·환경 |
| 구어체·잡음 포함 | ✕ | ▲ | ✕ | ✓ |
| 비식별 처리 | 해당없음 | 서버 처리 | 미처리 | ✓ 양측 동의 후 서버 (개인정보 자동 가림 97.5%) |
| 비용 대비 리스크 | 고비용 / 저리스크 | 중비용 / 중리스크 | 저비용 / 고리스크 | 적정비용 / 제로리스크 |
보안·개발·운영 — 데이터 비즈니스에 필요한 핵심 역량을 갖춘 팀이 만듭니다.
개인 — 방치된 통화 데이터를 자산으로. 1년에 한 분당 최대 ₩300만 (세금 부담 적은 구간).
기업 — 맞춤 샘플 데이터셋 2주 이내 무상 제공. 비밀유지 계약(NDA) 체결 가능.