Hubble Database

Financial Big Data Platform

대한민국 모든 기업을 담다.

Hubble Database는 대한민국 기업 생태계를 전산화한 금융 빅데이터 플랫폼으로,
국내 모든 법인 기업의 다양한 정보를 빅데이터 기술 기반으로 수집·검증·표준화 저장하여 기업을 다각적이고 정밀하게 진단할 수 있는 기반을 제공합니다.

파편화되고 분절된 기업의 최신 정보를 하나의 데이터베이스로 통합하여 기업 및 금융 분석을 위한 데이터 전처리에 소요되는 시간과 노력을 획기적으로 단축하고, 적시적인 기업 분석과 연구를 가능하게 합니다.
추적 기업
약 
128
만개
수집 분야
10
대 영역
수집 항목
약 
300
Platform (KR)

Step 01. 법인 전수 식별

1118117
개 기업 표본
Hubble Database는 국내 법인 전체를 AI 학습 데이터 표본으로 편입하였으며, 대한민국 기업 생태계를 전산화하는데 성공하였습니다.
2025년 4월
 법인 사업체 기준
 (폐업 제외)
기업 표본
1118117
법인 사업체
1530567
데이터 커버리지
83
%

Step 02. 데이터 수집

10대 데이터 영역 300개 이상의 비 금융 대안 데이터
대안 데이터는 전통적인 금융 지표나 기업 공시에서 탈피하여 기업과 사업을 보다 정밀하고 적시에 분석할 수 있도록 돕는 비재무적(Non-Financial) 정보를 의미합니다. 조직, 인증, 홈페이지, 지식재산권, 언론 보도 등 다양한 데이터를 바탕으로 기업을 다각도로 이해하고 수행 중인 사업의 성과를 세밀하게 관찰할 수 있습니다.

이러한 대안 데이터는 기업과 금융을 분석하는 데 있어 보다 창의적인 접근을 가능하게 하며, 기존 재무 정보만으로는 파악하기 어려웠던 기업의 내재적 가치를 드러냅니다. 이를 통해 투자 기회를 효과적으로 발굴하고, 선제적인 리스크 관리를 수행할 수 있습니다.
개요
Summary
상호 변경, 업력, 대표자 수, 등기/사업 상태
홈페이지
Web
URL, 도메인 유효 여부, 업데이트 이력
조직
Organization
월별 / 누적 고용, 입사자 & 퇴사자 수, 평균 급여
기술
Technology
특허, 실용신안, 상표, 디자인, R&D 수행
인증
Certification
벤처기업, 이노비즈 등 주요 인증 내역
산업
Industry
산업/기술 내역, 국가 체계 기준 분류
지리
Geolocation
소재지, 주소 변경 이력 및 추이, 공시지가
투자
Funding
투자 유치, 크라우드 펀딩, 정부 출연 자금
수상
Awards
수상 내역, 민간 / 정부 주요 사업 선정
언론
Media
언론사, 기사 제목·내용·일자, 유튜브 영상 정보

Step 03. 빅 데이터 전처리 통합

다양한 출처의 원천 데이터에 대해 자동 표준화 및 전처리 프로세스를 가동하여 AI 진단 및통계 분석을 위한 최적의 형태로 데이터베이스에 저장합니다.
유효성 검사
내부 규정에 따른 데이터 검증 및 정합성 확인
표준화 작업
공통된 형식과 기준에 맞게 데이터 변환
데이터 결합
동일한 회사 내 다양한 출처의 데이터 통합