고용보험 취득·상실 이력DB 표본 구축

공공데이터의 민간 개방 확산과 지자체 통계 수요의 증가 등 고용부를 비롯한 전 부처에서의 행정DB 민간 개방이 활성화되고 있다. 고용부는 2023년 1월 제2차 국가데이터…

연구사업보고서

표지_고용보험 취득 상실

고용보험 취득·상실 이력DB 표본 구축

고용보험 취득·상실 이력DB 표본 구축

저자
최형아, 박세정A, 윤성한, 김영원, 박민규
게시일
2025-06-12
주제대상
고용서비스,고용정보분석,공통
조회수
110
다운로드
98
바로보기
15
키워드

목차

제1장 서론

제1절 연구 배경 

제2절 연구 목적 및 내용 


제2장 국내외 표본데이터 개방 

제1절 사회보장 행정데이터 

제2절 환자 표본 자료 

제3절 독일 고용이력 통합 자료 구축 


제3장 개인별 고용보험 취득·상실 이력 데이터셋 구축

제1절 개요 

제2절 이력DB 구축 과정

제3절 확장 이력DB 구축 과정 


제4장 모집단DB 분석 및 표본추출 

제1절 이력DB 구조 

제2절 모집단DB 

제3절 표본설계 


제5장 추정 

제1절 모집단DB 추정 


제6장 표본DB 신뢰성 

제1절 표본DB 결과 

제2절 표본DB 신뢰성 


제7장 결론 


참고문헌 

부록 1. 고용보험 이력DB 표본 패널자료 구축_심층연구용 

부록 2. 표본추출 가이드라인 

부록 3. 고용보험 이력DB 표본 패널자료 설명서(ELDS, 2024.8.)

요약

공공데이터의 민간 개방 확산과 지자체 통계 수요의 증가 등 고용부를 비롯한 전 부처에서의 행정DB 민간 개방이 활성화되고 있다. 고용부는 2023년 1월 제2차 국가데이터정책심의위원회에서 고용행정포털의 25종 행정통계의 공표 수준을 시군구 단위, 산업소분류로 세분화하여 제공하도록 고용행정DB 통계 작성 방향을 의결하였다. 또한, 고용보험 취득․상실과 구직활동, 직업훈련 통계들이 각각 따로 제공되고 있어 노동시장 현안 분석 및 심층분석 활용에 불편하다는 지적을 하였다. 그에 대한 후속조치로 본 연구를 진행하였다.

고용보험 이력DB는 노동시장 내 임금근로자의 일자리 유지, 이동, 전직 등의 변동을 파악할 수 있는 국내 유일의 패널자료이다. 2021년 고용보험 이력DB DW구축을 완료하였다(이시균 외, 2021a). 이를 기반으로 본 연구에서는 현시점으로 DB구축의 이력 업데이트 등 현행화 구축을 하고 이력DB를 민간 개방을 함으로써 노동시장 진단하고, 행정DB 활용을 강화하는 데 목적이 있다. 민간 개방을 하기 위해서는 식별 가능한 정보들이 많아 고용보험 이력 모집단DB를 분석하여 잘 대표할 수 있는 표본셋을 구축하였다.

구축 과정을 간략히 정리하면, 기본 이력DB는 고용보험 취득DB, 상실DB를 중심으로 개인의 기본 이력 구조를 형성한 후 학력, 임금과 같은 추가 정보는 다른 행정 자료를 통해 보완하여 완성된다. 데이터 구축 과정에서는 결측 처리, 오류 수정, 중복 제거와 같은 전처리 과정을 거치며, 개인 단위의 취득과 상실 간의 연속적 고용 기간을 하나의 구간으로 정의한다. 최종 구축된 행 단위 이력 데이터셋은 활용도를 높이기 위해 데이터 구조를 재배치하여 취득-상실셋과 상실-취득셋 두 가지 형태로 제공된다. 확장 이력DB는 기본 이력DB 중 상실-취득셋에 실업자 직업훈련, 취업알선, 실업급여 수급 관련 정보를 가공·추가 연계하여 생성한 데이터셋이다. 고용정책 효과와 같은 심층적 연구 분석이 가능하도록 보다 다양한 정보를 제공한다.

1995년 고용보험 제도 시행이 시작된 이후부터 지금까지 구축된 고용보험 이력 모집단DB에 대한 표본셋 구축을 위해 모집단DB를 재정의하였다. 표본셋 구축 대상은 1995년부터 2021년 12월까지 고용보험에 가입한 사람이다. 다만, 관측시점(중도절단)은 2023년 12월 까지로 하여, 직업훈련 참여 종료 이후 6개월 정도의 시간차를 두어 고용성과 측정이 가능하도록 하였다(자세한 내용은 본문 4장 참고).

표본설계 방향은 가입연도 안에서 성별, 연령대의 인적속성을 층화 변수로 사용하고, 각 층 내에서 사업체 속성과 일자리 이력 속성 변수를 내재층으로 활용하였다. 이를 통해 개인별 인적특성, 일자리 특성, 첫 일자리 사업체 특성별 모집단DB 대표성을 갖는 표본DB를 구축하였다. 또한, 첫 가입연도를 주요 층으로 활용하게 된 배경으로는 향후 지속적으로 신규 가입자에 대한 표본셋을 기구축된 표본DB와 통합하여 이용하고자 한 데 있다. 적정 표본규모 산출에서는 모집단에서 지역, 산업별로 월평균임금 변인의 오차를 검토하여 적정 규모 검토를 하였고 최종적으로 첫 가입연도별 약 3% 표본추출을 하였다(범용셋 기준).

한편, 표본DB에서 모집단 추정 시 활용될 모평균(모비율) 산식과 분산추정식을 제시하고, 구축된 표본셋에서 모평균(모비율) 추정 시 신뢰수준을 살펴보았다. 신뢰성 검토는 연도별 직업훈련 유경험 비율 및 2020년 산업대분류별 월평균 보수를 추정하였다. 연도별 직업훈련 유경험률과 산업대분류별 월평균 보수 추정값의 95% 신뢰구간은 모집단 참값을 모두 포함하고 있는 것으로 나타났다.

표본셋은 범용셋(추출률 3%)과 심층연구용셋(추출률 20%)으로 구분하여 개방하였다. 범용셋은 데이터 이용 장벽을 낮춰 고용행정분석시스템(ELDS)에서 서비스 신청 후 원격으로 분석을 할 수 있도록 하였다. 심층연구용셋은 세부적인 통계 작성이 가능하도록 추출률을 20%로 상향하고 데이터 안심구역(서울, 대전, 충북음성)에서 이용 가능하도록 개방하였다. 이 자료는 범용셋(표본추출률 3%)보다 지역과 산업 변수에서 개방수준을 세분화하여 시군구 단위와 산업소분류 단위에서 이용 가능하도록 제공한다.

다양하고 깊이 있는 정보가 있는 행정DB를 민간 개방하기 위해 개인식별로부터 보다 안정적인 방법으로 표본셋 구축을 시범적으로 연구하였다. 본 연구에서는 표본추출 가이드라인을 부록에 제시하여 이후로도 지속적으로 표본셋 추가 작업과 이력DB 현행화에 따른 작업절차들을 제시하였다.

저자의 다른 보고서

의 다른 보고서,
검색조건 입력
게시판명 목록이며 번호, 구분, 보고서명, 게시일, 저자, 조회수, 첨부파일 정보 제공
번호 구분 보고서명 게시일 저자 다운로드수 첨부파일

연관 보고서

의 연관 보고서,
검색조건 입력
게시판명 목록이며 번호, 구분, 보고서명, 게시일, 저자, 조회수, 첨부파일 정보 제공
번호 구분 보고서명 게시일 저자 다운로드수 첨부파일

Loading...