표준 코드 사전 정의
- 표준 코드 정의는 수집된 용어로부터 코드를 선별하여 현 코드의 코드 값을 조사한다. 현 코드를 바탕으로 통합 요구 사항과 통합 필요성에 따라 통합 대상을 파악하고 표준 코드를 정의하고 현 코드와 매핑 설계를 한다.
표준 코드 사전
- 표준 코드 관리 기준
- 재사용성
- 표준 코드는 기업에서 자체적으로 정의하여 사용하는 것보다 표준화 기구나 정부, 공공 기관에서 정의한 코드를 재사용하는 것이 데이터에 대한 이해력을 높이고 코드 관리를 용이하게 하는 데 더 효과적이다.
- 일관성
- 코드는 업무 범위 내에서 가능한 한 유일하게 정의되어야 한다. 동일한 내용의 코드를 사용 형태나 업무 범위에 따라 중복 정의하여 사용할 경우 전사 차원의 코드 데이터 중복은 물론 코드 데이터의 불일치 문제를 발생시킨다.
- 정보 분석성
- 가능한 범위의 데이터는 모두 코드화하여 관리한다. 즉, 사용자가 텍스트로 직접 입력하는 값을 최소화하고 정의된 범위 안에서 선택하도록 함으로써 정보 분석 시에 데이터는 있으나 분석 가치가 없는 데이터가 생성되지 않도록 한다.
- 재사용성
- 표준 코드 작성 형식
- 전사적으로 사용하고 있는 코드를 추출하여 정의하고 부여된 코드와 동일한지를 확인하고, 동일한 값을 가지는 코드에 대해서 통합 작업을 수행하여 단일화 작업을 수행한다. 코드는 표준화 팀에서 엄격한 기준에 따라 관리되어야 하며, 사용자 임의대로 코드 체계를 생성하거나 수정해서는 안된다.

표준 코드 정의
- 표준 코드는 정보시스템별로 사용되고 모든 코드를 수집하여 동일 코드를 파악하고 통합하여 표준 코드를 정의한다.
- 현행 코드 수집
- 단독 코드 테이블
- 하나의 코드를 하나의 테이블에서 관리하는 형태이다. 이런 형태로 관리하는 코드들은 대부분 코드 데이터가 필수적으로 가지고 있어야 할 코드 번호, 코드 값 외에 부가 정보들을 관리할 경우가 많다.
- 통합 코드 테이블
- 복수 개의 코드를 하나의 통합 관리 테이블에서 관리하는 형태이다. 통합 관리 테이블에서 관리하는 기본적인 내용으로는 코드 자체를 식별하기 위한 코드 유형 번호, 코드명, 코드 구조, 코드 번호, 코드 값 등이 있고 기타 코드 관리 차원에서 필요한 정보들이 있다.
- 애플리케이션 정의
- 코드를 데이터베이스에 저장하여 관리하지 않고 애플리케이션에서 정의하여 관리하는 형태이다.
- 코드는 해당 코드를 관리하는 테이블에서 코드 값을 누락하거나 애플리케이션에서 코드 값을 정의하는 이유 때문에 단어, 도메인, 용어와는 달리 수집 시 누락될 가능성이 많다.
- 코드 데이터 값 수집
- 코드를 관리하는 테이블, 통합 코드 테이블, 애플리케이션 사용자 인터페이스를 통하여 코드 정보를 수집한다.
- 코드성 컬럼 파악
- 각 정보시스템의 테이블에 존재하는 컬럼 중에서 코드 정보를 저장하는 코드성 컬럼을 파악한다.
- 수집된 코드에 대한 사용처 파악
- 식별한 코드성 컬럼별로 어떠한 코드를 저장하는지를 파악함으로써 누락된 코드를 확인한다. 코드의 누락은 코드성 컬럼에 저장된 코드 데이터 값과 수집된 코드 번호를 비교하고 검증함으로써 파악한다.
- 단독 코드 테이블
- 현행 코드 상세 분석
- 수집된 현행 코드 정보를 상세히 분석함으로써 동일하거나 통합이 가능한 코드를 식별한다.
- 통합 대상 코드 식별 방법
- 코드 값이 일치하는 동일한 코드 인스턴스를 가지는 코드를 찾은 뒤 해당 코드의 모든 코드 인스턴스를 확인하고 비교함으로써 통합 가능한 코드를 식별한다.
- 분석해야 할 대상 코드가 너무 많을 경우에는 코드를 사용하는 업무 기능별로 코드를 분류한 후 분류된 단위로 코드를 분석한다.
- 표준 코드 정의
- 통합 대상이 없는 코드는 현행 코드 인스턴스를 그대로 유지하는 것이 일반적이다.
- 통합 대상이 존재하고 통합 대상 코드의 코드 번호가 서로 상이할 경우 새로운 코드 번호를 부여함으로써 표준 코드를 정의한다.
표준 코드 활용
- 일부 업무에서 특정 코드의 모든 코드 값을 사용하지 않고 범위를 한정하여 일부 코드 값만 사용할 경우에는 표준 코드로부터 파생된 코드를 정의하여 사용한다.
표준 코드 정의 시 고려 사항
- 코드 값은 향후 확장성을 고려하여 정의하여야 하며, 여러 업무에서 사용할 수 있도록 통합된 코드로서의 일관성을 유지해야 한다.
- 시스템 운영 중에 코드 값이 변경되는 경우 해당 코드를 사용한 기존 데이터의 유지를 위해 기존 코드 값을 삭제하는 대신 사용 중지 상태로 관리하고 새로운 코드 값을 신규로 정의한다.
- 표준 코드를 도출하면서 파악한 표준 코드-현행 코드 간의 변환 매핑 정보를 별도로 기록하여 향후 신규 정보시스템으로의 데이터 이행 시 참고한다.
표준 용어 사전 정의
- 표준 용어 사전 정의는 단어, 도메인, 코드 표준이 정의되면 이를 바탕으로 표준 용어를 구성하고, 단어의 조합, 도메인 분류, 데이터 타입 길이, 코드 값 등을 기준으로 해서 표준 적용이 업무적으로나 IT적으로 무리가 없는지 검토한다. 또한 검토 과정에서 누락된 단어, 도메인, 코드 등이 없는지를 확인하고 추가 보완 작업을 수행한다.
표준 용어 사전
- 용어는 업무에서 자주 사용하는 단어의 조합을 의미하며, 표준 용어는 전사적으로 사용하는 엔티티와 속성을 대상으로 표준 단어 사전에 정의된 단어를 조합하여 정의한다. 단어는 개별적이지만 용어는 업무와 조직의 성격에 따라 그 조합이 달라질 수 있다.
- 표준 용어 관리 기준
- 표준성
- 같은 기업 내부라도 업무별로 동일한 의미를 서로 다른 용어를 사용하여 표현하는 경우가 매우 많다. 따라서 표준 용어 사전은 용어의 표준화를 통해 용어 사용의 차이에 따라 발생되는 전사 차원의 혼란을 최소화할 수 있어야 한다.
- 일반성
- 용어가 지나치게 업무 관점에서만 정의되어 일반적으로 이해하기 힘들거나 의미상에 혼란을 초래해서는 안된다. 일반적인 의미와 전혀 다르게 사용된 용어는 적절한 다른 용어로 대체하고, 새로운 용어 개발 또한 자제해야 한다.
- 업무 지향성
- 용어는 기업의 업무 범위 내에서 약어를 사용하거나 내부에서 별도로 정의하여 사용할 수 있다. 단 지나친 약어의 사용은 업무에 대한 이해도를 떨어뜨릴 수 있으므로 주의한다.
- 표준성
- 표준 용어 작성 형식
- 표준 용어는 전사적으로 보유하고 있는 엔티티와 속성을 대상으로 추출된 표준 단어를 조합하여 생성되며 용어 사전은 엔티티 용어 사전과 속성 용어 사전으로 구분하여 정의 관리한다.

표준 용어 정의
- 표준 용어는 정보시스템별로 사용되고 있는 모든 형행 용어를 수집하고 표준 단어 사전, 표준 도메인 사전, 표준 코드 사전 등을 참조하여 현행 용어에 대한 표준 용어를 도출한다.
- 현행 용어에 대한 표준 단어 도출 및 표준 용어 정의
- 현행 용어로부터 표준 용어의 도출은 단어 수준에서의 표준화를 통해 이루어진다.
- 표준 단어에 대한 도메인/코드 정의
- 표준 도메인을 도출하면서 별도 관리했던 정보를 가지고 표준 단어에 대한 돔인을 정의할 수 있다.
표준 용어 정의 시 고려 사항
- 표준 용어 도출 시 데이터 표준 원칙에서 정의한 한글명 및 영문명의 허용 길이를 넘지 않도록 한다.
- 만약 영문명의 허용 길이가 문제가 된다면 한글명을 변경하거나 한글명을 구성하는 표준 단어들 중 일부를 조합하여 하나의 표준 단어를 등록하여 영문명의 길이를 축약한다.
- 생성된 표준 용어가 너무 길다면 두 개의 표준 용어를 복합하여 생성하는 방법도 고려한다.
'DAP' 카테고리의 다른 글
[DAP 전문가 가이드] 3.3 데이터 표준 관리 (0) | 2025.04.25 |
---|---|
[DAP 전문가 가이드] 3.2.3 데이터 표준 확정 (0) | 2025.04.25 |
[DAP 전문가 가이드] 3.2.2 데이터 표준 정의 (1) (1) | 2025.04.25 |
[DAP 전문가 가이드] 3.2.1 데이터 표준 원칙 정의 (0) | 2025.04.25 |
[DAP 전문가 가이드] 3.1.3 데이터 표준 관리 도구 (0) | 2025.04.25 |