공급사 AI BOM 제출 요구사항

자사에 AI 모델이나 시스템을 공급하는 공급사가 제출해야 하는 AI BOM의 요구사항입니다. 표준 데이터 형식, 필수 포함 정보, 식별자 규칙, 라이선스·출처·민감도 요구를 규정합니다.

이 문서는 자사에 AI 모델이나 AI 시스템을 공급하는 공급사가 제출해야 하는 AI를 위한 부품 명세서(AI Bill of Materials, AI BOM)의 요구사항을 규정합니다. 기존 소프트웨어 부품 명세서(SBOM) 제출 요구사항을 모델과 데이터셋 층위로 확장한 것이며, 필수 항목은 「AI BOM 필드 요구사항 매트릭스」의 공급사 열에서 도출했습니다.

1. 표준 데이터 형식

AI BOM은 기계 판독이 가능한 표준 형식으로 제출해야 합니다. 다음 두 형식을 인정합니다.

형식버전AI 표현 방식비고
SPDX3.0 이상AI Profile의 AIPackage, Dataset Profile의 DatasetPackage모델과 데이터셋 필드를 가장 촘촘하게 규정
CycloneDX1.6 이상componentmachine-learning-model·data 유형, modelCard취약점(VEX) 연계에 강점

두 형식 모두 동등하게 인정하나, 모델과 데이터셋의 필수 속성을 형식 차원에서 강제하는 SPDX 3.0을 권장합니다. 1.6 미만 CycloneDX나 2.x SPDX는 AI 전용 프로파일이 없으므로 제출 형식으로 인정하지 않습니다.

2. 필수 포함 정보

다음 항목은 모든 제출 AI BOM에 반드시 포함되어야 합니다. 값을 확인할 수 없는 항목은 비워 두지 말고 “확인 불가(unknown)“로 명시해야 합니다.

2.1 문서 메타데이터

항목설명
작성자AI BOM을 생성한 주체. 도구가 아니라 운용 주체의 정식 명칭
데이터 형식 이름SPDX 또는 CycloneDX
데이터 형식 버전예: SPDX 3.0.1, CycloneDX 1.6
타임스탬프최종 갱신 일시(ISO 8601 또는 RFC 9557)
의존성 관계구성요소 간 포함과 파생 관계

2.2 시스템 수준 정보

항목설명
시스템 이름공급 AI 시스템의 식별 가능한 이름
시스템 구성요소시스템에 포함된 AI 모델, 데이터베이스, 소프트웨어
시스템 생산자시스템을 생성한 주체
시스템 버전공급 시스템의 버전

2.3 모델 정보

항목설명
모델 이름모델 생산자가 부여한 이름
모델 식별자PURL 또는 CPE 등 기계 판독 식별자
모델 버전모델의 버전
모델 생산자사전학습, 사후학습, 미세조정에 관여한 주체
모델 라이선스open weight 여부를 포함한 라이선스 유형과 라이선스 문서 링크

2.4 데이터셋 정보

항목설명
데이터셋 이름학습이나 평가에 사용된 데이터셋의 이름
데이터셋 식별자데이터셋 URL 또는 URI
데이터셋 출처출처, 수집 방법, 전처리와 라벨링 단계, 합성 데이터 여부
데이터셋 민감도개인식별정보, 저작권 보호 데이터, 민감 데이터 포함 여부
데이터셋 라이선스데이터셋 라이선스 유형과 문서 링크

2.5 보안 정보

항목설명
취약점 참조모델과 시스템의 알려진 취약점 정보를 제공하는 데이터베이스나 저장소 링크

취약점 참조는 합의 기준으로는 선택이지만, 사이버 복원력법(Cyber Resilience Act)과 미국 식품의약국(FDA) 가이던스가 직접 요구하는 항목이므로 공급사 제출에서는 필수로 둡니다.

3. 식별자 규칙

모델과 데이터셋은 기계 판독이 가능한 표준 식별자로 식별해야 합니다.

  • 모델 식별자는 Package URL(PURL) 또는 공통 플랫폼 열거(Common Platform Enumeration, CPE)를 사용합니다. 모델 저장소 경로나 커밋 해시 같은 내재적 식별자를 함께 제공할 수 있습니다.
  • 데이터셋 식별자는 접근 가능한 URL이나 URI를 사용합니다.
  • 식별자가 여럿이면 전부 포함합니다.

4. 라이선스, 출처, 민감도 강조

기존 소프트웨어 SBOM 요구사항과 달리, AI BOM에서는 다음 세 항목을 특히 엄격하게 요구합니다.

라이선스는 모델 가중치와 데이터셋 각각에 대해 별도로 명시해야 합니다. 모델이 open weight, open architecture, open data 중 무엇에 해당하는지 구분하고, 라이선스 문서 링크를 제공해야 합니다. 데이터셋 출처는 단순 출처 표기를 넘어 수집 방법(웹 크롤링인지 상업적 계약인지), 전처리와 라벨링 단계, 합성 데이터 사용 여부까지 포함해야 합니다. 데이터셋 민감도는 개인식별정보, 저작권 보호 데이터, 금융이나 의료 같은 민감 데이터의 포함 여부를 표기해야 합니다.

5. 샘플 문서

다음은 CycloneDX 1.6 형식의 최소 AI BOM 골격입니다. 실제 제출에서는 위 2절의 모든 필수 항목을 채워야 합니다.

{
  "bomFormat": "CycloneDX",
  "specVersion": "1.6",
  "metadata": {
    "timestamp": "2026-06-29T09:00:00Z",
    "authors": [{ "name": "공급사 정식 명칭" }],
    "component": { "type": "application", "name": "공급 AI 시스템", "version": "1.0.0" }
  },
  "components": [
    {
      "type": "machine-learning-model",
      "name": "공급 모델명",
      "version": "1.0",
      "bom-ref": "pkg:huggingface/org/model@1.0",
      "supplier": { "name": "모델 생산자" },
      "licenses": [{ "license": { "id": "Apache-2.0" } }],
      "modelCard": {
        "modelParameters": {
          "datasets": [
            { "type": "dataset", "name": "학습 데이터셋명", "classification": "public",
              "governance": { "owners": [{ "organization": { "name": "데이터 출처" } }] } }
          ]
        }
      }
    }
  ],
  "vulnerabilities": []
}

6. 제출 전 검증 체크리스트

공급사는 제출 전에 다음을 확인해야 합니다.

  • 형식이 SPDX 3.0 이상 또는 CycloneDX 1.6 이상인가
  • 2절의 모든 필수 항목이 채워졌거나 “확인 불가"로 명시됐는가
  • 모델과 데이터셋이 표준 식별자로 식별되는가
  • 모델 가중치와 데이터셋 각각에 라이선스가 명시됐는가
  • 데이터셋 출처와 민감도가 표기됐는가
  • 취약점 참조 링크가 제공됐는가
  • 빌드 또는 모델 릴리스 완료 이후 시점에 생성됐는가

상세 점검 기준은 도입 점검 체크리스트와 공유합니다.