이 섹션의 다중 페이지 출력 화면임. 여기를 클릭하여 프린트.

기업용 AI BOM 필드 요구사항 매트릭스 — 표준과 규제 근거로 정의한 필수/선택

G7 「AI를 위한 SBOM 최소 요소」의 50개 요소를 SPDX 3.0.1, CycloneDX 1.6, NTIA 2021, OpenChain AI V1 등 권위 있는 표준과 CRA·AI Act·FDA 규제 근거로 대조해 AI BOM 필드의 필수와 선택을 판정합니다. 같은 매트릭스를 생산·도입·공급사 세 맥락에 적용하는 운영 문서와 도구 세트 전략까지 다섯 부분으로 정리한 시리즈입니다.

1: 공급사 AI BOM 제출 요구사항
2: 자사 개발팀 AI BOM 작성 지침
3: 외부 모델과 데이터셋 도입 점검 체크리스트
4: AI BOM 도구 세트 설계 전략
5: 검증 보고서
6: 이 시리즈를 만든 과정

이 글은 Claude Code를 이용해 작성했고, 인용한 핵심 사실은 1차 출처로 교차 검증했습니다.

1. 목적과 사용 맥락

기업의 오픈소스 관리 체계는 이미 공급사에 소프트웨어 부품 명세서(Software Bill of Materials, SBOM) 제출을 의무화하고 제출 요구사항을 운영하는 단계에 와 있습니다. AI 시스템은 같은 투명성 요구를 모델과 데이터셋 층위까지 확장해야 하지만, 기존 SBOM 요구사항은 소프트웨어 구성요소만 다루므로 AI 고유 정보를 담지 못합니다. 이 보고서는 AI를 위한 부품 명세서(이하 AI BOM)에 어떤 필드를 필수로, 어떤 필드를 선택으로 요구할지를 국제 표준과 규제 근거로 정의합니다.

판정 대상 필드는 G7 사이버보안 작업반이 발표한 「AI를 위한 SBOM 최소 요소」의 50개 요소입니다. 이 50개를 행으로 두고, 권위 있는 표준 다섯 곳의 요구 강도를 대조해 필수와 선택을 가립니다.

같은 매트릭스를 기업의 세 가지 사용 맥락에서 다르게 적용합니다.

생산: 자사 AI 모델 개발팀이 AI BOM을 직접 작성할 때 채워야 하는 필드입니다.
도입: 외부 모델이나 데이터셋을 가져와 활용할 때 투명성과 위험을 점검하기 위해 확인해야 하는 필드입니다.
공급사 요구: 자사에 AI 모델을 공급하는 공급사에게 제출을 요구할 필드입니다.

%%{init: {'theme':'neutral','themeVariables':{'fontSize':'18px'}}}%%
flowchart TD
    M["AI BOM 필드 매트릭스<br/>G7 50요소<br/>필수 20 · 선택 30"]
    P["생산 관점<br/>자사 개발팀이<br/>AI BOM 작성"]
    C["도입 관점<br/>외부 모델·데이터셋<br/>투명성 점검"]
    S["공급사 관점<br/>공급사에 제출<br/>요구"]
    M --> P
    M --> C
    M --> S

그림 1. 하나의 필드 매트릭스를 세 가지 사용 맥락에서 적용 (조사 종합)

2. 방법론

2.1 합의 카운트 대상 출처

필드별 필수 여부는 다음 다섯 출처의 요구 강도를 합산해 판정합니다.

G7 「AI를 위한 SBOM 최소 요소」(BSI와 ACN 공동 주도 G7, 2026): 50개 요소를 모두 “최소 요소"로 권고합니다. 요소 단위로 필수와 선택을 구분하지 않으므로, 본 매트릭스에서 G7은 모든 요소에 “최소 요소로 지정됨” 1표를 부여합니다.
SPDX 3.0.1: AI 프로파일의 AIPackage, Dataset 프로파일의 DatasetPackage, Core의 공통 클래스에서 각 속성의 카디널리티(필수 여부)를 명세가 직접 규정합니다.
CycloneDX 1.6: JSON 스키마의 required 배열로 필수 필드를 규정합니다.
NTIA 「소프트웨어 부품 명세서 최소 요소」(2021): 일반 소프트웨어 SBOM의 일곱 개 기준 데이터 필드를 규정합니다.
OpenChain AI 적합성 가이드(Version 1, 2025): 프로세스 표준으로 데이터 필드를 규정하지 않으나, 라이선스 의무 절차가 모델과 데이터셋 라이선스의 식별·문서화를 강제합니다.

2.2 판정 규칙

필드의 존재 자체를 요구하는 출처가 두 곳 이상이면 필수, 그렇지 않으면 선택으로 판정합니다. G7이 모든 요소에 1표를 주므로, 실제 판정은 “다른 출처 한 곳 이상이 그 필드의 존재를 요구하는가"로 귀결됩니다.

존재를 요구한다는 것은 클래스 수준 필수 카디널리티(SPDX의 AIPackage/DatasetPackage 필수 속성), 문서 루트 필수(CycloneDX bomFormat/specVersion), NTIA의 일곱 기준 필드, OpenChain의 shall 수준 프로세스를 뜻합니다. 객체를 생성할 때만 강제되는 조건부 필수(예: 해시 객체 안의 알고리즘과 값, 구성요소 객체 안의 이름)는 “그 객체를 반드시 포함하라"는 요구가 아니므로 존재 요구로 세지 않았습니다. 다만 이런 조건부 필수나 무결성·보안상 가치가 큰 항목은 선택으로 두되 역할별 적용에서 권장으로 표시했습니다.

이 규칙을 적용한 결과, 50개 중 20개가 필수, 30개가 선택입니다.

2.3 규제 근거 플래그

구속력 있는 규제가 해당 필드를 건드리는지는 별도 축으로 표시합니다. 합의 카운트에는 넣지 않습니다. 어떤 규제도 AI BOM을 그 이름으로 강제하지 않기 때문입니다. 사이버 복원력법(Cyber Resilience Act, CRA)은 일반 소프트웨어 SBOM을, 인공지능법(AI Act)과 미국 식품의약국(Food and Drug Administration, FDA) 가이던스, 국내 제도는 문서화 의무를 요구합니다. 직접은 규제가 그 항목을 명시 요구하는 경우, 간접은 SBOM 항목은 아니나 문서화·취약점 처리 의무가 같은 정보를 사실상 요구하는 경우입니다.

3. 합의 결과 개관

클러스터별 필수와 선택 분포는 다음과 같습니다.

클러스터	요소 수	필수	선택
메타데이터	10	5	5
시스템 수준 속성	9	4	5
모델	13	6	7
데이터셋 속성	10	5	5
인프라	2	0	2
보안 속성	4	0	4
핵심성과지표	2	0	2
합계	50	20	30

필수로 판정된 20개는 모두 식별과 추적의 기반입니다. 누가 만들었고(작성자, 생산자), 무엇인지(이름, 식별자, 버전), 언제 만들었고(타임스탬프), 무엇으로 구성되며(구성요소, 종속 관계, 데이터셋 내용), 어떤 라이선스인지(모델·데이터셋 라이선스)에 해당합니다. 표준 두 곳 이상이 한결같이 이 정보의 존재를 요구합니다.

반면 모델의 상세 속성(아키텍처, 학습 기법, 입출력 특성), 데이터셋의 통계·민감도, 보안 통제, 핵심성과지표는 G7만 최소 요소로 들 뿐 다른 표준이 존재를 강제하지 않아 선택으로 갈립니다. 이 항목들은 합의로는 선택이지만, 도입과 공급사 요구 맥락에서는 투명성·위험 평가에 직접 쓰이므로 역할별로 다시 끌어올립니다.

한 가지 구조적 사실을 짚어 둘 필요가 있습니다. AI 고유 클러스터(모델, 데이터셋)의 필수 판정은 사실상 G7과 SPDX 3.0이 좌우합니다. NTIA는 일반 소프트웨어 SBOM이라 메타데이터와 식별 계통에만 기여하고, OpenChain은 라이선스 외에는 필드를 규정하지 않으며, CycloneDX는 루트 두 필드 외에는 모두 조건부 필수입니다. AI BOM의 필드 수준 표준은 아직 SPDX 3.0의 AI·Dataset 프로파일이 사실상 유일하게 촘촘합니다.

4. 필드 매트릭스

표기 약속은 다음과 같습니다. 출처 열은 필수(존재 요구), 조건부(객체 생성 시 강제), 근사(전용 필드 없이 관계나 일반 속성으로 우회), 선택, –(대응 없음)입니다. OpenChain의 필수(P)는 데이터 필드가 아니라 프로세스 강제를 뜻합니다. 역할 열은 필수, 권장, 선택, –이며, 표 폭을 고려해 생산·도입·공급사 역할 열은 §4.6 역할별 적용 요약 표로 분리했습니다.

4.1 메타데이터 클러스터

요소	SPDX 3.0	CycloneDX	NTIA	OpenChain	합의 판정	규제 근거
SBOM 작성자	필수	근사	필수	–	필수	FDA 직접
SBOM 버전	–	선택	–	–	선택	–
데이터 형식 이름	암묵	필수	필수	–	필수	CRA·FDA 간접
데이터 형식 버전	필수	필수	선택	–	필수	–
작성자 서명	–	선택	–	–	선택	국내 간접
도구 이름	선택	조건부	–	–	선택	–
도구 버전	–	선택	–	–	선택	–
생성 맥락	선택	선택	–	–	선택	–
SBOM 타임스탬프	필수	선택	필수	–	필수	FDA 직접
의존성 관계	조건부	조건부	필수	–	필수	CRA·FDA 직접

4.2 시스템 수준 속성 클러스터

요소	SPDX 3.0	CycloneDX	NTIA	OpenChain	합의 판정	규제 근거
시스템 이름	필수	조건부	필수	함의	필수	AI Act·FDA 간접
시스템 구성요소	근사	조건부	필수	함의	필수	FDA 직접, CRA 간접
시스템 생산자	선택	조건부	필수	–	필수	FDA 직접, AI Act 간접
시스템 버전	선택	조건부	필수	–	필수	FDA 직접, AI Act 간접
시스템 타임스탬프	선택	선택	–	–	선택	–
시스템 데이터 흐름	–	선택	–	–	선택	AI Act 간접
시스템 데이터 사용	근사	근사	–	함의	선택	AI Act·국내 간접
입출력 속성	–	근사	–	–	선택	AI Act 간접
의도된 응용 분야	선택	근사	–	함의	선택	AI Act·국내 간접

4.3 모델 클러스터

요소	SPDX 3.0	CycloneDX	NTIA	OpenChain	합의 판정	규제 근거
모델 이름	필수	조건부	–	함의	필수	AI Act 간접
모델 식별자	필수	선택	–	함의	필수	–
모델 버전	필수	선택	–	–	필수	AI Act 간접
모델 타임스탬프	필수	선택	–	–	필수	AI Act 간접
모델 생산자	필수	선택	–	–	필수	AI Act 간접
모델 설명	선택	선택	–	–	선택	AI Act·국내 간접
모델 해시 값	조건부	조건부	–	–	선택	–
모델 해시 알고리즘	조건부	조건부	–	–	선택	–
모델 속성	선택	선택	–	–	선택	AI Act 간접
입출력 속성	근사	선택	–	–	선택	AI Act 간접
학습 속성	선택	선택	–	함의	선택	AI Act·국내 간접
모델 라이선스	근사	선택	–	필수(P)	필수	AI Act 간접
외부 참조	선택	조건부	–	함의	선택	–

4.4 데이터셋 속성 클러스터

요소	SPDX 3.0	CycloneDX	NTIA	OpenChain	합의 판정	규제 근거
데이터셋 이름	필수	선택	–	함의	필수	AI Act 간접
데이터셋 설명	선택	선택	–	–	선택	AI Act·국내 간접
데이터셋 내용	필수	선택	–	–	필수	AI Act 간접
데이터셋 식별자	필수	선택	–	–	필수	–
데이터셋 해시	조건부	조건부	–	–	선택	–
데이터셋 출처	필수	근사	–	함의	필수	AI Act·국내 간접
통계적 속성	선택	선택	–	–	선택	AI Act 간접
데이터셋 민감도	선택	선택	–	함의	선택	AI Act·국내 간접
의존성 관계	조건부	조건부	–	함의	선택	–
데이터셋 라이선스	근사	선택	–	필수(P)	필수	–

4.5 인프라, 보안, 핵심성과지표 클러스터

요소	SPDX 3.0	CycloneDX	NTIA	OpenChain	합의 판정	규제 근거
인프라 소프트웨어	근사	선택	–	–	선택	–
인프라 하드웨어	–	선택	–	–	선택	AI Act 간접
보안 통제	–	근사	–	–	선택	CRA·AI Act·FDA 간접
보안 준수	선택	선택	–	–	선택	적합성 평가 간접
사이버보안 정책 정보	–	근사	–	–	선택	CRA 직접
취약점 참조	근사	선택	–	–	선택	CRA·FDA 직접
보안 지표	선택	선택	–	–	선택	AI Act 간접
운영 성과 지표	선택	선택	–	–	선택	AI Act 간접

보안 클러스터는 합의로는 전부 선택이지만, 취약점 참조와 사이버보안 정책 정보는 CRA와 FDA가 직접 요구하는 항목입니다. 합의 카운트가 표준의 데이터 필드 규정만 보는 데 비해, 규제는 같은 정보를 의무로 요구합니다. 그래서 이 두 항목은 도입과 공급사 맥락에서 필수나 권장으로 끌어올렸습니다. 규제 근거 플래그가 역할별 적용을 조정하는 대표 사례입니다.

4.6 역할별 적용 요약

§4.1~4.5의 합의 판정을 생산·도입·공급사 세 맥락에 적용한 결과를 50개 요소 전체에 대해 한 표로 모았습니다. 역할 열은 필수, 권장, 선택, –입니다.

요소	합의 판정	생산	도입	공급사
메타데이터
SBOM 작성자	필수	필수	권장	필수
SBOM 버전	선택	권장	선택	권장
데이터 형식 이름	필수	필수	권장	필수
데이터 형식 버전	필수	필수	권장	필수
작성자 서명	선택	권장	권장	권장
도구 이름	선택	권장	선택	권장
도구 버전	선택	권장	선택	선택
생성 맥락	선택	권장	선택	권장
SBOM 타임스탬프	필수	필수	권장	필수
의존성 관계	필수	필수	필수	필수
시스템 수준 속성
시스템 이름	필수	필수	필수	필수
시스템 구성요소	필수	필수	필수	필수
시스템 생산자	필수	필수	권장	필수
시스템 버전	필수	필수	필수	필수
시스템 타임스탬프	선택	권장	선택	권장
시스템 데이터 흐름	선택	권장	권장	권장
시스템 데이터 사용	선택	권장	권장	권장
입출력 속성	선택	권장	권장	권장
의도된 응용 분야	선택	권장	권장	권장
모델
모델 이름	필수	필수	필수	필수
모델 식별자	필수	필수	필수	필수
모델 버전	필수	필수	필수	필수
모델 타임스탬프	필수	필수	권장	권장
모델 생산자	필수	필수	권장	필수
모델 설명	선택	권장	필수	권장
모델 해시 값	선택	권장	권장	권장
모델 해시 알고리즘	선택	권장	권장	권장
모델 속성	선택	권장	권장	권장
입출력 속성	선택	권장	권장	권장
학습 속성	선택	권장	권장	권장
모델 라이선스	필수	필수	필수	필수
외부 참조	선택	권장	권장	권장
데이터셋 속성
데이터셋 이름	필수	필수	필수	필수
데이터셋 설명	선택	권장	권장	권장
데이터셋 내용	필수	필수	권장	권장
데이터셋 식별자	필수	필수	필수	필수
데이터셋 해시	선택	권장	권장	권장
데이터셋 출처	필수	필수	필수	필수
통계적 속성	선택	권장	선택	선택
데이터셋 민감도	선택	권장	필수	필수
의존성 관계	선택	권장	선택	선택
데이터셋 라이선스	필수	필수	필수	필수
인프라·보안·핵심성과지표
인프라 소프트웨어	선택	권장	선택	권장
인프라 하드웨어	선택	선택	선택	선택
보안 통제	선택	권장	권장	권장
보안 준수	선택	권장	권장	권장
사이버보안 정책 정보	선택	권장	선택	권장
취약점 참조	선택	권장	필수	필수
보안 지표	선택	권장	권장	선택
운영 성과 지표	선택	권장	선택	선택

5. 역할별 적용 해설

5.1 생산 관점

자사 개발팀이 모델을 만들 때는 정보 접근성이 가장 좋으므로 요구 수준을 가장 높게 잡습니다. 합의 필수 20개는 그대로 필수입니다. 더해 모델과 데이터셋의 상세 속성, 해시, 학습 정보처럼 합의로는 선택인 항목도 생산 시에는 권장으로 작성하게 합니다. 생산자가 남기지 않으면 도입자와 공급망 하류가 영영 확보할 수 없는 정보이기 때문입니다.

5.2 도입 관점

외부 모델이나 데이터셋을 들여올 때는 투명성과 위험 평가에 직접 쓰이는 필드를 우선합니다. 식별 정보(이름, 식별자, 버전, 생산자)에 더해 모델 설명, 모델·데이터셋 라이선스, 데이터셋 출처, 데이터셋 민감도, 취약점 참조를 필수로 둡니다. 라이선스는 컴플라이언스 위험을, 출처와 민감도는 데이터 적법성과 개인정보 위험을, 취약점 참조는 보안 위험을 판단하는 근거입니다. 합의로는 선택이지만 도입 점검의 핵심이라 필수로 올렸습니다.

5.3 공급사 요구 관점

공급사에 제출을 요구하는 범위는 계약으로 강제 가능한 수준을 고려해 합의 필수 20개를 기본으로 합니다. 여기에 모델·데이터셋 라이선스, 데이터셋 출처와 민감도, 취약점 참조를 필수로 더합니다. 기존 소프트웨어 SBOM 공급사 요구사항이 식별과 의존성, 형식 준수를 강제하던 것과 같은 구조를, 모델과 데이터 층위로 확장한 형태입니다.

6. 한계와 검증 필요 사항

이 매트릭스의 합의 판정은 표준 명세의 카디널리티와 최소 요소 규정에 근거하며, 규제 근거 플래그는 별도 축입니다. 다음 항목은 1차 출처 접근 제약이 있어 별도 검증을 거쳐야 합니다.

NTIA 최소 요소의 1차 명세(ntia.gov)는 자동 조회가 차단되어 일곱 기준 필드를 공개 미러로 재확인했습니다. CRA Annex I와 AI Act 부속서, FDA 가이던스의 1차 원문(EUR-Lex, fda.gov)도 렌더링·차단 문제로 미러와 검색 집계로 교차 확인했습니다. 국내 AI 기본법의 학습데이터 관련 의무는 조항·항 단위까지 1차 조문으로 대조하지 못해 “간접(조문 미특정)“으로 표시했습니다. 이 항목들은 후속 검증 단계에서 1차 출처로 다시 확인합니다.

SPDX 3.0과 CycloneDX 1.6의 필드 카디널리티는 명세 클래스 정의와 JSON 스키마 원문에서 직접 확인했으므로 신뢰도가 높습니다.

7. 출처

주요 1차 출처는 다음과 같습니다.

A1. G7 Cybersecurity Working Group (2026). Software Bill of Materials for AI — Minimum Elements. BSI와 ACN이 공동 주도하고 그 외 G7 사이버보안 기관과 EU 집행위원회가 공동 발행. — 용도: 50요소 행 골격.

A2. SPDX Project (2024). System Package Data Exchange (SPDX) Specification, Version 3.0.1 — AI Profile, Dataset Profile, Core. https://spdx.github.io/spdx-spec/v3.0.1/ — 용도: 모델·데이터셋 필드 카디널리티.

A3. OWASP / ECMA International (2024). CycloneDX Bill of Materials Specification 1.6 (ECMA-424), JSON 스키마. https://cyclonedx.org/docs/1.6/json/ — 용도: 스키마 required 필드 판정.

A4. NTIA, U.S. Department of Commerce (2021). The Minimum Elements For a Software Bill of Materials (SBOM). https://www.ntia.gov/report/2021/minimum-elements-software-bill-materials-sbom — 용도: 일반 SBOM 최소 요소.

A5. OpenChain Project AI Work Group (2025). Artificial Intelligence System Bill of Materials — Compliance Management Guide, Version 1. — 용도: 라이선스 의무 프로세스.

A6. European Parliament and Council (2024). Regulation (EU) 2024/2847 — Cyber Resilience Act, Annex I. — 용도: SBOM·취약점 처리 규제 근거.

A7. European Parliament and Council (2024). Regulation (EU) 2024/1689 — AI Act, Article 53, Annex IV, XI, XII. — 용도: 문서화와 투명성 규제 근거.

A8. U.S. FDA (2023). Cybersecurity in Medical Devices: Premarket Submissions; FD&C Act §524B. — 용도: 의료기기 SBOM 규제 근거.

A9. 과학기술정보통신부·국가정보원·KISA (2026). 「AI 일상화 시대를 준비하는 SW 공급망 보안 강화 로드맵」; 「인공지능 발전과 신뢰 기반 조성 등에 관한 기본법」. — 용도: 국내 제도 규제 근거.

8. 이 시리즈의 구성

이 글은 다섯 부분으로 이어지는 시리즈의 출발점입니다. 위 매트릭스를 세 가지 사용 맥락의 운영 문서로 옮기고, 이를 떠받칠 도구 세트 전략과 검증 결과까지 함께 묶었습니다.

공급사 AI BOM 제출 요구사항 — 공급사에 제출을 요구할 필드와 제출 규약
자사 개발팀 AI BOM 작성 지침 — 자사 생산팀이 채워야 하는 필수·권장 항목
외부 모델과 데이터셋 도입 점검 체크리스트 — 외부 모델·데이터셋을 들여올 때의 위험 점검
AI BOM 도구 세트 설계 전략 — 매트릭스를 정책으로 코드화하고 기존 도구와 엮는 전략
검증 보고서 — 1~3단계 사실 검증 기록

1 - 공급사 AI BOM 제출 요구사항

자사에 AI 모델이나 시스템을 공급하는 공급사가 제출해야 하는 AI BOM의 요구사항입니다. 표준 데이터 형식, 필수 포함 정보, 식별자 규칙, 라이선스·출처·민감도 요구를 규정합니다.

이 글은 Claude Code를 이용해 작성했고, 인용한 핵심 사실은 1차 출처로 교차 검증했습니다.

이 문서는 자사에 AI 모델이나 AI 시스템을 공급하는 공급사가 제출해야 하는 AI를 위한 부품 명세서(AI Bill of Materials, AI BOM)의 요구사항을 규정합니다. 기존 소프트웨어 부품 명세서(SBOM) 제출 요구사항을 모델과 데이터셋 층위로 확장한 것이며, 필수 항목은 「AI BOM 필드 요구사항 매트릭스」의 공급사 열에서 도출했습니다.

1. 표준 데이터 형식

AI BOM은 기계 판독이 가능한 표준 형식으로 제출해야 합니다. 다음 두 형식을 인정합니다.

형식	버전	AI 표현 방식	비고
SPDX	3.0 이상	AI Profile의 `AIPackage`, Dataset Profile의 `DatasetPackage`	모델과 데이터셋 필드를 가장 촘촘하게 규정
CycloneDX	1.6 이상	`component`의 `machine-learning-model`·`data` 유형, `modelCard`	취약점(VEX) 연계에 강점

두 형식 모두 동등하게 인정하나, 모델과 데이터셋의 필수 속성을 형식 차원에서 강제하는 SPDX 3.0을 권장합니다. 1.6 미만 CycloneDX나 2.x SPDX는 AI 전용 프로파일이 없으므로 제출 형식으로 인정하지 않습니다.

2. 필수 포함 정보

다음 항목은 모든 제출 AI BOM에 반드시 포함되어야 합니다. 값을 확인할 수 없는 항목은 비워 두지 말고 “확인 불가(unknown)“로 명시해야 합니다.

2.1 문서 메타데이터

항목	설명
작성자	AI BOM을 생성한 주체. 도구가 아니라 운용 주체의 정식 명칭
데이터 형식 이름	SPDX 또는 CycloneDX
데이터 형식 버전	예: SPDX 3.0.1, CycloneDX 1.6
타임스탬프	최종 갱신 일시(ISO 8601 또는 RFC 9557)
의존성 관계	구성요소 간 포함과 파생 관계

2.2 시스템 수준 정보

항목	설명
시스템 이름	공급 AI 시스템의 식별 가능한 이름
시스템 구성요소	시스템에 포함된 AI 모델, 데이터베이스, 소프트웨어
시스템 생산자	시스템을 생성한 주체
시스템 버전	공급 시스템의 버전

2.3 모델 정보

항목	설명
모델 이름	모델 생산자가 부여한 이름
모델 식별자	PURL 또는 CPE 등 기계 판독 식별자
모델 버전	모델의 버전
모델 생산자	사전학습, 사후학습, 미세조정에 관여한 주체
모델 라이선스	open weight 여부를 포함한 라이선스 유형과 라이선스 문서 링크

2.4 데이터셋 정보

항목	설명
데이터셋 이름	학습이나 평가에 사용된 데이터셋의 이름
데이터셋 식별자	데이터셋 URL 또는 URI
데이터셋 출처	출처, 수집 방법, 전처리와 라벨링 단계, 합성 데이터 여부
데이터셋 민감도	개인식별정보, 저작권 보호 데이터, 민감 데이터 포함 여부
데이터셋 라이선스	데이터셋 라이선스 유형과 문서 링크

2.5 보안 정보

항목	설명
취약점 참조	모델과 시스템의 알려진 취약점 정보를 제공하는 데이터베이스나 저장소 링크

취약점 참조는 합의 기준으로는 선택이지만, 사이버 복원력법(Cyber Resilience Act)과 미국 식품의약국(FDA) 가이던스가 직접 요구하는 항목이므로 공급사 제출에서는 필수로 둡니다.

3. 식별자 규칙

모델과 데이터셋은 기계 판독이 가능한 표준 식별자로 식별해야 합니다.

모델 식별자는 Package URL(PURL) 또는 공통 플랫폼 열거(Common Platform Enumeration, CPE)를 사용합니다. 모델 저장소 경로나 커밋 해시 같은 내재적 식별자를 함께 제공할 수 있습니다.
데이터셋 식별자는 접근 가능한 URL이나 URI를 사용합니다.
식별자가 여럿이면 전부 포함합니다.

4. 라이선스, 출처, 민감도 강조

기존 소프트웨어 SBOM 요구사항과 달리, AI BOM에서는 다음 세 항목을 특히 엄격하게 요구합니다.

라이선스는 모델 가중치와 데이터셋 각각에 대해 별도로 명시해야 합니다. 모델이 open weight, open architecture, open data 중 무엇에 해당하는지 구분하고, 라이선스 문서 링크를 제공해야 합니다. 데이터셋 출처는 단순 출처 표기를 넘어 수집 방법(웹 크롤링인지 상업적 계약인지), 전처리와 라벨링 단계, 합성 데이터 사용 여부까지 포함해야 합니다. 데이터셋 민감도는 개인식별정보, 저작권 보호 데이터, 금융이나 의료 같은 민감 데이터의 포함 여부를 표기해야 합니다.

5. 샘플 문서

다음은 CycloneDX 1.6 형식의 최소 AI BOM 골격입니다. 실제 제출에서는 위 2절의 모든 필수 항목을 채워야 합니다.

{
  "bomFormat": "CycloneDX",
  "specVersion": "1.6",
  "metadata": {
    "timestamp": "2026-06-29T09:00:00Z",
    "authors": [{ "name": "공급사 정식 명칭" }],
    "component": { "type": "application", "name": "공급 AI 시스템", "version": "1.0.0" }
  },
  "components": [
    {
      "type": "machine-learning-model",
      "name": "공급 모델명",
      "version": "1.0",
      "bom-ref": "pkg:huggingface/org/model@1.0",
      "supplier": { "name": "모델 생산자" },
      "licenses": [{ "license": { "id": "Apache-2.0" } }],
      "modelCard": {
        "modelParameters": {
          "datasets": [
            { "type": "dataset", "name": "학습 데이터셋명", "classification": "public",
              "governance": { "owners": [{ "organization": { "name": "데이터 출처" } }] } }
          ]
        }
      }
    }
  ],
  "vulnerabilities": []
}

6. 제출 전 검증 체크리스트

공급사는 제출 전에 다음을 확인해야 합니다.

형식이 SPDX 3.0 이상 또는 CycloneDX 1.6 이상인가
2절의 모든 필수 항목이 채워졌거나 “확인 불가"로 명시됐는가
모델과 데이터셋이 표준 식별자로 식별되는가
모델 가중치와 데이터셋 각각에 라이선스가 명시됐는가
데이터셋 출처와 민감도가 표기됐는가
취약점 참조 링크가 제공됐는가
빌드 또는 모델 릴리스 완료 이후 시점에 생성됐는가

상세 점검 기준은 도입 점검 체크리스트와 공유합니다.

2 - 자사 개발팀 AI BOM 작성 지침

자사 개발팀이 AI 모델이나 시스템을 만들 때 작성해야 하는 AI BOM의 지침입니다. 생산 시점의 정보 접근성을 살려 필수·권장 작성 항목과 무결성·출처 기록 방법을 정리합니다.

이 글은 Claude Code를 이용해 작성했고, 인용한 핵심 사실은 1차 출처로 교차 검증했습니다.

이 문서는 자사 개발팀이 AI 모델이나 AI 시스템을 만들 때 작성해야 하는 AI를 위한 부품 명세서(AI Bill of Materials, AI BOM)의 지침입니다. 생산 시점에는 정보 접근성이 가장 좋으므로 요구 수준을 가장 높게 잡습니다. 필수 항목은 「AI BOM 필드 요구사항 매트릭스」의 생산 열에서 도출했습니다.

생산팀이 남기지 않으면 도입팀과 공급망 하류가 영영 확보할 수 없는 정보가 많습니다. 그래서 합의 기준으로 선택인 모델과 데이터셋 상세 정보도 생산 시에는 권장으로 작성합니다.

1. 작성 원칙

AI BOM은 모델 학습이나 시스템 빌드가 끝난 뒤 생성합니다. 생성 시점의 수명주기 단계(빌드 이전, 빌드, 빌드 이후)를 메타데이터에 기록합니다. 형식은 SPDX 3.0 이상 또는 CycloneDX 1.6 이상을 사용하고, 가능하면 생성 도구로 자동 생성한 뒤 누락 항목을 수기로 보완합니다.

값을 확정할 수 없는 항목은 비워 두지 말고 “확인 불가"로 명시합니다. 모델이나 데이터셋을 갱신하면 AI BOM 버전과 타임스탬프를 함께 올립니다.

2. 필수 작성 항목

다음은 반드시 작성합니다. 매트릭스에서 표준 두 곳 이상이 존재를 요구한 항목입니다.

클러스터	필수 항목
메타데이터	작성자, 데이터 형식 이름, 데이터 형식 버전, 타임스탬프, 의존성 관계
시스템 수준	시스템 이름, 시스템 구성요소, 시스템 생산자, 시스템 버전
모델	모델 이름, 모델 식별자, 모델 버전, 모델 타임스탬프, 모델 생산자, 모델 라이선스
데이터셋	데이터셋 이름, 데이터셋 내용, 데이터셋 식별자, 데이터셋 출처, 데이터셋 라이선스

3. 권장 작성 항목

다음은 합의 기준으로 선택이지만, 생산 시점에만 정확히 기록할 수 있으므로 작성을 권장합니다. 특히 모델 카드와 데이터 카드를 운영한다면 그 내용을 AI BOM에 연결합니다.

클러스터	권장 항목	작성 이유
메타데이터	SBOM 버전, 작성자 서명, 도구 이름과 버전, 생성 맥락	무결성과 추적성 확보
시스템 수준	데이터 흐름, 데이터 사용, 입출력 속성, 의도된 응용 분야	하류의 위험 평가 근거
모델	모델 설명과 계보, 모델 해시 값과 알고리즘, 모델 속성, 입출력 속성, 학습 속성, 외부 참조	재현성과 무결성 검증, 모델 카드 연계
데이터셋	데이터셋 설명, 데이터셋 해시, 통계적 속성, 데이터셋 민감도, 의존성 관계	데이터 적법성과 위험 평가 근거
보안과 지표	보안 통제, 보안 준수, 취약점 참조, 보안 지표, 운영 성과 지표	사이버보안 위험관리 연계

4. 모델 해시와 무결성

모델 해시 값과 알고리즘은 합의 기준으로는 선택이지만 권장 강도가 높습니다. 가중치 파일이나 모델 아티팩트의 해시를 기록해 두면, 하류에서 모델 무결성을 검증할 수 있습니다. 해시 알고리즘은 인터넷 할당 번호 관리기관(IANA)의 해시 함수 명칭을 사용하고, 미국 국립표준기술연구소(NIST)가 승인한 알고리즘을 씁니다.

5. 데이터셋 출처와 민감도

생산팀은 학습에 사용한 데이터셋의 출처를 가장 잘 아는 위치에 있습니다. 출처, 수집 방법, 전처리와 라벨링 단계, 합성 데이터 여부를 기록하고, 개인식별정보나 저작권 보호 데이터, 민감 데이터의 포함 여부를 표기합니다. 이 정보는 인공지능법(AI Act)의 학습 데이터 문서화 의무와 국내 AI 기본법의 학습데이터 개요 요구에 대응하는 근거가 됩니다.

6. 작성 후 확인

2절 필수 항목이 모두 채워졌는가
3절 권장 항목 중 모델 카드나 데이터 카드로 확보 가능한 것을 연결했는가
모델 가중치와 데이터셋 각각에 라이선스를 명시했는가
생성 시점의 수명주기 단계를 기록했는가
모델이나 데이터셋 갱신 시 버전과 타임스탬프를 올렸는가

3 - 외부 모델과 데이터셋 도입 점검 체크리스트

외부 AI 모델이나 데이터셋을 가져와 활용할 때 AI BOM을 근거로 투명성과 위험을 점검하는 체크리스트입니다. 식별, 라이선스, 데이터 적법성, 보안 위험을 단계별로 확인합니다.

이 글은 Claude Code를 이용해 작성했고, 인용한 핵심 사실은 1차 출처로 교차 검증했습니다.

이 체크리스트는 자사 개발팀이 외부 AI 모델이나 데이터셋을 가져와 활용할 때, AI를 위한 부품 명세서(AI Bill of Materials, AI BOM)를 근거로 투명성과 위험을 점검하는 기준입니다. 확인 항목은 「AI BOM 필드 요구사항 매트릭스」의 도입 열에서 도출했습니다.

도입 점검의 목적은 모델을 만드는 것이 아니라 들여오는 것이므로, 위험 평가에 직접 쓰이는 필드를 우선합니다. 라이선스는 컴플라이언스 위험을, 출처와 민감도는 데이터 적법성과 개인정보 위험을, 취약점 참조는 보안 위험을 판단하는 근거입니다.

1. AI BOM 존재와 형식

도입 대상에 AI BOM이 제공되는가
형식이 SPDX 3.0 이상 또는 CycloneDX 1.6 이상인가
AI BOM의 타임스탬프가 도입 대상 버전과 일치하는가

AI BOM이 없거나 AI 전용 프로파일이 없는 형식이면, 도입 전 공급처에 요청하거나 자체적으로 최소 정보를 확보합니다.

2. 식별과 버전 (필수 확인)

확인 항목	판정 기준
모델 이름과 식별자	표준 식별자(PURL/CPE)로 식별되는가
모델 버전	도입하려는 버전과 일치하는가
데이터셋 이름과 식별자	학습 데이터셋이 식별되는가
시스템 이름과 버전	공급 시스템이 식별되고 버전이 표기되는가
시스템 구성요소	포함된 구성요소가 열거되는가
의존성 관계	구성요소 간 관계가 표기되는가

3. 라이선스 점검 (필수 확인)

확인 항목	판정 기준
모델 라이선스	라이선스가 명시되고, 자사 사용 목적과 양립하는가
open weight 여부	open weight, open architecture, open data 중 무엇인지 확인
데이터셋 라이선스	학습 데이터셋의 라이선스가 명시되고 사용 목적과 양립하는가

라이선스가 비어 있거나 사용 목적과 충돌하면 도입 보류 사유입니다. 모델 라이선스와 데이터셋 라이선스는 별개이므로 각각 확인합니다.

4. 데이터 적법성과 위험 (필수 확인)

확인 항목	판정 기준
데이터셋 출처	출처, 수집 방법, 전처리 단계가 표기되는가
데이터셋 민감도	개인식별정보, 저작권 보호 데이터, 민감 데이터 포함 여부가 표기되는가
모델 설명과 계보	모델의 한계와 선행 모델 계보가 기술되는가

데이터셋 출처가 불명확하거나 민감 데이터 포함 여부가 표기되지 않으면, 데이터 적법성과 개인정보 위험을 별도로 평가해야 합니다.

5. 보안 위험 (필수 확인)

확인 항목	판정 기준
취약점 참조	알려진 취약점 정보 링크가 제공되고, 알려진 취약점이 도입 환경에서 수용 가능한가

취약점 참조는 사이버 복원력법과 미국 식품의약국 가이던스가 직접 요구하는 항목이므로, 도입 점검에서 필수로 확인합니다.

6. 권장 확인 항목

다음은 위험 수준이 높거나 규제 대상 용도일 때 추가로 확인합니다.

모델 타임스탬프와 생산자
모델 속성, 입출력 속성, 학습 속성
모델 해시 값과 알고리즘(무결성 검증)
데이터셋 내용과 해시
시스템 데이터 흐름과 데이터 사용
의도된 응용 분야와 자사 사용 목적의 일치 여부

7. 도입 판정

위 1절부터 5절까지의 필수 확인 항목을 모두 충족하면 도입 가능으로 판정합니다. 라이선스 충돌, 출처 불명확, 민감 데이터 미표기, 수용 불가 취약점 중 하나라도 해당하면 도입 보류로 두고 공급처에 보완을 요청하거나 대체 모델을 검토합니다.

판정 결과는 도입 대상의 AI BOM 식별자, 버전, 판정 일자와 함께 기록해 두어, 이후 재평가와 공급망 추적에 활용합니다.

4 - AI BOM 도구 세트 설계 전략

7개 도구 범주를 공식 리포지토리와 문서로 조사해, 무엇을 재사용·확장·신규 구축할지와 구축 순서, 매트릭스를 코드화할 정책 스키마, Dependency-Track 통합 아키텍처를 정리합니다.

이 글은 Claude Code를 이용해 작성했고, 인용한 핵심 사실은 1차 출처로 교차 검증했습니다.

7개 도구 범주를 공식 리포지토리와 문서로 조사한 결과를 근거로, 무엇을 기존 도구로 재사용하고 무엇을 확장하거나 새로 만들지, 어떤 순서로 구축하며, 매트릭스를 어떤 정책 스키마로 정의할지를 정리합니다. 확보 전략은 미리 정하지 않고 조사 결과로 판단하며, 기존 SBOM 플랫폼(Dependency-Track)을 이미 운영 중이라는 전제를 둡니다.

1. 핵심 판단 세 가지

생성과 검증, 저장, 모델 스캔의 표준 경로는 이미 오픈소스로 작동합니다. cdxgen의 aibom 명령이 CycloneDX 1.6 AI BOM을 실제로 만들고, sbomqs와 OPA가 필드 적합성을 검사하며, Dependency-Track이 소프트웨어 계층을 받고, ModelScan과 sigstore model-signing이 모델 무결성을 보강합니다. 자체 구축을 처음부터 다 할 필요가 없습니다.

포맷은 CycloneDX 1.6으로 단일화하는 편이 현실적입니다. SPDX 3.0 AI 프로파일은 표현력이 더 풍부하지만 이를 실제로 생성하는 성숙한 도구가 없고, Dependency-Track이 SPDX를 인입하지 못합니다. SPDX 3.0은 표준 추종 대상으로 두되 운영 1차 포맷은 CycloneDX로 잡습니다.

신규 구축이 불가피한 곳은 좁고 분명합니다. AI 고유 필드를 검사하는 정책 계층, 모델과 데이터셋을 1급 객체로 다루는 인벤토리, 라이선스 사용 제한 판정입니다. 나머지는 재사용이나 확장으로 메워집니다.

2. 영역별 재사용 판정

기능 영역	대표 도구	판정	근거
AI BOM 생성(CycloneDX)	cdxgen `aibom`	재사용	CycloneDX 1.6 AI BOM 자동 생성이 작동(조사 시점 기준 활발히 개발 중)
AI BOM 생성(SPDX 3.0)	spdx-tools	불가	3.0이 실험적 쓰기 전용, AI 프로파일 생성 미지원
심층 필드 자동 추출	없음	신규	데이터셋 통계, 바이어스, 해시, 라이선스를 자동으로 못 채움
검증·적합성 엔진	sbomqs, sbom-utility	재사용	범용 필드 존재 검사와 점수화 제공
AI·역할별 적합성 규칙	없음	신규	G7 50요소와 역할별 필수 집합을 검사하는 기성 프로파일 부재
저장소·인벤토리(SW 계층)	Dependency-Track	재사용	소프트웨어 의존성 인벤토리와 영향분석이 성숙
저장소·인벤토리(모델·데이터 계층)	Dependency-Track	확장 대기	`machine-learning-model`과 `data` 분류자, modelCard 미인입(이슈 #4361, 조사 시점 open)
취약점 매칭(SW 의존성)	Dependency-Track, OSV	재사용	이미 연결, ML 라이브러리도 일반 패키지로 매칭
위험 피드(모델 고유)	huntr, Insights	확장	huntr 발급 CVE는 NVD 경유 유입, 직접 커넥터는 없음
모델 직렬화 스캔	ModelScan, Fickling	재사용	성숙, JSON 리포트와 종료코드로 CI 삽입
무결성·서명	sigstore model-signing	재사용	DSSE와 in-toto라 BOM 무결성·출처 필드에 매핑
데이터 오염 탐지	없음(연구 단계)	추적성으로 대체	production 도구 부재, 탐지 보증 대신 출처·무결성 기록
라이선스 식별·표기	ScanCode, ORT + SPDX/HF 사전	재사용+확장	엔진은 재사용, AI 라이선스 사전 보강 필요
라이선스 사용 제한 판정	없음	신규	RAIL 계열 행위 제한의 기계 판독·자동 판정 표준 부재
정책 코드화	OPA/Rego, sbomqs YAML	재사용	역할별 정책 파일 분리로 매트릭스 표현

요약하면 열세 영역 중 일곱은 재사용, 셋은 확장, 셋은 신규입니다. 신규 셋(AI·역할별 적합성 규칙, 모델·데이터 인벤토리, 라이선스 사용 제한 판정)이 이 프로젝트의 고유 가치가 모이는 지점입니다.

3. 구축 우선순위

P0 — 작동하는 최소 파이프라인 (재사용 위주)

가장 먼저 기성 도구를 엮어 끝에서 끝까지 도는 파이프라인을 세웁니다. 생성은 cdxgen aibom으로 CycloneDX 1.6을 만들고, 모델 파일은 ModelScan으로 스캔하고 sigstore로 서명하며, 결과를 Dependency-Track에 올려 소프트웨어 계층 취약점과 영향분석을 얻습니다. 검증은 sbomqs custom policy로 필수 필드 존재를 점검합니다. 이 단계는 거의 전부 재사용이라 빠르게 가치를 냅니다.

P1 — AI 고유 계층 확장

다음으로 신규 가치를 얹습니다. 매트릭스를 정책 스키마로 코드화해 역할별 적합성 검사를 구현하고(4절), 모델과 데이터셋을 CycloneDX properties나 외부 참조로 실어 인벤토리 추적성을 확보합니다. 라이선스 파이프라인에 AI 라이선스 사전(RAIL, OpenRAIL, Llama, Gemma, OpenMDW, CDLA)을 보강하고, 모델 위험은 huntr CVE를 NVD 경유로 받습니다.

P2 — 신규·연구 영역

마지막은 표준과 연구가 더 익어야 하는 부분입니다. 데이터셋 통계나 바이어스 같은 심층 필드의 자동 추출, 라이선스 사용 제한의 자동 판정, 데이터 오염은 탐지 대신 출처와 무결성 추적성으로 다룹니다. SPDX 3.0 생성은 도구 생태계가 성숙하면 합류시키되 지금은 표준 추종 대상으로만 둡니다. Dependency-Track의 모델·데이터 분류자 지원(이슈 #4361)이 들어오면 P1의 우회책을 1급 인벤토리로 승격합니다.

4. 정책 스키마 설계

매트릭스의 “요소 × 필수/선택 × 역할"을 기계 판독 정책으로 정의하는 것이 이 도구 세트의 핵심입니다. 조사 결과 어떤 도구도 역할별 필수 집합을 1급 개념으로 갖지 않으므로, 직접 설계합니다. 두 계층으로 나눕니다.

4.1 필드 레지스트리

G7 50요소 각각을 CycloneDX 경로(그리고 장래 SPDX 경로)에 매핑하는 표를 한곳에 둡니다. 「AI BOM 필드 요구사항 매트릭스」가 이미 요소별 출처 매핑을 담고 있으므로, 이를 기계 판독용으로 옮기면 다음과 같은 모양입니다.

# field-registry.yaml — G7 요소를 BOM 경로에 매핑
model_license:
  g7: 모델 라이선스
  cyclonedx: "components[?type=='machine-learning-model'].licenses"
  spdx: "Relationship(hasDeclaredLicense) from AIPackage"
dataset_provenance:
  g7: 데이터셋 출처
  cyclonedx: "components[?type=='data'].data[].governance"
  spdx: "DatasetPackage.originatedBy / dataCollectionProcess"
vulnerability_referencing:
  g7: 취약점 참조
  cyclonedx: "vulnerabilities[] 또는 externalReferences[?type=='vcs']"
  spdx: "VulnAssessmentRelationship"

4.2 역할별 정책 파일

생산, 도입, 공급사 각각의 필수 집합을 별도 정책 파일로 둡니다. 매트릭스의 역할 열을 그대로 옮기면 됩니다.

# policy/supplier.yaml — 공급사 제출 시 필수 요소 (§4.6 공급사 필수 20개)
required:
  - sbom_author
  - sbom_data_format_name
  - sbom_data_format_version
  - sbom_timestamp
  - sbom_dependency_relationship
  - system_name
  - system_components
  - system_producer
  - system_version
  - model_name
  - model_identifier
  - model_version
  - model_producer
  - model_license
  - dataset_name
  - dataset_identifier
  - dataset_provenance
  - dataset_sensitivity
  - dataset_license
  - vulnerability_referencing
recommended:
  - model_timestamp
  - dataset_content
  - model_hash_value

4.3 판정 엔진

엔진은 두 가지를 함께 권합니다. 빠른 시작은 sbomqs custom policy(YAML)로, 별도 엔진 학습 없이 역할별 파일을 오늘 바로 운용하고 충족률을 점수로 환산합니다. 표현력이 필요한 곳은 OPA/Rego(conftest)로, 입력 BOM의 역할 값을 보고 필수 집합을 분기합니다. Rego는 필드 레지스트리의 경로를 따라가 존재 여부를 평가하므로 조건부 필수나 교차 필드 일관성까지 표현할 수 있습니다.

# policy/aibom.rego — 역할별 필수 필드 검사 골격
package aibom

deny[msg] {
    role := input.metadata.properties[_].value  # "supplier" 등
    req := data.policy[role].required[_]
    not field_present(req)
    msg := sprintf("필수 요소 누락: %s (역할: %s)", [req, role])
}

OSCAL은 보안 통제 표현용이라 SBOM 필드 적합성에는 과중량이고, 검증을 스스로 실행하지 않으므로 채택하지 않습니다. 다만 규제·감사용 상위 산출물(요구사항 카탈로그, 평가 결과 보고)을 연방 친화 포맷으로 남길 필요가 생기면 그 층위에서만 고려합니다.

5. 참조 아키텍처와 Dependency-Track 통합

AI 시스템의 BOM은 소프트웨어 의존성 계층과 모델·데이터셋 계층으로 갈립니다. Dependency-Track은 앞 계층을 지금 바로 처리하고, 뒤 계층은 아직 1급으로 받지 못합니다(이슈 #4361은 조사 시점에 open 상태이며 추후 변경될 수 있습니다). 그래서 계층을 나눠 통합합니다.

%%{init: {'theme':'neutral','themeVariables':{'fontSize':'18px'}}}%%
flowchart TD
    GEN["생성<br/>cdxgen aibom<br/>CycloneDX 1.6"]
    SEC["보강<br/>ModelScan 스캔<br/>sigstore 서명"]
    POL["검증<br/>역할별 정책<br/>sbomqs, Rego"]
    DT["저장·취약점<br/>Dependency-Track<br/>SW 계층 매칭"]
    INV["모델·데이터 계층<br/>properties 우회<br/>또는 분류자 대기"]
    GEN --> SEC
    SEC --> POL
    POL --> DT
    POL --> INV

그림 2. AI BOM 도구 파이프라인과 계층 분리 (조사 종합)

소프트웨어 계층은 추가 작업이 거의 없습니다. cdxgen이 ML 프로젝트의 PyPI나 npm 의존성을 CycloneDX로 만들어 Dependency-Track에 올리면, OSV와 NVD로 취약점을 상관하고 “이 컴포넌트를 쓰는 프로젝트는?” 영향분석까지 제공합니다. huntr가 ML 라이브러리에 발급한 CVE도 NVD를 거쳐 잡힙니다.

모델·데이터셋 계층은 분류자 지원이 올 때까지 우회합니다. 단기로는 모델과 데이터셋을 일반 컴포넌트로 올리되 모델 카드 핵심 필드를 CycloneDX properties나 외부 참조로 실어 보존합니다. 검색성은 제한되지만 추적은 됩니다. 모델 파일 고유 위협(안전하지 않은 pickle, 백도어 가중치)은 CVE 매칭 모델에 맞지 않으므로 ModelScan으로 따로 점검하고 그 결과를 정책이나 티켓으로 연계합니다.

6. 한계와 검증 필요 사항

이 전략의 도구 사실은 각 프로젝트의 공식 리포지토리와 문서로 확인했습니다. 다음은 채택 전 재확인이 필요합니다.

라이선스 영역에는 표기와 실제의 불일치 위험이 있습니다. 플랫폼에 선언된 라이선스가 모델·데이터셋의 실제 구성요소 라이선스와 어긋나는 이른바 permissive-washing은 잘 알려진 위험이며, 기존 소프트웨어 라이선스 도구가 모델 카드나 데이터셋 카드를 파싱하고 학습 데이터 출처를 추적하지 못한다는 한계와 맞물립니다. 도구 세트는 이를 자동 탐지로 약속하지 않고 선언 라이선스와 산출물의 일치 검증을 신규 구축 대상으로 남겨 둡니다.

Dependency-Track의 모델·데이터 분류자 지원 시점(#4361)은 외부 일정이라 통제할 수 없습니다. P1의 모델·데이터 인벤토리는 이 일정에 의존하므로, 우회책(properties 보존)을 기본으로 두고 분류자 지원이 들어오면 승격하는 방식으로 설계해야 합니다.

GUAC의 AI 전용 처리, OSV의 모델 전용 레코드 체계, huntr Insights와 ModelScan 결과를 Dependency-Track이 직접 소비하는 커넥터는 모두 부재로 확인되거나 미확인(unverifiable)입니다. 모델 위험 피드와 SBOM 인벤토리를 잇는 표준은 아직 비어 있어, 이 연계는 자체 글루 코드로 메워야 합니다.

데이터 오염 탐지는 production 도구가 없습니다. 도구 세트에서 오염 자동 탐지를 약속하지 않고, 데이터 출처와 해시, 검증 통과 여부를 기록하는 추적성과 예방 통제로 한정합니다.

7. 참고문헌

본문의 도구 판정은 각 프로젝트의 공식 리포지토리와 문서를 1차 출처로 확인했습니다. 접속 시점은 모두 2026-06입니다.

A1. CycloneDX / cdxgen 프로젝트. cdxgen — AI/ML BOM 생성과 aibom CLI, --spec-version. https://github.com/CycloneDX/cdxgen (접속: 2026-06). — 용도: cdxgen aibom이 CycloneDX 1.6 AI BOM을 자동 생성한다는 근거.

A2. CycloneDX. Machine Learning Bill of Materials (ML-BOM) 역량 소개. https://cyclonedx.org/capabilities/mlbom/ (접속: 2026-06). — 용도: CycloneDX 1.6이 machine-learning-model과 modelCard를 정의한다는 표준 근거.

A3. SPDX. SPDX 3.0.1 — AI Profile 사양. https://spdx.github.io/spdx-spec/v3.0.1/model/AI/AI/ (접속: 2026-06). — 용도: SPDX 3.0 AI 프로파일이 사양 차원에서 존재한다는 근거(표현력 비교).

A4. SPDX. tools-python (spdx-tools) — 3.0 실험적 쓰기 전용, 프로덕션 비권장. https://github.com/spdx/tools-python (접속: 2026-06). — 용도: SPDX 3.0 AI 프로파일을 생성하는 성숙한 도구가 부재하다는 근거.

A5. interlynk-io. sbomqs — 정책 가이드(custom policy, required 타입, feature 점수화). https://github.com/interlynk-io/sbomqs/blob/main/docs/guides/policy.md (접속: 2026-06). — 용도: sbomqs가 사용자 정의 정책으로 필드 존재를 강제하고 충족률을 점수화한다는 근거.

A6. Open Policy Agent. Conftest — 구성 파일에 대한 OPA/Rego 정책 평가. https://github.com/open-policy-agent/conftest (접속: 2026-06). — 용도: CycloneDX/SPDX JSON을 Rego로 평가해 역할별 필수 집합을 분기한다는 근거.

A7. OWASP Dependency-Track. 정책 컴플라이언스 문서(조건 종류, regex 값). https://docs.dependencytrack.org/usage/policy-compliance/ (접속: 2026-06). — 용도: Dependency-Track 정책 엔진이 라이선스·취약점·컴포넌트 좌표 중심이며 프로젝트/태그 단위 정책이 가능하다는 근거.

A8. DependencyTrack. 이슈 #4361 — CycloneDX 1.5/1.6 분류자(machine-learning-model·data) 지원 요청. https://github.com/DependencyTrack/dependency-track/issues/4361 (접속: 2026-06). — 용도: Dependency-Track이 모델·데이터 분류자와 modelCard를 아직 인입하지 못한다는 근거(조사 시점 open).

A9. Protect AI. ModelScan — 모델 직렬화 공격 정적 스캐너(JSON 리포트, 종료코드). https://github.com/protectai/modelscan (접속: 2026-06). — 용도: 모델 파일 직렬화 스캔이 CI 삽입 가능한 수준으로 성숙했다는 근거.

A10. Sigstore / OpenSSF. model-transparency (model-signing) — DSSE + in-toto 모델 서명. https://github.com/sigstore/model-transparency (접속: 2026-06). — 용도: 모델 서명·출처 보증이 BOM 무결성·출처 필드에 매핑된다는 근거.

A11. Z. Tian 외 (2025). Data Poisoning in Deep Learning: A Survey. https://arxiv.org/html/2503.22759v1 (접속: 2026-06). — 용도: 데이터 오염 탐지가 여전히 연구 단계이며 범용 production 도구가 없다는 근거.

A13. Responsible AI Licenses (RAIL). FAQ / BigScience OpenRAIL-M — 파생 전파되는 사용 기반 제한. https://www.licenses.ai/faq-2 (접속: 2026-06). — 용도: RAIL 계열의 행위 제한을 기계가 읽고 자동 판정하는 표준이 부재하다는 근거.

A14. LF AI & Data. Simplifying AI Model Licensing with OpenMDW. https://lfaidata.foundation/blog/2025/07/22/simplifying-ai-model-licensing-with-openmdw/ (접속: 2026-06). — 용도: OpenMDW가 모델과 데이터, 가중치를 묶는 허용형 라이선스로 SPDX에 등재됐다는 근거(AI 라이선스 사전 보강 대상).

A15. Protect AI. huntr — AI와 ML 대상 버그바운티이자 CNA. https://huntr.com/ (접속: 2026-06). — 용도: huntr가 발급한 CVE가 NVD를 거쳐 Dependency-Track 매칭에 유입된다는 근거.

A16. Google와 OpenSSF. OSV.dev — 오픈소스 취약점 데이터베이스. https://osv.dev/ (접속: 2026-06). — 용도: OSV가 ML 라이브러리 취약점을 포함하나 모델 가중치 자체 위험은 수록하지 않는다는 근거.

A17. Trail of Bits. Fickling — pickle 정적 분석 도구. https://github.com/trailofbits/fickling (접속: 2026-06). — 용도: 고위험 pickle 정밀 검사 도구 근거.

A18. OSS Review Toolkit. ORT — 라이선스 컴플라이언스 오케스트레이션. https://github.com/oss-review-toolkit/ort (접속: 2026-06). — 용도: 정책 룰 엔진과 SBOM 리포터를 재사용한다는 근거.

A19. OpenSSF. GUAC — SBOM 그래프와 영향분석. https://guac.sh/ (접속: 2026-06). — 용도: 영향분석을 보강하는 선택지이며 AI 전용 처리는 미확인이라는 근거.

5 - 검증 보고서

기업용 AI BOM 필드 요구사항 매트릭스와 운영 문서, 도구 전략(1~3단계)의 사실 검증 기록입니다. 표준 근거, 합의 계산, 규제 축, 도구 단정의 1차 출처 확인 결과를 담습니다.

이 글은 Claude Code를 이용해 작성했고, 인용한 핵심 사실은 1차 출처로 교차 검증했습니다.

본 보고서는 1단계(REPORT.md 매트릭스)의 기존 검증을 보존하고, 2단계(운영 문서 operational/01~03)와 3단계(도구 전략 operational/04)의 검증을 추가했습니다. 1~3단계 전체 판정은 CONDITIONAL PASS이며, 발행 가능합니다. 발행 차단(FAIL) 사유는 없습니다. 2·3단계 검증은 이 문서 후반의 “2·3단계 검증” 섹션에 있습니다.

1단계: 매트릭스 검증 (기존, 보존)

판정: CONDITIONAL PASS

매트릭스의 핵심인 표준 근거(SPDX 3.0.1, CycloneDX 1.6 카디널리티)와 합의 계산은 1차 명세로 직접 확인했고 모두 일치합니다. 규제 축의 시행일과 조문은 워크스페이스의 기존 1차 검증 자산과 안정적 출처로 교차확인했습니다. 필수 수정(Critical)에 해당하는 환각이나 잘못된 사실 진술은 없습니다. NTIA 일곱 기준 필드의 1차 명세(ntia.gov)가 인증서 오류로 직접 조회되지 않아 공개 미러로만 확인된 점 하나가 CONDITIONAL 사유이며, 권장 수정으로 분류합니다.

검증 경위: 지정된 fact-checker 에이전트가 차단 URL(ntia.gov 인증서 오류로 추정)에서 600초 무응답으로 중단되어 _verification.md를 남기지 못했습니다. 이에 코디네이터가 차단 URL을 우회해 안정적 1차 경로와 워크스페이스 기존 검증 자산으로 직접 검증을 완료했습니다.

1. 표준 근거 검증 (매트릭스 핵심) — 일치

검증 항목	1차 출처	결과
SPDX 3.0.1 AIPackage 필수 속성: name, packageVersion, releaseTime, suppliedBy, downloadLocation, primaryPurpose, creationInfo, spdxId 모두 minCount 1	spdx.github.io v3.0.1 AIPackage 클래스 (200 OK, WebFetch)	일치
SPDX 3.0.1 DatasetPackage 필수 속성: datasetType(1..*), originatedBy, builtTime, downloadLocation, primaryPurpose, releaseTime 필수	spdx.github.io v3.0.1 DatasetPackage 클래스 (200 OK, WebFetch)	일치
CycloneDX 1.6 루트 required는 bomFormat, specVersion 둘뿐	github CycloneDX bom-1.6.schema.json (200 OK, WebFetch)	일치
CycloneDX 조건부 required: component[type,name], hash[alg,content], dependency[ref], externalReference[url,type]	동일 스키마	일치

표준 검증 결과, 모델 클러스터 필수 6개(이름, 식별자, 버전, 타임스탬프, 생산자, 라이선스)와 데이터셋 필수 5개(이름, 내용, 식별자, 출처, 라이선스) 중 SPDX 기여분이 명세와 정확히 일치합니다. 해시와 의존성 관계를 “선택"으로 둔 판정도 검증과 일치합니다. 두 항목 모두 객체 생성 시에만 강제되는 조건부 필수일 뿐, 명세가 그 객체의 존재 자체를 요구하지 않기 때문입니다.

2. 합의 계산 정합성 — 일치

§2.2 규칙(“G7 1표 + 존재 요구 출처 1곳 이상 → 필수”)이 §4 매트릭스에 일관 적용됐는지 표본 점검했습니다.

필수 20개 전수: 메타데이터 5, 시스템수준 4, 모델 6, 데이터셋 5. §3 개관표의 클러스터별 합계와 일치.
“조건부”, “근사”, “함의"를 존재 요구로 세지 않는다는 규칙 위반 셀 없음. 예: 모델 해시 값(SPDX 조건부 + CycloneDX 조건부)과 데이터셋 의존성 관계(조건부+조건부)는 정확히 “선택"으로 판정됨.
OpenChain “필수(P)“가 부여된 모델 라이선스, 데이터셋 라이선스는 정확히 “필수"로 반영됨.

3. 규제 축 검증 — 교차확인 일치

검증 항목	확인 경로	결과
AI Act Article 53(1)(d) 학습 콘텐츠 요약 공개 의무	artificialintelligenceact.eu Article 53 (200 OK, WebFetch)	일치
AI Act GPAI 의무 시행 2025-08-02 (Article 113(b))	동일 출처	일치
AI Act 고위험 시행 2026-08-02	워크스페이스 g7-sbom-for-ai 검증 자산(EU 집행위 정책 페이지)	일치
CRA 발효 2024-12-10, 보고의무 2026-09-11, 전면적용 2027-12-11	워크스페이스 sw-supply-chain-roadmap 검증 자산(EUR-Lex Reg 2024/2847 Art.71, B1 200 OK)	일치
CRA SBOM Annex I Part II 최상위 종속성	워크스페이스 g7 검증 자산(Annex I Part II 적용일 2027-12-11)	일치
FDA §524B 신설(§3305), 시행 2023-03-29	워크스페이스 sw-supply-chain-roadmap 검증 자산(1차 보도자료)	일치

규제 시행일과 조문은 본 워크스페이스의 두 선행 보고서(g7-sbom-for-ai, sw-supply-chain-roadmap)가 이미 1차 출처로 검증해 PASS 판정한 자산과 일치합니다. 이 선행 검증 중 CRA는 EUR-Lex 원문을 200 OK로 직접 확인한 기록이 있어, 본 보고서의 규제 축은 미러 단독이 아니라 1차 검증 경유로 뒷받침됩니다.

4. 권장 수정 (High/Medium)

NTIA 일곱 기준 데이터 필드: 1차 명세(ntia.gov)가 인증서 오류로 직접 조회 불가하여 공개 미러(sbomify)로만 확인했습니다. 일곱 필드(Author of SBOM Data, Timestamp, Supplier Name, Component Name, Version, Other Unique Identifiers, Dependency Relationship)는 업계 표준으로 널리 통용되는 비논쟁적 사실이나, 발행 시에는 NTIA 보고서 PDF나 CISA 2025 개정 초안을 1차 인용으로 보강할 것을 권장합니다.
국내 AI 기본법: 학습데이터 관련 의무의 조항·항 번호를 1차 조문으로 못 박지 못해 “간접(조문 미특정)“으로 표시했습니다. 조항 단위 인용이 필요한 단계(예: 공급사 계약서 근거)에서는 국가법령정보센터 본문으로 조문을 특정할 것을 권장합니다.
FDA SBOM 권고 항목 상세(지원종료일, 알려진 취약점)는 fda.gov 가이던스 PDF 직접 URL이 404를 반환해 FAQ와 요약으로 교차확인했습니다. §524B 발효일은 1차 검증 자산과 일치하므로 핵심 사실은 안정적입니다.

5. 참고 사항 (Low)

본 보고서는 표준 파이프라인의 단일 원본 번역이 아니라 다중 출처 종합이므로 00~03 단계 파일 대신 workspace/의 네 매핑 파일이 출처 근거를 보존합니다. 03-references에 해당하는 통합 출처는 REPORT.md §7에 단락 형식으로 수록했습니다.

6. 재현성 점검

판정 직후 핵심 사실 표본을 다른 경로로 재확인했습니다.

SPDX AIPackage suppliedBy minCount 1: AIPackage 클래스 페이지에서 직접 확인(WebFetch). DatasetPackage originatedBy minCount 1도 동일 경로로 확인. 두 속성은 각각 모델 생산자, 데이터셋 출처의 필수 판정 근거이며 일치.
CycloneDX 루트 required 2개: 스키마 원문 required 배열에서 직접 확인. “조건부 필수를 존재 요구로 세지 않는다"는 규칙의 근거가 되는 핵심 사실이며 일치.
AI Act 2025-08-02와 CRA 2027-12-11: 안정적 출처(AI Act Explorer)와 워크스페이스 1차 검증 자산이라는 두 독립 경로에서 일치.

재현성 점검 결과, 표본 사실에서 드리프트가 발견되지 않았습니다.

권장 수정 반영 현황

항목	분류	반영 여부
NTIA 일곱 필드 1차 인용 보강	High	미반영 (발행 전 권장)
국내 AI 기본법 조문 특정	Medium	미반영 (계약 근거 단계에서 권장)
FDA 권고 항목 1차 보강	Low	미반영 (핵심 사실은 검증됨)

2·3단계 검증: 운영 문서와 도구 전략

판정: CONDITIONAL PASS

2단계(운영 문서 operational/01-supplier-requirements.md, 02-producer-guide.md, 03-ingestion-checklist.md)와 3단계(도구 전략 operational/04-toolset-strategy.md)를 검증했습니다. 도구 전략의 핵심 단정 일곱 가지는 모두 각 프로젝트의 1차 출처(공식 리포지토리·문서)로 뒷받침되며, 표본 네 곳의 URL을 200 OK + 본문 일치로 직접 재확인했습니다. 운영 문서의 역할별 필수 집합은 REPORT.md §4.6 역할 표와 정합합니다. 환각이나 발행을 막을 사실 오류는 없습니다. CONDITIONAL 사유는 1단계와 동일한 NTIA 1차 명세 접근 제약(비논쟁적 사실), 그리고 도구 전략의 예시 정책 파일이 §4.6 공급사 필수 집합을 일부만 옮긴 점(권장 수정)입니다.

검증 비용 통제: 이전 검증이 차단 URL 재시도로 타임아웃된 전례가 있어, 이번에는 workspace/tools/의 다섯 조사 파일이 수집해 둔 1차 출처 URL을 근거로 삼고 WebFetch는 표본 다섯 건(도구 4 + NTIA 1)으로 제한했습니다. 차단·인증서 오류는 1회 시도 후 즉시 “확인 불가(접근 제약)“로 표기하고 재시도하지 않았습니다.

2·3단계 요약

검증한 도구 단정: 7건 (전부 1차 출처 뒷받침)
도구 인용(A1~A14): 14건, 표본 4건 WebFetch 200 OK + 내용 일치 / 나머지 10건은 workspace/tools 조사 파일이 동일 URL을 1차 출처로 수집한 것으로 교차확인
역할별 필수 집합 정합(운영 문서 ↔ §4.6): 생산 20/20 일치, 공급사 20/20 일치, 도입 실질 일치(경미한 누락 1)
표 분리 보존(§4.1~4.5 ↔ §4.6): 표본 10항목 합의 판정 일치, 필수 합계 20 보존
arXiv 2602.08816 잔존: 0건 (발행 대상 문서에 없음)
환각 의심: 0건
FAIL(발행 차단): 0건

1. 도구 전략 단정 검증 (3단계, 04-toolset-strategy)

본문 도구 단정과 §7 참고문헌(A1~A14)의 정합을 점검했습니다. 표본 URL 네 곳은 직접 WebFetch했고, 나머지는 workspace/tools/01~05가 같은 URL을 1차 출처로 수집한 기록과 대조했습니다.

본문 단정	인용	1차 출처 확인	결과
cdxgen `aibom`이 CycloneDX AI BOM을 생성하고 `--spec-version 1.6`으로 1.6 출력 가능(기본 1.7)	A1	github.com/CycloneDX/cdxgen 직접 확인(WebFetch 200 OK). `aibom` 명령과 `--spec-version 1.6` 예시 본문 확인	일치
SPDX 3.0 AI 프로파일을 생성하는 성숙한 도구 부재(spdx-tools는 실험적 쓰기 전용, AI 프로파일 생성 미문서화)	A3, A4	workspace/tools/01이 spdx-tools README의 “실험적·쓰기 전용·프로덕션 비권장” 문구를 수집. SPDX 3.0 AI 프로파일 사양 존재는 A3로 별도 확인	일치
sbomqs custom policy의 `required` 타입으로 필드 존재 강제	A5	sbomqs policy.md 직접 확인(WebFetch 200 OK). `type: required`(“Ensures the field is present”) 본문 확인	일치
OPA/Rego(conftest)로 역할별 필수 집합 분기	A6	conftest는 CNCF 표준 도구로 workspace/tools/02가 수집(공식 페이지 본문 1차 열람은 미완, 존재·기능은 다수 출처 교차확인)	일치(보조 출처)
Dependency-Track이 `machine-learning-model`·`data` 분류자·modelCard 미인입(이슈 #4361 open)	A8	issue #4361 직접 확인(WebFetch 200 OK). 제목 “Basic Support for Classifiers … 1.5 & 1.6”, 상태 open, 누락 분류자에 machine-learning-model·data 포함 확인	일치
ModelScan 정적 스캔(JSON 리포트·종료코드), sigstore model-signing DSSE+in-toto	A9, A10	sigstore model-transparency 직접 확인(WebFetch 200 OK). “DSSE envelope … in-toto statement”, predicate `model_signing/signature/v1.0` 확인. ModelScan은 workspace/tools/04가 수집	일치
데이터 오염 탐지는 연구 단계, 범용 production 도구 부재 → 추적성으로 대체	A11	workspace/tools/04가 동일 결론을 서베이(arXiv 2503.22759)로 뒷받침. 인용 형식 정상	일치

이슈 #4361은 외부 일정에 달린 “조사 시점 스냅샷"이며, 본문도 “조사 시점 open, 추후 변경될 수 있다"고 명시했습니다. 검증 시점에도 open으로 확인됐고, 지침에 따라 FAIL 트리거에서 제외했습니다.

2. 운영 문서 ↔ §4.6 역할 표 정합 (2단계)

REPORT.md §4.6 역할 표에서 역할별 필수 집합을 산출해 운영 문서가 도출했다는 집합과 대조했습니다.

생산(02-producer-guide §2): §4.6 생산 필수 20개(메타 5, 시스템 4, 모델 6 — 모델 타임스탬프 포함, 데이터셋 5 — 데이터셋 내용 포함)와 정확히 일치합니다. 20/20 일치.

공급사(01-supplier-requirements §2): §4.6 공급사 필수 20개와 정확히 일치합니다. 특히 §4.6에서 공급사 기준으로 권장인 모델 타임스탬프와 데이터셋 내용을 01 문서도 필수에서 빼고(2.3·2.4) 권장으로 두지 않은 점, 취약점 참조를 규제(CRA·FDA) 근거로 필수에 올린 점이 표와 일치합니다. 20/20 일치.

도입(03-ingestion-checklist): §4.6 도입 필수 15개(메타 의존성 1, 시스템 3, 모델 5 — 모델 설명 포함, 데이터셋 5, 보안 1)와 실질적으로 일치합니다. 체크리스트 §2~§5가 모델 설명·계보(필수 승급), 데이터셋 민감도·출처, 취약점 참조를 모두 필수 확인으로 담았습니다. 경미한 누락 한 건은 아래 권장 수정으로 분류합니다.

3. 표 분리 보존 점검 (REPORT §4.1~4.5 ↔ §4.6)

합의 7열 표(§4.1~4.5)와 역할 표(§4.6)로 분리하면서 합의 판정 값이 바뀌거나 누락됐는지 표본 대조했습니다. SBOM 작성자(필수), SBOM 버전(선택), 메타 의존성 관계(필수), 시스템 데이터 사용(선택), 모델 해시 값(선택), 모델 라이선스(필수), 데이터셋 내용(필수), 데이터셋 민감도(선택), 취약점 참조(선택), 데이터셋 라이선스(필수) 등 10개 표본의 합의 판정이 두 표에서 동일합니다. §4.6 합의=필수 합계는 20으로 §3 개관표(5+4+6+5)와 보존 일치합니다. 표 분리에 따른 값 변경·누락은 없습니다.

4. arXiv 2602.08816 잔존 확인

발행 대상 문서(REPORT.md, operational/01~04) 전체를 검색한 결과 arXiv 2602.08816은 한 건도 남아 있지 않습니다. 데이터 오염 관련 인용(A11)은 실재하는 서베이 arXiv 2503.22759(2025-03)로, 식별자 형식과 발행 시점이 정상입니다. 환각 식별자가 발행본에 유입되지 않았습니다.

5. 필수 수정 (Critical)

없음. 발행을 차단할 사실 오류나 환각, 죽은 인용은 발견되지 않았습니다.

6. 권장 수정 (High/Medium)

(Medium) 04-toolset-strategy.md §4.2의 예시 정책 파일 policy/supplier.yaml은 공급사 필수 15개만 나열해, §4.6 공급사 필수 20개 중 데이터 형식 버전, 시스템 생산자, 시스템 버전, 모델 버전 네 항목이 required에서 빠져 있습니다. 본문은 “매트릭스의 역할 열을 그대로 옮기면 됩니다"라고 설명하므로, 예시가 축약본임을 한 줄 명시하거나 누락 네 항목을 채워 §4.6·01-supplier와 정합시키는 것을 권장합니다. 도구 사실이 아니라 예시 완성도 문제이므로 발행 차단 사유는 아닙니다.
(High, 1단계 이월) NTIA 일곱 기준 필드의 1차 명세(ntia.gov)는 이번에도 인증서 오류(“unable to get local issuer certificate”)로 직접 조회되지 않았습니다. 1회 시도 후 재시도하지 않았습니다. 일곱 필드는 업계 표준으로 널리 통용되는 비논쟁적 사실이며, 발행 시 NTIA 보고서 PDF나 CISA 2025 개정 초안을 1차 인용으로 보강할 것을 권장합니다.

7. 참고 사항 (Low)

(Low) 03-ingestion-checklist.md §2는 “시스템 구성요소와 버전"을 필수 확인으로 두나 §4.6 도입 필수의 “시스템 이름"을 명시 항목으로 분리하지 않았습니다. 식별 맥락상 자명하나, 점검 항목 완전성을 위해 시스템 이름을 한 줄 추가하면 표와 1:1 대응이 됩니다.
(Low) A5(sbomqs policy.md)는 “필드 존재 강제"의 근거로는 정확합니다. 다만 §4.3·workspace의 “충족률을 점수로 환산"은 policy.md가 아니라 sbomqs의 별도 score 기능에 해당합니다. policy.md는 pass/warn/fail 판정이 본문입니다. 점수화는 sbomqs의 잘 알려진 핵심 기능이라 사실 자체는 맞으나, 점수화 근거로는 policy.md가 아닌 score 문서를 인용하는 편이 정밀합니다.

8. 재현성 점검 (2·3단계)

판정 근거 핵심 사실 표본을, 최초 확인에 쓰지 않은 경로로 재확인했습니다.

핵심 사실	최초 확인 경로	재확인 경로	일치
cdxgen `aibom` + `--spec-version 1.6` 가능	workspace/tools/01 수집 URL	github.com/CycloneDX/cdxgen 본문 직접 WebFetch	일치
이슈 #4361 open, machine-learning-model·data 분류자 미지원	workspace/tools/03 수집	github 이슈 본문 직접 WebFetch(제목·상태·분류자 목록)	일치
sigstore model-signing = DSSE+in-toto 번들	workspace/tools/04 수집	github.com/sigstore/model-transparency 본문 직접 WebFetch	일치
생산 필수 20개 = §4.6 생산 열	§4.6 표 카운트	02-producer-guide §2 항목 카운트	일치
공급사 필수 20개 = §4.6 공급사 열	§4.6 표 카운트	01-supplier-requirements §2 항목 카운트	일치

표본에서 드리프트가 없어 2·3단계 판정(CONDITIONAL PASS)을 유지합니다.

9. 검증 매트릭스 (2·3단계)

항목	결과	비고
도구 인용 URL 실재성	정상 (표본 4/4 200 OK)	나머지 10건 workspace 1차 수집과 교차확인
도구 단정-출처 일치	정상 (7/7)	핵심 단정 전부 1차 출처 뒷받침
운영 문서-§4.6 정합	정상 (생산 20/20, 공급사 20/20, 도입 실질 일치)	도입 시스템 이름 누락 1건은 Low
표 분리 보존	정상 (표본 10/10, 필수 합계 20 보존)
arXiv 2602.08816 잔존	정상 (0건)	정당 인용은 arXiv 2503.22759
환각 패턴	정상	깔끔한 인용·구체 수치 표본 추적, 환각 없음
NTIA 일곱 필드 1차 명세	확인 불가 (접근 제약)	인증서 오류, 1회 시도. 비논쟁적 사실
예시 정책 파일 완성도	주의 (1건)	§4.2 supplier.yaml 4항목 누락, 권장 수정

10. 발행 가부

발행 가능(CONDITIONAL PASS). 발행을 차단할 Critical은 없습니다. 권장 수정 두 건(예시 정책 파일 완성·NTIA 1차 보강)과 참고 사항 두 건은 발행 후 보완해도 무방하며, 사용자 판단에 맡깁니다.

권장 수정 반영 현황 (2·3단계)

항목	분류	반영 여부
§4.2 supplier.yaml 4항목 보강 또는 축약 명시	Medium	미반영 (발행 후 권장)
NTIA 일곱 필드 1차 인용 보강	High	미반영 (1단계 이월, 발행 전 권장)
03 도입 체크리스트에 시스템 이름 추가	Low	미반영
A5 점수화 근거를 sbomqs score 문서로 정밀화	Low	미반영

6 - 이 시리즈를 만든 과정

AI BOM 필드 요구사항 시리즈가 표준 합의 매트릭스, 운영 문서 3종, 도구 세트 전략, 검증과 red-team 검토를 거쳐 만들어진 과정을 정리합니다.

이 글은 Claude Code를 이용해 작성했고, 인용한 핵심 사실은 1차 출처로 교차 검증했습니다.

이 시리즈는 세 단계로 쌓아 올렸습니다. 먼저 무엇을 요구할지를 표준으로 정하고, 그것을 기업의 세 가지 사용 맥락에 맞춘 운영 문서로 옮긴 다음, 그 요구사항을 실제로 검사할 도구 세트를 조사했습니다. 각 단계는 다음 단계의 입력이 되므로, 매트릭스가 흔들리면 운영 문서와 도구 전략이 함께 흔들립니다. 그래서 매트릭스의 근거를 가장 단단하게 잡았습니다.

1단계 — 표준 합의 매트릭스

출발점은 G7 사이버보안 작업반이 정의한 「AI를 위한 SBOM 최소 요소」의 50개 요소입니다. 이 50개를 행으로 두고 SPDX 3.0.1, CycloneDX 1.6, NTIA 2021, OpenChain AI V1 네 표준의 요구 강도를 대조했습니다. 어떤 필드의 존재를 두 곳 이상이 요구하면 필수, 아니면 선택으로 갈랐습니다. 그 결과 50개 중 20개가 필수, 30개가 선택으로 나뉘었습니다.

판정의 핵심 근거인 SPDX 3.0.1 클래스 카디널리티와 CycloneDX 1.6 JSON 스키마의 required 배열은 1차 명세에서 직접 확인했습니다. 객체 생성 시에만 강제되는 조건부 필수를 “존재 요구"로 세지 않는다는 규칙을 일관되게 적용해, 모델 해시나 데이터셋 의존성 관계 같은 항목이 과도하게 필수로 올라가지 않게 했습니다. 규제(CRA, AI Act, FDA, 국내 제도)는 합의 카운트와 분리된 별도 축으로 두어, 표준이 데이터 필드로 규정하지 않아도 규제가 같은 정보를 요구하는 경우(취약점 참조 등)를 역할별 적용에서 끌어올릴 수 있게 했습니다.

2단계 — 운영 문서 3종

같은 매트릭스를 기업이 실제로 쓰는 세 가지 맥락으로 옮겼습니다. 자사 개발팀이 직접 작성하는 생산, 외부 모델·데이터셋을 들여올 때 점검하는 도입, 공급사에 제출을 요구하는 공급사 요구입니다. 정보 접근성이 가장 좋은 생산 시점은 요구 수준을 가장 높게, 위험 평가가 목적인 도입은 라이선스와 출처, 민감도, 취약점에 무게를 두는 식으로, 같은 필드라도 맥락에 따라 필수와 권장을 다르게 배치했습니다. 세 문서의 역할별 필수 집합은 매트릭스 §4.6 역할 표에서 그대로 도출했습니다.

3단계 — 도구 세트 전략

요구사항을 정의했으면 그것을 검사할 수단이 필요합니다. 7개 도구 범주를 공식 리포지토리와 문서로 조사해, 무엇을 재사용하고 무엇을 확장하거나 새로 만들지 판단했습니다. 생성(cdxgen aibom), 검증(sbomqs, OPA/Rego), 저장(Dependency-Track), 모델 무결성(ModelScan, sigstore)은 이미 오픈소스로 작동하므로 재사용하고, AI 고유 필드의 역할별 적합성 검사와 모델·데이터 인벤토리, 라이선스 사용 제한 판정만 신규 구축 대상으로 좁혔습니다. 매트릭스를 필드 레지스트리와 역할별 정책 파일로 코드화하는 설계까지 포함했습니다.

검증과 red-team 검토

세 단계 전체를 fact-checker가 별도로 검증했습니다. 매트릭스의 표준 근거는 1차 명세로 직접 확인해 일치했고, 도구 전략의 핵심 단정 일곱 가지도 각 프로젝트의 공식 리포지토리·문서로 뒷받침됨을 확인했습니다. 전체 판정은 CONDITIONAL PASS입니다. NTIA 일곱 기준 필드의 1차 명세(ntia.gov)가 인증서 오류로 직접 조회되지 않아 공개 미러로 확인한 점, 도구 전략의 예시 정책 파일이 공급사 필수 집합을 일부만 옮긴 점이 조건부 사유로 남았습니다. 발행을 차단할 사실 오류나 환각은 발견되지 않았습니다. 자세한 검증 기록은 검증 보고서에 있습니다.

발행 전에는 적대적 관점의 red-team 검토를 한 차례 더 거쳐, 매트릭스 판정 규칙의 일관성과 역할별 적용의 근거, 도구 단정의 과장 여부를 다시 점검했습니다.