CNN 기반 웨이퍼 결함 분석과 발표
Shared on May 23, 2026
반도체 웨이퍼 결함 검출 CNN 모델 및 발표 일정 논의
개요
본 세션은 (1) 수업 일정 및 발표 방식 논의와 (2) CNN 기반 웨이퍼 결함 검출 모델에 대한 구체적 설명으로 구성된다. 발표는 영상 제출 방식과 실시간 Q&A가 혼합된 형태로 진행되며, CNN 모델은 3계층 Conv‑Pool 구조, 9개 라벨(정상, 긁힘, 원형, 센터, 엣지 등)을 사용한다. 학습 과정에서 과적합 방지, 해상도 조정, 클래스 가중치, Grad‑CAM을 통한 해석을 강조한다.
핵심 개념
| 구분 | 내용 |
|---|---|
| 발표 방식 | - 영상(10~20분) 제출<br>- 6월 13일(자료), 6월 14일(영상) 제출<br>- 6월 20일 최종 발표, Q&A |
| CNN 모델 구조 | - 3개의 Conv‑Pool 블록<br>- 9개의 최종 클래스 (softmax) |
| 특징 추출 | - Conv‑Pool 반복을 통한 고차원 특징 맵 생성<br>- 8192개 가중치 집합 |
| 학습 | - 10~20 epoch 반복<br>- 로스 감소 및 검증(Over‑fitting 방지) |
| 해상도 영향 | 낮은 해상도 → 오분류 증가 → 128x128↑로 개선 |
| 클래스 가중치 | 불균형 클래스에 가중치 부여 (예: 스크래치 가중치 ↑) |
| 다중 라벨 | 복합 결함(스크래치+도넛 등) 처리 필요 |
| Grad‑CAM | 모델 내부 활성화 시각화 → 오분류 원인 분석 |
| 오류 분석 | - 해상도<br>- 가중치 분포<br>- 라벨링 오류 |
| 개선 방안 | 해상도 증가, 클래스 가중치 조정, 다중 라벨 학습, Grad‑CAM 활용 |
상세 내용
1. 수업 일정 및 발표
- 온라인 수업: 2월 2일 공휴일 대비 조정 필요.
- 기말 발표: 6월 20일, 10–20분 영상 + 10–15분 Q&A.
- 제출 마감:
- 6월 13일: PPT 자료
- 6월 14일: 영상 제출
- 평가: 영상의 명확성, 내용 정리, Q&A 대응력 중점.
2. CNN 모델 구조
- Conv‑Pool 블록: 2D Conv → Max‑Pooling → ReLU × 3.
- 특징 맵: 8192개의 피처(예: 128x128) → 5차원 분류.
- 출력: 9개의 softmax 라벨 → 확률값(0.0–1.0).
- 파라미터: 320, 98,000, 10,000 등 수백만 개.
3. 학습 및 과적합
- Epoch: 10~20까지 진행, 3단계 이상에서 로스 감소가 급격히 둔화.
- 검증: validation loss 상승 시 학습 중단(early stopping).
- 과적합 방지: dropout, L2 정규화, 데이터 증강 활용.
4. 해상도와 라벨링
- 해상도 영향: 64x64 → 128x128으로 증가 시 스크래치 인식률 30% 상승.
- 라벨링 오류: 사람이 직접 라벨링 시 오류 발생 → Grad‑CAM으로 원인 시각화 후 재라벨링 필요.
5. 클래스 가중치와 다중 라벨
- 가중치 부여: 스크래치 등 희귀 클래스에 가중치 2×~3× 적용.
- 다중 라벨: 스크래치+도넛 같은 복합 결함은 multi‑label 학습 필요.
6. Grad‑CAM 활용
- 활성화 맵: 모델이 중요하게 여기는 영역(빨간색)과 실제 결함 위치 비교.
- 오류 원인 파악: 해상도 낮음, 가중치 불균형 등 시각화로 진단.
- 개선: 가중치 재배열, 추가 특징 추출 층 삽입 검토.
7. 기타 논의 사항
- 강화 학습: 라벨 없이 스스로 패턴을 학습하는 방법 탐색 중.
- 시각화 도구: Grad‑CAM 외에도 Class‑Activation‑Mapping(CAM) 활용 가능.
- 데이터 수집: 더 많은 결함 예시 확보 → 모델 일반화 향상.
핵심: 모델 성능 향상을 위해 해상도, 클래스 가중치, 다중 라벨 학습, Grad‑CAM 기반 오류 분석을 체계적으로 적용해야 한다.