반도체 웨이퍼 결함 검출 CNN 모델 및 발표 일정 논의

개요

본 세션은 (1) 수업 일정 및 발표 방식 논의와 (2) CNN 기반 웨이퍼 결함 검출 모델에 대한 구체적 설명으로 구성된다. 발표는 영상 제출 방식과 실시간 Q&A가 혼합된 형태로 진행되며, CNN 모델은 3계층 Conv‑Pool 구조, 9개 라벨(정상, 긁힘, 원형, 센터, 엣지 등)을 사용한다. 학습 과정에서 과적합 방지, 해상도 조정, 클래스 가중치, Grad‑CAM을 통한 해석을 강조한다.

핵심 개념

구분	내용
발표 방식	- 영상(10~20분) 제출<br>- 6월 13일(자료), 6월 14일(영상) 제출<br>- 6월 20일 최종 발표, Q&A
CNN 모델 구조	- 3개의 Conv‑Pool 블록<br>- 9개의 최종 클래스 (softmax)
특징 추출	- Conv‑Pool 반복을 통한 고차원 특징 맵 생성<br>- 8192개 가중치 집합
학습	- 10~20 epoch 반복<br>- 로스 감소 및 검증(Over‑fitting 방지)
해상도 영향	낮은 해상도 → 오분류 증가 → 128x128↑로 개선
클래스 가중치	불균형 클래스에 가중치 부여 (예: 스크래치 가중치 ↑)
다중 라벨	복합 결함(스크래치+도넛 등) 처리 필요
Grad‑CAM	모델 내부 활성화 시각화 → 오분류 원인 분석
오류 분석	- 해상도<br>- 가중치 분포<br>- 라벨링 오류
개선 방안	해상도 증가, 클래스 가중치 조정, 다중 라벨 학습, Grad‑CAM 활용

상세 내용

1. 수업 일정 및 발표

온라인 수업: 2월 2일 공휴일 대비 조정 필요.
기말 발표: 6월 20일, 10–20분 영상 + 10–15분 Q&A.
제출 마감:
- 6월 13일: PPT 자료
- 6월 14일: 영상 제출
평가: 영상의 명확성, 내용 정리, Q&A 대응력 중점.

2. CNN 모델 구조

Conv‑Pool 블록: 2D Conv → Max‑Pooling → ReLU × 3.
특징 맵: 8192개의 피처(예: 128x128) → 5차원 분류.
출력: 9개의 softmax 라벨 → 확률값(0.0–1.0).
파라미터: 320, 98,000, 10,000 등 수백만 개.

3. 학습 및 과적합

Epoch: 10~20까지 진행, 3단계 이상에서 로스 감소가 급격히 둔화.
검증: validation loss 상승 시 학습 중단(early stopping).
과적합 방지: dropout, L2 정규화, 데이터 증강 활용.

4. 해상도와 라벨링

해상도 영향: 64x64 → 128x128으로 증가 시 스크래치 인식률 30% 상승.
라벨링 오류: 사람이 직접 라벨링 시 오류 발생 → Grad‑CAM으로 원인 시각화 후 재라벨링 필요.

5. 클래스 가중치와 다중 라벨

가중치 부여: 스크래치 등 희귀 클래스에 가중치 2×~3× 적용.
다중 라벨: 스크래치+도넛 같은 복합 결함은 multi‑label 학습 필요.

6. Grad‑CAM 활용

활성화 맵: 모델이 중요하게 여기는 영역(빨간색)과 실제 결함 위치 비교.
오류 원인 파악: 해상도 낮음, 가중치 불균형 등 시각화로 진단.
개선: 가중치 재배열, 추가 특징 추출 층 삽입 검토.

7. 기타 논의 사항

강화 학습: 라벨 없이 스스로 패턴을 학습하는 방법 탐색 중.
시각화 도구: Grad‑CAM 외에도 Class‑Activation‑Mapping(CAM) 활용 가능.
데이터 수집: 더 많은 결함 예시 확보 → 모델 일반화 향상.

핵심: 모델 성능 향상을 위해 해상도, 클래스 가중치, 다중 라벨 학습, Grad‑CAM 기반 오류 분석을 체계적으로 적용해야 한다.

CNN 기반 웨이퍼 결함 분석과 발표