alt

새 노트

Shared on May 19, 2026

10:08:29

혹은 이렇게 나누어도 되겠죠. 할 수 있지 않냐. 이런 식으로 하다가 컴퓨터에서 이게 안 되기 시작했으니까 이런 식으로는 이제 not or 해가지고 각각 0이냐 1이냐 이렇게 판단을 할 수 있었는데 이 문제 말고 딱 이 문제에서 해결을 할 수 없게 된 거죠.

10:08:59

이 문제 같은 경우는 어떻게 하면 하나의 선만 그어서 분류를 해서 낼 수 있을까요? 딱 하나의 선만 그어서 공과 세골을. 어렵죠. 이거는 그냥 딱 하나의 선만 했을 때는 그냥 근데 직관적으로 하면 사람들은 그냥 이렇게 이렇게 메꾸면 되지 않냐 판단을 할 수도 있고 꼭 하나의 선만 그을 수 있나요? 두 개의 선을 그으면 안 되나요? 라는 생각을 할 수 있었겠죠. 근데 그 과거 60년도의 하드웨어와

10:09:38

메모이저 기술과 그래픽 이렇게 처리할 수 있는 연산 양으로는 따라갈 수가 없었어요. 그래서 50년도 60년도에 한번 싹 부저앉습니다. 그러니까 거의 폐기 처분되다시피 한 개념으로 들어갔다가 이제 하드웨어들이 본격적으로 들어가게 성장을 하면서 이제 얘를 해결할 수 있게 된 거예요. 어떻게 하면 될까요? 아까 말한 것처럼?

10:10:09

선 하나가 아니면 선 여러 개를 그어서 분류를 해보자. 그런데 이거를 다중신경망이라는 개념으로 들어가게 되겠습니다. 다중신경망은 그래도 많이 들어보실까요? 이렇게 다양하게 결정경계를 만들어서 분류를 해냐면 되지 않을까 라는 거고 이거는 나중에 한번 들어가서 시각으로 볼 수 있는 링크거든요. 한번 들어가 보시면 재미있을 겁니다. 그래서 맨 처음에

10:10:41

그래서 이러한 개념적으로 나타나다가 이제부터는 실질적으로 우리가 분류를 해낼 수 있는 방법들에 대해서 진행하겠습니다. 첫 번째는 로지스틱입니다. 이 레그레이션이라는 것들은 저번에 우리 첫 번째 시간에 많이 나왔던 단어죠. 저게 선형회기에 대해서 나타나는 겁니다. 선형회기. 얘는 어떤 거냐면 선형회기적인 방법으로 분류를 해낸 방법입니다. 어떻게 되는지 한번 볼게요.

10:11:15

그런 선용의 기준들은? 죄송합니다.

10:11:53

이 제품은 총 30개의 피처벌을 가지고 있는, 30개의 인크값이 들어가 있는 유방암 데이터입니다. 그래서 얘가 악성이냐 정상이냐를 분류해내는 굴모델인데, 우리가 선형위기에 대해서 이야기했을 때 특징 하나 해서 여러가지의 피트를 만들어서 어떤 추세에 따라서 매칭이 될 거다라는 이야기를 했었어요.

10:12:25

이런 이야기를 했었는데 얘도 비슷합니다. 특성에 대해서 만들어 준 다음에 단 하나를 근데 더 넣어줘요. 마지막에. 그러면 얘네들 내가 다양하게 피처를 넣어주고 마지막에 해주는 애가 시드모이드라는 활성화수인데 시드모이드의 역할은 뭐냐면 이런 특징을 딱 넣어주면 아 확률로써 얘를 변경시켜줘요. 그러니까 이런 데이터들을 음성일 확률 혹은 양성일 확률이 몇 퍼센트 될 것 같은데

10:12:58

라고 바꿔주는게 저 로드 스틱에 들어가 있습니다. 그래서 우리가 이런식으로 30개의 특성을 피트를 시켜주고 여기서 피트를 시켜주면 이거에 맞는 시그모이드가 아 이거에 맞는 각각의 확률값들을 이렇게 만들어 주는 겁니다. 아주 간단한 내용입니다. 그래서 저 시그모이드를 넣으면 총 30개의 데이터를 넣으면 아, 너가 양성일 확률 혹은 악성일 확률

10:13:31

0.96, 그러니까 96%가 너는 악성 즉 유방암이야라고 판단을 해주는 겁니다. 이게 그래서 최종적으로 확률로 나타난 건데 이렇게 말로 하면 좀 헷갈리잖아요. 그래서 실제 시그모이드 함수를 한번 가져가 봤습니다. 실제로 이런 형태로 분류를 해주는 겁니다. 로지스틱 분류기 같은 경우는 각각에서 시그모이드 함수는 0에서 1까지의 그러니까 이런 식의 데이터들은 범위가 엄청 넓을 수 있잖아요. 예를 들어서 -1부터 5일 수도 있고 0에서부터 100일 수도 있고 이렇게 돼 있는 이런 액을 그냥 딱 0에서 1까지의 범위를 가진 상태로 만들어주고 그 범위가 확률이 되는 겁니다. 이게 확률로써.

10:14:23

그래서 내가 특성을 딱 30개의 특성을 넣었는데 너는 지금 이런 형식으로 보니까 0.6%야, 0.0%야 이 부분이 클래스 0번이 되는 거고요 이 위쪽이 클래스 1번이 되는 거고 이렇게 하면 헷갈릴 수도 있으니 쟤들의, 이거를 먼저 말씀드려야겠다 얘는 한마디로 이진분류에요 기냐 아니냐 얘가 악성이냐, 얘가 음성이냐를 구분해내는 함수입니다.

10:14:56

그래서 0.5 미만의 확률은 클래스 0번, 그러니까 악성이라고 나타나는 거고 클래스 1번은 정상. 근데 이거는 제가 지금 정상이다, 악성이다 이렇게 말을 하기는 하는데 소프트웨어가 데이터 클래스 어떤 걸로 지정해 했냐에 따라서 달라질 수 있어요. 지금 육안 데이터 세트 보는 경우는 클래스 0을 지금 악성이라고 나누고 클래스 1을

10:15:31

정상이라고 나타낸 거예요. 그러니까 0.5% 미만이면 악성이에요 라고 나타내는 거고 그 다음에 이상이면 음성이에요 이렇게 제시를 해주는 모델입니다. 그래서 이런 형태를 통해서 실질적으로 분류를 하는데 우리가 이런 분류 중에서도 가장 중요한 것은 그 앞에 나왔었던 소정위기 모델에서도 가중치가 중요했잖아요. 얘도 마찬가지로 어떤 특징을 어떤 특성을 많이 쓰고 어떤 특성을 많이 활용하는지에 대한 가중치를 확인할 수 있습니다.

10:16:10

로지스틱을 통해가지고 확률로 만들고 확률에 대해서 이해들이 진행해줍니다.

10:16:31

이게 가장 많이 보는 결과가 있죠. 그래서 이렇게 양성과 응성을 했을 때 그냥 이런 CME 히트메토로 봤을 때 악성을 총 64개 중에서 63개의 악성을 찾아내는 것입니다. 실질적으로 정상인 분들 중에서는 107명 중에서 거의 106명까지 찾아내는 것입니다. 혹시 이거는 많이 보셨죠? 이게 거의 우리가 말하는 정확도, 재현성, 민간도를 나타내는 그냥 하나의

10:17:04

혼동이 중요하죠. 이게 제일 중요한 부분이고 앞으로 저걸로도 조금 많이 설명을 하겠습니다.

10:17:22

유망한 데이터에 대해서 이 피트 했을 때에 대한 특이도록 눈에 본 거예요. 그런데 실질적으로 얘네들은 마이너스로 나타나는 애들인데 마이너스라는 것은 어떤 의미일까요? 마이너스라는 것은?

10:17:46

우리가 일단은 클래스 이쪽이 0이고 이쪽이 1이라고 생각을 해주시면 될 것 같아요. 그래서 얘네들이 클래스 0번을 잘 찾는 애들인지, 클래스 1번 정상인 분을 잘 찾는 건지 생각해주면 아 낮은 애들은, 낮은 애들, 얘네들과 높은 확률인 애들은 아 이거 어떻게 다름이 안 되지? 지금 색깔이 약간 지금 반대로 나와서 그런 건데 이쪽이 지금 파란색이라고 생각해주면서 음성인 것들입니다. 음성. 그러면 음성인 애들은 뭐냐면 아 클래스 0과 클래스 1을 구분을 할 때 클래스 0을 더

10:18:34

많이 반영을 한다는 겁니다. 그럼 이 데이터 세트를 딱 봤을 때는 어떤 데이터 세트구나라고 알 수 있냐면 아 얘는 정상인군의 데이터보다 이 데이터 세트들은 악성을 찾아내기 위한 특성들이 많은 데이터 세트들이구나. 그럼 한마디로 이걸 훈련하는 모델들은 뭐냐면 정상인군을 막 하는 것보다 악성인의 데이터를 막 훈련하고 이 악성이랑 안 맞는 애들을 정상인이라고 딱 걸러내는 거예요.

10:19:06

이렇게 생각해주시면 돼요. 그래서 막 피팅을 해서 데이터 세트 뭐가 중요하지, 뭐가 중요하지 하는 것들도 딱 이 중요도를 보면 아, 얘가 그래도 이런 이런 특성으로 모델이 피팅이 됐구나 라는 것들을 판단할 수 있어요. 그래서 실질적으로는 정상인에 대한, 중요도에 대해서 정상인에 대한 데이터들을 물론, 어느 정도인지.

10:19:37

보면 총 30개에 대한 데이터들 중에서 양성을 우위로 두는 애들은 총 7개 정도 밖에 없었던 거고 다 음성, 악성 종양을 판단할 수 있는 중요도 그러니까 이런 애들이 커질수록 악성일 확률들이 더 높아지겠구나를 알 수 있겠죠. 이렇게 해서 데이터 세트에 대한 것들도 확인할 수 있습니다.

10:20:09

그리고 여기서도 지금 말하지만 이 부분에서 저는 가장 중요하게 생각하는 한번 글모델을 터치를 했을 때 가장 중요하게 생각하는 부분이 오즙이라는 부분입니다. 오즙이라는 것들은 지금 어떤 거냐면 그냥 간단하게 말하면 오즙이라는 것은 아까 말씀드린 것처럼 음성에 대해서 현실하는 데이터들 있잖아요. 그냥 그 데이터들이 커질 때마다

10:20:44

이 음성으로 악성으로 판단할 확률이 더 높아지는 비율을 나타내는 거거든요. 한마디로 1 올라갈 때마다 그냥 쉽게 설명하면 이 변수의 값이 1 증가할 때마다 이 악성이라고 판단할 확률이 예를 들어서 2%가 올라가고 3%가 올라가고 하는 비율인데 이거를 한번 조금 가볼게요.

10:21:19

이게 실제 오지비를 구하는 공식입니다. 오지비를 구하는 공식인데 이거는 뭐 알아부지 외우라는 것은 아니고요. 실질적으로 이런 공식에 의해서 확률이 늘어나는 것들을 실질적으로 확인할 수 있는 것들이고 그 확률이 고정되어 있지는 않아요. 왜냐하면 초기에 낮은 확률일 때랑 높은 확률일 때 초기 확률의 값에 따라서 이 변화되는 비중이 달라집니다. 공식에 의해서. 실질적으로 얘네들을 비유를 보면

10:21:53

이런 식의 값을 가져요. 우리가 실질적으로 진행을 했을 때. 그래서 실질적으로 각각의 피처금이 1 증가할 때마다 얘네들의 비율이 이렇게 늘어나는구나. 그러면 여기서 반대로 하는 것들은 그러면 내가 이 모델에서 확률을 더 높이기 위해서는 어느 정도의 환자 집단금, 평균 혹은 편차를 어느 정도까지 끌어올려야 더 높은 정확도를 꼭 더 높은 데이터 세트를 가질 수 있는 이런 뭔가를 만들 수 있겠구나를 저 OGB에서도 확인을 할 수 있어요.

10:22:36

是這種

10:22:52

보시는 것처럼 실제 얘네들의 확률 이게 기본 확률이었을 확률이었었던 확률이고 실질적으로 이제 각각의 변수를 올려줬을 때 1이 올라갔을 때 이렇게 확률 퍼센트가 올라가는 것들을 보실 수 있고 이런 논술위를 통해 가지고 아까도 말씀드린 것처럼 아 이 중요도 높은 애들만 평균을 높일지 아니면 어떤 그룹들을 만들 수 있을지 이런 것들을 판단할 수 있는 거죠 그래서 실질적으로 어 우리가 모든 데이터 데이터들을 모아서 혹은 이런 데이터들에서 한번 평균을 내잖아요 그 평균들이 실질적으로 그 이런 오즙이 기반으로 해서 아 저거 여기서 어느 정도 평균을 끌어 올릴지 낮출지 저런 변수를 보고 판단을 해주시면 될 것 같아요 그래서 뭐 규제나 소프트웨어를 만드는 사람들도 이런 구독분에서 통계약적 통약적 분류나

10:23:52

인류인구 통계학적인 이런 부분들을 이제 다 진행을 하시잖아요. 그런 것들도 봐주셔야 되는 것들 중에 하나가 이런 거고 두 번째는 그래서 데이터 세트를 그냥 피트를 하는 게 중요한 게 아니라 실제로 그 데이터가 어떤 특성을 가지고 있고 어떤 식으로 변화를 유도할 수 있는지를 알아주셔야 되는 것들도 중요한 겁니다. 그래서 데이터의 먼저 이런 결과만 보는 게 아니라 실질적으로 그 데이터들이 어떻게 관리되어야 되는 것들도 이런 역할에서 나올 수 있고요. 반대로 말하면 갑자기 데이터

10:24:31

평균을 손상시킬 수 있는, 혹은 데이터 세트의 어떤 변화 때문에 손상될 수 있다고 한 거면 저런 평균과 데이터들의 특성이 변경되겠죠. 그러면 그 순간 내 모델은 똑같아도 저 데이터가 변경됨에 따라서 평균적인 것들도 쭉 나갈 수 있다는 부분들입니다. 그래서 중요한 것은 가장 간단한 모델에서도 실질적으로 좀 다양하게 로지스틱은 좀 다양하게 맨 처음 우리가 로지스틱 회기, 선형회기를 했던 것들처럼 유사한 특성들을 가지고 있어요. 우리가 맨 처음에 말했을 때 선형회기에서도 각각의 특징에 대해서 어떤 중요도를 가지고 있는지를 좀 시각하기 편했죠. 이런 것에도 이런 식으로 시각하기 편하다.

10:25:18

근데 이런 로지스테이크 패기는

10:25:30

Okay.

10:25:43

근데 얘네 같은 경우는 아까도 말했듯이 실질적으로 선형적으로 상식의 특징을 다 가지고 와서 예를 들어서 클레이버 같은 거라고, 아 클레이버 아닌데? 약간 찹쌀, 지정토 같은 거. 그냥 지정토 같은 것처럼 내가 다양한 게 어떤 고양이를 만들고 강아지를 만들었어. 그걸 판단할 수 있는 시그모이드 단위였어. 그 시그모이드에 입력을 했을 때 얘는 고양이가 몇 퍼센트 혹은 강아지가 몇 퍼센트일 것 같아. 혹은 내가 봤을 때 얘는 고양이가 한 60 몇 퍼센트야. 강아지는 몇 퍼센트야. 했을 때 더 높은 애들을

10:26:22

그렇게 해주는 거죠. 악성인 것 같아. 악성인 확률이 70% 정상인 확률이 30% 그러면 이건 악성이네. 이렇게 판단해 줄 수 있는 어떤 활성 함수들을 가진 거고 이 KKNN 이 거리 기반에 대한 것들은 얘네들은 어떤 활성 함수나 이런 것들이 있는 게 아니라 그냥 특징과 특징의 거리를 기반으로 우리가 분류모델을 하는 겁니다. 이거를 한번 조금

10:26:54

간단하게 생각을 해볼게요. 그러면 이 생각 들지 않아요? 30개의 특성을 어떻게 거리를 재? 이 30개의 특성을 어떻게 거의 그러면 몇 차원이지? 이 높은 차원에 있는 거리를 도대체 어떻게 하는 걸까? 라는 생각을 해보실 수 있지 않나요? 어떻게 할 것 같아요? 이 30개에 대한 차원에 어떻게 거리를 해요? 3차원까지는 내가 머릿속에서는 펜션이 가능한데

10:27:35

3차원까지는 내가 계산하는데 차원이 늘어나고 늘어나면 대체 어떻게 할까? 라는 생각이 들지 않을까요?

10:27:49

그냥 간단합니다. 특성과 특성. 그 특성과 특성 하나에 대한 거리를 구하고 그 다음 특성에 대한 거리를 구하고 다음 특성에 대한 거리를 구해서 그냥 더해주고 걔네들을 다시 그거를 합산해 가지고 나타나는 것들을 그냥 거리 기반으로 이게 그래서 유클리드 방법으로 거리를 구한다고 생각하면 될 것 같고 어떤 거냐면 그냥 눈에 보이기 편하게

10:28:30

이런 식의 어떤 분류?

10:28:52

그룹들이 있겠죠. 특징마다. 그러면 여기에 있는 거리를 계산하고 이쪽에 있는 거리를 계산하고 얘에 대한 결론을 계산해서 더해주고 최종적인 최종적으로 이 정도 거리면 너는 멀 것 같아 라고 판단을 해주는게 테이드맨이라는 겁니다. 그래서 얘네들은 피팅을 해서 머신러닝을 훈련한다기보다는 들어오면 족족 그냥 계산을 해버리는 거예요. 계산 기반으로 해대는 내가 라고 생각을 해주시면 될 것 같고 실질적으로 우리가 이걸 한번 보면

10:29:41

이런 식으로 결과가 나와요. 아까보다는 조금 떨어졌죠? 왜냐하면 제일 중요한 부분, 악성을 구하는 부분, 이 부분에서가 좀 중요한 거죠. 그러면 여기서 조금 생각을 해보실 수도 있을 건데 '왜 떨어졌을까?'라는 생각을 한번 해보시겠어요? '왜 얘가 왜 떨어졌을까?' '아까보다 왜 떨어졌을까?'

10:29:32

- Thank you.

10:30:33

근데 이 KNN의 가장 큰 장점 아닌 단점은 그겁니다. 차원이 많은 특징을 쓰면 쓸수록 거리라는 개념이 약간 사라져요. 왜 사라질까요? 우리가 이 KNN은 거리를 기반으로 내가 어떤 특정 포인트를 딱 보자 넣었을 때 그 주변에 있는 애들과의 거리를 계산을 해서 이 부분은 이렇게

10:31:17

이렇게 그룹이 두 개까지 있다고 하면 딱 여기에 어떤 특징이 딱 여기에 발생했다고 쳐 봅시다.

10:31:32

그러면 얘는 도대체 어디일까를 분류해내는 게 지금 저희의 목적이잖아요. 그렇죠? 그래서 얘는 어떤 거냐면 얘네 주변에서 얘랑 거리를 계산해보고 얘랑 계산해보고 얘랑 계산해보고 여기랑 계산해보고 계산해보고 계산해봅니다. 이렇게. 이 계산되는 이 n수는 이따가 보여드릴 건데 저희가 지정을 할 수 있고요. 이렇게 계산을 했을 때 가장 근접해 있는 애들로 우리가 평균을 냈을 때 아 그래도 제일 근접해 있는

10:32:08

이 상에서 이 거리가 가장 짧으니까 얘는 추측으로 얘가 빨간색이야. 라고 이렇게 계산을 해보게 됩니다. 다음 건스를 이제 또 들어가면 이렇게 계산을 하게 됩니다. 여기서 우리가 뭘 생각되냐면 이 특정이 많아지면 많아질 수 있는 건 아까 음식에서 이 부분입니다. 어떻게 될 것 같나요? 증증이 많아지면 많아질 수 있어요. 한번 보시죠?

10:32:45

그래서 공식이 이 부분인데

10:32:52

우리가 정말로 중요도 있는 특성이면 많으면 많을수록 좋기는 하겠죠. 그런데 실질적으로 그 특성 하나하나가 생각보다 그렇게 큰 특성, 완전 가슴치가 높은 특성들은 생각보다 별로 없어요. 정말 중요한 거 아니면. 그러면 그런 것들이 쌓이고 쌓이고 쌓이다 보면 어차피 같은, 같이 증가하게 돼요. 실질적으로. 그렇게 보다 보면 다 같은 특성이 많아지면 많아지고 그 특성이 많아지니까 또 갖고 같이 증가할 거예요. 그럼 내가 이 컴퓨터가 이제 머신러닝을 계산을 했을 때 실질적으로

10:33:33

어차피 다 같이 큰 거고 어차피 이게 다 같이 뭔가 동일한 차이가 없어지는 그 순간까지 가게 된다면 얘네들이 그냥 이 정도까지 하자 맨날 하는 거 아니에요. 이 정도면 이 정도까지 하거나 혹은 잘못된 판단을 계속 하는 거죠. 예를 들어서 이제 엄청 많은 특성을 넣어가지고 거리가 완전한 0.1차이, 2차이 이런 식으로 되다 보면 얘네들도 계속 거기에서 발생하는 오차가 생긴다는 거죠. 실질적으로 특징을 많이 넣으면 많이 넣을수록 좋다는 것보다는 중요한 특징을 넣어주는 게 좋고 생각보다 그 중요한 특징을 찾는 게

10:34:14

쉽지는 않습니다. 그래서 실질적으로 얘네들이 거리 기반이 약해져서 이렇게 떨어진다고 생각을 해주시면 될 것 같아요. 그래서 실질적으로, 아, 그러니까 어떤 거냐면 이게 자, 중요 특징을 넣어서 거리를 약간 좀 차이를 탁탁탁 내는 거는 이 컴퓨터한테는 정말 중요하겠죠? 그런데 아까도 말했듯이 우리가 이 데이터에서는

10:34:49

다중치를 이런 식으로 잡히기는 했지만 컴퓨터가 얘네들을 사용할 때는 어디고 우리 선형외기 했을 때 그리고 규제 했을 때 점점 그리고 0으로 만들어놓은 피처들도 많았죠. 저희가 규제를 넣었을 때 그런 것처럼 필요 없는 애들은 안 쓰는 게 제일 베스트에요. 근데 내가 아무 의미 없는 데이터들을 넣으면서 걔네들의 거리를 벌려봤자 그 의미 없는 데이터들이 어차피 동시에 그 두 개 양성과 음성을 분류해야 되는 그 두 개로 같이 들어가게 되는 거잖아요. 그러면 컴퓨터 입장에서는

10:35:27

혼란이 올 수밖에 없는 거죠. 의미 없는 데이터들로 거래를 벌려봤자 의미 없는 데이터가 양쪽에서 두 개 들어가게 된다면 한마디로 평균값만 똑같게 만드는 거밖에 안 된다는 거죠. 말이 약간 계속 새서 그러는데 한마디로 쓸모없는 데이터들로 훈련을 시켜서 딱! 킹업! 이걸 어떻게 설명해야 할까요?

10:36:03

뭔가 차이, 예를 들어서 큰 차이가 나 있는 걸로 이렇게 거리를 재서 우리가 훈련을 한다고 합시다. 여기서 '너는 양성이야, 음성이야' 거리를 기반으로 판단을 했어요. 근데 유니콘은 그냥 동시, 양성과 음성을 동시에 해석할 수 있는 데이터들이 막 들어간다고 했을 때는 내 컴퓨터 입장에서는 이런 특성들로 훈련을 받았으니까 양성과 음성이 동시 두 개 다 가지고 있는 특성들을 딱 보고 판단을 했을 때

10:36:40

판단을 하기가 어렵다는 거죠. 악성인지, 응성인지. 왜냐면 악성도, 정상도, 암도, 정상도 그 특성을 다 가지고 있습니다. 그래서 의미 없이 차원만 딱 늘린다고 중요한 게 아니라 가장 큰 차이를 난 피처들로 구성을 하는 게 제일 좋다는 게 일단은 KM의 특징이었습니다. 그래서 실질적으로 이런 식으로 구분이 되고

10:37:12

아까도 말한 것처럼 그래서 K&A 훈련을 할 때는 얘네들의 개수도 어떻게 정해주는지가 중요해요. 그게 우리가 K라는 부분에서 이 모델, 유광한 모델에서는 총 12개의 피처를 계산을, 아 피처가 아니라 주변에 12개까지에 대한 거리를 계산을 해가지고 그 거리에서 분류해 놓는게 가장 좋게 나오더라 하고 그렇게 나오는 피처들이 이런 식으로 분류됩니다.

10:37:45

실질적으로 결정경계들이 이런 식으로 다행이다.

10:38:00

그래도 이렇게 쓸 때 K나 어떤 파라미터들을 맞춰주니까 그래도 조금은 몰랐더라. 근데 여전히도 많은 픽처를 사용하기 때문에 거리기반에서 가질 수 있는 한계를 보여주고 있다.

10:38:22

그러면 아까도 말했듯이 그러면 이 많은 피처를 어떻게 쓰는 게 제일 좋을까요? 어떻게 쓰는 게 제일 현명할까요? 라고 생각을 해주실 수도 있죠. 여기서 나타나는 게 이제 주성분 분석이라는 분석을 사용을 합니다. 주성분 분석. 이 분석에 대한 연결을 한번 볼까요?