새 노트

Shared on April 29, 2026

03:37:00

있는 관계성이 랜덤하게 생성된 확률입니다. 내가 여기 가사를 쓴다는 것은 x 변수와 y 변수 간의 시스템에 대한 체계적인 관계성이 있다는 것을 기대하는 것인데 반대의 의미로써 랜덤하게 무작위로 우연하게 형성된 관계성 1관계를 보여주는 것입니다.

03:37:33

또는 이걸 좀 통계적으로 달리 표현으로 우리 지난 시간에 그 샘플과 파퓨레이션의 관계를 배웠습니다. 파퓨레이션의 서브샘플이 바로 샘플이었습니다. 그런데 그 샘플에서 목격되고 있는 바가 파퓨레이션에서는 존재하지 않을 관계 이라는 거예요. 그러니까 쉽게 말하면 연가설에 관한 내용들을 언급하고 있는 거예요.

03:38:08

내가 보고 싶은 건 연구가설 또는 대안가설인데 여기에는 관계가 있다 를 넘어서서 연구 방향으로 관계가 있는지 즉 x가 높아질수록 y가 높아진다 또는 음의 방향으로 관계가 있는지 x가 높아질수록 y가 낮아진다 관계가 있는 것뿐만 아니라 그 direction에 대해서도 언급이 포함이 될 겁니다. 여러분들이 그러셨듯이 과제에서 그게 연구가설인데 그것에 반대되는 게 일만 사실 연구가설입니다. 그리고 제가 앞서 통계적인 사고방식은

03:38:42

영가설을 기각함으로써 영구가설 또는 대안가설에 대한 지지를 찾고자 한다는 건데 영가설을 바로 기각하기 위한 도구가 바로 P-Value인 거예요. 그래서 이 P-Value가 의미하는 바가 내가 관찰하고 있는 그 관계성이 시스테메틱하지 않고 랜덤하게 무작위로 우연하게 발생된 것인지 또는 내가 샘플을 통해서 밝힌 그 관계성이 모집나 포퓸 레이션에서는 존재하지 않는 건 아니지 을 판단하는

03:39:14

피밸류다 라고 설명이 되고 있습니다. 이따가 곧 예시를 통해서 찾아보도록 하겠습니다. 피밸류는 보통 이제 이런 식으로 확률이기 때문에 0에서 1의 값을 가집니다. 피밸류가 0.03이 얼핏 나올 수도 있고요. 통계 소프트웨어를 돌리면 자동으로 계산이 됩니다. 보통은 95% 신뢰 수준에서 우리가 통계적으로 유익이 하다 하지 않다라고 판단을 하기 때문에 0.05 맞죠? 0.05

03:39:46

하나의 기준점으로 삼습니다. 그래서 지금부터 제가 말씀드릴 표현이 완전히 정확한 건 아닌데 이런 식으로 그냥 이해를 하시면 꽤 용이할 거예요. 다시 말해 통계적으로는 우리 가설이 두 개가 있다고 보죠. 연구가설 또는 대한가설 그리고 연가설 근데 연구가설에 대한 경험적인 증거를 잡기보다 우리는 통계 분석을 했더니

03:40:20

영가설이 기각될 수 없음이 확인되었으므로 영구가설이 맞을 것이다 라는 식의 논리를 구축해요. 통계적으로. 그래서 핵심은 영가설을 기각할 수 있냐 없냐인 건데 이 피벨류는 여러분들 직관적으로 이해하기 위해서는 이 피벨류는 어쩌면 영가설이 맞을 확률이라고 이해하시면 좀 더 용이할 수도 있습니다. 그런데 이 표현이 사실 통계적으로 옳은 표현이 아니지만 여러분들이 이해를 하기 위해서는

03:40:54

이게 도움이 될 수 있는 표현이 같습니다. 그래서 만약에 0.05 보다 작으면 영과서를 맞을 확률이 0.05 미만인 거니까 95% 신뢰 수준에서 우리는 나의 영과설도를 대한 마서를 지지할 수 있구나라고 쉽게 판단을 할 수도 있다는 말씀입니다. 이해가 좀 됩니까? 그래서 이 0.03이도 저게 뭐지? 그냥 직관적으로는 그냥

03:41:28

영가설이 맞을 확률이 0.03이구나. 3.2%구나. 그러면 0.05.5%보다 낮으니까 영가설을 기각할 수 있네. 영가설이 기각된다는 말은 나의 영부가설이 지지될 수 있구나라고 결론을 내릴 수 있게 되는 거죠. 우리 수준은 우리 학부 수준에서는 그런 식으로 이해를 하는 것이 더 직관적일 것 같아요. 맨 밑에 나와 있는 표현은 앞서 얘기했던 말 그대로입니다. 피밸류도 하나의 통계적인 요인이었어. 즉, 스타트업이.

03:42:03

이 statistical significance를 보여주는 하나의 지표일 뿐이기 때문에 substantive significance를 보여주지는 못합니다. 따라서 substantive significance를 보여줄 수 있는 이 sample statistics, 통계치를 반드시 함께 보고해야 한다라는 얘기를 맨 밑에 제시를 하고 있습니다. 여기 이제 똑같은 얘기가 넘었는데, 피베리도가...

03:42:37

피베류가 0.05 또는 뭐 .05라고 하니까 .05보다 이제 낮으면 그 값이 낮으면 그러면은 우리가 지금 보고 있는 그 관계성이 존재하지 않거나 또는 랜덤하다 라고 우리가 보여집니다. 다시 말해서 피베류가 낮으면 영가설을 기각할 수 있구나. 영가설을 기각할 수 있구나. 영가설이 기합된다는 말은 영가설이 아닌 가설입니다.

03:43:08

나의 연구가설 또는 대한가설이 지지받을 수 있구나라고 결론을 내릴 수 있다는 겁니다. 좀 이제 심플하게 제가 표현을 해드리고요. 따라서 피벨리는 나를수록 좋아요. 나를수록 내가 보이고자 하는 바, 나의 연구가설, 대한가설에 대한 경험적 지지가 생기는 거니까 피벨리는 나를수록 좋습니다. 그래서 연구할 때 여러분들 중에

03:43:42

R 써보신 분들도 계실 거고 저는 R은 잘은 안 쓰고 써야 할 때 쓰지만 잘은 안 쓰고 저는 그냥 시대이라로 하는데 R이든 시대이라를 같이 쓰게 되면 코드를 다 쓰고 엔터를 치잖아요. 행위보석이 막 돌아갑니다. 자동으로 다 돌아갑니다. 내가 관심 가지는 그 변수의 핏값만 계속 보고 있는 거예요. 내가 언제 0.0으로 떨어지고 0.5 밑으로 떨어지나 그 기대를 갖고 보는 거예요. 그러니까 제가 말씀드린 이유는 뭐냐면

03:44:14

연구자들도 그 P값이 0.0보다 낮기를 바라는 마음으로 그것만 바라보면서 통계 분석을 돌리는 경향이 있는데 심플하게 얘기하면 P값이 0.0보다 낮으면 나의 주장이 경험적으로 지시되는구나 라고 직관적으로 해석할 수 있는 통계 결과를 획득한 셈입니다. 그러니까 P값의 용도는 딱 그거든요.

03:44:45

하나입니다. 그러다 보니까 아 바로 여기 나오네요. 핏값의 용도가 통계적으로 유의미하다 안하다. 특히 영가설이 통계적으로 유의미하다 안하다. 이모로 반대로 뒤집어서 영가설이 기락되었으므로 나의 영구가설이 지지받는 거겠죠. 딱 그 영도 하나이기 때문에 한계가 많습니다. 첫 번째 한계는 우리는 이론적인 거를 논의할 때

03:45:19

인과서부티, 인과적 관계를 위한 4가지 코드에 대해서도 학습을 한다고 하십니다. 우리 사회각에서는 항상 그 인과성, 인과성에 대해서 꽤 많은 신경을 씁니다만 피베류가 0.15보다 낮음으로써 연과서를 기각했다. 따라서 나의 연과서를 경험적으로 지지할 수 있다는 사실이 곧 인과관계를 얘기해주시면 안 있습니다. 그래서 여러분들 그런 표현 들어봤는지 모르겠어요.

03:45:52

Garbage in, garbage out. The first thing is that you can see the results of the software and the results of the results. The results of the visualization is fancy. You can see it in the beginning, but the data itself is garbage.

03:46:24

이는 뭐예요? 통계 소프트웨어는 바보라는 거예요. 통계 소프트웨어는 정말 바보니까. 연구자가 투입한 대로 그냥 되는 기계이기 때문에 돌아갈 수밖에 없어요. 그런데 이게 정말로 나의 연구에 필요한 estimation입니다. 정말로 나의 연구에 필요한 specification이니까. 즉, 모델을 여러분들께서 직접 결정을 해야 되거든요. 나의 상황상마다 데이터 가지고 있는 한계를 고려해서 모델을 결정해야 되거든요. 이건 업데이트 수준이니까 그냥.

03:46:57

이런 것만 제가 묶하였습니다. 연구자가 직접 데이터를 코바지하고 연구자가 직접 그 데이터를 분석하기 위한 적절한 통계 분석 방법을 선택해서 코드를 짜야 하고 그 코드를 짰다고 하더라도 다음에 우리 후간에 배울 수 있겠습니다만 일반적으로 OLS라고 하는 대표적인 회계 분석도 가정이 깨지면 우리가 좀 더 어딘가 할 수 있는 러리아의 스페시피케이션, 분석 방법을 사용해야 하는데 그런 것들 다 순자리 연구자의 목숨입니다. 통계 소프트웨어는

03:47:31

틀린 코드를 넣어도 그에 따라서 결과를 보여줄 뿐이에요. P-Value도 똑같습니다. P-Value도 그러한 통계 소프트웨어가 보고하는 하나의 수치일 뿐이기 때문에 그것에 너무 큰 의존을 낼 필요가 없어요. 이러한 얘기는 또 무엇과 연결이 되냐면 제가 그 학기 초부터 강조를 했던 그리고 여러분들보다 대학원생들에게 항상

03:48:05

너무 많이 강조하는 게 그런 게 있어요. 대학원 가면, 와, 어디서 보이는 거예요? 통계 분석하고, 그림 띄우고 하는 게 멋있어 보여지는 거예요. 통계에 매몰이 되는 애들이었어요. 그러니까 연구는 통계로 하는 게 아니라 연구를 이론으로 승부를 하는 거예요. 지금까지 많은 사람들, 지금까지 기존의 학자들이 보여주지 못했던 새로운 관점, 새로운 시각으로 어떤 정치적, 사회적, 경제적 현상을

03:48:37

밝혀낼 수 있어야 하는데 그게 바로 연구자의 책임인 거죠. 그런데 그러한 책임은 이론적인 사고, 이론적인 기어가 얼마나 퀄리티가 있는지에 따라서 판단되는 것이지 얼마나 데이터 분석을 잘했냐, 얼마나 비주얼리지이션을 예쁘게 했냐는 과감하게 얘기하면 전혀 쓸모가 없어요. 이론적으로 빅 컨트리뷰션이라면 정말 심플한 그림을 하나 보여주고 끝일 수도 있습니다.

03:49:10

그런데 이제 이론적인 것들은 아무래도 줄글로 막 설명이 되다 보니까 멋이 없어 보이죠. 그래서 원생들이 특히 이제 주니어레벨의 원생들이 좀 더 예쁜 그림을 뽑기 위해서 좀 더 있어 보이는 통계 분석을 하기 위해서 공을 들이는 경우가 있는데 네 그건 사실 틀린 접근입니다. 이 얘기가 바로 그룹과 관련이 됩니다. 피밀류가 아무리 낮아서 피밀류가 낮아서 연가설을 비각할 수 있고 나의 대학가설에 대한 강력한 지지를

03:49:44

찾는다 할지라도 나의 이론적 주장은 언제나 커서 인과적인 관계성을 설명하고 있는데 P-value 값이 어떻다 하는 것 그 이유 하나만으로 나의 인과적인 이론적 주장이 지지되었다라고 판단할 수는 절대 없습니다. 그 말씀은 못 드리겠고 마찬가지로 밑에. 밑에니까 바로 이거죠. 통계적으로 유의미한 건 아니냐를 판단해 줄 수 있는 P-value 1뿐입니다.

03:50:16

이게 얼마나 중요한지, 건강 상태가 얼마나 중요한지는 피부회료가 보여주지 못하고요. coefficients, 회귀 개수가 보여줄 겁니다. 그 회귀 개수가 뭔지는 이따가 나올 텐데 앞서 말씀드렸다시피 X의 한 단위 증가에 따른 종속변수의 한 단위 증가 또는 감소, 폭. 만약에 X가 열 단위나 증가했는데 0.061%밖에 증가하지 못한다.

03:50:49

별로 우리가 관심을 가질 필요가 없는 변수라는 거죠. 그런데 그럼에도 불구하고 피별율은 0.05보다 낮을 겁니다. 따라서 통계적으로 유의미하다는 사실이 곧 그 변수가 중요하다는 것을 의미하는 것은 아닙니다. 통계적으로 유의미할 뿐만 아니라 substantive significance, 실질적 유의미성 역시, 다시 말해, 이 텍스와의 효과의 크기 역시 사회연구에 비추어 보험된 의미가 있는 수준이어야 그 변수가 중요하다고 말할 수 있습니다.

03:51:23

그래서 하나만 더 언급을 드리면 제가 언젠가 한번 말씀을 드린 적이 있는 것 같은데 통계적으로 유의미하지는 않은데 0.05가 기준점이라고 했잖아요. 그런데 예를 들면 0.05이 막 이랬어요. 그래서 아! 아쉽게 기각을 시키지 못했어요. 그런데 Substantive Significance. Effect Size가 꽤 커요. 꽤 큰데 0.05라고 하는 Threshold에 근접한 힘이 되었어요.

03:51:58

P-value를 가지고 있는 변수는 오히려 그 변수에 더 주목할 필요가 있습니다. 왜냐하면, 여러분들 P-value는 이 얘기는 좀 복잡할 수도 있겠지만 그냥 들어만 주세요. P-value는 핵이 분석을 했을 때 스탠더드 에러가 있고요. 에러와 coefficient 간에 coefficient을 에러로 나눴을 때의 그 값이에요. 그게 T 값이고 T 값에 따른 P-value가 계산이 되는 거거든요.

03:52:34

그 말은 심플하게 얘기하면 P-value를 결정하는 두 요소가 있는데 하나가 Coefficient 즉 Substantive Significance에 관한 정보고 또 하나는 에러예요. 표준업체. 그런데 그 에러가 여러분들 이제 기억하셔야 되는데 그 에러가 어떤 값에 따라 커질 수도 있고 작아질 수도 있어요. 가장 대표적으로는 뭘까요? 혹시...

03:53:08

보시면 기억할 것 같아요

03:53:26

여러분 표현 기억나요? 여러분 표현 기억납니까? 네. 표준 편차가 작아야 되고, n이 커야 돼요. n이 뭡니까? 그렇죠. 샘플 사이즈에요. 샘플 사이즈가 커지면 커질수록 에러가 줄어들고요. 에러가 줄어들면 그것이 핏값에서 영향을 미쳐요. 따라서, Substantive Distance가 꽤 주목할 만한 수치인데,

03:53:57

0.052 정도로 아슬아슬하게 얘가 Threshold를 넘지 못했어. 에이 통계적으로 유의미하지 않는데 버려야지. 버리시면 절대 안되고요. 오히려 샘플 사이즈를 더 늘려서라도 한 번 더 검증할 필요가 있어요. 샘플 사이즈가 늘어나면 P-Value는 그 Threshold 미만으로 떨어지게 될 겁니다. 근데 Substantive Screams은 쉽게 바뀌지 않습니다. 이해가 돼요? 그렇기 때문에 오히려

03:54:29

Statistical Screenfulness 보다 우리는 substantive screenfulness에 더 초점을 두고 해기분석 결과를 다시 바라봐야 한다는 것을 미리 말씀을 드리겠습니다. 그렇고, 이제 밑에 거는, 맨 밑에 거 먼저 갈게요. 그 얘기가 바로 이거예요. 비밀유는 substantive screenfulness를 보여주지는 않는다는 얘기를 하고 있고, 그리고 우리 그 어...

03:55:00

분석 과정에서의 그 오차, 에러는 또한 예를 들어 어떤 변수를 측정했는데 그 측정 자체가 신뢰성을 담보하지 못하거나 타당성을 담보하지 못함에 따라 왜곡된 결과를 초래할 수도 있을 겁니다. 그죠? 또는 측정 지표는 신뢰할 만하고 타당한데 샘플이 편향되어 있다. 대한민국 국권자의 편향이 있다.

03:55:34

북한 정부에 대한 지지도를 보고 싶은데 내가 귀찮아서 외대생들에게만 1500명 샘플을 해버리면 왜곡되겠죠. 연령 왜곡, 환경 수준 왜곡, 거주지 왜곡. 그렇죠? 그렇기 때문에 샘플이 어떠한지, 샘플이 대표성을 가지는지, 또는 측정이 타당한지 또는 신뢰할 만한지, 즉 측정의 퀄리티와 관련해서도 핏값 또는 스탠디스컬, 스틱디스컬, 스틱디스컬은 전혀 아무 말도 해주지 않습니다.

03:56:07

따라서 Statistic plus Script Consul 하나 만 보고 결정을 내려가 안되고요. 그것보다 첫 번째는 Substantive Screens를 봐야 한다. 두 번째는 이것보다 당연히 더 악성 순서이긴 하겠지만 내가 가지고 있는 샘플이 파표데이션을 대표할 만한 샘플인지 그리고 내가 가지고 있는 측정 지표들이 신뢰할 만하고 타당한지에 대해서 먼저 사회에 도울 필요가 있다는

03:56:39

It can be connected to the world. That's the idea.

03:56:49

이 논문을 읽어보는 경제의 핵심은 이거예요. 통계적으로 의미하다는 사실이 곧 실질적인 의미성 또는 실질적인 중요성을 반부해주지는 않는다 라는 것을 얘기하고 있습니다. 밑에 나오는 것은 그냥 예시인데요. 예를 들어 남성과 여성들 사이에 대통령에 대한 지지가

03:57:25

차이가 있다고 통계적으로 유인계 수준에서 확인이 되었을지라도 그 차이가 0.0 얼마 정도, 여기 같은 경우는 얼마죠? 0.7인가요? 0.7 정도로 굉장히 미미하다면 인간 사실 선별에 따른 지지율의 차이가 존재한다라고 그렇게 큰 중요성을 부여하지는 못한다라는 지금 세계적으로 미미는 했죠. 그 얘기 똑같은 얘기를 하고 있었나봐요. 오늘 두 번째 포인트를 더 할 수 있는 건가요?

03:58:02

자 이제 드디어 나옵니다. 그러면 통계적으로 유입이 하다라는게 중요한 정보일 수도 있겠지만 언제나 중요한 것은 아니다. 왜냐? 통계적으로 유입이해도 실질적으로 유입이 하지 않을 수 있으니까 이라고 말씀드렸어요. 그러면 이 실질적으로 유입이 하고 말고는 우리가 어떻게 판단할 수 있을까? 바로 이펙트 사이즈입니다. 이펙트 사이즈. 근데 이펙트 사이즈라고 하면 여러분들 직관적으로 이해가 되죠?

03:58:39

X의 Y에 대한 효과가 얼마나 큰지 그걸 살펴보면 됩니다. 그런데 얼마나 큰지를 어떻게 판단할 수 있냐면 제가 하나 말씀드린 것은 선행 용보들에 근거해야 된다는 거고요. 여기서 슬라이드를 좀 더 자세하게 설명이 되고 있는 바로 이 표현인데

03:59:11

뭐냐면 경제성장이 democracy에 붙이는 영향이라고 할게요. 경제성장이 democracy에 붙이게 됩니다. 그런데 경제가 한 달이 증가함에 따라 democracy가 얼마만큼 증가하는지를 보통 회기분석이 보여줍니다.

03:59:47

이 서비스 컨셉을 얘기할 때 이런 생각을 반드시 해야 해요. 해결해서 했는데, 이 카노믹 브러스트가 2라고 하는 이펙트 사이즈를 갖고 있네요. 그런데 이 2라고 하는 이펙트 사이즈가 얼마만큼 큰지는 종속 변수가 어떻게 측정되어 있느냐에 따라 달라요. 여러분 중에 그 Freedom House 인덱스가 몇 점부터 몇 점까지 있는지 아세요?

04:00:23

It's usually 1.7.1. The 1 is the most democratic, or Mr. Democracy. But it's a counter-coding. The 1 is the most democratic and the 7 is the most democratic, and the 7 is the most democratic. The economic growth is the most democratic and the 8 is the most democratic.

04:00:56

성장시킬 수 있다면 1에서 7점의 스코어에서 2를 점핑시키는 것은 꽤 큰 폭입니다. 그런데 학자들은 이것저것 지표를 보아서 어떤 학자들은 민주주의를 0에서 100점으로 측정하기도 해요. 그럼 만약에 1에서 7의 스케일에서 2만큼 증가하는 것과 0에서 100 스케일에서 2만큼 증가하는 것이 다르다는 것은?

04:01:29

여러분들을 직관적으로 이해할 수 있죠. 따라서 단순히 경제성장의 substantive significance, 즉 effect size가 이구나 하고 그치지 말고요. 그 이가 종속변수에서 얼마만큼의 증가폭을 의미하고 있는지, 다시 말해 종속변수의 measurement scale에 대해서 반드시 확인하실 필요가 있습니다. 이 이는 엄청난

04:02:01

상승일 수도 있고 소위 말해 별거 아닌 증가폭일 수도 있습니다. 종속변수의 스케일에 따라서. 이해가 되죠? 지금 그 이야기를 하는 게 바로 이 부분입니다. 근데 이거는 사실 분석 다 끝나고 여러분들께서 확인을 한 번 더 하는 거지 그때 처음 확인하고 있으면 안 된 거예요. 보통 후기 분석하기 전에는 우리 그때 그거 배웠죠. 센터의 텐데요.

04:02:34

평균, 그리고 미디언, 중앙값, 또는 7백, 10배였고, 뿐만 아니라 레인즈로 확인을 해야 되고요. 레인즈로. 몇 점이 미니멈이고 몇 점이 넥스멈인지 확인해야 되고, 그리고 외도, 첨도까지 수치를 확인할 필요는 없겠습니다만, 그 분포는 한번 그려볼 만해요. 히스토그램이나 뭐든. 사실 그러한 이유 때문에 우리가 2주 전에, 3주 전에, 그 하나의 변수가 어떻게 생겨먹었는지 어떤 비주얼 디지에이션을 활용해서

04:03:09

보일 수 있는지를 사실 학습하는 겁니다. 내가 분석에서 사용할 변수들, 즉 나의 주된 관심사의 변수들이 어떤 분포를 갖고 있고, 어떤 최소값과 최대값을 갖고 있으며 어떤 central tendency를 갖고 있는지에 대해 기본적으로 이해한 채 통계 분석에 들어가야 한다는 의미입니다. 그래야 궁극적으로는 이 Substantive Disciplines에 대해 판단을 할 수 있게 됩니다.

04:03:40

이해가 되세요? 그게 큰 얘기입니다. 이제 밑에 얘기도 나오는 거는 우리가 이 Substantive Sinaitic Homes로서의 이펙트 사이즈는 어떻게 표현하는지에 대한 건데 Marger Effect나 한계효과라고 하고요. 또는 Predictive Parability, 예측 확률이라고도 하는데 제가 여기서 2라고 했던 것 또는 건강 얘기할 때 0.001이라고 합니다. 그렇게 표현되는 서운한 방식이라고 일단 이해를 하시면 될 것 같습니다.

04:04:18

뭐 그렇게 설명하면 심플한가? 그런 거죠. 투표 참여 같은 경우는 확률로써 표현이 되겠죠. 투표 참여했다 안했다 조금 어려운 표현이 나올 수도 있겠습니다. 했다 안 했다를 분석할 때는 로즌 모델을 쓰는데 로즌 모델은 확률로 계산이 되기도 하고요. 네, 그런 식으로 확률의 단위에 의해서 실질적 유의미성이 표현되는 경우도 있습니다.

04:04:54

이 예시 같은 경우는 민주주의를 굳이 우리가 확률로 변환할 필요 없이 민주주의 값이 1에서 7의 스코어를 갔냐 또는 0에서 100의 스코어를 갔냐만 알고 있으면 2라고 하는 이펙트 사이즈가 어느 정도의 중요성에 대해서 우리가 쉽게 판단할 수 있죠. 그런 얘기를 하고 있는 겁니다. 그래서 정리를 좀 하고 여기까지 이 슬라이드까지만 하고 쉬고 그 뒤에 슬라이드 이어서 들어가겠습니다. 굳이 이렇게 나눠 놓긴 했어요.

04:05:27

가설 테스트 그리고 통계적 유인기성 테스트라고 하는데 먼저 통계적 유인기성 테스트를 보면 뭐 앞서 얘기했던 바와 같이 95% 신뢰 수준으로 표현될 수도 있고 또는 그 디그리어 프리덤 자유도와 크림 오바륨 인계각 세트 펑션으로 표현될 수도 있고요 또는 피 밸리로도 표현될 수가 있습니다. 칼스케어는 이따가 뒤에 나올 거예요.

04:05:59

아무튼 통계적으로 유의미하냐 안하냐 마지막에 영가서를 계약할 수 있냐 못하냐는 이러한 두 가지 지표를 통해서 쉽게 판단을 할 수 있습니다. 그런데 영가서를 계약해서 통계적으로 유의미하다라고 판단을 했다는 그 사실이 실질적 유의미성을 보전하지는 않는다라는 거예요. 그 실질적 유의미성을 확인하기 위해서는 예를 들어 디스크립티브 아날로우스,

04:06:32

기술적인 변수가 어떤 패턴으로 관계를 가지는지. 뒤에 슬라이드에서 나오겠지만 이런 것들이요. 두 가지 이렇게 바이배렛하게 표를 보일 수도 있고요. 이런 식으로 보일 수도 있고 또는 나중에 회기분석. 다음 주에만 보여드릴 것 같은데 회기분석에서는 실제 회기 개수값이 표현됩니다. 따라서 여기서 말하는 바는 통계적 유의미성 그 자체에 접착하지 말고 실질적 유의미성을 보여줄 수 있는

04:07:06

통계치에 우리가 한 번 더 집중할 필요가 있다. 따라서 이것을 토대로 이게 중요한 변수인지 아닌지 이 2라고 하는 값이 통계적으로 유의미한데 1에서 7 사이 값에서 2가 증가하는 건지 0에서 100 사이 값에서 2가 증가하는 건지 확인할 필요가 있다는 의미입니다. 대학적인 큰 그림은 이해가 되세요? 여러분들 다시 말씀드리지만

04:07:39

통계적인 것들에 대한 어떤 통계학적인 디테일한 것들에 너무 집착하지 마시고요. 우리는 통계학자가 안 얘기이기 때문에 그렇습니다. 통계학과가 아니라 우리는 정치학과이기 때문에 통계를 사용해서 정치적인 현상을 어떻게 이해하는지에 초점을 두고 있습니다. 지금 하나하나 분란을 쌓고 있고 나중에 회기분석에서 그리고 그 회기분석에 관한 그 결과표를 또는 피규어를 해석하는 데 있어서 우리가 어떻게 정확하게 이해를 할 수 있고 또는 기존의 분석이 가지고 있는 한계를 짚어낼 수 있는지

04:08:13

그러한 역량을 길러내기 위한 목적이니까 큰 틀에서의 스토리들을 이해하시면 그게 더 도움이 될 것 같습니다. 아무튼 여기까지 하고 지금 8분이니까요. 15분시면 23분까지.

04:26:05

우리가 크로스 단어는 교차표입니다. 여기 나와 있듯이 연속형에서는 무슨 요새가 되죠. 이렇게 생겨본 교차표, 태블럴 알라우스 단어. 이런 경우에 연속형을 어떻게 구분을 해가지고 하나의 표 내 위에 서로 다른 셀의 숙지를 입력하면 쉽지가 않습니다. 감사합니다.

04:26:38

이 두 분의 변수와의 관계가 어떠할지 보여주는 하나의 틀로서 이해할 수 있겠습니다. 보통은 좀 헷갈리긴 하는데 보통은 종속 변수가 이쪽입니다.

04:27:11

and the money. I'm confused about it. When we go to the X-Chuk, the Y-Chuk is on the left side. We will talk about the fact that we have to be concerned about the X-Chuk, the Y-Chuk, and the Y-Chuk.

04:27:45

Legging and whitey down. And, Chomsopdonsononon. Spring-Chorter down. Shoe-nay.

04:28:04

세균값으로서의 각각의 종합분수, 값이 어느 정도 높은 금액이 있는지 보여주는 거라고 할 수 있겠고요. 그런데 우리가 사실 주된 목적은 이 두 가지죠. 이 두 가지 가면.