alt

새 노트

Shared on May 22, 2026

06:32:21

정체에서 아주 대해선 정체에

06:32:32

대상관에서 광교중앙역까지 가는 버스 노선이나 학생들이 걸어가는 길이나 이런 것들을 정비하지 않은 아이디어를 우리가 가진 것 같아요. 그러면 현재 학생들이 어떻게 생각하고 있는지 정말 편한지 불편한지 이런 것들을 알아야 되겠죠. 어떤 데이터들을 모으면 될까? 전화한지 한번 생각해볼래? 어떤 데이터들을 모으면 될까?

06:33:07

또 뒤에 다 볼 것 같아. 이거 왔습니다. 왜 이렇게 나와?

06:34:06

이런거 할 수도 있죠. 발전투자국한테 모든게 전부 다 물어볼 수도 있고 몇명한테 물어볼 수도 있을거에요. 그쵸? 자 그 다음에 그런거만 있는게 아니에요. 아이디어라고 생각해보세요. 아이디어를 내야됩니다. 이런 질문할 때마다 여러분들 생각을 해야해요. 생각을 어떤 디지털을 우리가 볼 수 있을까 어떤 디지털을 볼 수 있을까요? 자 그러면은 자 그러면 가는 경우는

06:33:32

-먹어먹었네. -먹어먹었네.

06:33:45

감사합니다.

06:34:40

근데부터 생각하지 않을게요. 이게 가능하다. 실제로는 이런 데이터를 구하는 것이 불가능하다. 이런 것을 전부 다 배제하고 모든 것이 다 가능하다고 가정하고 질문을 다시 한번 던져볼게요. 어떤 데이터를 우리가 습득하면 지금 학생들이 광교 중앙정까지 가는 최적의 루트 이런 것들을 찾아가지고 길을 만들어준다든가 이런 걸 할 수 있을까요?

06:35:14

걸리는 시간을 어떻게 측정할 수 있을까? 다 가능하다 했으니까 긴장됐지만 토를 내서 알려달라 토를 내서 알려달라? 좋아요. 이런 데이터도 가능하고 좀 더 쉽게 하려면 어플 같은 걸 만들어가지고 출발할 때 누르고 도착할 때 누르고 하는 그런 어플을 임시적으로 만들어가지고 데이터를 모을 수도 있고 혹은 몸에다가

06:35:47

태그를 붙이는 거야. 학생들한테. 그래가지고 실제로 걸어갈 루트 같은 거를 트랙해보는 거예요. 이렇게 돼있던 거 모으기로. 정말 세상에 데이터를 모을 수 있는 방법은 무능무진합니다. 여기서 어떤 방식으로 어떤 방법을 어떻게 모았을 때 정말 최적의 의사결정을 할 수 있느냐 기능을 설계하는 능력이 필요합니다. 이게 바로 갭데이터 분석에 역력이에요.

06:36:21

데이터 분석의 영역입니다. 데이터 분석은요. 정말 중요한 것은 뭐냐면 데이터 분석의 가장 중요한 것. 디자인입니다. 왜냐하면 세상에 데이터는 너무나 많아요. 지금 이 시간에도 정말 맑은데이터들이 쏟아져 나오고 있고 계속 생성되고 있어요. 그런데 그 데이터를 우리가 다 가져다가 쓰거나 새롭게 다 수집하거나 이러면

06:36:53

말도 안 되게 오래 시간이 걸리고 빠져드는 기용이 들고 아예 불가능해요. 그건 분석한다는 자체가 그리고 발표 조회사도 잘 얘기해 줬지만 이거를 다 분석하고 나면 너무 시간이 많이 걸려요. 그러면 이미 아웃데이트 된 상황이 되는 경우도 있어요. 분석하는 거 한다고 걸려봐야 해요. 그러면 의미 없는 경우가 이 실제 기업 상황에는 많이 기억이 나요. 그렇죠? 그러니까

06:37:24

결국은 그 정말 다양한 방법 중에서 우리가 원하는 목표 즉 학생이 가장 만족스럽게 안전하게 빠르게 편하고 쉽게 광교중앙역까지 가는 그 방법을 알아내기 위해서 어떤 데이터를 모을 것인가를 설계하는 것. 그것이 중요한 이야기에요. 그래서 빈 데이터라고 하는 것은 결국 모르는 것입니다.

06:37:57

뭘로 한다? 이 머리를 하는 거예요. 사람이 하는 거란 뜻입니다. 자 빅데이터 분석 같은 거 다 AI가 대체한다? 분석은 대체할 거예요. 분석 자체는. 그렇기 때문에 분석 방법이라든가 이게 중요한 게 아니라 디자인하는 것이 중요하다는 거예요. 무슨 얘기인지 알겠죠? 저의 이야기의 취지를 알겠죠? 그렇죠? 그래서 제가 이거 되게 중요하게 생각하는 거예요. 이 빅데이터 하는 쪽을. 자 그러면 잘 발표를 해주었지만 빅데이터라는 것이 전체 뭐냐? 정의.

06:38:34

정의를 먼저 알아야 되죠? 그렇죠? 빅데이터 빅이 뭐예요? 크다는 얘기잖아요? 데이터? 데이터예요 어떤 거예요? 우와~ 진짜 큰 데이터 빅데이터예요 첫 번째 정의입니다 두 번째 정의 전체 데이터를 말합니다 그게 무슨 얘기냐 예를 들어서 예를 들어서 투표라고 하는 걸 한다고 했을 때

06:39:06

요즘 왜 저런거 하죠? 선거 전에 그 여론조사 같은거 하죠? 그쵸? 그래서 어떤 후보가 몇 퍼센트의 지지도 어떤 후보는 몇 퍼센트 지지도 이런 것들 여론조사를 하기 위해서 전화를 돌리거나 아니면 ARS를 하든가 이런 식으로 데이터를 모으잖아요 자 이거는 전체 데이터에요 아니에요? 아니죠? 전체 데이터가 아니라 거기서 샘플링을 한 거예요 샘플링은 어떻게 하냐면 여러분들도 오해가 있을 수 있는데

06:39:39

가끔 여러분들이 전화하는데 갑자기 전화가 끊어버리는 경험했어요. 답한다면 끊어버리잖아요. 미쉽기 바람. 이거 끊어버렸네. 이거 정치적으로 문대 있는 거 아니야. 이런 음모를 가질 필요는 없습니다. 끊는 이유는 바로 그게 제가 이거 전문적으로 전문적으로 얘기하기는 그렇지만 이게 스톡시케이션이라고 하는 게 있어요. 그래서 결국은 연령대별로 랜덤 샘플링을 하는 거예요. 10대에서 랜덤 샘플링 20대에서 랜덤 샘플링 그리고 남녀를 나눠가지고 성비도 비슷하게 맞춰야 되기 때문에 남자와 비슷하게 여자와 비슷하게 맞추기 위해서 남자와 받으면 끊어버리거나 여자 받으면 끊어버리거나 이런 일도 생기는 것입니다.

06:40:25

언제껏 이건 전체가 아니죠. 근데 진짜 알고 싶으면 어떻게 해야 돼요? 진짜 사람들의 민심을 알고 싶으면 어떻게 해야 돼요? 전수조사를 해야 되겠죠. 전체 다 보면 가장 정확한 거예요. 그거 역시 뭐라고 한다? 빅데이터라고 한다. 알겠죠? 그 다음에 세 번째. 세 번째 정의. 정형, 미정형 얘기해 줬잖아요. 발표할 때.

06:40:57

그런 것처럼 우리가 데이터베이스 메울 때 이런 데이터 있죠? 테이블에 들어와 있는 그런 데이터를 정형 데이터라고 얘기를 해요. 그런 거를. 근데 요즘은 이제 데이터 분석 기법도 좋아지고 그러다 보니까 굳이 그렇게 테이블에 있는 데이터만 가지고는 진짜 의미 있는 그런 결과를 얻기가 쉽지 않더라. 그래서 요즘은 그렇게 테이블 형태로 되어 있는 잘 오버나이즈 되어 있는 데이터뿐만이 아니라

06:41:31

SNS, 커뮤니티 등에서도 데이터를 모은다는 거예요. 다양한 소스로부터 분석해서 가장 최적의 의자결정을 하는 데 도움이 되는 방향으로 가고 있습니다. 그래서 정형 데이터뿐만이 아니라 이렇게 SNS, 텍스트라든가 이런 비정형 데이터까지 전부 다 통칭한 개념이 그 데이터다.

06:42:02

자, 빛띛띛 기념 잘 아셔야 돼요. 알겠죠? 여러분들 어제 축제 때 뭐 술 많이 먹었어? 다들 후고 또 졸고 막 난리 났네. 나도 오늘 늦게까지 마셨는데. 너무 하는 거 아니야, 니들? 어, 그러면 여기서 너무 피곤해하니까 다음 시간에 할게요. 이거 지금 남은 부분은 이어수업 다음 시간에 중요한 부분 드리니까 다음 주에 계속하고, 우리가 하겠습니다. 슬가.

06:42:40

- That's cool.

새 노트 | Alt