딱 내가 배우고 싶은 것만 배우면 되는데 뭐가 이렇게 많아?

지하철 안에서 공돌이로 보이는 어린 학생들 2명의 대화 일부를 주워들었다.

  • A: 여기 6개월 과정에서 4달째 수업이 딱 내가 찾던 건데, 앞에 3개월 수업을 들어야 된다고 그래서 ㅈㄹ zzang나
  • B: 돈 벌라고 그 ㅈㄹ 하는거잖아 ㅆㅂ

정확하게 어떤 상황인지 모르겠지만, 약간 내 방식대로 풀어 쓰면

  • A: CPA 학원에 고급회계 대박 잘 가르치는 강사 발견했는데, 무조건 자기 방식 중급회계 들으라고 그래서 ㅈㄹ zzang나
  • B: 돈 벌라고 그 ㅈㄹ 하는거잖아 ㅆㅂ

또는

  • A: 사업연수원만 가면 되는데 사법고시 시험 합격해라고 그래서 ㅈㄹ zzang 나
  • B: 돈 벌라고 그 ㅈㄹ 하는거잖아 ㅆㅂ

이런거 헤아릴 수 없이 많은 variation을 만들어 낼 수 있을 것 같다.

 

바로 중간 단계부터 들어가도 상관없다고 생각할 수 있는 교육이 굉장히 많은 것은 인정한다.

별 대수롭지 않은 내용을 가르치면서 돈 벌려고 그러는 것도 많더라.

 

근데, 내 기억에 중급회계를 모르면, 특히 특정 스타일의 중급회계 지식이 없으면, 그 스타일로 정리한 고급회계 따라가기 힘들다.

사법고시 합격할 수 있는 법학 이해도가 없는데 사업연수원만 가면 된다는 생각으로까지 유비추리가 연결되면 좀 공감할 수 있지 않을까?

(뭐든 Cherry picking 할 수 있는게 아닌데…)

 

ML만 배우면 되지 그깟 통계학은 그냥 대충 보면 되잖아요

그간 내 경험상, ML은 코딩 지식만 좀 배우면 된다고 주장하는 사람들 중에 Estimation theory를 “필요치 이상”으로 이해하는 사람은 단 한 명도 없었다.

단 한 명도.

Estimation theory를 먼저 가르치고 ML을 가르쳐야 되겠다고 생각해본 적이 있다는 한국어 댓글을 한번 본 적 있기는 하네.

근데, 영미권 모든 메이저 대학의 ML 교육의 출발점은 통계학이다. ML 가장 기초 교재로 알려진 ISLR의 S는 ‘Statistical’이라는 점을 상기하시기 바란다.

 

“학위 과정을 다 하고 싶지만 시간이 없어서… 수업 1-2개만 들으면…. 책을 추천해주면 책만 보면…”

이런 이야기를 하는 사람들 99%가 공대라는 점, 나머지 1%가 의대라는 점을 놓고보면,

이 분들이 얼마나 Estimation theory 류의 기초 통계학 이해도가 낮은 상태에서 무작정 ML 교과서들만 쳐다보고 있는지 알 수 있다.

 

우리 MBA 학생들이 3rd term에 ML, 4th term에 DL수업 들으면서 공통적으로 하는 말이,

왜 1st, 2nd term에 수학, 통계학 기초 수업을 그렇게 빡빡하게 했는지 공감이 된다는 이야기고,

ML, DL을 응용하면서 현실에 적용하는 Case study 위주의 BUS 라인 수업을 들으면,

왜 Estimation theory와 ML, DL이 하나로 엮여야 되는지, 현실 문제 풀어보면서 느낀다고들 한다.

온갖 현실의 도전에 배운 내용들이 하나하나 아주 미세하게 다른 각도에서 적용되면서 합리적인 결론을 얻어낼 수 있게 되기 때문이다.

 

공돌이들은 ML 수업 하나만 들으면 되겠지, DL수업만 들으면 되겠지라고 생각하는데,

그 수업만 들어서는 이런저런 책 몇 권 짜집기해서 이해하는 수준 이상, 아니 코드 복붙하는 수준 이상으로 이해도를 깊게하는건 거의 불가능하다.

근데, 앞에서 배운 Estimation theory와 연결이 되기 시작하면, ML 이론들이 어떤 각도에서 생겨났는지,

그래서 어디에서 어떻게 활용되는지, 언제 조심해야되는지를 관통하면서 이해할 수 있게 된다.

 

이런 교육을 받고나면, 현실의 문제를 푸는데 학교에서 배운 이론을 활용한다는게 상아탑의 뜬구름 잡는 소리라고 생각하지 않게 되고,

더 훈련이 쌓여서 자기만의 스토리에 필요한 이론들을 갖다 끼워넣게되면, 그게 바로 논문인데, 그 논문을 쓰는 레벨이 되면,

우리끼리는 Theorist가 되는 훈련이 어느 정도 됐다고 표현한다.

 

다른 학문 사정은 잘 모르겠고, 비슷한 표현으로 경제학에서는 Economist by training 이라는 표현이 있다.

경제학의 사촌 전공인 보험, 행정, 정책, 무역, 심지어 경영학까지, Economist by training이 안 되어 있으면 잘 해 봐야 2류 학자 취급받는다.

아니, 좀 더 냉정하게 말해서, 아예 학자들 리그에 안 끼워줄 것이다. (세일즈나 하러 돌아다니는 사짜 교수로 살아야 한다.)

즉, 제대로 인재를 길러내는 학교를 가면, 유사한 전공을 가도 교수진들이 모두 Economist by training이라는 훈련이 되었다는 뜻이다.

 

우리 SIAI 교육, 아니 일반적으로 Data Scientist를 길러주는 교육도 비슷한 철학으로 운영되어야 제대로 된 인재를 길러낼 수 있다.

까딱 잘못하면 코딩으로 뭐든 다 된다고 착각하게 만드는, 직업학교 교육 수준으로 전락하게 되기 때문이다.

그리고, 저 위의 99%와 1% 그룹 분들이 그런 Theorist 교육 대신 직업학교 교육으로 Data Science 교육을 바라보니 난 어이가 없을 뿐이다.

 

난 당신들이 배우는 전공을 그렇게 무시한 적 없다. 당신들은 왜 내 전공을 이렇게 무시하는가? 왜 코드 몇 줄이면 다 된다고 생각하지?

내가 2-3달 동안 골학 수업 하나 듣고 뇌수술, 뼈수술, 신경수술 다 할 수 있게 됐다고 그러면 의대 분들 다 비웃으실 것 아닌가?

의대 본과 수업 중 어느 수업 1주일만, 1달만 듣고 불치병을 진단하고 고칠 수 있게 된다고 하면, 사기꾼이라고 맹폭격을 하실 것 같은데?

내가 기분 나쁜건 당연하지 않을까?

 

어차피 몰라도 되는데요?

어차피 그런 배경지식은 몰라도 되고, 그냥 이거 붙여서 쓸 수 있는지 아닌지만 알면 되니까, 그냥 듣게 해 주세요

가끔 이런 반응도 본다.

까짓거 뭐, 네가 이해 못하건 말건 내 사정 아니니까 그냥 알아서 들어라고 해 볼까? 싶은데,

대학 설립하기 전까지 4년동안 1달 압축 ML, DL 수업 듣고 간 공돌이들이 나한테 해왔던 욕을 생각해봐라.

이런거 배워서 어디 써먹어요? 어차피 현실이랑 거리 멀잖아요

이런식으로 자기의 학부 전공이나 이해도 수준이 직업 학교 수준임을 스스로 인증하던 질문부터,

무슨 대학 교수처럼 가르침. 아는 거 많다고 자랑하는거 재수없음.

이런 강의 후기도 한두번 본 게 아니다.

 

자기가 이해 못하는 사실이 무능력이라는 걸, 가르치는 사람을 비하하는 걸로 해결하는, 전형적인 2류 인재들의 특징을 여기서 본다.

보통 1류 인재들은

제대로 못 배워서 반성문 쓰러 왔습니다

이런 훈련을 받아야 시야가 열린다는 걸 이제 조금 알게 되었습니다

같은 투가 되더라.

평생 설명을 못 알아들어서 부끄러운 일은 많았는데, 내용이 어렵다고 화내는건 사고 흐름 자체가 잘 이해가 안 되더라.

기초 지식이 없는데 머리까지 나쁘니 당연히 이해 못하고, 그럼 식은 땀이 나며 쪽팔리고 그러는게 상식 아닐까?

 

말을 바꾸면, ML, DL 두 과목만 들을꺼면, 어차피 저런 욕 하고 나갈 수준의 실력이니까,

그냥 안 듣는게, 평범한 공돌이인 당신들에게도 더 돈과 시간을 아끼는 길이다.

내 교육의 가치를 제대로 이해도 못 하고 저런 식의 코딩 학원 수준 인재의 강의 후기 보는게 내 입장에서도 스트레스고.

 

우리 교육이 현실의 문제를 풀어내기 위한 기초 수학 + 지식 이해 + 현실 응용 같은 스텝으로 구성되어 있고,

그 각각을 제대로 이해하면서 동시에 묶음으로 이해해야 한다는 걸 인지 못하는 분들에게는, 어차피 돈/시간/에너지 낭비라는 말이다.

기초 수학 훈련이 우리 교육을 받을 수 있는 수준으로 매우 탄탄하게 된 경우가 아니면, 그런 고통을 참아낼 학생이 아니면,

그냥 서로 만나지 말자.

 

저희 회사 개발자들이 AI 스터디 하는데요, 뭐 대단한 거 공부하는거처럼 그러더니, Beta hat 구하는거 코드 몇 줄 복붙해 놓고 엄청난 공부했다고 자랑하고 있더라구요

이런 이야기하는 어느 통계 석사 출신의 표정이 기억난다.

“Beta hat 구하는거” (단순 OLS)가 우리에게 어떤 느낌의 지식인지 모르면 진짜 더더욱 말을 섞고 싶지 않다.

그 수준이니 우리 방식의 고급 정상 교육이 잘 이해가 안 되고, 어려우면 화내는 스타일이니 여기저기 우리 교육을 욕하는 글을 쓰고 다니는 거라고 짐작해본다.

 

0 아니면 1

Boolean 스타일의 데이터, 혹은 True/False 형태의 데이터를 저장하는게, 우리가 알고 있는 컴퓨터의 가장 단순한 연산 처리 원리와 같다.

그런 “컴퓨터” 전공하신 분들이, 자기네들의 학습이 0에서 1까지 Step function이 아니라 continuously increasing function이라고 생각하더라.

 

정작 이쪽 관련 전공을 발이라도 제대로 걸쳐보는 수학, 통계학, 좀 멀어지면 물리학, 경제학 같은 전공하는 사람들 사이에서는,

어차피 우리 과 1,2,3등만 풀 수 있는 문제고, 나머지 전원은 그냥 외운거 베껴적고 나와서 F 안 나오기를 빌어야하는 전공이라고 생각한다.

말을 바꾸면, 0 아니면 1 이라고 생각한다는 뜻이다.

 

우리 전공에서는 Boolean이라는 표현도 안 쓰고, True/False 문제들은 시험 앞 부분에 점수 줄려고 나오는 문제라는 선입견이 있는 단순 개념인데,

Data Science 연관 전공을 배우는 사람들은 모두 이 쪽 지식에 대한 이해도라는게 Boolean type이라는걸 정확하게 인지하고 있는 반면,

자기네가 다루는 시스템의 구성 원리 자체가 Boolean인 사람들이 정작 Data Science 지식 이해도라는게 Boolean이라는걸 이해 못한다는게 참 아이러니인 것 같다.

이건 공돌이들의 자뻑이 문제일까, 무지가 문제일까, 아니면 그 이전에 교육 내용의 문제일까, 아니면 교육 철학의 문제일까?

 

0 아니면 1이라는게 Beta hat부터 알아가는거니까 Continuous function 아니냐고 반문할지도 모르겠는데,

공대는 학부 나와도 직장에서 전공 살리는 자리에 배정해주지만, 통계학은 최소 석사해야 그런 자리 준다는 이야기 기억나시나?

이게 0 아니면 1이라는게 우리 쪽 사람들 머리 속에 박혀 있으니까 노동 시장에서의 대우가 그렇게 바뀌는 것이다.

어쩌면 공돌이들은 석/박 과정이 정말 프로젝트 하다가 학위 받는거여서, 별거 없어서,

대학원을 다 만만하게 보고 있기 때문에 0/1로 이쪽 지식을 바라보지 않는 것일수도 있겠다.

 

어쨌건, 당신들이 어떻게 이해하건 말건, 여긴 0 아니면 1이다.

Beta hat 이해하는 수준이 아니라, GLS로 확장되는 기초 회귀분석 아무리 외워서 시험 점수 잘 받아도 써 먹을 곳이 없다.

언젠가 GLS와 IVE 둘을 놓고 Hausman test를 하면서 둘 중 어느 쪽 Regime이 더 맞는지를 테스트할 수 있는 역량이 쌓이기 전까지는.

그리고, GLS와 IVE가 각각 어떤 현실에 대한 가정을 담고 있는지를 연결해서, 세상을 압축적으로 요약한 테스트라는걸 이해할 수 있는 역량이 쌓이기 전까지는.

GLS를 배웠는데, 이렇게 쓸 수 있는걸 처음 봤다는 어느 통계학 학부 출신의 표현이 기억난다. MBA 첫 학기 수업이었다.

그럼 수 많은 스위치 중 하나가 0에서 1로 켜진 상태, 아직 많은 스위치들은 여전히 0인 상태일 뿐이다.

 

그래야 나중에 ML, DL 수업 들을 때 무조건 x% 잘 맞다고 모델이 좋다~ 는 1차원적인 이야기 하는게 아니라,

각각이 담고 있는 Factor Analysis 가정 중 어느 쪽이 더 데이터의 Hidden structure를 잘 잡아내고 있다는 걸 “통계 검정” 할 수 있을 것이다.

 

ML은 단독 지식이 아니라, 통계학의 일부라는 걸 깨달아야

ML이 단독 지식이 아니라, 통계학의 일부라는 걸 깨닫고 나면, 여러 스위치가 0에서 1로 켜지고 나야, 제대로 배울 수 있는 지식이라는걸 감 잡을 것이다.

마치, 컴퓨터 게임하는데 여러 건물을 짓고 나야 기술력이 높은 건물을 지을 수 있고, 그 건물이 있어야 특정 개체가 생산될 수 있는 것처럼.

속성으로 그 특정 개체만 1개 독립적으로 생산하는건, 적어도 이쪽 지식을 공부하는 사람들 사이에선 사상누각에 불과하다.

 

학부 시절 사법고시 공부하던 친구들이 했던 말인데,

민법총칙 처음에 공부할 때는 헌법, 형법… 같은 법들이 다 독립적인거니까 각각 X달씩 시간 부으면 이해할 수 있을거라고 생각했는데,

여러 법들을 공부하다보면 전체적인 큰 틀 안에서 특정 항목들을 묶어놓고 그걸 민법, 형법이라고 부른다는걸 깨달았다고 했었다.

덕분에 어느 하나의 법 조항을 이해하려면 여러 법을 다 알고, 어떻게 연결되어 있는지 구체적으로 이해해야 제대로 법을 아는거란다.

그리고, 어느 레벨까지 이해도가 쌓이지 않으면 행정법 같은 상위 레벨 법조항을 바로 이해할 수가 없고,

그래서 사법고시 최상위권, 사법연수원 최상위권 초특급 인재들만 행정법원 판사 오퍼가 나간다고 하더라.

 

회사 운영하느라 필요한 민법 조항 일부, 관련된 증권거래법 같은 조항 일부만 겨우 알고 있는 주제라,

고민할 사항이 생기면, 최대한 정보를 모아 기초적인 판단을 내린 다음에 주변에 변호사 지인들과 의견을 나눈다.

자기네들끼리도 XX법 Y조의 다 목, 라 목에 특정 사례가 해당할 수 있는지 사뭇 진지한 토론을 하는걸 보면서,

그런데 말 귀를 거의 못 알아들으며, 최소한 그냥 답만 알려달라는 꽉 막힌 소리는 안 하려고 최대한 따라가려고 노력하며 대화에 임한다.

누구 유명한 사람이 이야기 했냐?

논리가 어떻게 된 거야?

윗 질문 같은, “(난 바보라서) 네 말 못 믿겠다” 스타일을 혐오하는 성격이라, 나 스스로도 최대한 아래 스타일로 질문하려고 노력한다.

그래야 그 변호사 친구들에게 무시를 안 당할꺼잖아.

 

ML이 단독 지식이고, 통계학이 무쓸모, or 기초 회귀분석만 알면 된다고 생각하는 수준의 사람들에게,

위의 변호사 친구들과의 대화를 그대로 덮어씌워보고 싶다.

공학 자체의 한계인지, 교육이 잘못된 건지, 사고방식의 근본적인 문제인지, 어느 쪽이 진정한 원인인지 모르겠지만,

0 아니면 1인 지식에 감히 발을 들이려면, 4달째 수업을 듣기 위해서 앞의 3달을 배정한 6개월 교육과정 설계 의도는 파악하고 불평하자.

 

딱 내가 배우고 싶은 것만 배우면 되는데 뭐가 이렇게 많아?

배우고 싶은 것만 배우면 된다는 표현을 쓸려면, 대학을 다니신 분들이니까 Pre-requisite이라는게 있다는걸 알 것이다.

정말 대학 나온게 맞다면, Pre-requisite에 해당하는 수업들 들었는지 검증하는 시험에 합격부터하고 난 다음에 불평하는게 맞지 않을까?

 

나 역시 “1년 & Part-time” 라는 말도 안 되는 짧은 시간 안에 MBA AI/BigData 우겨넣으면서 엄청난 고민을 담았었다.

그리고, 국내 공대 출신이 그 말도 안 되는 짧은 시간에 우겨 넣은 과정의 첫 꼭지에 해당하는 수업들 조차도

제대로 못 할 것이라는데 짐작도, 확신도 아니고, 맹신을 갖게 됐다.

엄청나게 열심히 공부하지 않으면.

 

이 블로그에 여러번 언급했던, 우리과 게임이론 수업 왔다가 C학점으로 털려나갔던 공대 00학번 선배들 3명이,

최소한 경제과 2학년의 미시경제학을, 가능하다면 1학년의 경제원론부터 듣고 왔어야,

어쩌면 수학과의 해석개론 같은 과목을 들어놨었어야 우리과 3학년의 게임이론을 들을 수 있다는 사실을 미리 알았더라면,

과연 게임이론 수강을 미뤘을까? 귀찮다고 생각하고 아예 안 들었겠지? 어차피 처음부터 과목 이름이 Fancy하니까 신청했을꺼니까.

 

아마 C학점 받은 사람들이 주변에 굉장히 많이 쌓이고 나야 감을 잡았을 것이다.

그 중 일부는 DNA를 갖추고 있어, 혹은 자기도 모르게 다른 채널로 기초 훈련이 된 덕분에, 쉽게 잘 따라오는 경우도 있었을 것이다.

그렇다고해도, 준비가 안 된 상태에서 타 과의 고학년 과목을 듣는 건 매우 위험한 선택이라는 걸 인지할 수 있는 경험치가 있으면,

아니, 자뻑이 없었다면, 어지간해서는 무모한 선택을 하는 비율이 점점 줄어들 것이라고 생각한다.

 

외부에서 Data Science라는 주제를 굉장히 만만하게 보고 있으신 많은 분들께 같은 말을 하고 싶다.

당신들이 배우고 싶은 내용은, 일종의 대통령이 되는 상황인거다.

국민들은 혜성처럼 나타나 검증이 전혀 되지 않은 인재에게 표를 주지 않는다.

학부 4학년 마지막 학기에 겨우 들을 수 있는 수업을 학부 1학년이 신청하면, 3-4년 후에 보자고 교수가 쫓아내듯이,

열심히 여론의 지지를 얻을 수 있도록 다양한 방식으로 대중과의 접점을 넓히는 시간을 보내야하듯이,

새로 만든 대학이 정말 고급 교육을 한다는 사실을 평범한 사람들에게 열심히 알릴 수 있도록 몇 년간 노력을 쏟아부어야 하듯이.

인터넷 커뮤니티 곳곳에 온갖 음해가 돌아다니는 이야길 계속 듣지만, 그저 묵묵히 좋은 컨텐츠를 만드는데 최선을 다할 뿐이다.

 

딱 내가 배우고 싶은 것만 배우면 되는데 뭐가 이렇게 많아?

지식 공부는 복권 당첨이 아니다.

Similar Posts