[공지] MBA AI/BigData 2nd term 시험 문제 공개

 

MBA AI/BigData 학위 과정 2nd Term 시험 예상 문제를 공개한다.

각 과목명은

  • COM501: Scientific Programming (MSc/MBA 공통)
  • STA503: Math & Stat for MBA II (MBA 단독)

였고, Data Scientist들 중 Business 특화된 업무를 할 수 있도록 기초 훈련을 시키는 과정의 일부다.

위의 두 수업까지 총 4개의 초반 수업을 잘 마무리 짓고 나면, 계량경제학과 계산통계학이라는 기초 과목 훈련을 모두 끝내게 된다.

(지난 term의 2개 수업 기출 문제 중 일부는 여기서 찾으면 된다.)

MBA 학생들은 다음 학기부터는 4개의 수업에서 배운 내용과 ML, DL, RL로 이어지는 컴퓨터 기반 계산법들을 적절히 조합해,

현실의 문제를 풀어내는 훈련을 받게 된다.

 

간단 해설

첫번째 문제는 COM501 수업의 전반부를 커버하고 있고,

Rectangular quadrature 와 FFT라는 계산법을 이용해서 비선형 함수의 근사치를 계산하는 과정을 다뤘다.

비선형함수 근사치라는걸 학부 1학년 때 Taylor’s expansion으로 살짝 배우고 난 다음,

학년이 올라가면서 다양한 계산법들이 각각의 상황에 맞게 다르게 결과물을 가져다준다는걸 말로만 들을게 아니라,

실제로 코드로 구현해보며 Computational efficiency가 달라지는걸 눈으로 확인하게 된다.

 

어렵게 느껴질지 모르겠지만, 주어진 코드를 필요한 부분만 골라서 살짝살짝 변형하는 능력치만 기르면,

그 결과물을 제대로 해석할 수 있도록 논리적인 이해가 잘 되어 있기만 하면 높은 점수를 받을 수 있다.

(그러니까 Data Science에는 코딩을 “잘” 한다는게 별로 필요가 없다고. 이미 코드 돌려보기 전에 결과를 짐작할 수 있어야 수업을 제대로 들은거거든.)

 

뒷 편에는 Finite difference를 이용했을 때와 Monte-Carlo simulation을 이용했을 때,

주어진 상황에 따라 Computational efficiency가 달라지는 것을 확인할 수 있도록 구성했다.

수업 시간에 가르친 4가지 계산법들이다.

 

두번째 문제는 MBA학생용 수학/통계학 수업으로, Time series와 간단한 Bayesian simulation 주제를 가르치는 수업을 듣고,

실제 현실에서 그런 고급 수학/통계학이 어떻게 활용될 수 있는가를 개념적으로 잘 따라올 수 있는가를 묻고 있다.

기초적인 암기 계산이라고 볼 수 있는 Covariance stationary 찾는 앞부분을 제외하고나면,

중후반부의 모든 문제들은 복잡한 수식을 도출해야하는 통계학과 시험문제가 아니라,

개념적으로 어떤 접근법이 주어진 상황에 더 적절한 계산이 될 수 있는지를 논리적으로 따지면 만점을 받을 수 있다.

 

복잡한 수학/통계학 모델 (ARMA)를 갖고 온 동료에게, 1주일간 주중/주말 사이에 변화가 있는 부분에 초점을 맞추자고

더 납득가능한 시계열 계산법인 Seasonality decomposition을 제안하고, 그 제안을 납득 가능하도록 논리적으로 보조한다.

마지막 부분에서는 (내가 가장 싫어하는) Deep-learning maniac한테 non-stationary한 시계열 데이터에

적절한 데이터 전처리 없이 무식하게 모델 갖다붙이기를 하면 얼마나 엉망진창이 나오는지를 설명하면 된다.

여기도 당연히 코드 돌리고 뭐고 하기 전부터, 이미 필요한 모델을 어느 정도 예상할 수 있다.

 

(Y대 DS대학원이 자동문인게 문제가 아니라, 교수가 수업을 잘못한건 아니겠지? SKY 아닌 학부 출신도 잘 아는데?)

 

To general audience

위의 짤에 나온대로, X대 데이터 사이언스 석사를 나와놓고 시계열에 Random forest 갖다쓰면 안 되냐는 단순 무식한 소리하는 동료를 놓고,

왜 뭐가 어떻게 틀렸는지를 조목조목 지적해줘야하는 일이 우리나라처럼 지식 수준이 낮은 인재들 밖에 없는 나라에서는

헤아릴 수도 없이 자주 겪게 될 것이라고 생각한다.

 

(보통 한국인들, 특히 공돌이들은 “학교에서 쓰던 코드 가져와서 씁니다~ 거기서도 되니까 여기서도 되겠죠. 왜냐고 묻지말고 그냥 쓰면 됩니다~” 이딴 소리하고 있을 것이다. 닭 잡을 때랑, 소 잡을 때랑, 회 뜰 때랑 각각 다른 칼을 쓰지 않나?)

 

위의 STA503 시험 문제 예시는 딱 그런 상황이 주어졌을 때 어떻게 반격(?) 하느냐에 대한 논리적인 사고의 흐름을 검증하고,

COM501에서는 그런 사고의 흐름이 “계산의 효율성”이라는 통일된 목적아래 어떻게 나타나게 될 지를

코드로도 구현해보고, 그래프로도 그려보면서 논리적인 사고 능력을 갖추도록 해 놨다.

 

왜 저렇게 가르치냐고?

난 시계열의 뼈대라고 불리는 ARMA라는 공식을 아무리 봐도 이걸 왜 공부해야되는지 이해를 못 했었다.

그러다 우연한 기회에, 외부에서 기습적인 충격이 온 파장 데이터가 어떻게 움직이는지를 놓고,

이걸 ARMA로 “추상화”를 해버리니 미래 예측이니 성분 분석이니 등등의 온갖 종류의 Cool~ 해 보이는 계산을

간단한 수식 몇 개로 다 정리할 수 있게 되더라.

 

교육도 그런 경험에 맞춰서 현실의 상황을 “추상화”시킨 수학을 갖다 쓰는 방식으로 가르친다.

 

박사도, 교수도 못 푸는 문제?

우리 조교들이랑 STA503 문제 보고 농담했었는데,

MBA 전용으로 수식을 거의 다 빼고 논리적인 전개만 하면 좋은 점수를 받을 수 있도록 해 놓은 저 문제를

국내 대학의 통계학 석사생들, 아니 박사 과정 학생들에게 던져줘도 아마 평균 40점을 넘기 힘들 것이다.

국내의 AI대학원 같은 공돌이 방식 교육하는 곳에서는 더하면 더했지 덜하진 않겠지.

 

국내 대학원을 졸업한 조교 하나는,

STA503 문제를 제대로 각 잡고 수식 추가해서 논리 전개를 하도록 변형해놓으면,

아마 국내 대학 교수진을 포함해도 한국 땅에서 50점 이상 받을 수 있는 사람이 거의 없을 것이라고 하더라.

 

몇몇 존경하는 교수님들이 있고, 그 분들은 나의 부족한 시험 문제들을 가볍게 풀어내실 수 있을 것이라고 생각하지만,

그 외의 나머지 교수들, 내가 교수라고 별로 대접해주고 싶지 않은 사람들 중에

과연 몇 명이나 저 문제에 손이라도 댈 수 있을지 모르겠다.

 

근데, 외국 나가보니 이렇게 수학 레벨만 다르고 “논리” 레벨은 비슷비슷하게 만든 교육을

고교 수준에서부터 하고 있더라.

학부 고학년, 대학원 올라가면서 수학을 더 배워서 논의가 좀 더 깊어질 뿐, 껍데기의 주제는 같은 교육이었다.

한국 교육이 앞으로 20년간 절대로 복제 불가능한 시스템일 것이라는데 손가락 열 개 걸어도 되지 않을까? 한 50년 주면 손가락 위험할 수도 있나? 영원히 안 위험할지도?

 

SIAI에서 ARMA를 가르칠 때도 똑같다.

MBA에는 외부에서의 기습 충격 정도로 끝내고, MSc에서는 Impulse response function 같은 수식을 쓰는 정도의 차이 밖에.

 

MBA가 뭐 이렇게 빡세요?

우선, 죽어도 MBA는 못 가겠다고 징징대던 너네들 좀 나와서 이거 풀어봐라ㅋㅋㅋ

STEM MBA라서 대충 MIT의 MSc Business Analytics 정도, 국내엔 비교대상이 전무한 레벨이라고 입이 닳도록 이야기했지 않나?

가짜 석사인 여느 학교 MBA랑 동급 취급하면 섭섭하다못해 화난다ㅋ

 

SIAI 와서 교육 받아보면 알겠지만, 수학은 사실 수식이 아니라 논리적인 전개를 위한 언어에 불과하다.

그리스 철학 초창기의 궤변론자 소리 듣는 소피스트들이 “논리적 사고”의 창시자들이면서, 동시에 수학의 창시자들이기도 하거든.

저 문제들이 당연히 엄청나게 어려운 수학을, 그것도 국내기준 석사 과정에서도 보기 힘든 수학을 담고 있다는 것을 인정하지만,

논리적인 전개만을 놓고보면, 스토리를 어떻게 따라갈 수 있느냐에 불과한 문제들이다.

 

그리고 그 스토리들은 이미 MBA 수업 시간에 다 가르쳐주고, 저 문제들도 MBA 수업 시간에 전부 다 풀어준다.

아예 논리를 그렇게 쌓는 훈련을 시키는, 아니 시험 문제의 답안지를 가르쳐주는 교육 과정을 포함하고 있다.

개념을 배우고 끝나는게 아니라, 저렇게 문제를 계속 풀다보면 개념이 훨씬 더 구체화되기 때문이다.

그러니까 경영학과, 예체능 같은 “비전공” 출신들도 좀 힘들어하면서 따라오는거겠지?

 

교육을 이렇게 현장에서 겪을 수 있는 문제에 대한 대응법으로 하고 있으면,

수학이 어렵다와 같은 관점으로 교육을 구성하는게 아니라, 무슨 도구가 필요할까는 관점에서 커리큘럼을 만들게 된다.

 

계속하는 이야기인데, 수식들을 전개해야되는 부분은 대부분 학부 2학년, 높아봐야 학부 3학년 수준이다.

실제로 STA503 예제 문제의 1-3번은 어느 대학 학부 2학년 기출문제에서 뽑았다.

COM501도 Discrete Brownian motion 형태로 바꾼 부분 (고난이도 수학이지만 정작 시험 중에 영향을 전혀 미치지 않을 부분)을 제외하면

코드 돌려서 스토리를 만들어내라는 부분은 모 대학의 학부 수치해석론 기출문제 구조를 그대로 베껴왔다.

아는 사람은 알겠지만, 수학과, 공대 가릴 것 없이, 수치해석론은 그냥 껌 씹는~ 수준의 널럴한 수업이라는 평가를 받는다.

 

수식 전개는 최악의 경우에는 그냥 외우면 된다.

같은 수학을, 상황이 바뀌었을 때 (ex. 새 보스가 왔을 때), 어떻게 바꿔서 설명해 줄 수 있느냐가 훨씬 더 중요하거든.

SIAI 학위 과정 반 년 안에 느끼겠지만, 당신이 성적이 낮게 나오면 원인은 수학이 아니라 논리 & 사고력이다.

 

우리 MBA 졸업하면 국내 상위 1%… 아니 0.1% 라니까

여러차례 강조했는데, 우리 MBA AI/BigData 졸업하면 국내 상위 1%, 아니 0.1%일 것이다.

어쩌면 0.01% 정도 될지도 모른다.

이런 교육을 받은 인력이 아예 전무한 시장이거든.

 

이렇게 교육받고 회사 들어갔는데 딥러닝 마니악들이 헛소리 떠들면,

해외에서는 그렇게 안 하는데요~

라고 그냥 “넌 무식한 국내파”라는 프레임을 씌워버려라.

어차피 백번 설명해줘도 못 알아먹는 바보들한테 시간 쓸 거 없다.

 

한국 사회에서 직장 생활, 사회 생활 해 보면 알겠지만, 해외에서… 어쩌고 그러면 보통 상대방이 입을 다물더라.

딱히 원하는 방식의 설득은 아니지만, 그렇게 해도 충분할만큼 압도적인 교육을 받았으니,

적어도 한국이라는 나라에서는 면죄부를 받을 수 있는 정당방위(?)가 아닐까 싶다.

 

어려운 개념을 차근차근 따라와주고 있는 우리 MBA AI/BigData 학생들이 정말 자랑스럽다.

Similar Posts