‘체비쇼프 부등식 알지?’라는 표현으로 본 ‘수학 = 제3외국어’ 이론

가끔 듣는 낯 부끄러운 표현 중에

“글도 잘 쓰시는 분이 어떻게 그렇게 수학을 잘 할 수 있어요?”

라는 표현이 있다.

일단 글도 잘 못 쓰고, 수학은 진짜로 잘하는거 아니라고 생각한다. 굳이 따지자면 수학은 한국식 문제 풀이형 교육에서 겨우 발만 떨어진 수준, 글로벌 레벨의 고급 대화를 수학으로 술술 풀어내고 증명이 머리 속에서 좌르르 되는 수준은 절대로 아니다. 글 쓰기는 한국어로도 요 모양 요꼴이고, 영어 문장들은 non-native의 한계를 영원히 극복 못 할 것이다.

사진=한국은행

오늘 우리 기자들 기사 잘 쓰라고 다그치다가 우연히 이창용 교수님이 Lawrence Summers와 대담한 내용이 기사로 올라온 걸 봤다. 기자들이 이래저래 부러워 하는 표현 써 놓은 부분말고, 눈에 하나 딱 들어오는 부분이 있었는데,

창(용), 체비쇼프 부등식 알지?

라는 부분이다. 아마 영어 표현으로 “Remember Chevyshev inequality?”라는 표현이었겠지. 나도 종종 Fat tail event라고 생각되는 사건을 만나면 던지는 표현이다. 학부 2학년 통계학 수업 시간에 배운 내용이다. 특정 사건이 일어날 확률의 최대/최소치를 계산할 때, 전체 분포 범위의 1/k^2 범위를 기준 값으로 삼는 계산으로, 정규분포상 거의 안 일어날 사건 확률에 굉장히 큰 확률이 배정되게 된다. 반대로 무조건 이거다~ 라고 생각할만한 사건이 일어날 확률이 훨씬 더 낮을 수도 있다는 기준점으로 쓰이기도 한다.

좀 더 Data Science 분야로 가깝게 예시를 들면, 정규분포에 가까운 사건이 아닌 사건들, ‘이런 예외가 일어날 리는 (거의) 없다’라고 생각했던 사건들이 생각보다 자주 일어날만한 상황에 쓰는 표현 중 하나다.

요즘 스타일의 math를 써서 내 주력 전공에 가깝게 표현한다고 치면, 최근 경제 문제인만큼 high correlation in downside 정도로 표현할 수 있을 것 같다. 안 풀릴 때는 모든 문제들이 한꺼번에 닥치는 반면, 잘 풀릴 때는 특별히 하나가 다른 하나에 영향을 주는데 아니라 따로 놀 때의 경우를 말한다.

굳이 위의 사례를 갖고 오는 이유는,

‘수학 = 제3외국어’

라는 내 평소 지론을 일반이 이해할 수 있도록 해 주는 좋은 예시일 것 같아보여서다.

우리 SIAI 학생들도 느끼겠지만, 수학이라는게 뭔가 엄청나게 복잡한 수학과 수준의 수학을 이야기하고, 필즈상을 받아야하고 이런게 아니라, 그냥 일반적인 언어를 대체하는 압축형 언어로 쓰인다. 위의 사례에서도 확률이 어쩌고 뭐라고 구질구밀하게 설명해야하는 상황인데 remember chevyshev right? 이정도면 모든 대화가 끝날 수 있다. 남들이 보기엔 Chevyshev라고 하는 사람 이름을 댄 것 같은데, 우리는 무슨 뜻인지 다 알아먹어 버리는 것이다.

천자문부터 대학, 맹자 같은 한문 서적 기준의 지식을 갖고 있는 분들에게 “명심보감 학이편에 한소열 고사네”라는 표현 하나면 선한 행동과 악한 행동의 경중에 대한 마음 가짐을 이야기한다는 것을 바로 감을 잡을 수 있을 것이고, Frame 안에서 변수를 함수 안밖에서 클래스 다르게 중복 선언하는 바람에 함수들이 꼬여 돌아가는 상황을 보곤 “OOP는 기본 아니냐?” 같은 표현을 쓸 수도 있을 것 같다.

같은 측면에서 “그거 Normal (distribution)인데 왜 딥러닝 돌려요?” 같은 표현을 누가 못 알아들으면 “아~ 대화 안 되는 사람이네”, “교육 안 받은 가보구만” 같은 방식으로 생각이 확장될 수밖에 없다. 요즘 같은 시대에 잘 모르고 그저 코드 몇 줄 복붙해놓고는 화려하게 포장해서 공무원들 속이고 지원금 받아가고 있는 걸 보고 있으면 “교육 안 받은 가보구만”을 넘어서 “쟤네 사기꾼 아니냐”로 확장되는 것이다.

아마 한국은행 총재쯤 되는 자리에 앉은 인력이 Chevyshev inequality 라는 표현을 못 알아듣고 버벅거리고, “분포함수 그런거 소용없고, 그냥 이자율 안 올려요 안 올려~!” 이딴 소리를 하고 있으면 아마 한은 내부에서는 “우리가 저런 인간 밑에서 일하냐 ….”라는 자괴감 섞인 표현이 나올 것이고, 밖에서는 “저 인간 누가 한은 총재로 뽑았냐?”같은, 대통령 및 내각을 질타하는 표현이 돌 것이다. 좀 더 심해지면 “한은 갖고 놀려고 꼭두각시 하나 앉혀놨나보네” 같은 모욕적인 표현이 나올 수도 있다.

가짜 Data Scientist들이 국민 세금을 빼먹는 사건을 보고 ‘쟤네 사기꾼 아니냐”는 표현을 쓰는게 특별히 잘못되지 않았다는 걸 강조하려다보니 애꿎은 한국은행을 괴롭히게 됐네 ;;

그간 SIAI 학생들에게 꾸준히 주입식(?) 반복학습(?)으로 교육했다시피, 수학을 고교 시절(이나 공대처럼) 문제 풀이하듯이, 혹은 대학교 수학과의 증명 수업하듯이 접근하지 말고, 언어로 생각하고 접근해야 적절한 곳에 적절한 수학을 갖다 쓸 수 있는 사람이 된다. 한글이나 영어로 문장을 잘 쓸려면 단어들의 뜻을 잘 알고, 기본적인 문법을 잘 이해해서 조합하는 능력이 중요한 것과 완전히 일치한다.

물론 한자어, 라틴어 같은 고급어가 있고, 그런 문학적, 문화적 기초가 깔린 언어를 제대로 쓸 수 있으면 어휘 수준이 높은 사람이라고 추켜세워지기는 하겠지만, 고작 Data Science를 그것도 학부 수준에서 공부하는데 굳이 그렇게 무리해야할 필요는 없다.

미국에서 학부 수학, 컴공을 전공하고 대학원을 다녔던 한 SIAI 학생이 “해석개론에서 쓰는 수학들 하나도 안 쓰시니까 왔지, 그런거 쓰셨으면 저도 안 왔죠”라는 표현을 쓰던데, 이게 내가 수학을 ‘언어’ 도구로 쓰는 관점이다. 쉬운 언어로 쉽게 풀어내는, 마치 이야기하듯이 대화하는데, 거기에 단지 개념이 구질구질한 한국어가 아니라 함축적인 수학일 뿐이다.

몇 달 전 사무실에 놀러왔던 학생이 시간 축을 PCA를 때린다길래 아인슈타인 상대성 이론 이야기를 기반으로 “타임머신이 있어야 time dimension을 축 변환할 수 있겠지”라고 낄낄거리는 표현을 쓰는 것도 그렇고, “어 stationarity 신경쓰다가 seasonality만 날라가버렸네?”라고 따릉이 이용 데이터를 지적하는 것도 마찬가지다.

이렇게 기본적인 ‘언어’를 모르고 무조건 코드 베껴서 아는체나 하려고 하고, 실제로 그걸로 ‘사기’를 쳐서 아까운 정부 R&D 예산을 등쳐먹고 있다가 이제 그 예산 줄어든다니 데모질이나 하는 분들, 당신들이 정말로 국민 세금을 받을 자격이 있는지 한번쯤 돌이켜보라고 하고 싶다.

Similar Posts