E(XY) & Cov(X,Y)

x ~ Dirichlet(a) 에서 E(xi * xj) 를 어떻게 계산해야할지 감이 안 잡혀서 Topic-Models 메일링 리스트에 질문.

누군가 Cov(X,Y) = E(XY) – E(X)E(Y) 를 사용해보라고 했는데, 아차 싶었다.

분명 확률 통계 수업 시간에도 여러 번 봤던 식인데 막상 필요할 때 생각이 나지 않는 걸 보니 아직 covariance에 대해서 제대로 이해하고 있지 못하다는 게 여실히 드러나네.

Advertisements
E(XY) & Cov(X,Y)

For math education, reduce the number of problems

As I posted here, a large number of problems discourage students even before they read a question. There are two boys who particularly lack attention, and somehow I happened to care for them. I lured them by promising that if they solved the first eleven problems then I would let them go home. This strategy was surprisingly effective. They started to focus on the problems (although they still lack attention compared to other students), and praising them seemed to make them feel respected. I’m not 100% sure that this strategy is good at all, but I’m sure that forcing them to solve 40 problems is bad.

For math education, reduce the number of problems

수학 공부

아빠는 내가 어렸을 때부터 수학, 영어 이 두 가지 공부를 강조하셨고 수학 공부에 대해서는 확실한 교육관을 가지고 계셨다. (아빠께서 수학과 출신이시기도 하고.)
첫째, 풀다가 모르겠어서 해답을 읽고 이해하면 그건 푼 게 아니다. 읽는 순간에는 완벽히 아는 것 같지만 그건 곧 기억에서 사라지는 것이며 내 실력이 된 것이 아니다. 따라서 모든 문제는 스스로 풀어야 한다. 하루가 걸리든 이틀이 걸리든. 심지어 내가 초등학생, 중학생일 때에도 이런 방식을 강조하시고 요구하셨다는 게 놀랍다.
둘째, 채점을 하지 않으면 아무런 소용이 없다. 심지어 아빠께서 오늘 분량을 끝냈냐고 물어보실 때, “네. 채점만 하면 돼요.”라고 대답하면 “그럼 한 게 아니지.”라고 대답하셨다.

배나사 수학교육 방식에 문제가 있다고 생각한다. 배나사의 교육은 시험 성적만으로 모든 것을 평가하는 우리 나라의 현 교육 체제에 맞춰져 있으며, 이것은 사실 배나사를 처음 시작한 준석 선배님도 인정한 부분이다. 따라서 매 수업이 끝나면 학생들에게 문제지를 나눠주고 풀도록 시킨다. 수학 이론을 배우고 나면 문제를 푸는 것은 당연하지만 문제의 양이 너무 많다(약 40문제). 학생들은 당연히 질릴 수밖에 없고 어떻게 하면 이 많은 문제를 빨리 풀고 집에 갈 수 있을까 하는 생각을 하게 된다. 문제를 꼼꼼히 풀지 않고 조금 생각해보다가 잘 모르겠으면 바로 질문을 한다. 이런 교육 방식의 문제가 무엇인가? 바로 요령과 패턴에 초점을 맞춘다는 것이다. 이런 상황에서 학생이 스스로 생각해보도록 지도해주는 선생님은 짜증나는 선생님이다. 수능을 일 년 앞둔 고등학교 3학년을 가르쳐야 한다면 모르겠지만, 중학교 2학년 학생들에게 이런 식으로 수학을 가르치고 싶지는 않다. 공식을 이해하는 문제 5~10문제, 그리고 응용 문제 5문제 정도만 주었으면 좋겠다. 학생들이 스스로 열심히 생각해보고 답을 찾도록 격려하는 교육 문화였으면 좋겠다. 이런 방식이 장기적인 관점에서 볼 때 더욱 효과적인 것 아닌가.

수학 공부

사고 방식 바꾸기

작년에 김기응 교수님 지도 하에서 SIFT와 PLSA를 결합한 논문에 대해서 공부를 할 때, 교수님께서 PLSA에 대해 말씀하시면서 “앞으로는 이런 식으로 생각하는 방식을 바꿔야 할 것이다.”라고 하신 적이 있었다. 무슨 말인가 하면, PLSA는 텍스트에 나타나는 단어들을 보고 같은 주제에 속하는 단어들을 자동으로 묶어 주는데 이를 위해 단어의 등장 빈도를 메트릭스로 나타내고 SVD를 한다. 단어와 주제라는 상당히 추상적인 개념을 수학적으로 표현하고 계산한다. 다시 말해, 우리에게 주어진 문제를 숫자들로 표현해내고 수학적인 계산을 통해 문제를 해결하도록 해야한다는 것이다.

요즘 절실히 느끼고 있다. 문제를 해결하기 위해서 경우의 수를 모두 고려해서 이 경우는 이렇게 하고 저 경우는 저렇게 하고 하는 것은 정말 피곤한 일이다. 심하게 말하면 막일이 되기도 쉽다. 이런 쪽으로 훈련이 너무 부족한 것 같다. 사실 어떻게 훈련을 해야하는지도 잘 모르겠다. 이번 학기 이미지 프로세싱 수업을 들었는데, 이미지는 당연히 사람의 시각을 통해 느껴지는 것이니까 어떤 문제에 대해 접근할 때에도 추상적인 접근을 하기가 쉬운데, 알고 보면 이미지 프로세싱은 완전 수학이다. 추상적인 접근을 통해서 아이디어를 얻을 수는 있지만 문제를 case by case로 나누고 추상적으로 해결하진 않는다. 정말 어렵게 느껴진다. So hard.

사고 방식 바꾸기