수학의 쓸모 (독후감-2편)
조건부확률 - 패턴과 예측규칙 - 베이즈규칙 - 통계와 알고리즘 - 변동성 - 가정의 힘 - 공중보건과 데이터 과학
이 책에 대한 인상이 다시 바뀌었다. 이 책의 주제는 수학이다. 그런데, 그 수학이 쓰이는 곳은 AI와 연계된다. 기계학습, 인공지능으로 대변되는 AI를 통한 데이터 혁명의 핵심 수학적 이론을 7가지로 설명하는 것이다.
조건부확률도 예측규칙에 대한 내용도 문과인 나에게는 생소한 개념이다. 아무리 수식이 없다고 하지만, 수학적 이해를 위해서는 많은 주의집중이 필요하다. 그래서, 이 책은 오래동안 읽어야 할 책이다. 대여기간은 짧고 오래는 읽어야하고 끝까지 읽을 수 있을 지 모르겠다. 그 와중에 나는 오늘 좀 피곤하다.
피곤한 상태에서 고도의 집중력이 필요한 책을 읽고 있자니, 머리속에 잘 들어오지 않는 것 같다. 패턴과 예측규칙에 대한 가장 기초적인 수학을 발전시킨 사람이 헨리에타 레빗이라고 하는데, 그 이전에는 이런 내용이 없었던 건지 의문이 생긴다. 내가 이해한 예측규칙이라는 것은 데이타들을 놓고 방정식을 만들어 가는 것이다. 그 방정식이 데이타를 가장 잘 표현할 수 있도록 하는 것이고, 과거를 잘 표현하기 위해서는 매개변수가 많이 필요하고, 매개변수가 많은 방정식은 미래예측이 어려워진다는 것이 이 책에서 지적하는 부분이다. 그런데, 현대 AI는 수십만개의 매개변수로 사물을 인식하고 있다. 이 기계학습에서 매계변수는 다층적인 단계를 통해서 만들어지고, 그 단계의 질문이 심층신경망이고 이 신경망을 이용해서 하는 학습이 심층학습니다.
AI가 패튼인식과 예측규칙에 따른 사물 인식을 하기위해서 대용량모형, 대용량 데이터 집합, 초당 100만번 가능한 시행착오, 심층학습 이라는 4가지가 필요했다. 나는 아직까지 어떻게 대용량모형을 만들고 데이터를 이용해서 초당 100만번을 시행착오시키고 그 데이터가 심층학습이라는 이름으로 사물을 인식하는지 하나부터 열까지 과정을 보여주면서 설명해줬으면 좋겠다는 생각이 들었다.
데이터를 가공하여 뭔가 정보를 얻어내는 것은 이해를 했었다. 하지만, 기계에게 학습을 시키는 방식은 아직도 뜬구름 잡는 것 같다. 이 책을 다 읽으면 AI가 어떻게 동작하는 지 이해하게 될까? 의문스럽다.