최근 약 2~3주 동안 블로그에 글을 쓰지 못했다. 사실 ADSP를 처음 준비할 때에는 인터넷의 여러 블로거들이 3일 컷, 1주일 컷 등의 이야기를 써놓았기에, 특히 이른바 '민트책'을 구매한 이후 펼쳐 본 ADSP의 1과목은 말 그대로 '날로 먹을 수 있는' 시험이라는 느낌이 매우 강하였기에, 초반 공부에 더욱 소홀하기도 하였다. 아래의 글이 내가 시험 원서 접수하기 전에 썼던 글인데, 이 시험에 대해 얼마나 가볍게(?) 생각하고 있는지가 잘 드러난다. 진짜 이때만 해도 내가 거의 1주일 동안 스트레스 속에서 살게 될 줄은 몰랐다. 시험이 다가오고 2과목, 나아가 3과목으로 넘어가게 되자, 생각보다 쉽지 않을 수 있음을 느꼈다. 기본적으로 '의미 없는 암기'가 필요한 문제들이 많았으며, 3과목에서는 책에 서술된 이론이 문제와 지나치게 동떨어져 있거나, 기술되어 있는 이론만으로는 문제를 풀 수 없는 경우도 꽤나 자주 등장했기에, 언제나 꽉 찬 이론으로 정치하게 쓰여있는 법 관련 서적만 읽던 나로선 너무나도 난해하였다. 특히나 시험이 있는 주 중에 저녁 약속과 출장이 많았기에, 시험 직전 공부 시간 확보가 너무나도 고통스러웠다. 늦게까지 기분 좋게 놀다가, 집에 들어와서는 새벽까지 공부를 해야 한다니, 여간 스트레스가 아니었다. 어쨌든, 변명은 이 정도로 하고, 그래도 2주 동안 퇴근 후 짬을 내서 2시간 정도씩은 꾸준히 공부를 하고, 이윽고 엊그제인 지난 2월 26일 토요일, 나는 제32회 ADSP 시험을 응시하게 되었다. 흰머리가 쭉쭉 늘어나는 기분이었다. 3과목에서 처음 인테그랄과 미분에 관한 것을 본 순간 느꼈던 좌절감은 잊히지 않는다. 나도 고등학교 땐 수학을 참 잘했는데... 하필이면 우리 교육과정에선 문과에게 미적분을 가르쳐주지 않았던 것이 이렇게 비수가 되어 꽂힐 줄이야! 어쨌든 ADSP 응시자들이 많이 모이는 카페에서 입수한 '가답안'은 아래와 같다. 작성자 : asics 님. (*정말 감사드립니다!) 이하 * 표시가 된 부분은 내 소회 및 느낀 점에 관한 것이다. 1. [1과목] 데이터의 이해 * [1번] X . CREATE: DDL에 해당하는 명령어 * 1과목의 1번 부터 틀렸다. CREATE가 DDL임은 기억했으나, UPDATE 역시 DDL이라고 생각했다. DDL은 무언가 DB의 큰 틀 자체를 생성하고 바꾸는 느낌이라는 정도로만 기억하여, 이런 불상사가 벌어지고 말았다. * [2번] O ERP (Enterprise Resource Planning) SVM은 머신러닝에 해당함 * 4번 문제는 진짜 아무것도 모르고 찍었다. 암기가 필요한 영역이라고 판단하지 못했다. Autoencoder가 무언가 이질적이어 보이는 느낌적인 느낌으로 찍었다가 칼같이 틀리고 말았다. 이런. * [5번] X . 분류분석, 감성분석, 회귀분석 → 지도학습 . 군집분석 → 비지도학습 * 지도학습과 비지도학습 역시 단순 암기 문제였는데, 암기를 소홀히 했던 난 이역시도 틀리고 말았다. 다만 아쉬운 점은 지도, 비지도 학습은 1과목보다는 3과목 쪽에 가까운 문제라고 생각했는데, 1과목에서 나왔다는 점인 듯 싶다. * [6번] O . 빅데이터 분석 기법 이해와 분석 방법론 확대는 해당되지 않음 . 알고리즘에 의해 부당하게 피해를 입은 사람을 구제한 인력은 알고리즈미스트 자재 구매, 생산, 제고, 유통, 판매, 고객 데이터로 구성되는 시스템은? SCM (Supply Chain Management) 2. [2과목] 데이터 분석 기획 * [1번] O 체계는? 데이터 표준화 운영을 위한 프레임워크 및 저장소를 구축하는 것은? 데이터 거버넌스 * 전사 차원이면 데이터 거버넌스라는 것은 매우 빈출 문제였는데, 내가 데이터 거버넌스를 제대로 골랐는지 확신이 들지 않는다. 만약 보기 중 데이터웨어하우스가 있었다면, 아마도 데이터웨어하우스를 찍었을 것 같기도한데, 내가 무엇을 골랐는지 기억이 나질 않는다. 2과목은 아무래도 암기할 부분이 많아서 공부를 소홀히 했었는데, 말그대로 큰 코를 다친 느낌이다. * [5번] O . 분석기획 → 데이터 준비 → 데이터분석 → 시스템 구현 → 평가 및 전개 * 유독 2과목에서는 문제와 답이 정확히 기억나지 않는 것이 많다. 7번 역시 마찬가지인데, 보기의 다른 선지가 전혀 기억나지 않는다. * [8번] O . 분석 성과는 해당하지 않음 현상을 무엇이라 하는가? 프레이밍 효과 (Framing Effect) * 과거 기출문제 중에는 '활용'단계가 아니라 '확산'단계 부분을 빈칸으로 내었던 문제가 있었다. 다른 객관식 기출문제들도 확산과 최적화 부분의 문제는 많았던 것으로 기억하는데, 활용이란 단어가 도저히 떠오르지 않았다. 난 아마도 '정착'이라는 단어를 썼던 것 같은데........ 쉽게 맞출 수 있던 문제였던 듯 싶어 아쉬움이 남는다. * 위와 같은 내용으로 난 2과목에서 10문제 중 맞았는지 틀렸는지 모르겠는 것이 2개, 확실히 틀린 것이 1개이다. 가장 보수적으로 계산한다 하여도, 7/10이므로, 이역시 과락의 위험에서는 다행히 벗어날 수 있던 듯 싶다. 3. [3과목] 데이터 분석 * [1번] O . 카이제곱은 모수적 검정에 해당함 ※ 민감도 (Sensitivity)는? TP / (TP + FN) ※ 재현율 (Recall)과 같음 ※ 정확도 (Precition)는? TP / (TP + FP) . 마할라노비스 거리는 변수의 표준편차를 고려한 거리 측도이나 변수 간에 상관성이 있는 경우는 표준화 거리 사용을 검토해야 한다. → 표본 공분산을 사용한다. . 특정 조건을 말족하거나 특정 함수에 의해 값을 만들어 의미를 부여한 변수 . 주관적일 수 있으므로 논리적 타당성을 갖추어 개발 . 세분화, 고객행동 예측, 캠페인 반응 예측에 활용 . 여러 모형에서 공통적으로 사용될 수 있다. → 요약변수의 특징 가정하에 분석을 하는 방법은? 혼합분포군집 연관분석 (연관규칙분석, Association Analysis) * LOOCV라는 단어 자체를 시험 중에 처음 보았다. 위 정답이 4번 선지로 기억하는데, 다른 선지와 끝까지 고민하다가 다른 선지를 선택한 기억이 난다. 아쉬움이 남는다. * [16번] O . 비표본오차는 조사대상이 증가한다고 해서 오차가 커지지 않는다. → 오차가 커진다. . 원변수의 선형결합 중 가장 분산이 작은 것을 제1주성분(PC1)으로 설정한다. → 가장 분산이 큰 것 * 다른 선지와 고민했었는데, 이 역시도 마지막에 무엇을 찍었는지 기억나지 않는다. 개념에 대한 기본적인 암기가 부족했던 탓이 크다. * [20번] O . k개의 객체 임의 선택 → 각 자료를 가장 가까운 군집 중심에 할당 → 군집 중심 업데이트 → 반복 * 정답을 써주신 것을 보면 이렇게 명쾌하고 기본적인 이론이 없어 보이는데, 시험을 보던 당시에는 왜그리도 객체 임의 선택이 군집 할당 이후에 이루어져야만 할 것으로 생각 되었는지 모르겠다. 이번 시험 틀린 문제 중 가장 아쉬움이 남는다. . 평균이 일정, 분산이 일정, 공분산도 시차에만 의존하고 실제 특정 시점 t, s에는 의존하는 않음 * 이 문제는 정말 전혀 기억이 나질 않는다. 3과목은 역시... 쉽지가 않다. * [23번] ?? * 이 문제 역시 전혀 기억이 나질 않는다. 이때쯤 주관식 문제들이 보이면서, 멘탈이 점점 흔들렸던 것 같다. * [24번] X * 사실 이 문제만큼 문제 속에 답이 있는 문제가 있었을까?! '상시계열'이라는 단어 속에서 '시계열'을 발견하지 못한 이유로 고민 끝에 "분리분석방법"이라는 답안을 적어 낸 이틀 전의 내가 너무 바보같이 느껴진다. * [25번]
O * 답안을 보고나니, 누가봐도 '정확도'를 써내야 하는 문제인데, 내가 민감도를 적어냈는지 정확도를 적어냈는지 기억이 잘 나지 않는다. 이틀 전의 내가 조금 더 똑똑했기를 바란다. * [27번] O * '그래프'라는 단어를 보고 히스토그램밖에 떠올리지 못한 나는..... ㅜ.ㅜ... 30문제 중 확실하게 틀린 것은 4문제, 답을 기억하지 못하는 문제가 똑같이 4문제이다. 보수적으로 계산한다면, 총 8문제를 틀렸을 가능성이 있는데, 그렇다면 22/30에 해당한다. 결국 위 복기 자료의 정답이 맞다면, 그리고 내가 기억하고 있는 내 답안이 맞다면, 내 총스코어를 가장 보수적으로, 즉 긴가민가한 모든 것을 틀렸다고 가정했을 때 아래와 같다. ADSP 시험의 합격 기준은 "총점 60점 이상 취득(과목별 40% 미만 취득이 없을 것)"이다. 또한 이 시험의 각 문제는 모든 균등한 점수 배분이 이루어져 있어, 문제당 2점의 배점이므로 정답의 수가 30개 이상이면 합격이라는 의미이다. 이 포스팅을 하면서 처음으로 가채점을 해본 것인데, 결과가 좋아서 정말 다행이라는 생각이 든다. 만약 떨어졌다면, 포스팅 중에 꺼버렸을지도 모르겠다ㅋㅋㅋ 기쁘다. 진짜 금요일만 해도 스트레스 때문에 많이 고통스러웠는데, 가채점 결과로나마 합격의 기쁨을 누리게 되니 기쁘기 그지없다. 특히 막판에 스트레스를 주었던 가장 큰 요인이었던 3과목의 계산문제들이 모두 풀 수 있는 상태로 나와주었기에 더더욱 기쁘다. 자신의 공부 현황을 공유하는 글을 포스팅해주어, 내가 남들과 함께 공부하는 기분이 들게 해 준 네이버의 많은 네티즌에게도 감사한다. 어쨌든 나뿐만 아니라 이 글을 읽어주신 모든 분들이 합격의 기쁨을 누릴 수 있길 바라며, 오랜만의 포스팅을 마친다. 이젠 다시, 꽤 오래 밀려있는 교대역 맛집 투어 시리즈를 포스팅해야겠다. |