2020년 여름 엑스브레인 인턴 일지 — 시카고 대학교 3학년 황희승

Original article was published by XBrain Info on Artificial Intelligence on Medium


2020년 여름 엑스브레인 인턴 일지 — 시카고 대학교 3학년 황희승

Data Scientist 인턴 황희승님(사진 우측)과 XBrain 팀원들

어느새 여름이 지나가고 맑은 하늘과 알록달록한 단풍이 선선한 기운을 내뿜는 가을이 찾아왔습니다. 지난 2020년 여름, 엑스브레인 오피스를 날씨만큼이나 뜨겁게 달구었던(?) 인턴 황희승님의 짧지만 다채로웠던 3개월 간의 일지를 공유합니다.

Q. 인턴십에 대해서 간략히 설명해주세요!

2020년 6월부터 9월까지 3개월간 Data Scientist Intern으로 활동했습니다. AI/ML 회사가 실제 상업적으로 다루고 있는 데이터를 가지고 다양한 분석 및 가치 창출에 참여하고, 여러가지 논문을 통해 비즈니스 문제를 창의적으로 해결하는 방법을 배웠습니다. 현장에서 일하고 계시는 ML 엔지니어 분들 곁에서 Data Scientist로서 필요한 역량과 경험을 쌓을 수 있는 좋은 경험이었다고 생각합니다.

Q. 인턴십과 관련해 이전에 도움이 될 만한 경험이 있었나요?

저는 원래 역사와 정치를 공부하던 전형적인 문과생이었습니다. 하지만 대학생이 되고 난 후로부터 머신러닝과 인공지능의 발전 가능성에 대한 강한 믿음을 갖게 되었고, 데이터 사이언티스트가 되겠다는 꿈을 키웠습니다. 어렸을때부터 코딩 공부를 시작한 다른 친구들에 비해 조금 늦은 출발이었지만 대학교에서 컴퓨터와 머신러닝 관련 수업을 매 학기 들으며 부족하게나마 실력을 갈고 닦았습니다. 그리고 2학년 여름 현장에서 머신러닝이 어떻게 적용되는지 직접 보고 경험하기 위해 엑스브레인에 지원하게 되었습니다.

Q. 첫 데이터 사이언티스트 인턴십, 적응하기 어려웠나요?

만약 3개월간 혼자 프로그램을 구성하고, 자유분방한 분위기 속에서 스스로 결과를 내야한다는 부담이 있었다면, 많은 시간을 방황하면서 보냈을 지 모릅니다. 하지만 대표님과 여러번 대화를 하면서 저의 흥미와 능력 수준에 맞게 12주 프로그램을 구상할 수 있었습니다. ML 엔지니어 JungKap Park 님의 밀착 지도가 있었기 때문에 일을 하면서 정체가 생기거나 궁금한 점이 있으면 언제나 도움을 요청할 수 있었고, 결과에 대해 항상 솔직하고 건설적인 평가를 받을 수 있어서 좋았습니다. 또한 머신러닝 이외의 분야에 있어서 대표님, UX Designer, Software Engineer 분들과 주기적으로 소통할 수 있어서 제가 처음에 기대한 것보다 훨씬 많은 것들을 보고 들을 수 있었습니다. 덕분에 3개월동안 지루할 틈이 없었던 것 같습니다.

하루, 2주, 한달 단위로 업무나 일상에 대해 작고 큰 디스커션 세션이 있어서 본인이 어려움을 겪고 있다, 일에 능률이 떨어지고 있다, 무언가 말하고 싶은것이 있다 하면 곧바로 해결할 수 있는 기회들이 널려 있습니다. 단순히 코딩 공부하다 떠나는 곳이 아니라 인생 선배들에게 삶에 대한 궁금증, 미래에 대한 불확실성, 앞으로 배우고 겪어야 할 것들에 대해 편하게 조언을 구하고 스스로 성장할 수 있는 도약의 발판이 된 3개월이었다고 생각합니다.

Q. 어떤 업무를 다루었나요?

우선 모 유통사의 데이터를 가지고 고객들의 구매 패턴을 분석하고 수요 예측 모델을 만드는 과정에 참여했습니다. 품절관리와 재고관리는 유통사에게 매우 중요한 문제인데, 이것을 머신러닝으로 해결하기 위해 종합적인 파이프라인을 구축하는 프로젝트가 있었습니다. 저의 역할은 ML Engineer분과 함께 Raw Data 를 전처리하는 것, 수요 예측 모델에 필요한 소비자들의 Feature 추출하는 것, 그리고 품절로 인한 손실을 보정하는 모델을 구현 해보는 것이었습니다. SQL, Pandas, Gradient Boosting Tree, Logistic Regression 을 주로 다루었는데, 여러가지 모델을 실험해보면서 각각 객관적인 성능을 비교하고 장단점을 목격할 수 있었습니다.

번외로 쿠폰이 고객생애가치(CLV)에 미치는 영향을 매출의 변화로써 분석하고, TF-IDF를 이용해 회원등급별 구매 패턴의 키워드를 추출하는 실험도 해보았습니다.

두번째로 참여했던 프로젝트는 중고차의 시세를 예측하는 문제였습니다. 자동차의 회계상 감가상각은 기계적으로 계산할 수 있지만, 그것이 실제로 거래되는 가격은 다르기 때문에 과거의 거래 데이터를 가지고 어느정도 예측할 수 있습니다. EDA 를 통해 차종별로 시세 감가상각이 어떻게 다른지, 가격의 분포가 왜 다른지, 그 이유는 무엇인지 잔존가치 예측에 관한 논문을 통해 연구해보고 실제로 시세 예측 모델을 만들어 실험해보았습니다.

마지막으로 가까운 미래에 회사의 새로운 사업이 될 수 있을만한 분야에 대해 Literature Survey 를 한 다음 세미나 형식으로 발표를 진행했습니다. 첫번째는 지난 3년간 ML Pipeline Architecture에 혜성처럼 등장한 Feature Store에 대해(feature store란? 글을 참고해 주세요), 두번째는 Location Embedding에 대해 발표를 준비했습니다. 다수의 논문, 회사 제품 소개글, 전문 블로그 기사를 읽으며 각각 30분간의 발표와 30분간의 토의를 위한 세미나 준비를 했습니다.

Q. 힘들었던 점, 그리고 가장 보람을 느꼈던 것은 무엇인가요?

학교에서 수업을 듣는 것과, 현장에서 아는 것을 응용하는 것은 매우 다르다는 것을 깨닫는 과정이 제일 어려웠던 것 같습니다. 하물며 모르는 것을 스스로 배우고 터득해, 수준 있는 결과물을 내기 위해 필요한 논리적이고 효율적인 사고 방식을 훈련하는것. 처음에는 무작정 해보고 안되면 다시 시작하는 고전적인 방법들을 고집했던 것 같습니다. 하지만 시간과 자원이 한정적인 환경에서는 적합하지 않다는 점을 느꼈습니다. 가설을 세워 실험하고 반박하고 개선하는 것을 현명하게 반복할 줄 아는 ‘Grit’ 이 필요하다는 점, 때로는 모르는 것을 바로바로 물어보는게 더 빠르다는 점, 빠르게 해결하는 것보다 정확하게 아는 것이 더 중요할 때가 있다는 점, 잘 이해하는 것과 잘 설명하는 것은 다르다는 점 … 이전에 몰랐던 것들을 몸소 느끼며 배워가는 것이 제일 힘들면서도 가장 보람있었습니다.

Q. 가장 좋았던 것? 이런 사람에게 추천!

넘치는 에너지로 사무실 분위기를 업 시키는 걸 즐기는 사람, 업무 외적으로 스트레스를 덜 받고 싶은 인턴십을 하고 싶은 사람, 조금 내성적이더라도 자신이 맡은 일을 잘 해낼 수 있는 사람, 배우고 싶은 것이 많은 만큼 열정적인 사장님과 일하고 싶은 사람들에게 추천드립니다. 이전에 엑스브레인에서 인턴십을 했었던 분들도 자주 들리셔서 식사와 커피를 함께하고 가실 정도로 저 뿐만 아니라 이 곳에서 인턴십을 했던 사람들은 좋은 기억만을 가지고 있습니다. 제 생각을 얘기하거나 직원분들과 소통하는데 전혀 위화감을 느끼지 않았고, 항상 점심시간이 기대될 만큼 나름 화목하고 즐거운 회사 분위기 입니다.

Q. 마지막 한 말씀 부탁드려요!

많이 부족한 실력의 대학교 2학년’따리’ 학생을 믿고 뽑아주셔서, 그리고 좋은 추억만을 선사해주셔서 진심으로 감사드립니다. 복학해서 무엇을 더 공부해야 하고, 어떻게 진로를 설정해야 하는지 더 깊이 이해할 수 있었습니다. 빠르고 타이트하게 돌아가는 스타트업 특유의 분위기를 경험하고, 뛰어난 실력자 분들의 조언을 바로 옆에서 들을 수 있어서 진한 여운을 남기는 3개월이었습니다. 이 글을 읽게 되시는 여러분들도 이 시간을 공유했으면 합니다.