글또 2기를 시작하며

2018-11-11

글또 라는 모임의 2기 활동에 참여합니다. 글쓰는 또라이가 세상을 바꾼다 라는 재밌는 이름의 개발자 글쓰기 모임입니다. 예전부터 성윤님의 존재를 알고 팔로잉하고 있었는데, 글또 2기 모집글 올리신걸 보고 바로 신청했습니다.

지난 수요일에 첫 모임이 있었고, 앞으로 6개월 동안 2주에 하나씩 글을 쓰게 됩니다. 관심 분야별로 프론트, 백엔드+안드로이드, 머신러닝, 데이터 엔지니어링 4개 팀으로 나눴는데, 저는 데이터 엔지니어링 팀입니다. 데이터 관련 개발자 분들이 생각보다 많이 계셔서 더욱 기대됩니다.

일하다보면 시간을 두고 공부하고 싶은 주제들이 생기는데, 그동안 게으름 때문에 못보고 있었습니다. 점점 일하는 속도가 빨라져서 시간이 생길거라는 막연한 생각으로 지냈었는데, 일한지도 이제 2년이 좀 넘었고, 이렇게 외부의 자극으로 새로운 변화를 이끌어낼 때가 된 것 같습니다. 글또를 통해 꾸준히 글을 쓰면서, 당장의 업무에서 살짝 벗어난 주제들도 들여다보려고 합니다.

  • Non-Blocking JDBC : 데이터 엔지니어링 보다는 백엔드 쪽의 주제가 되겠습니다. 신규 프로젝트 개발때 Spring Data 의 Repository 인터페이스로 RDBMS 를 다뤘었는데, HTTP 쪽의 WebClient 인터페이스처럼 Non-Blocking 이면 좋지 않을까 막연히 생각했습니다. 관련 내용들을 파보면서, 이해가 미진한 Non-Blocking 쪽의 개념을 다지는게 목표입니다.
  • Data Warehouse / Lake : 다양한 소스의 데이터들을 어떻게 잘 분석할 수 있을까 고민입니다. 요새 Presto 를 도입해보고자 파보고 있는데 좀 정리가 되면 간단히 글로 적어볼 수 있을 것 같습니다. Presto 에 대한 관심은 사실 제 게으른 성격이 발현된 부분이기도 합니다. 어떻게 하면 ETL 을 안하고, 데이터들을 본연의 소스에 그대로 둔채로 한번에 분석할 수 있을까 찾다보니 Presto 에 이르렀는데, 나중을 생각하면 결국 BigQuery 처럼 잘 만든 managed service 를 써야하지 않을까 싶기도 합니다. 고민이 많습니다.
  • 기본적인 ML 알고리즘 : 최근 몇주동안 데이터쪽 직무의 몇건의 면접에 참여했습니다. 많은 분들이 업무 외에 개인적으로 Kaggle 이나 데이터 해커톤에 참여하면서 역량을 쌓아나가시는것을 보고 감명을 받았습니다. 그동안은 데이터 사이언스는 제 업무가 아니라며 멀리 두고 있었는데 차차 기본기를 쌓아나가려고 합니다.