if (kakao) 2021 컨퍼런스에서 Data 관련 기술 발표 세션을 소개합니다.
듣고 싶은 세션이 있다면, 컨퍼런스 사이트에서 관심 세션으로 등록해 주세요. 세션 영상이 공개되면 알려드릴게요. 참고로, 개발자를 위한 세션과 프로그램은 Day2 탭에서 확인할 수 있습니다.
컨퍼런스 홈페이지에 가입하고 사전등록하면, 한정판 이모티콘도 증정합니다.
많은 관심과 참여 부탁드려요.
대량의 스트림 데이터를 실시간으로 분류하기 : Elasticsearch Percolator를 이용한 콘텐츠 분류
대량의 스트림 데이터를 실시간으로 분류하면서 늘어나는 데이터와 분류 조건으로 발생하는 문제들을 Elasticsearch Percolator를 활용해 개선하는 방법을 공유합니다.
- 발표자 : rick.lee(이규열)
– rick.lee은 카카오 콘텐츠플랫폼개발팀에서 Software Engineer로 일하고 있으며 사내에서 유통되는 콘텐츠를 수집, 분석 그리고 유통하는 멋진 플랫폼을 개발하고 있습니다. - 추천대상 : 대량의 데이터를 실시간으로 분류하고 싶은 개발자, Elasticsearch Percolator를 사용해 보고 싶은 개발자
- #실시간처리 #데이터분류 #스트림데이터처리
300GB 데이터로 어떻게 학습을 할 수 있을까?
광고추천팀에서 전환 최적화 타게팅 모델을 딥러닝으로 전환하면서 학습 데이터의 규모가 크고 광고주 별로 많은 모델을 처리하다 보니 많은 어려움을 겪었습니다.
모델의 성능/효율을 유지하면서 어떻게 하면 데이터를 줄일 수 있을까 고민하고 튜닝했던 경험들을 공유합니다.
– 데이터의 볼륨과 데이터의 처리 시간
– 하둡 데이터를 처리할 때 병목구간
– 데이터를 줄이기 위한 방법들에는 어떤 것들이 있는지 소개하고 우리 상황에 적합한 방법을 선택한 과정
- 발표자 : peter.han(한민호)
– 전환 최적화 타게팅 플랫폼을 개발하고 있습니다. - 추천대상 : 머신러닝 엔지니어, 데이터 사이언티스트
- #FeatureEngineering #DataEngineering #Machine Learning
추천 시스템 airflow 2.0 도입기
추천시스템 내 workflow 개선을 위해 airflow를 도입했던 이유와, 쿠버네티스에서 airflow를 안정적으로 운영하기 위해 했던 고민들, 그리고 2.0으로의 버전업 경험과 추천시스템 내에서 이를 어떻게 활용하고 있는지 공유합니다.
- 발표자 : jerry.4(윤정수)
– jerry.4는 카카오 추천팀에서 데이터 파이프라인과 ML 시스템 개선, 키워드 광고 추천 업무를 맡고 있습니다. 카카오에 합류한지 1년이 조금 지난 주니어 개발자로, 더욱 다양한 기능을 제공하면서 안정적인 추천시스템을 만들기 위해 노력하고 있습니다. - 추천대상 : airflow 업그레이드를 고민하고 있는 개발자, 쿠버네티스에서 에어플로우를 효율적으로 운영하고 싶은 개발자
- #Airflow #Kubernetes #DataEngineering #MLOps
PostgreSQL ecosystem
안녕하세요. 카카오에서 postgresql 디비의 운영을 담당하고 있는 비버입니다. postgresql ecosystem의 핵심 개념인 extension에 대해 알아보고 extension으로 개발된 citus와 timescaledb에 대해 소개해 드리겠습니다.
- 발표자 : biber.baek(백수환)
– postgresql 디비의 운영을 담당하고 있는 비버입니다. - 추천대상 : postgresql에 대해 궁금하신 개발자와 DBA
- #database #postgresql
카카오 공용 하둡 운영 사례
공용 하둡 클러스터 구축 시 고려해야 할 포인트와 장애 대응 사례에 대해 소개합니다.
- 발표자 : jace.beleren(이재영)
– 전사 공용 하둡 클러스터 구축 및 운영을 담당하고 있습니다. - 추천대상 : 공용 하둡 클러스터 운영에 관심 있으신 분
- #hadoop
Druid@Kakao
Kakao의 Druid 도입 사례 및 multi-tenant 클러스터를 소개합니다.
- 발표자 : evan.hwangbo(황보동규)
– evan.hwangbo는 카카오 하둡엔지니어링파트의 데이터 플랫폼 엔지니어로, 카카오 크루 누구나 HBase, Druid를 빠르고 안정적으로 활용할 수 있도록 돕고 있습니다. 데이터 엔지니어링 업무에 관한 다양한 고민거리에 적절히 방법을 제시하고 문제 해결할 수 있도록 데이터 웨어하우스와 실시간 데이터 처리 기술 전반에 관심이 많습니다. - 추천대상 : Druid 도입을 고민하시는 분, 데이터 실시간 처리 관련 문제를 겪고 계신 분
- #druid