본문 바로가기

전체 글74

구인/구직의 기록 - 데이터 분석가@스타트업 2년 반 정도 스타트업에서 데이터 분석가로 일했다. 그동안 다른 사람을 채용하기 위한 인터뷰를 스무번쯤 했고, 최근 이직을 위해 내가 지원한 인터뷰도 열번 정도된다. 그 과정에서 알게된 점을 정리 해두고자 한다. (한글을 사랑하는 마음으로! 이제부터 인터뷰는 모두 면접이라고 쓰려고 함) 가장 먼저 얘기하고 싶은것은 면접은 일방적인 ‘선발’이 아니라, ‘탐색’의 자리라는 점이다. 그러니까 쫄 필요 전혀 없다! ^^; 빗대어보자면 시험이 아니고, 소개팅이나 맞선에 가까운 자리라는거다. 조금만 노력한다면 지원자도 면접과정에서 이 회사가 나랑 맞는지 아닌지를 꽤나 정확하게 알아챌 수 있다. 일단 회사에 가보면 느끼게 되는 첫인상이 있고, 말을 섞어보지 않아도 오가는 직원들의 표정과 말투에서 우리는 많은것을 알게.. 2017. 3. 6.
몇 번째 이벤트에 반응했는지 확인하는 Scala 코드 예제 오늘은 Spark + Zeppelin 상에서 돌아가는 scala 코드 예제를 좀 보여드리려고 합니다. 이걸 보시면 map reduce의 개념과 로그 데이터 처리를 어떤 식으로 하는지에 대한 대략의 감을 잡으실 수 있을것 같아서요.코드가 어렵지 않습니다. 포기하지 말고 읽어보세요. :) 아래와 같이 유저별 이벤트 시간과 반응여부 데이터를 가지고 있을때, 각각의 유저별로 몇번째 이벤트에서 처음 반응(O)을 했는지 알아보려고 합니다. val test_rdd = sc.makeRDD(List( ("user1","2016-07-01 03:03:00","X") ,("user1","2016-07-01 15:15:00","O") ,("user1","2016-07-01 16:16:00","X") ,("user1","201.. 2017. 2. 12.
인생의 고민을 함께하는 동지를 만난 느낌... ('열한 계단'을 읽고) 올해는 100권의 책을 읽어보기로 했습니다. 보통 연 50여권의 책을 읽어온 저에게는 도전적인 목표입니다. 맘이 급해졌죠. 시간이 있을까? 시간은 있더군요! ... 주중엔 회사에 오가며 읽고, 가끔 점심시간에 혼자 샌드위치나 샐러드 먹으며 읽기도 하구요, 주말엔 읽을 책이 있으니 시간을 효율적으로 쓰게돼 두꺼운 책 한권쯤은 거뜬히 읽어내게 되더라구요. 재미있는 책이 있을까?제가 폭넓은 독서형은 아니다보니 걱정됐어요. 억지로 머리에도 안들어오는데 꾸역꾸역 읽게되거나, 반대로 목표 숫자에 눈이멀어 쉬운 소설책들만을 읽어제낄것 같기도 했어요. 그런데, 세상은 넓고 읽을 책은 많더군요! 아직도 제가 접하지 않/못 했던 많은 분야가 있고, 그 분야마다 제 수준에 맞춰서 쉽고 재미있게 쓰여진 입문서들이 있었습니다... 2017. 2. 11.
Data를 추출할때 고려할 것 요사이 여러번 데이터 추출에 대한 교육을 할일이 있었습니다. Database도 설명하고 Big Data를 이해하기 위해 Log도 설명하고, 이걸 추출하는 기본 방법을 알려드리기 위해 SQL 이랑 간단한 프로그래밍도 설명했죠. 그런데 뭔가 허전하더라구요. 기법이나 기술을 안다고 잘 추출할 수 있을까 싶은.... 데이터를 제대로! 잘 추출하기 위해서는 생각해야 할 지점이 있고, 이런건 뭐랄까 자세나, 단계 같은 내용이 되더라구요. 그래서 이걸 정리해서 자료로 만들어서 설명을 했더랬습니다. 지나고 나니 제 생각에 이게 더 중요하고 구하기 어려운 자료겠구나 싶어 슬라이드 쉐어에도 올리게 되었네요.도움이 되시길 바랍니다. http://www.slideshare.net/SooKyungChoi/data-52877608 2015. 9. 20.