저희 회사에서도 그렇고, 비즈니스 현장에서는 데이터 사이언티스트(=데이터 분석가)가 부족하다고 합니다. 하지만 제 주위에는 분석 업무로 일하고 있는 지인들이 많을 뿐만 아니라, 분석가로 취업하고 싶은 취준생도 많거든요.
Continue reading
- 이번 글에서는 시계열 데이터 클러스터링에 대해 정리해 보았습니다.
- 이론 위주로 다루었고, 논문 리뷰와 데이터 실습은는 다음 포스팅에서 진행하겠습니다.(원하는 데이터 못구함😭)
- 많은 연산을 필요로 하는 DTW의 단점을 해결할 수 있는 알고리즘(tadpole,k-shape clustering)에 대해서도 리뷰하였습니다.
Continue reading
- 최근 논문을 읽으려고 하는데, 오랜만의 공부라 그런지 어려워하는 저를 보며 충격을 먹었습니다.
- 기본 개념조차 까먹고 있어서, 다시 공부 시작하는 겸 정리해보려고 합니다.
- 이번 글은 제가 다시 보기 위해 쓰는 글이다보니 다소 러프할 수 있습니다😢
Continue reading
- 이번 글에서는 제조 분석에서의 분석 목적별 모델링 및 평가지표를 정리해 보았습니다.
- “이게 무조건 답이다!”라고 단정 짓는 것이 아닌, “일반적으로 이런 것들을 쓰더라~” 정도로 가볍게 읽어주시면 감사하겠습니다.
- 데이터와 모델만 있으면 분석은 끝난 것이라고 절대 생각하지 않지만, 누군가에게 설명할 때는 이것만큼 편한 것이 없더라구요!😂
- 제가 잘못된 지식을 전파하여 그릇된 정보를 받아들이시게 될까봐, 여러 레퍼런스를 참고하여 작성해 보았습니다. 가볍게 읽어주시길 바랍니다!🙏
Continue reading
- 이번 글에서는 시계열 데이터에서 누락된 시간의 범위를 구하는 SQL문을 정리해보았습니다.
- 종종 이런 케이스가 발생하여 누락된 시간 범위를 구하는 일이 생기는데, 그때마다 빠르게 일처리를 진행해야하는 제자신을 돕기 위해 이 글을 바칩니다. (For Me😂)
- 간단한 쿼리지만 장황(?)하게 써보았으니, ‘제조 데이터는 이런 상황도 생기는구나!’하고 가볍게 참고만 해주시면 감사하겠습니다.
Continue reading
- 이번 글에서는 기상청 API허브를 통해 데이터를 로드하는 방법을 정리해보았습니다.
- 아무래도 설비 장비가 외부에 있어서 외기온도에 영향을 많이 받기 때문에, 기상청 데이터가 매 분석마다 필요한 상황입니다.⛅
- 비록 최소 단위가 ‘시간’이지만 n년 이상의 데이터를 볼 때 유용하게 쓰이기에, Data I/F 하는 과정을 기록해보았으니 참고 부탁드립니다.
Continue reading
- 이번 글에서는 데이터 분석 관련 잘 정리된 사이트 리스트를 정리해보았습니다.
- 정리된 의견은 주관적이니 참고만 부탁드립니다.😊
- 사이트 리스트는 지속적으로 업데이트 될 예정입니다.
Continue reading
Continue reading