본문 바로가기

머신러닝

(3)
머신러닝 입문자 가이드 : 피처 엔지니어링 이란? 안녕하세요. 오늘은 간단하게 피처 엔지니어링에 대한 설명을 하겠습니다. 피처 엔지니어링은 머신러닝 모델을 만드는데 있어 필수라고 할 수 있습니다. 그렇다면 이 피처 엔지니어링이 무엇인지 간략하게 알아보도록 하죠 :) 머신러닝 모델이 좋은 성능을 내려면 반드시 피처 엔지니어링은 필요합니다. 시계열 데이터를 다루는 대회에서는 유의미한 파생 변수를 생성하기 위한 몇 가지 기술들이 있습니다. 날짜/시간의 정보가 포함된 데이터의 경우, 주중/주말 여부, 공유일 여부, 아침/낮/밤, 계절, 학기/시험기간.방학 등 다양한 파생변수를 생성할 수 있습니다. 그러나 모든 파생 변수가 모델에 유의미 한 것은 아닙니다. 식별력이 있는 변수는 모델마다, 주제마다 다르기 때문에 모든 가능성을 시도해보는 것이 좋습니다. Tabul..
머신러닝 입문자 가이드(1) : 케글 대회 구조 알아보기 안녕하세요 :) 앞으로 저의 지식도 차근차근 정리해 볼 겸 머신러닝 입문자 가이드라는 거창한 제목을 달아 봤습니다! 거창한 제목에 비해 별 체계없이 기본지식들을 정리해서 올릴 예정인데요. 많은 도움 얻어가셨으면 좋겠습니다. 오늘은 케글이 낯선 분들을 위해 준비한 글입니다. 케글은 홈페이지 대부분이 영어로 되어 있기 때문에 처음 들어가면 익숙하지 않은 환경에 당황하실 수 있는데요, 각 게시판의 특징(?)과 함께 구조에 대해 알아 봅시다. 먼저 케글 경진대회 홈페이지에 들어오게 되면 경진대회 첫 페이지인 [Overview]를 만날 수 있는데요, 말 그대로 경진대회에 출제되는 문제에 대해서 설명하는 페이지 입니다. 그 아래를 보면 [Evaluation]이라는 탭이 있는데요, 이 탭에서는 경진대회에서 사용되는 ..
머신러닝에 가장 적합한 언어는? 안녕하세요 :) 그동안 배웠던 지식들을 정리하고 리마인드 하기 위해 다시 블로그를 운영하려 합니다. 많은 관심 부탁드립니다. 오늘은 가장 기본으로 머신러닝에 입문하려는데 어떤 언어를 사용해야 하나요?라는 질문에 대한 답이 될 수 있는 글일 것 같습니다. 이전에 읽었던 서적에서는 이와 같이 밝히고 있습니다. "손에 익숙한 프로그래밍 언어가 이미 있다면, 그 언어로 시작하시고, 그것이 아니라면 무조건 파이썬을 강력 추천한다!!" 저 또한 이 의견에 굉장히 공감을 많이 하고 있습니다. 코딩을 아주 조금이라도 알고 계신 분이라면 파이썬에 대해 들어 보셨을 텐데요, 실제로 파이썬은 2018년 기준 머신러닝에 가장 많이 사용되고 있는 프로그래밍 언어입니다. 다들 한번쯤 '대세'가 아닌 제품을 구입하여 낭패를 봤던 ..