전체 글 67

[Kaggle][문제]강아지 품종 분류(dog-breed-identification)

0. 대회 설명 URL : https://www.kaggle.com/c/dog-breed-identification 강아지 사진에 알맞은 품종을 할당(분류)하는 대회 1. 데이터 읽어오기 (1) 상위 5개 항목 확인하기 (2) 종('breed')에 대한 정보 확인하기(어떤 종류가 있는지, 몇개 있는지) (3) id 값에 해당하는 이미지 경로를 'imgpath' 필드에 저장하기 예: id= 000bec180eb18c7604dcecc8fe0dba07 할당: ../input/dog-breed-identification/train/000bec180eb18c7604dcecc8fe0dba07.jpg (4)'imgpath'에 있는 이미지를 읽어서(load_img 활용) array로 변환(img_to_array 활용)..

[파시데]파이썬 기본 연습문제

안녕하세요. 데이터 요리사, 루나입니다. 파이썬 기본 이론을 제대로 알고 있는지 다음 문제를 스스로 해결해보세요. - 이 글은 '파이썬으로 시작하는 데이터 분석'에서 배우는 문제를 일부 소개합니다. - 코드의 자세한 설명은 책의 내용을 참고해주세요. - '더보기'를 클릭하시면 샘플 답안을 확인하실 수 있습니다. - 제시한 답안은 샘플 답안입니다. 동일한 코드를 사용하지 않아도 정답일 수 있습니다. 1 기온이 0ºC보다 높으면 ‘아이스 아메리카노’를 출력하고, 그렇지 않은 경우에는 ‘따뜻한 아메리카노’를 출력하는 함수를 만들어 보세요. 샘플 답안 더보기 # 함수 def coffee(temp): if temp > 0 : print("아이스 아메리카노") else: print("따뜻한 아메리카노") # 함수 ..

[Kaggle][문제]타이타닉(titanic)

1. 대회 설명 www.kaggle.com/c/titanic 타이타닉호에서 생존한 승객을 예측하는 모델을 만듭니다. 평가방법 : 승객의 생존여부를 0, 1로 예측하여 제출하고, 정확도를 계산하여 순위를 결정 2. 데이터 설명 Variable Definition Key survival 생존여부 0 = No, 1 = Yes pclass 티켓 등급 1 = 1st, 2 = 2nd, 3 = 3rd sex 성별 Age 나이 sibsp 타이타닉에 탑승한 형제/자매 수 parch 타이타닉에 탑승한 부모/자녀 수 ticket 티켓번호 fare 운임(티켓요금) cabin 객실 번호 embarked 탑승한 곳(항구) C = Cherbourg, Q = Queenstown, S = Southampton 3. 데이터 전처리 (1..

[Kaggle][답]타이타닉(titanic)

Titanic: Machine Learning from Disaster 1. 대회 설명 URL: https://www.kaggle.com/c/titanic 설명: 타이타닉호에서 생존한 승객을 예측하는 모델을 만듭니다. 키워드: #분류 # classification 평가방법: 승객의 생존여부를 0, 1로 예측하여 제출하고, 정확도(accuracy)를 계산하여 순위를 결정 2. 데이터 Variable Definition Key survival 생존여부 0 = No, 1 = Yes pclass 티켓 등급 1 = 1st, 2 = 2nd, 3 = 3rd sex 성별 Age 나이 sibsp 타이타닉에 탑승한 형제/자매 수 parch 타이타닉에 탑승한 부모/자녀 수 ticket 티켓번호 fare 운임(티켓요금) ca..

[Kaggle][답]샌프란시스코 범죄 예측(sf-crime)

San Francisco Crime Classification 1. 대회 설명 URL: https://www.kaggle.com/c/sf-crime 설명 1934년부터 1963년까지 샌프란시스코의 알카트라즈섬에 악명 높은 범죄자들을 수용 한 것으로 유명했습니다. 이 대회는 약 12년 동안 샌프란시스코의 모든 지역에서 발생한 범죄 보고서를 제공합니다. 시간과 장소가 주어지면 발생한 범죄의 유형(카테고리)을 예측하여 제출합니다. 키워드 #분류 # classification 평가방법 범죄 유형별 범죄 발생 가능성을 확률로 계산하여 제출하면, multi class logarithmic loss를 사용하여 정확도를 측정합니다. 2. 데이터 본 대회는 샌프란시스코 오픈 데이터 SF OpenData에서 제공하는 범죄..

[Kaggle][문제]샌프란시스코 범죄 예측(sf-crime)

URL: https://www.kaggle.com/c/sf-crime 데이터 훑어보기 csv 파일을 데이터프레임으로 읽기 학습 데이터 셋의 상위 5개 항목 출력 학습 데이터 셋의 각 필드 데이터 분포(평균, 최소값, 최대값 등)를 살펴보기 각 컬럼의 데이터 타입 확인하기 범죄의 범주 'Category'는 어떤 값이 있는지 확인하기 데이터 할당/변경하기(create, update) Dates 필드의 데이터타입을 'datetime64' 타입으로 변경하기 범죄 사건 발생 날짜 및 시간 정보를 포함한 'Dates'필드의 값을 연도별, 월별, 일별, 시간별로 분석하기 위해서 datetime64타입으로 변환합니다. 문자열 파싱을 해서 분석할 수도 있지만, datetime64 타입으로 변환하면 파이썬 내장함수를 사용..

안녕하세요? 데이터 요리사, 루나입니다.

안녕하세요. 데이터 요리사, 루나입니다. 데이터 레시피는 데이터 분석, 인공지능을 이제 막 시작하시려는 분들을 위한 공간입니다. 데이터 레시피의 데이터요리사 루나를 소개합니다. 1 루나라는 닉네임 이 닉네임은 2016년 사내 창업 프로그램에서 닉네임이 필요해서 사용하기 시작했어요. 저의 두 아이들의 닉네임(루비와 나무)을 한 글자씩 따서 지었구요. 어감도 좋고, 루나(달의 여신)이라는 뜻도 저에게는 매력적으로 느껴지는 닉네임이에요. 개인적으로 루나라고 불리었던 그 시절에 정말 행복하게 일 했었어서 그 프로젝트가 참 기억에 많이 남습니다. 그 때의 좋은 기운을 담아 데이터레시피에서도 루나라는 데이터요리사 페르소나로 활동하려고 결정했습니다. 2 강의, 프로젝트 멘토링 이력 저는 지금까지 기업, 공공기관, 학..

소개 2020.07.10
LIST