Kaggle·데이터분석예제

[Kaggle][문제]강아지 품종 분류(dog-breed-identification)

데이터요리사 2020. 7. 20. 15:00

0. 대회 설명

URL : https://www.kaggle.com/c/dog-breed-identification
강아지 사진에 알맞은 품종을 할당(분류)하는 대회

1. 데이터 읽어오기

(1) 상위 5개 항목 확인하기

(2) 종('breed')에 대한 정보 확인하기(어떤 종류가 있는지, 몇개 있는지)

(3) id 값에 해당하는 이미지 경로를 'imgpath' 필드에 저장하기
예: id= 000bec180eb18c7604dcecc8fe0dba07

할당: ../input/dog-breed-identification/train/000bec180eb18c7604dcecc8fe0dba07.jpg

(4)'imgpath'에 있는 이미지를 읽어서(load_img 활용) array로 변환(img_to_array 활용)하여 'imgArray' 필드에 저장하기
(참고)

from keras.preprocessing.image import img_to_array,load_img,ImageDataGenerator
img = load_img('/kaggle/input/dog-breed-identification/train/e7af8f590b4fbdca0779f5e606ef91a1.jpg', target_size = (100, 100))
img = img_to_array(img)
print(img.shape)

2. 데이터 전처리

(1) X: 이미지 데이터(array) 정규화하여 할당
(2) Y :정답레이블(breed)을 원핫인코딩 변환

(3) train, test set 분리하기

3. 모델 설계

# 컨볼루션 신경망의 설정
model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3), input_shape=(100, 100, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=2))
model.add(Dropout(0.25))#과적합을 막기위해 날려버림

model.add(Conv2D(64, kernel_size=(3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=2))
model.add(Dropout(0.25))#과적합을 막기위해 날려버림

model.add(Conv2D(128, kernel_size=(3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=2))
model.add(Dropout(0.25))#과적합을 막기위해 날려버림

model.add(Flatten())
model.add(Dense(256, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(120, activation='softmax'))

4. 모델 컴파일

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

5. 학습

# 모델 최적화 설정
MODEL_DIR = './model/'
if not os.path.exists(MODEL_DIR):
    os.mkdir(MODEL_DIR)

modelpath="./model/{epoch:02d}-{val_loss:.4f}.hdf5"
checkpointer = ModelCheckpoint(filepath=modelpath, 
                               monitor='val_loss', verbose=1, 
                               save_best_only=True)
early_stopping_callback = EarlyStopping(monitor='val_loss', patience=10)


# 모델의 실행
history = model.fit(X_train, Y_train, validation_data=(X_test, Y_test), 
                    epochs=30, batch_size=200, verbose=0, 
                    callbacks=[early_stopping_callback,checkpointer])

6. 검증

# 테스트 정확도 출력
print("\n Test Accuracy: %.4f" % (model.evaluate(X_test, Y_test)[1]))

# 테스트 셋의 오차
y_vloss = history.history['val_loss']

# 학습셋의 오차
y_loss = history.history['loss']

# 그래프로 표현
x_len = numpy.arange(len(y_loss))
plt.plot(x_len, y_vloss, marker='.', c="red", label='Testset_loss')
plt.plot(x_len, y_loss, marker='.', c="blue", label='Trainset_loss')

# 그래프에 그리드를 주고 레이블을 표시
plt.legend(loc='upper right')
plt.grid()
plt.xlabel('epoch')
plt.ylabel('loss')
plt.show()

728x90

'Kaggle·데이터분석예제' 카테고리의 다른 글

Kaggle 이란? (0)	2020.08.30
[Kaggle][답]강아지 품종 분류(dog-breed-identification) (1)	2020.07.20
[파시데]파이썬 기본 연습문제 (4)	2020.07.20
[Kaggle][문제]타이타닉(titanic) (0)	2020.07.20
[Kaggle][답]타이타닉(titanic) (0)	2020.07.20

현재글[Kaggle][문제]강아지 품종 분류(dog-breed-identification)

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

데린이를 위한 데이터레시피

[Kaggle][문제]강아지 품종 분류(dog-breed-identification)

0. 대회 설명

1. 데이터 읽어오기

2. 데이터 전처리

3. 모델 설계

4. 모델 컴파일

5. 학습

6. 검증

'Kaggle·데이터분석예제' 카테고리의 다른 글

'Kaggle·데이터분석예제'의 다른글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

[Kaggle][문제]강아지 품종 분류(dog-breed-identification)

0. 대회 설명

1. 데이터 읽어오기

2. 데이터 전처리

3. 모델 설계

4. 모델 컴파일

5. 학습

6. 검증

'Kaggle·데이터분석예제' 카테고리의 다른 글

'Kaggle·데이터분석예제'의 다른글

관련글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역