Kaggle·데이터분석예제 14

[파시데]삼성전자 주가 데이터로 데이터프레임 연습 - pandas, dataframe, 데이터전처리

안녕하세요. 데이터 요리사, 루나입니다. pandas의 기본 기능을 얼마나 알고 계신가요? 다음 문제를 스스로 해결해보세요. - 이 글은 '파이썬으로 시작하는 데이터 분석'에서 배우는 문제를 일부 소개합니다. - pandas의 자세한 설명은 책의 내용을 참고해주세요. - '더보기'를 클릭하시면 샘플 답안을 확인하실 수 있습니다. - 제시한 답안은 샘플 답안입니다. 동일한 코드를 사용하지 않아도 정답일 수 있습니다. 1 준비 - 삼성전자 주가 데이터 불러오기 야후 파이낸스로부터 삼성전자 주가 데이터를 다운로드 받습니다. 2020년 1월 1일부터 2021년 6월 30일 데이터를 다운 받았습니다. 만약 다른 종목이나 날짜를 조정하고 싶다면 get_datat_yahoo()의 파라미터를 조절하여 설정해주세요. !..

파이썬 기본 문법, 10분 안에 정리하기

안녕하세요. 데이터 요리사, 루나 입니다. 파이썬 기본 문법은 배웠는데, 아직 익숙하지 않으시다구요? 파이썬 책을 들고다니기엔 무겁고, 하나씩 검색해서 하기에는 너무 시간이 오래 걸리시는 분들을 위해서 파이썬 기본 문법 정리본을 공유드립니다. pdf도 함께 첨부했으니 인쇄하셔서 사용하세요~ 1 파이썬 기본 문법 2 파이썬 기본 함수 pdf 파일 위에 정리한 내용 인쇄가능한 pdf 파일입니다. 함께 보면 좋은 글 ※ 이 글의 내용을 상업적으로 무단 활용, 편집하는 것은 금지하고 있습니다. 강의, 출판 등 상업적 이용이 필요하신 경우, 문의 바랍니다.

주피터 노트북 사용법, 테마 셋팅방법

안녕하세요. 데이터 요리사, 루나 입니다. 주피터 노트북 실행부터 설정방법까지 정리해볼께요! 1 다양한 파이썬 개발환경 : 통합 개발 환경 vs 인터렉티브 개발환경 파이썬의 특징 중 하나가 코드가 바로바로 실행된다는 것임 Java, C 언어 등의 프로그래밍 언어는 이클립스, 비주얼스튜디오 같은 통합개발환경(IDE)에서 코드를 작성하는 것이 일반적이나 파이썬은 통합개발환경(IDE) 뿐만 아니라 인터렉티브 개발 환경도 제공한다는 것이 큰 장점! '인터렉티브하다'는 것은 뭐냐? 코드 작성하고 실행하면 결과가 바로 아래 보임. 작성한 코드와 연산 결과를 곧장 확인 가능할 뿐만 아니라 결과도 함께 저장할 수 있음. (숙제 검사할 때 아주 좋음) 인터렉티브 개발환경 중 대표적인 것이 바로 주피터 노트북(Jupyte..

Mecab 윈도우 설치 방법

somjang.tistory.com/entry/Windows-%EC%97%90%EC%84%9C-Mecab-mecab-%EA%B8%B0%EB%B0%98-%ED%95%9C%EA%B5%AD%EC%96%B4-%ED%98%95%ED%83%9C%EC%86%8C-%EB%B6%84%EC%84%9D%EA%B8%B0-%EC%84%A4%EC%B9%98%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95 mecab 설치 §https://github.com/Pusnow/mecab-python-msvc 1) mecab-ko-msvc 설치: C 기반으로 만들어진 mecab이 윈도우에서 실행될 수 있도록 하는 역할 -https://github.com/Pusnow/mecab-ko-msvc/releases/tag/rele..

Kaggle 파일 제출하기

Notebooks 탭에서 New Notebook을 선택합니다. 노트북 환경 셋팅에서 원하는 작업환경을 셋팅합니다. 저는 Python 언어, Notebook 형태의 에디터를 선택했습니다. 추가로 ADVANCED SETTINGS 에서 Accelator로 GPU를 사용하도록 설정하였습니다. 하드웨어 가속기(GPU 또는 TPU) 설정은 작업 도중에 변경이 불가능하니 꼭 사전에 셋팅할 수 있도록 주의해주세요. 노트북 형태의 작업 환경이 생성된 화면입니다. 사용방법이 다른 노트북(주피터 노트북 또는 Colab) 환경과 크게 다르지 않습니다. 처음에 Kaggle 환경에서 데이터 분석 할 때 가장 헤매는 부분이 데이터를 어디에서 읽어와야하는지, 어떻게 제출해야하는지 하는 부분입니다. 입력 데이터는 우측의 Data 섹션..

Kaggle-Colab 연동방법

Kaggle은 파이썬 명령으로 Kaggle의 일부 기능을 사용할 수 있도록 API를 제공합니다. github.com/Kaggle/kaggle-api Kaggle/kaggle-api Official Kaggle API. Contribute to Kaggle/kaggle-api development by creating an account on GitHub. github.com 오늘은 Kaggle API를 활용하여 구글 Colab에서 Kaggle 대회의 데이터셋을 다운로드 받고 제출하는 방법을 정리해보겠습니다. 1. Kaggle API 토큰 발행 우선 Kaggle 사이트에서 자신의 계정과 API 토큰을 발행하는 작업이 필요합니다. Kaggle의 우측 상단에 아이콘을 클릭하고, My Account를 선택합니다..

Kaggle 이란?

Kaggle(https://www.kaggle.com/)은 전 세계 데이터 사이언티스트들이 데이터를 분석할 수 있도록 대회를 개최하고, 분석 내용을 토론할 수 있는 커뮤니티를 제공하는 플랫폼입니다. 데이터 분석 대회 뿐만 아니라 데이터 분석을 위한 데이터 셋, 파이썬, R 기반 개발 환경, 초보 데이터 분석가들을 위한 무료 강의 등 다양한 기능을 제공합니다. 데이터 분석을 할 때 분석할 데이터 셋을 구하고 문제를 정의하는 것 부터 쉽지 않습니다. Kaggle은 이런 번거로운 작업들을 미리 다 해두었기 때문에 데이터 전처리와 분석에만 집중 할 수 있습니다. Kaggle 대회 참여방법 Kaggle 사이트에 접속해서 **Compete** 메뉴를 선택하면 다양한 대회 목록을 볼 수 있습니다. 대회 종류는 크게 ..

[Kaggle][답]강아지 품종 분류(dog-breed-identification)

0. 대회 설명 URL : https://www.kaggle.com/c/dog-breed-identification 강아지 사진에 알맞은 품종을 할당(분류)하는 대회 1. 데이터 읽어오기 (1) 상위 5개 항목 확인하기 정답확인 label = pd.read_csv('../input/dog-breed-identification/labels.csv') sample_submission = pd.read_csv('../input/dog-breed-identification/sample_submission.csv') label.head() (2) 종('breed')에 대한 정보 확인하기(어떤 종류가 있는지, 몇개 있는지) # label['breed'].value_counts().index print(len(lab..

[Kaggle][문제]강아지 품종 분류(dog-breed-identification)

0. 대회 설명 URL : https://www.kaggle.com/c/dog-breed-identification 강아지 사진에 알맞은 품종을 할당(분류)하는 대회 1. 데이터 읽어오기 (1) 상위 5개 항목 확인하기 (2) 종('breed')에 대한 정보 확인하기(어떤 종류가 있는지, 몇개 있는지) (3) id 값에 해당하는 이미지 경로를 'imgpath' 필드에 저장하기 예: id= 000bec180eb18c7604dcecc8fe0dba07 할당: ../input/dog-breed-identification/train/000bec180eb18c7604dcecc8fe0dba07.jpg (4)'imgpath'에 있는 이미지를 읽어서(load_img 활용) array로 변환(img_to_array 활용)..

[파시데]파이썬 기본 연습문제

안녕하세요. 데이터 요리사, 루나입니다. 파이썬 기본 이론을 제대로 알고 있는지 다음 문제를 스스로 해결해보세요. - 이 글은 '파이썬으로 시작하는 데이터 분석'에서 배우는 문제를 일부 소개합니다. - 코드의 자세한 설명은 책의 내용을 참고해주세요. - '더보기'를 클릭하시면 샘플 답안을 확인하실 수 있습니다. - 제시한 답안은 샘플 답안입니다. 동일한 코드를 사용하지 않아도 정답일 수 있습니다. 1 기온이 0ºC보다 높으면 ‘아이스 아메리카노’를 출력하고, 그렇지 않은 경우에는 ‘따뜻한 아메리카노’를 출력하는 함수를 만들어 보세요. 샘플 답안 더보기 # 함수 def coffee(temp): if temp > 0 : print("아이스 아메리카노") else: print("따뜻한 아메리카노") # 함수 ..

LIST