본문 바로가기
  • 가제가재_기록블로그

Python4

_Dataset의 구조와 이해 Dataset의 구조와 이해¶ 머신러닝을 배우기 위해 Scikit-Learn 라이브러리를 공부하고 있다. 해당 라이브러리에는 기본으로 제공하는 Dataset들이 있는데 처음 보는 구조이다. 어떤 구조이길래 머신러닝에 적합한지, 또 인자는 어떤 식으로 구성되어있는지 알기 위해 이 글을 작성한다. Dataset의 정의¶위키 위키에서 정의한 바로는 '데이터셋' = '자료 집합' 이란 자료가 모여있는 형태를 말한다. 일반적으로 자료 집합은 하나의 데이터 베이스 테이블의 내용이나 하나의 통계적 자료 행렬과 일치하며 각 row는 제시된 자료 집합의 주어진 멤버와 일치한다. 이 자료 집합은 변수 개개의 값들을 나열하는데, 이를테면 자료 집합의 각 멤버에 대한 물처의 높이와 무게를 들 수 있다. (후략) 요약하면 특정.. 2023. 8. 23.
파이썬 통계분석_TIL(scipy , pingouin) 파이썬 통계분석을 배웠다. 기록용 - 개념은 얼추 배웠으나 우선 빠르게 써먹어야 하니 방법만 적는다. - 개념과 정의 등은 추후 작성한다.(링크던 뭐던) 참고 - Learning statistics with pyton - Pingouin Documentation - Scipy Documentation 문제 01. A와 B 두 그룹의 점수가 하나의 DataFrame으로 있다. 이 두 그룹의 평균 점수가 통계적으로 차이가 없는지 검증하려 한다. 1-1. A와 B 두 그룹의 정보를 수집한다. DF.info() DF.head() DF.describe() 여러 정보를 확인, 판단 특히 데이터의 갯수를 판단한다. 1-2. 가설 설정 귀무가설 : 기존의 관념과 유사한 가설(ex. 전 세계 여자의 평균키는 남자의 평균.. 2023. 8. 14.
VSCode, Git 가상환경 설정하기 VSCode, Git Bash 에서 가상 환경(파이썬) 을 설정하자. 가상환경을 설정하는 이유. 버전 관리 용이. 포멧 및 재설치 용이. 시작하기 01. git 을 이용해 클론 만들기. $ git clone 링크 02. 경로 이동하고 VSCode 열기 $ cd 이동 경로$ pwd$ code . 03. 파이썬 경로 확인 - 터미널 - git bash which python 04. 가상환경 인스톨 pip install virtualenv 05. 가상환경 가져오기 vitualenv venv 06. 설정 및 확인 sourve venv/Scripts/activate 가상환경 설정 완료! venv 활성화 됨. 번외) 라이브러리 등 설치 pip install django numpy pandas matplotlib s.. 2023. 7. 25.
pycharm 가상환경설정 및 django 설치 pycharm 에서 가상 환경(파이썬) 을 설정하자. 가상환경을 설정하는 이유. 버전 관리 용이. 포멧 및 재설치 용이. 시작하기 01. git 을 이용해 클론 만들기. $ git clone 링크 02. pycharm 열기 03. pycharm 화면 모습. 04.우측 상단 IDE -> 설정 후 05. Project: ~ -> [Python Interpreter] 버튼 06. 우측 상단의 [Add Interpreter] 07. 첫 번째 [Virtualenv Environment] -> [OK] 08. [Apply] 버튼 09. 확인 venv 생성확인 10. Git Bash 터미널 - which python 시스템에 있는 상태(local) -> 가상환경으로 가야됨 11. 가상환경 설치 - source ven.. 2023. 7. 25.