2022. 10. 7. 21:12ㆍTIL(Today I Learnd)
- 목차
장고 프로젝트가 마무리 되고 머신 러닝이 시작됐다.
1. Install anaconda 아나콘다 설치
아나콘다를 다운받는데 설치가 안됐다고 하면서 터미널로 확인해보니 설치가 돼있음 ㅋㅋ
https://www.anaconda.com/products/distribution#Downloads
2. Install tensorflow 텐서플로우 설치
터미널에
#1
conda create --name sparta_project(하고싶은 프로젝트 이름 쓰면 됨) python=3.8 pip
# 뭐라고 막 뜰거임 다 뜬다음
#2
y #엔터
#3
conda activate sparta_project(실행될 가상환경 이름)
# 이제 터미널에서 base 없어지고 sparta_project라고 뜰거임 그러면
#4
pip install tensorflow
# 텐서플로우 설치해줌
3. Install OpenCV 오픈씨브이 설치
터미널에
pip install opencv-python
3. Install dlib 디엘아이비 설치
# 1
conda install -c conda-forge dlib
# 2
y #엔터
4. 확인하기
잘 설치됐나?
conda list
잘 작동하나?
test.py 파일을 만들어
cmd + shif + p 해주고
interpreter를 sparta_project로 해준다음
import cv2
import tensorflow as tf
import dlib
print(cv2.__version__)
print(tf.__version__)
print(dlib.__version__)
(응 어림도 없지~~)
illegal hardware instruction 라고 한다 검색해주자
https://github.com/tensorflow/tensorflow/issues/46178
여기를 보니 m1이 나온지 얼마 되지 않아서 지원 안될 때 이런 오류가 발생했던 것 같다.
내 생각에는 파이썬 버전을 3.8로 설치해서 그런것 같다는 생각이 드는데 3.10으로 해보자
우선 삭제는 다음의 블로그를 참조했따
https://seong6496.tistory.com/68
이 화면이 꽤 오래 가는데 기다려주니까 진행된다
아씨 이게 아니었다 딥러닝 과정 하고 있엇음 개빡치네
다시 머신러닝을 보자
kaggle에 가입을 해준다.
그리고 공부하자
회귀분석 (regression analysis):
나의 방식대로의 이해: 연속적인 두개 이상의 데이터간의 상관관계를 통해서 예측을 한다.
예를 들어 내가 콜라를 마시고 잤을 때 살이 몇그램이 쪘냐를 기록해보자
콜라 | 1일 | 2일 | 3일 | 4일 | 5일 | 6일 |
1잔 | 50g | |||||
2잔 | 100g | |||||
3잔 | 150g | |||||
4잔 | 200g | |||||
5잔 |
하루에 1잔씩 늘려가며 측정했더니 1잔당 50g씩 몸무게가 늘어나는것을 알 수 있으며 5일차에 5잔을 마시게 되면 250g이 되는 것을 예측 할 수 가 있다.
이 것을 선으로 나타내고 분석하는 것이 회귀 분석이라더라..? 모르겠으니 검색 더 해보자
https://www.youtube.com/watch?v=Dd0GGGqx4Ck
이 영상을 보면 알 수 있는것:
회귀 = 반복해서 데이터를 측정하면 평균으로 돌아가려는 현상 (유전 뿐만 아니고 사회, 문화 등에서도 계속 나타나는 현상이라 함)
회귀분석 = 데이터를 선으로 나타내며 분석하는 분석 기법
https://www.youtube.com/watch?v=L5Rpq7E-SHM
이거는 아직 보면 안되는 영상 같지만 일단 놓자
그리고
분류분석(Classification Analysis)
https://www.youtube.com/watch?v=227kcrFEijA
여러가지 데이터들의 결과를 조합하여 결과를 도출해내는 듯 하다
Machin learning 머신러닝 종류
지도 학습(Supervised learning): 정답값을 입력시켜놓고 학습시킴 정답값을 입력시켜주는 작업을 Labeling, Annotation 이라고 함
비지도 학습 (Unsupervised learning): 정답값을 알려주지 않고 군집화(Clusetering)하는 방법
강화학습(Reinforcement learning): 주어진 데이터 없이 실행과 오류를 반복하면서 학습하는 방법(AlphaGo) -> 그니까 시간과 정신의 방에서 뺑뺑이를 오지게 굴리는거임 잘하면 보상 못하면 채찍 근데 컴퓨터는 지치지 않음 미친... 그래서 알파고같은 미친게 나오는 것임 롤 헬퍼들이 계속 똑똑해지는 이유 같음 계속해서 프로게이머 플레이 보면서 이랬을때는 노이득 이랬을 때는 이득 이렇게 알려주고 승리로 가는 경우의 수를 줄여가는 과정 그런거 아닐까? 무섭다...
선형 회귀 (Linear Regression): 모든 문제는 선형회귀로 풀 수 있다 가정하고 가설 세우고 원래 있는 정답값에 가까워 지려면 어떻게 해야되는지 손실값을 알아내는 것이 머신러닝
입력값 정답값 출력값?
가설(Hypothesis)
cost function(손실함수)
Mean Squard Error(평균 제곱 오차)
가설을 세우고 그에 맞는 손실 함수를 정의하는게 머신러닝
다중 선형 회귀(Multi-variable linear regression)
변수가 여러개인 선형회귀
경사 하강법(Gradient descent method): 말그대로 경사를 따라 내려감 Wx+b를 구할 때...
Learnig rate -> 학습 하는 단위(?)로 학습시간 결정
Data set
1. Training set = 교과서 -> 학습 데이터셋
2. Validation set = 모의고사 -> 검증 데이터셋
3. Test set = 수능 -> 평가 데이터넷
Google Colab
https://colab.research.google.com
드라이브로 복사 하고 진행
개발환경 구성 이미 돼있음
GPU 무료 액세스
간편 공유
ㄷ ㄷ
케글(keggle) - 데이터셋 저장소 커뮤니티?
'TIL(Today I Learnd)' 카테고리의 다른 글
20221012 TIL (0) | 2022.10.13 |
---|---|
20221011 TIL Logistic regression (0) | 2022.10.12 |
20221006 TIL (0) | 2022.10.06 |
20221005 TIL (0) | 2022.10.05 |
20221004 TIL - instagram clone coding follow (0) | 2022.10.05 |