20221007 TIL [Machine Learning Start]

2022. 10. 7. 21:12TIL(Today I Learnd)

    목차

장고 프로젝트가 마무리 되고 머신 러닝이 시작됐다.

 

1. Install anaconda 아나콘다 설치

아나콘다를 다운받는데 설치가 안됐다고 하면서 터미널로 확인해보니 설치가 돼있음 ㅋㅋ

 

https://www.anaconda.com/products/distribution#Downloads

 

Anaconda | Anaconda Distribution

Anaconda's open-source Distribution is the easiest way to perform Python/R data science and machine learning on a single machine.

www.anaconda.com

https://velog.io/@augus-xury/%EB%A7%A5%EB%B6%81-M1-%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%ED%99%98%EA%B2%BD-%EC%84%B8%ED%8C%85feat.-%EC%95%84%EB%82%98%EC%BD%98%EB%8B%A4

 

맥북 M1 파이썬 머신러닝 환경 세팅(feat. 아나콘다)

아나콘다 설치 파이썬은 다양한 모듈을 바탕으로 편리하게 코딩을 할 수 있다는 장점이 있는 언어이지만 각 모듈/라이브러리 별로 지원 버전 범위가 다 다르기 때문에 버전관리가 어렵다는 단

velog.io

2. Install tensorflow 텐서플로우 설치

터미널에

#1
conda create --name sparta_project(하고싶은 프로젝트 이름 쓰면 됨) python=3.8 pip

# 뭐라고 막 뜰거임 다 뜬다음
#2
y #엔터

#3
conda activate sparta_project(실행될 가상환경 이름)
# 이제 터미널에서 base 없어지고 sparta_project라고 뜰거임 그러면

#4
pip install tensorflow
# 텐서플로우 설치해줌

 

3. Install OpenCV 오픈씨브이 설치

터미널에

pip install opencv-python

 

3. Install dlib 디엘아이비 설치

# 1
conda install -c conda-forge dlib

# 2
y #엔터

 

4. 확인하기

잘 설치됐나?

conda list

 

 

잘 작동하나?

 

test.py 파일을 만들어

cmd + shif + p 해주고

interpreter를 sparta_project로 해준다음

import cv2
import tensorflow as tf
import dlib

print(cv2.__version__)
print(tf.__version__)
print(dlib.__version__)
 
를 써주고 파일을 실행해 보면
각각의 패키지 버전이 출력되면 완성!

(응 어림도 없지~~)

illegal hardware instruction 라고 한다 검색해주자

 

https://github.com/tensorflow/tensorflow/issues/46178

 

Apple M1 chip - illegal hardware instruction · Issue #46178 · tensorflow/tensorflow

System information OS Platform and Distribution (e.g., Linux Ubuntu 16.04): MacOS Big Sur 11.0.1 TensorFlow installed from (source or binary): https://www.tensorflow.org/install/pip TensorFlow vers...

github.com

여기를 보니 m1이 나온지 얼마 되지 않아서 지원 안될 때 이런 오류가 발생했던 것 같다.

내 생각에는 파이썬 버전을 3.8로 설치해서 그런것 같다는 생각이 드는데 3.10으로 해보자

 

우선 삭제는 다음의 블로그를 참조했따

https://seong6496.tistory.com/68

 

[Anaconda]가상환경 설치,삭제

보통 우리는 64bit 환경에서 개발을 합니다만 증권사 api를 쓰기 위해서는 32bit 개발환경이 필요합니다. 물론 다시 설치할 수도 있지만 번거롭기 때문에 32bit 가상환경을 만들어 32bit 환경에서 python

seong6496.tistory.com

 

 

이 화면이 꽤 오래 가는데 기다려주니까 진행된다

 

아씨 이게 아니었다 딥러닝 과정 하고 있엇음 개빡치네

 

다시 머신러닝을 보자

 

kaggle에 가입을 해준다.

그리고 공부하자

 

회귀분석 (regression analysis): 

나의 방식대로의 이해: 연속적인 두개 이상의 데이터간의 상관관계를 통해서 예측을 한다.

예를 들어 내가 콜라를 마시고 잤을 때 살이 몇그램이 쪘냐를 기록해보자

콜라 1일 2일 3일 4일 5일 6일
1잔 50g          
2잔   100g        
3잔     150g      
4잔       200g    
5잔            

하루에 1잔씩 늘려가며 측정했더니 1잔당 50g씩 몸무게가 늘어나는것을 알 수 있으며 5일차에 5잔을 마시게 되면 250g이 되는 것을 예측 할 수 가 있다.

 

이 것을 선으로 나타내고 분석하는 것이 회귀 분석이라더라..? 모르겠으니 검색 더 해보자

 

https://www.youtube.com/watch?v=Dd0GGGqx4Ck 

이 영상을 보면 알 수 있는것:

회귀 = 반복해서 데이터를 측정하면 평균으로 돌아가려는 현상 (유전 뿐만 아니고 사회, 문화 등에서도 계속 나타나는 현상이라 함)

회귀분석 = 데이터를 선으로 나타내며 분석하는 분석 기법

https://www.youtube.com/watch?v=L5Rpq7E-SHM 

이거는 아직 보면 안되는 영상 같지만 일단 놓자

 

그리고

 

분류분석(Classification Analysis)

https://www.youtube.com/watch?v=227kcrFEijA 

여러가지 데이터들의 결과를 조합하여 결과를 도출해내는 듯 하다

Machin learning 머신러닝 종류

지도 학습(Supervised learning):  정답값을 입력시켜놓고 학습시킴 정답값을 입력시켜주는 작업을 Labeling, Annotation 이라고 함

비지도 학습 (Unsupervised learning): 정답값을 알려주지 않고 군집화(Clusetering)하는 방법

강화학습(Reinforcement learning): 주어진 데이터 없이 실행과 오류를 반복하면서 학습하는 방법(AlphaGo) -> 그니까 시간과 정신의 방에서 뺑뺑이를 오지게 굴리는거임 잘하면 보상 못하면 채찍 근데 컴퓨터는 지치지 않음 미친... 그래서 알파고같은 미친게 나오는 것임 롤 헬퍼들이 계속 똑똑해지는 이유 같음 계속해서 프로게이머 플레이 보면서 이랬을때는 노이득 이랬을 때는 이득 이렇게 알려주고 승리로 가는 경우의 수를 줄여가는 과정 그런거 아닐까? 무섭다...

 

선형 회귀 (Linear Regression): 모든 문제는 선형회귀로 풀 수 있다 가정하고 가설 세우고 원래 있는 정답값에 가까워 지려면 어떻게 해야되는지 손실값을 알아내는 것이 머신러닝

입력값 정답값 출력값?

 

 

 

가설(Hypothesis)

cost function(손실함수)

Mean Squard Error(평균 제곱 오차)

 

가설을 세우고 그에 맞는 손실 함수를 정의하는게 머신러닝

 

다중 선형 회귀(Multi-variable linear regression)

변수가 여러개인 선형회귀

 

 

경사 하강법(Gradient descent method): 말그대로 경사를 따라 내려감 Wx+b를 구할 때...

Learnig rate -> 학습 하는 단위(?)로 학습시간 결정

 

Data set

1. Training set = 교과서 -> 학습 데이터셋

2. Validation set = 모의고사 -> 검증 데이터셋 

3. Test set = 수능 -> 평가 데이터넷

 

 

Google Colab

https://colab.research.google.com

 

Google Colaboratory

 

colab.research.google.com

 

드라이브로 복사 하고 진행

 

개발환경 구성 이미 돼있음

GPU 무료 액세스

간편 공유 

ㄷ ㄷ

 

 

케글(keggle) - 데이터셋 저장소 커뮤니티?

 

'TIL(Today I Learnd)' 카테고리의 다른 글

20221012 TIL  (0) 2022.10.13
20221011 TIL Logistic regression  (0) 2022.10.12
20221006 TIL  (0) 2022.10.06
20221005 TIL  (0) 2022.10.05
20221004 TIL - instagram clone coding follow  (0) 2022.10.05