반응형

파이썬 8

[머신러닝] 파이프라인(Pipeline)

이번 포스팅에서는 파이프라인(Pipeline)에 대해 알아보겠습니다. (출처: 선형대수와 통계학으로 배우는 머신러닝 with 파이썬, 장철원 지음) 파이프라인(Pipeline) 일반적으로 파이프라인은 생산라인에서 동시에 여러 공정 프로세스를 효율적으로 가능하게 하도록 하는 것을 말합니다. 머신러닝에서도 비슷하게 파이프라인은 모델을 가속, 재사용, 관리 및 배포하는 프로세스를 구현하고 표준화합니다. 파이프라인을 사용하면 데이터 전처리와 모델 학습, 예측까지 한번에 가능하여 코드도 간결해지는 장점이 있습니다. 파이프라인 적용 예제 (Python) 파이프라인 적용 전/후의 코드가 어떻게 바뀌는지 예제를 통해 알아보겠습니다. import pandas as pd import numpy as np from skle..

[Python] 파일 경로 설정

이번 포스팅에서는 파일 경로 설정에 대해 알아보겠습니다. 경로 설정 파일을 읽고 쓰려면 우선 원하는 경로를 지정할 수 있어야 합니다. 그런데 윈도우, Mac os, 리눅스 등 각 운영체제에서는 경로를 지정할 때 구분하는 기호를 쓰는데 윈도우에선 백슬래시(\)를 사용하지만, Mac os에서는 슬래시(/)를 사용합니다. 따라서 경로를 지정하려면 운영체제에 따라 다르게 처리해주어야 합니다. 이럴 때에 유용하게 쓸 수 있는 함수가 있는데요. 바로 os.path.join() 함수입니다. 함수 안에 경로의 개별 폴더 이름을 지정하면 해당 경로를 각 운영체제에 맞는 구분 기호를 사용하여 생성해줍니다. import os print(os.path.join('user','Desktop','Python')) 저는 맥북을 사..

[Python] 문자열 입력 방법

다양한 문자열 입력 방법에 대해 알아봅시다. 따옴표 - 홑따옴표, 겹따옴표, 세겹따옴표 파이썬에서 문자열을 입력할 때엔 홑따옴표 안에 입력합니다. 'Hello, world.'와 같은 형식으로 말이죠. 하지만 문자열 안에 홑따옴표를 사용해야할 경우엔 어떨까요? A = 'Hello, I'm minsoo.' 이 경우 아래와 같은 에러가 발생합니다. I 다음 홑따옴표로 인해 문자열이 끝난 것으로 간주하여 m minsoo.'는 잘못된 코드로 받아들이기 때문이죠. 이 경우 겹따옴표를 사용하면 해결됩니다. A = "Hello, I'm minsoo." print(A) 그러면 홑따옴표로 이루어진 문자열 안에선 홑따옴표를 쓸 수 없을까요? 역슬래시로 이루어진 이스케이프 문자를 쓰면 가능합니다! A = 'Hello, I\'..

[Python] 데이터 유형: 사전(Dictionary)

이번 포스팅에서는 사전(Dictionary) 데이터 유형에 대해 알아봅시다. 사전(Dictionary) 사전은 리스트와 마찬가지로 많은 값의 모음입니다. 하지만 리스트에서 인덱스를 정수밖에 사용하지 못했던 것과는 달리 사전 데이터에서는 인덱스를 다양한 데이터 유형을 사용할 수 있습니다. 그 인덱스를 key라고 하며, key와 연관된 value의 쌍을 key-value pair라고 합니다. 사전 데이터는 중괄호 {}로 정의합니다. myDog = {'old': '4', 'color': 'white', 'size': 'fat'} 여기서 key는 'old', 'color', 'size'이고, value는 각각 '4', 'white', 'fat' 입니다. 만약 key를 통해 value를 호출하고 싶다면 myDog..

[Python] 리스트(list) 활용 - for문, 다양한 메소드

이번 포스팅에서는 리스트의 다양한 활용법에 대해 알아봅시다. 리스트가 무엇인지는 지난 포스팅에서 알아보았으니, 궁금하시다면 아래를 참고하시기 바랍니다. [Python] 데이터 유형: 리스트(list) 이번 포스팅에서는 데이터 유형 중 하나인 리스트(list)에 대해 알아보겠습니다. 리스트(list) 리스트는 순서를 가진 여러 값의 배열로써, 대괄호로 구분됩니다. 첫번째 줄처럼 정수형 자료를 담 study2give.tistory.com 리스트의 다양한 활용법 for 루프문 for 루프에서는 리스트 또는 리스트와 같은 값 안에 있는 각각의 값에 대해 코드를 반복할 수 있습니다. 예를 들면 for i in range(0,5): print(i) 위의 코드를 실행했을 때 결과는 아래와 같습니다. range(0,5..

[Python] 지역변수와 전역변수

이번 포스팅에서는 파이썬에서의 지역변수와 전역변수에 대해 다뤄보겠습니다. 지역변수와 전역변수 파이썬에서 모든 함수의 바깥에서 할당된 변수들은 전역 범위에 존재하여, 이 변수를 전역변수라고 합니다. 반면에 지역 범위에 존재하는 변수는 지역변수라고 합니다. 변수는 전역/지역변수로 구분되며, 지역이면서 전역변수일 수는 없습니다. 지역변수 사용 예시 아래와 같은 함수가 있습니다. def apple(): banana = 100 apple() print(banana) 위 함수를 실행하면 아래와 같은 에러가 발생하게 됩니다. banana라는 변수는 apple() 함수 내에 지역변수로 선언되었으므로, 전역 범위에 속하지 않아 에러가 발생하는 것입니다. 또한 특정 지역 범위 내에선 다른 지역 범위의 변수를 사용할 수 없..

[Python] 사용자 정의 함수(def)

이번 포스팅에서는 파이썬에서 사용자 정의 함수에 대해 알아보겠습니다. 사용자 정의 함수 - def 파이썬에서는 print(), len() 등과 같이 기본적으로 제공하는 함수도 있지만 유저가 직접 필요한 함수를 만들어 쓸 수도 있습니다. 아래와 같이 hello라는 이름의 함수를 정의해봅시다. def hello(): print("hello!") print("hello!!") hello() 첫번째 줄은 hello()라는 이름의 함수를 정의하는 문장이고, 그 아래의 코드는 함수의 본문입니다. 그리고 정의된 함수 아래에 hello()는 정의된 함수를 호출하는 문구입니다. 함수의 실행 결과는 아래와 같습니다. 매개변수를 사용한 def 함수 위에서는 매개변수를 사용하지 않고 함수를 호출하였지만, 함수 정의 시 매개변..

[Python] 예측 모델을 통한 주가 예측하기!

이번 글에서는 Python으로 예측모델을 통해 주가를 예측하는 방법을 알아보도록 하겠습니다. 역시 직접 모델을 모델링하진 않을거고, 똑똑하신 분들이 만들어 놓은 것 잘 써먹는 방법으로 진행하겠습니다. ㅎㅎ 본격적으로 시작하기 전에 이번에 사용하는 모델은 그저 과거 주가 trend, 등락 주기 등을 파악하여 예측하는 방법으로써, 기업의 현재 경영전략과 미래 성장 가능성과는 관련이 없을 수 있습니다! 재미로 '이런게 있다' 라는 정도로만 참고해주세요. ^^ Prophet 모델 간략 소개 Prophet 모델은 시계열 데이터를 예측하는데에 유용한 모델로써, Facebook에서 개발한 모델이라고 합니다. 이 모델은! 1) 시간별, 일별, 주별 기록 데이터나 2) 계절성을 띄는 데이터, 3) 불규칙한 이벤트 등 이..

반응형