'분류 전체보기' 카테고리의 글 목록 (14 Page)
세모로그
SQLP
[친절한 SQL 튜닝] 1.1 SQL 파싱과 최적화 [1]
2025.01.13
SQLP를 준비하면서 [친절한 SQL 튜닝]이라는 책을 추천받게 되었다.앞으로 이 책을 공부하면서 조금씩 정리를 하려고 한다. 1.1 SQL 파싱과 최적화1.1.1 구조적, 집합적, 선언적 질의 언어SQL이란 무엇인가SQL은 'Structured Query Language'의 줄임말로, 구조적 질의 언어라고 불린다.SQL은 기본적으로 구조적(Structerd)이고, 집합적(Set-based)이고 선언적(Declarative)인 질의 언어이다. SQL 옵티마이저원하는 결과집합을 구조적, 집합적으로 선언하지만, 그 결과집합을 만드는 과정은 절차적일 수밖에 없다.즉, 프로시저가 필요한데, 그런 프로시저를 만들어 내는 DBMS 내부 엔진을 SQL 옵티마이저라고 부른다. 1.1.2 SQL 최적화SQL 최적..

Dacon
[Dacon] 풍력 발전량 예측 AI 경진대회 - AutoML(mljar-supervised)
2023.02.17
Dacon 풍력 발전량 예측 대회를 진행하였다. 지금껏 사용해 온 모델을 학습시킨 후 예측값을 추출한 후 제출하였는데 점수가 좋게 나오진 않았다. 성능 향상 방법을 구글링을 통해 찾아서 전처리를 여러 가지 방법으로 처리하여 진행을 해도 뛰어난 성능 향상을 느끼진 못했다. 그러다 예전에 Pycaret을 사용한 경험이 생각이 나서 AutoML에 대해 찾아보았다. mljar-supervised라는 AutoML을 찾아 이 데이터에 적용해 보았다. 라이브러리 설치부터 제출까지 해보는 시간을 가져보자. AutoML(mljar-supervised) 설치 https://supervised.mljar.com/ pip install mljar-supervised 위 명령어를 통해 AutoML 라이브러리를 설치할 수 있다...

Dacon
[Dacon] 해외 부동산 월세 예측 AI 경진대회 - 앙상블
2023.01.05
https://dacon.io/competitions/official/236044/overview/description 데이콘 Basic 해외 부동산 월세 예측 AI 경진대회 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다. dacon.io 2022년 12월 12일부터 2022년 12월 26일까지 데이콘 Basic 해외 부동산 월세 예측 AI 경진대회가 진행되었다. 비록 참가 기간에 참여하진 못했지만, 연습을 통해 진행할 수 있었다. 성적에는 반영되지 않지만, 내가 짠 모델의 성능을 평가할 수 있다. 간단하게 해외 부동산의 여러 가지 정보를 통해 월세 예측 모델을 만들어 보았다. 해외 부동산 월세 예측 - 앙상블 모델 데이터 불러오기 먼저 데이터를 다운받아 불러와..

파이썬
로지스틱 회귀(Logistic Regression)
2022.04.08
로지스틱 회귀(Logistic Regression) - 독립 변수의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는 데 사용되는 통계 기법 로지스틱 회귀 목적 - 일반적인 회귀 분석의 목표와 동일하게 종속 변수와 독립 변수간의 관계를 구체적인 함수로 나타내어 향후 예측 모델에 사용하는 것. - 이는 독립 변수의 선형 결합으로 종속 변수를 설명한다는 관점에서는 선형 회귀 분석과 유사 - 하지만 로지스틱 회귀는 선형 회귀 분석과는 다르게 종속 변수가 범주형 데이터를 대상으로 하며 입력 데이터가 주어졌을 때 해당 데이터의 결과가 특정 분류가 나뉘기 때문에 일종의 분류(Classification) 기법으로 볼 수 있음 로지스틱 회귀는 종속 변수가 이항형 문제(유효한 범주의 개수가 두 개인 경우)를 지칭할 때..

파이썬
SVM(서포트 벡터 머신) 알고리즘
2022.04.07
서포트 벡터 머신(SVM, Support Vector Machine) SVM이란 두 개의 그룹(데이터)을 분리하는 방법으로 데이터들과 거리가 가장 먼 초평면(Hyperplane)을 선택하여 분리하는 방법 - 데이터를 분리하기 위해 직선이 필요 - 직선이 한쪽 데이터로 치우쳐져 있으면 데이터에 변동이나 노이즈가 있을 때 제대로 구분하지 못할 수 있음 - 이러한 문제점을 해결하기 위해 margin(마진)을 이용 Optimal Hyperplane(초평면) Support Vector은 데이터를 의미 margin은 초평면과 가장 가까이 있는 데이터와의 거리를 의미 마진을 최대로 만드는 직선을 계산하여 데이터를 분류하는 방법이 서포트 벡터 머신(SVM) - C값은 사용자가 설정하는 파라미터 - C값을 크게 설정하면..