Project/ML 프로젝트 14

[ML 프로젝트] SVR모델과 KNN 모델의 성능이 트리 기반 모델보다 더 좋게 나온 이유

SVR(Support Vector Regression) 모델과 KNN(K-Nearest Neighbors) 모델의 성능이 XGBoost나 Random Forest 같은 트리 기반 모델보다 더 좋게 나온 이유 분석1. 데이터의 특성과 적합한 모델링(1) XGBoost와 Random Forest트리 기반 모델은 비선형성과 상호작용을 잘 다룰 수 있음:트리 기반 모델은 비선형적 관계나 여러 특성 간의 복잡한 상호작용을 학습하는 데 강점을 가집니다.그러나 이러한 모델은 데이터가 고차원이고, 각 변수 간의 상관관계가 적거나 변동성이 큰 경우, 과적합될 가능성이 있습니다.작아 보이는 데이터셋:첨부파일 데이터는 대략 100~200개의 샘플로 보이며, 피처 개수(컬럼)는 40개 이상으로 상대적으로 많습니다. 트리 기반..

ML프로젝트 개요(AI) 청년층 순이동률 예측 및 목표 달성을 위한 피처 영향 분석

프로젝트 제목"청년층 순이동률 예측 및 목표 달성을 위한 피처 영향 분석: 전라남도 평균을 목표로"연구 목적청년순이동률(타겟 변수)을 다양한 지역의 경제·주거·교육 등 여러 환경 지표(피처)로부터 예측하는 ML 모델 구축데이터 기반 접근을 통해 전라남도(목표 지역)의 청년순이동률 평균치 달성을 위한 주요 피처(인자)들이 어떤 영향을 미치는지 정량적으로 분석모델 해석 및 시뮬레이션을 통해, 실제 피처 값이 변화할 경우 청년순이동률이 목표값(전라남도 평균)에 도달할 수 있는 조건을 도출연구 방법론 및 ML 접근 전략1. 데이터 수집 및 전처리데이터 원천: 통계청, 지방자치단체 등에서 제공한 “real_final_df.xlsx” 파일주요 변수:타겟 변수: 청년순이동률설명 변수: 재정자주도, 주택 관련 지표(단..

논문 개요(AI) - 청년층의 지역 이탈 원인과 정착 정책의 효과 분석: 청년 순이동률을 중심으로

### 수정된 논문 내용 #### 논문 제목 **"청년층의 지역 이탈 원인과 정착 정책의 효과 분석: 청년 순이동률을 중심으로"** --- ### **연구 목적** - **청년층 지역 이탈 원인 분석**: 청년 순이동률 데이터를 활용하여 지역별 특성과 이탈 요인을 다각적으로 분석. - **정책적 대안 제시**: 지역 이탈 문제를 해결하기 위한 정책적 대안을 도출. - **정착 정책 효과 평가**: 정착 정책의 효과성을 평가하여 실질적인 개선 방안을 마련. --- ### **연구 방법론** #### **1. 데이터 수집 및 분석** - **데이터 출처**: 통계청, 지방자치단체, 청년 순이동률 데이터. - **분석 대상**: 전국 17개 광역시·도 및 주요 기초자치단체. - **분석 지표**:   - 청년..

해남군에 대한 이해 [우리해남]

해남소개연혁 천혜(하늘이 베푼 은혜)의 자연적경관이 뛰어난 해남남해안 관광의 구심적역할을 수행해 온 해남육지 최남단의 땅끝해남세계로 향한 새로운 출발점이 되자상징해남군의 상징마크는 상승하는 곡선의 형태를 통해 군의 진취적인 비전을 상징화 하였으며, 한반도의 모습과 해남군의 위치에 그려진 쉼표를 통해 '한반도의 시작이자 끝'인 해남군의 지리적 특징을 형상화한 상징마크이다.또한, 해남군을 의미하는 'ㅎ'을 군민의 진취적인 기상을 의미하는 횃불의 형태과 결합하여 상징적 이미지를 부여하였으며, 붉은 색과 푸른색의 어울림을 통해 대한민국 땅끝도시 해남군의 가치를 강조하였다.동백꽃의 꽃말 : 희망, 진실한 사랑, 청렴, 절조, 순결, 비밀스러운 사랑, 어머니와 아이의 사랑, 굳은 약속동백나무 개화 시기 : 12월~..

유출 위험 지역 분류 - 분류 분석

1. 데이터 준비import pandas as pd import numpy as np from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, classification_report, confusio..

순이동률(%) 예측 - 회귀 분석

1. 프로젝트 목표목적: 정주 인구 유출(순이동률 감소)을 방지하기 위한 주요 요인을 식별하고, 이를 기반으로 정책적 제안을 도출.모델링 목표- 회귀 분석: 순이동률(%) 예측. - 분류 분석: 유출 위험 지역 분류.2. 데이터 준비데이터셋 개요- 총 229개 지역에 대해 39개 변수 포함. - 주요 변수: 관광, 교육, 의료, 산업, 인구 이동 관련 정보 등. - 타겟 변수: 순이동률 (%). 데이터 전처리- 문자열 데이터를 숫자로 변환 (예: `총전입`, `총전출` 등). - 불필요한 컬럼 제거 (`법정동코드`, `법정동명`). - 상관관계 분석을 통해 주요 특성 15개 선정: => 주요 변수: 외국인관광도시민박업수, 일반야영장업수, 대학교 수, 식당 수, 관광식당 수, 목욕장업수, 산업단지기업수 등..

이동률과 순이동률의 차이

이동률과 순이동률은 인구 이동을 측정하는 데 사용되는 두 가지 주요 지표로, 각각의 정의와 계산 방식에서 차이가 있습니다. **이동률**- **정의**: 이동률(Migration Rate)은 특정 기간 동안 주민등록인구(거주자) 100명당 이동자 수를 나타냅니다.- **의미**: 이 지표는 전체 인구 중 얼마나 많은 사람이 이동했는지를 보여주며, 전입과 전출을 모두 포함합니다.**순이동률**- **정의**: 순이동률(Net Migration Rate)은 인구 100명당 전입자 수에서 전출자 수를 뺀 값을 나타냅니다. 즉, 특정 지역으로 유입된 인구와 유출된 인구 간의 차이를 비율로 표현한 것입니다.- **의미**: 이 지표는 특정 지역에서 실제로 인구가 증가했는지 감소했는지를 판단하는 데 사용됩니다. 양..

사회네트워크 분석을 이용한 광주 전남지역의 공간 구조 변화 및 중심지 분석 [해남군 공모전]

이 문서는 광주광역시와 전라남도 지역의 공간 구조 변화 및 중심지를 분석하기 위해 사회네트워크 분석을 적용한 연구를 다루고 있습니다. 주요 내용과 방법론을 정리하면 다음과 같습니다:연구 배경 및 필요성인구 감소와 고령화: 농촌 지역에서의 과소화와 고령화 문제는 심각하며, 이러한 현상은 지역 간 상호작용과 공간 구조를 통해 지역 계획에 반영될 필요가 있음.네트워크 분석의 중요성: 전통적인 중심지 이론 대신, 네트워크 분석을 통해 지역 간 상호작용과 중심지의 역할을 구체적으로 분석.연구 목적공간 구조 변화 분석: 광주광역시와 전라남도의 인구 이동 및 통행 데이터를 기반으로 공간 구조와 중심지 변화를 분석.중심지 식별: 인구 이동과 통행 데이터를 통해 중심지의 위치와 특성을 파악.데이터 및 분석 방법데이터 출..

단계적 인구이동에 따른 출산력 변화와 과소화: 전라북도를 사례로 [해남군 공모전]

1. 연구 배경 및 목적배경:우리나라 저출산 문제는 이미 1980년대부터 시작되었으며, 현재는 인구 감소와 고령화 문제가 농촌을 넘어 중소 도시로 확산.인구 감소와 고령화의 원인으로 젊은 연령층의 단계적 이동(농촌 → 중소도시 → 수도권)이 주요 요인으로 작용.목적:젊은 연령층(20-34세)의 이동 양상과 세대 간 이동이 출산력과 지역 인구 감소에 미치는 영향을 분석.전라북도를 중심으로 농촌과 도시의 출산력 변화를 비교하고, 단계적 이동이 지역 과소화로 이어지는 과정을 규명.2. 연구 방법분석 대상:전라북도 14개 시군의 1970년, 1990년, 2010년 데이터를 활용.주요 분석 집단: 20-34세 연령층 (혼인과 출산의 주요 시기).분석 데이터:인구 이동 O-D 행렬 (출발지와 도착지 간 이동 패턴)..