분류 전체보기 104

[프로그래머스 자바 입문] 주석처리

한 줄만 주석 처리 : // 주석 처리할 내용 여러 줄을 주석 처리 : /* 주석 내용 */ 문서화 주석 : /** 주석 내용 */ public class HelloWorld { public static void main(String[] args) { // 이 부분을 주석처리 해서 프로그램이 정상적으로 실행되도록 만들어 보세요. System.out.println("HelloWorld"); } } ✅ 자바는 파이썬과 다르게 # ,', ''' 가 아닌 // 으로 주석처리를 한다. ✅ 자바의 주석처리에는 한 줄만 주석처리 ( // ), 여러 줄을 주석 처리 (/* */), 문서화 주석 (/** */) 3가지가 있다. ✅ 단축키는 ctrl + / 이다.

JAVA 2022.11.17

[머신러닝] 순서없는 범주형 인코딩

머신러닝에서 레이블에 인코딩 해주는 방법에는 크게 두 가지가 있다. 1. 레이블 인코딩 - LabelEncoder API 이용 fit(), transform() 예> ['고양이','강아지','새']-->[0,1,2] 단점: 몇몇 ML 알고리즘은 변경된 숫자 [0,1,2]값을 분류라 인식하지 않고 내부적으로 0이 1보다 작기 때문에 가중치 값을 더 부여 할 수 있다. 따라서 예측성능이 떨어진다. 2. 원-핫 인코딩 - OneHotEnoder API 이용 fit(), transform() 예> ['고양이','강아지','새'] --> 고양이는 1로 나머지 모두 0 --> 강아지는 1로 나머지 모두 0 --> 새는 1로 나머지 모두 0

머신러닝 2022.11.01

[머신러닝] 과적합과 규제(regularization)

과적합 과적합에는 과대적합과 과소적합이 있다. 먼저 과대적합에 대해 알아보자 과대 적합 과대적합 : 모델이 훈련데이터로만 훈련을 너무 많이해서 훈련 데이터에는 너무 잘 맞지만 일반성이 떨어지는 현상 Q 어떨 때 발생할까? - 과대적합은 훈련데이터에 있는 잡음의 양에 비해 모델이 너무 복잡할 때 일어난다. Q 해결 방안은? -1. 파라미터 수가 적은 모델을 선택하거나 (고차원 다항 모델 보다 선형 모델) , 훈련데이터에 있는 feature 수를 줄이거나 , 모델에 제약을 가하여 단순화 시킨다. - 2. 훈련 데이터를 더 많이 모은다. - 3. 훈련 데이터의 잡음을 줄인다.(오류 데이터 수정과 이상치 제거) 과소적합 과소적합: 과대적합의 반대이다. 이는 모델이 너무 단순해서 데이터의 내재된 구조를 학습하지 ..

머신러닝 2022.10.28

[머신러닝] scaling

https://vinyee.tistory.com/81 [머신러닝] 사이킷런(sklearn) 내장데이터 샘플 가져오기 붓꽃데이터 df_setosa=df[df['species_name']=='setosa'] df_versicolor=df[df['species_name']=='versicolor'] df_virginica=df[df['species_name']=='virginica'] df_setosa df_virginica df_versicolor​ iris.feature_nam.. vinyee.tistory.com 지난 글에서 머신러닝 sklearn 패키지에 내장된 붓꽃 데이터를 데이터 프레임으로 가져오는 실습을 했었다. (위 링크 참고) 이번 글에서는 scaling 이라는 개념에 대해서 알아보자 Scal..

머신러닝 2022.10.22

[머신러닝] 사이킷런(sklearn) 내장데이터 샘플 가져오기 붓꽃데이터

df_setosa=df[df['species_name']=='setosa'] df_versicolor=df[df['species_name']=='versicolor'] df_virginica=df[df['species_name']=='virginica'] df_setosa df_virginica df_versicolor​ iris.feature_names iris.feature_names ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']​ from sklearn.datasets import load_iris iris=load_iris() iris - sklearn 에서 iris 데이터 가져오기 {'data'..

머신러닝 2022.10.22

[pandas] DataFrame 컬럼, 행 조회

- 컬럼 조회 df.컬럼명 ==> series 반환 df['컬럼명'] ==> series 반환 df[['컬럼명','컬럼명']] ==> 다중컬럼 조회 dict_value={"c1":[4,5,6], "c2":[14,35,26], "c3":[43,50,61]} df=pd.DataFrame(dict_value) print(df) print(df.c1)# series 반환 ''' 0 4 1 5 2 6 Name: c1, dtype: int64 ''' print(df['c2']) #series 반환 ''' 0 14 1 35 2 26 Name: c2, dtype: int64 ''' print(df[ ["c1","c3"] ])#DataFrame 반환 ''' c1 c3 0 4 43 1 5 50 2 6 61 ''' # 특별..

pandas 2022.10.02

[pandas] DataFrame 인덱스 관리

-1. 새로운 값으로 index로 설정할 때 df.index=[값,값2,...] ===> dict_value={"date":['2002','2003'], "name":["홍길동","이순신"], "age":[20, 30] } df=pd.DataFrame(dict_value) print(df) ''' date name age 0 2002 홍길동 20 1 2003 이순신 30 ''' #1. 기존 컬럼값으로 index를 설정할 때 #df.set_index() new_df=df.set_index("date")#inplace=False(자신이 수정되지 않고 복사본을 생성해서 반환) print(new_df) ''' name age date 2002 홍길동 20 2003 이순신 30 ''' new_df=df.set_i..

pandas 2022.10.02

[pandas] Data Frame 중첩 Dict 으로 생성하기

Data Frame 의 중첩과 중첩 리스트에 대해서 알아보자 ''' 중첩 dict dict_value = { key1: { key1-1: value}, key2: { key2-1: value}, ....} key1, key2 ==> 컬럼명으로 지정됨. key1-1, key2-1 ==> 인덱스로 지정됨. ''' 앞서 dict 로 Data Frame 을 만드는 것을 배웠는데 위 처럼 dict 의 value 값에 다시 dict 가 들어가있으면 어떤 Data Frame 이 만들어 질까? mport numpy as np import pandas as pd dict_value = {"key1":{"key1-1":[1,2,3]}, "key2":{"key2-1":[1,2,3]}, "key3":{"key3-1":[1,2..

pandas 2022.10.02

[pandas] Data Frame 컬럼과 인덱스 값의 변경

''' DataFrame 컬럼 및 인덱스 변경 1. 컬럼 변경 df.columns=[값,값2,값3,..] 2. 인덱스 변경 1 df.index =[값, 값2, ...] 2. 인덱스 변경 2 df = pd.DataFrame(dict, index =[값, 값2, ...] ) ''' Data Frame 의 컬럼과 인덱스 값을 변경하는 방법을 알아보자. dict_value = {"c1":[4,5,6], "c2":[14,35,26], "c3":[43,50,61]} df = pd.DataFrame(dict_value) print(df) ''' c1 c2 c3 0 4 14 43 1 5 35 50 2 6 26 61 ''' 위와 같은 Data Frame df가 존재한다고 가정한다. 1. 컬럼 변경 print("1. 컬럼..

pandas 2022.10.02

[pandas] Data Frame 컬럼, 인덱스, 내용 정보 보기

Data Frame 을 통해 확인 할 수 있는 정보는 크게 3가지 이다. 행( 인덱스 ), 열(컬럼), 그리고 내용(레코드) ''' DataFrame 정보보기 1. 컬럼 정보 - df.columns - df.keys() 2. 인덱스 정보 - df.index 3. 내용 보기 ''' dict_value={"c1":[4,5,6], "c2":[14,35,26], "c3":[43,50,61]} df=pd.DataFrame(dict_value) print(df,type(df))# ''' c1 c2 c3 0 4 14 43 1 5 35 50 2 6 26 61 ''' 먼저, 위와 같은 DataFrame 이 존재한다고 가정하자. 1. 컬럼 정보 확인하기 print("1. 컬럼 정보(컬럼 라벨 정보)") print(df.c..

pandas 2022.10.02