자 이번에는 R에서 사용되는 데이터의 유형에 대해서 알아보도록 할게요.

1, 2, 3 은 숫자이고 '코딩곰'은 문자라는 것은 딱 봐도 알 수 있습니다.

그렇다면 R에서는 구분을 할까요?

정답은 구분한다입니다.

R에서는 숫자(numeric), 복소수(complex), 문자(character), 논리(logical)로 데이터의 유형을 구분합니다.

mode()라는 함수가 있는데요. 이것을 사용하면 입력한 값이 어떤 유형인지 볼 수 있습니다.

그럼 예를 볼까요.

num이라는 변수에 10이라는 값을 할당해보면 숫자(numeric)로 들어가 있는 것을 확인할 수 있습니다.

R에서는 숫자를 입력하면 자동으로 숫자라고 인식을 합니다.

 

그렇다면 문자를 입력하기 위해서는 어떻게 해야 할까요?

문자를 입력하기 위해서는 따옴표(' ') 또는 큰따옴표(" ")로 묶어서 입력해야 합니다.

만약 따옴표(큰따옴표)를 쓰지 않고 그냥 입력한다면 문자가 아닌 변수 또는 함수로 인식을 합니다.

따라서 할당된 변수나 함수가 있으면 이 값을 보여주고, 없다면 에러가 나게 됩니다.

 

데이터의 유형을 왜 알고 있어야 할까요?

데이터의 유형이 맞지 않으면 R은 제대로 인식을 하지 못해 원하는 대로 출력되지 않습니다.

만약 숫자를 큰따옴표로 묶어서 입력하고 사칙연산을 시켜본다면 다음과 같이 에러가 날 거예요.

숫자가 아닌 문자로 인식을 했기 때문에 1+3=4로 계산하지 못한 것입니다.

 

복소수는 어떻게 입력하면 될까요?

숫자 뒤에 + 숫자*i로 입력하면 됩니다.

 

마지막으로 논리의 경우 True / False를 판단하여 나타냅니다.

논리를 판단하기 위해서는 크다(<), 작다(>), 같거나 크다(<=), 같거나 작다(>=), 같다(==), 같지 않다(!=)를 사용할 수 있습니다.

특이한 것은 논리의 경우 True를 1로, False를 0으로 인식할 수 있기 때문에 숫자처럼 계산이 가능합니다.

실제 데이터 분석을 하면서, 많은 데이터의 True/False를 판단한 후 결과를 모두 더하면 True가 몇 개인지, False가 몇 개인지 간단히 볼 수 있습니다.

 

Posted by 코딩곰돌이
,