빅데이터(big data)/스팟파이어(Spotfire)

[Overview] Spotfire(by TIBCO)의 소개, 강력한 Graph Visualization 소프트웨어, 추적 분석과 데이터 비교에 독보적인 강점

에스도비91 2021. 6. 28. 23:02
반응형

요즘 회사에서 아주 미친듯이 쓰고 있는 Tool입니다.

미국 매사추세츠 주 소머빌에 한 인텔리전스 회사에서 개발된 것으로 2007년에 TIBCO(팁코) 소프트웨어에 인수되었네요.

Big data를 다루는 직업이라면 무조건 써야한다고 해도 과언이 아닐정도로 Powerful하고 여러가지 프레젠테이션 용 그래프 등, Visualization하는데 성능이 아주 좋습니다. 선형, 원형, 꺽은선, Histogram, Scatter 등.. 이걸 써보시면 엑셀에서의 그래프 기능은 초보 수준에 아주 불편하다고 느끼시게 될겁니다.

그리고 Spotfire를 써야하는 이유이자 최고의 강점은

추적 분석, 데이터 비교가 용이하다.

Visuallization이 강점인 소프트웨어답게 여러가지 형태의 Graph를 그릴 수가 있는데 한 그래프에서 특정 data 한 point를 클릭하면 나머지 그래프에서 해당 데이터가 어디에 위치하는지 강조되어 나타납니다. 아주 직관적으로 데이터를 비교할 수 있게 되죠.

 데이터를 비교하는데 사용되는 가장 기본적인 것은 Color, 종류별로 구분하는데 유용합니다.

 그리고 Size 분류도 되는데 예로 data의 time을 설정하면 가장 최근 데이터는 큰 point로 표현되죠

▶ Trellis는 저도 처음에 굉장히 생소한 단어였는데 '격자구조물'이라는 뜻으로 원하는 분류에 따라 그래프를 Raw, Column, Page로 나누어 데이터를 더 세분화해 일목요연하게 보여줍니다. 

Label은 다들 아시다시피 데이터의 포인트에 세부 설명들이 나타나는데 이건 자주 안씁니다. big data, 즉 많은 양의 데이터를 표현하는데 켜봐야 그래프가 더러워지는 경우가 많아서요.

Line & Curves는 data graph에 원하는 함수 그래프를 넣을 수 있는 기능입니다. 데이터의 Spec을 표현하거나 Histogram에선 Gaussian graph를 추가로 표현해 주는 등 이것도 아주 유용한 기능입니다.

 

Calculated Column

그리고 Calculated Column은 기존 데이터들을 엑셀처럼 수식을 이용해 작업하면 그 계산된 데이터를 새로운 Column으로 만들어주는 기능입니다. 그리고 여기서 작성할 수 있는 수식에는 엑셀에선 지원하지 않는 아주 유용한 것들이 많습니다. Over함수와 Case When Then은 정말이지 강력한 수식!! 이것들을 앞으로 포스팅할 예정입니다.

 

회사 보안 때문에 직접 업무 화면을 캡처할 수는 없어 설명하는데 효과는 조금 떨어지겠으나.. 제가 이 소프트웨어를 다루면서 생긴 노하우, 꿀팁 등을 공유해보겠습니다.

 

일단 본 포스팅에서는 기본 Basic Manual

Replace : 가장 먼저 할 줄 알아야하는 기본은 아무래도 데이터 Replace하는 법일 것 같습니다. Spotfire를 다루는 부서라면 누구라도 하나쯤 데이터 분석 파일을 만들어서 공유할 텐데 이 파일을 받아두면 새로운 데이터가 쌓였을 때 업데이트해서 만들어둔 Graph들의 형식 그대로 바로 나타내주기 때문에 꼭 알아야하는 기능입니다.

왼쪽 Data와 항목들이 나오는 칸에서 상단에 있는 톱니모양을 클릭, 오른쪽에 나오는 창에서 표시한 버튼을 클릭해 Replace를 선택, 새로운 Raw data를 불러옵니다. 혹시 밑에 항목들이 클릭되어 오른쪽 사진과 같은 상태라면 빨간 표시의 'Go to data table view'를 클릭하면 됩니다.

 

Replace할 Raw data는 파일 제작자가 어떻게 뽑는지 가르쳐 줄 것이고,, 데이터를 업데이트해가며 작성된 그래프의 데이터들을 분석, 비교해보세요. 그러면 자기 스타일대로 데이트들을 만들고 싶어질 것이고 그것이 Spotfire를 배우고 싶은 원동력이 될 것입니다.