DGIST, 신개념 데이터 분할 고성능 처리기술 개발

DGIST 김민수 교수
방대한 데이터를 더 효율적이고 더 빠르게 처리할 수 있는 원천 기술이 DGIST에서 개발됐다.

DGIST는 정보통신융합전공 김민수 교수팀이 관계형 데이터 처리기술인 ‘GPT(Graph-based Partitioning Table)기술’을 개발했다고 21일 밝혔다.

최고의 처리속도를 자랑하는 기존의 처리방식보다도 평균 4배가량 더 우수한 처리 성능을 보여 향후 관련 분야에서 활용될 수 있을 것으로 기대된다.

‘관계형 데이터’는 여러 대의 컴퓨터에 분산 저장·처리하는 기술들이 널리 사용되지만 네트워크상에서 연결된 컴퓨터 사이의 많은 양의 네트워크 통신이 필요한 단점을 갖고 있다.


이에 김민수 교수팀은 컴퓨터들 간의 네트워크 통신을 거의 발생시키지 않고도 데이터 분산 처리가 가능한 GPT 기술을 개발해 기존의 문제를 근본적으로 해결하는데 성공했다.

이 기술은 업계 표준 벤치마크 방식인 ‘TPC-DS’를 이용한 데이터 처리성능 비교에서 아파치 스파크 SQL보다 평균 4.2배 더 빠른 처리속도를 보였다. 또한 단순한 이론적 단계를 넘어 실제 산업용 데이터 처리에 짧은 시일 내 상용화가 가능한 수준의 완성도까지 갖췄다는 평가를 받고 있다.

DGIST 정보통신융합전공 김민수 교수는 “이번 연구로 확보한 관계형 데이터 처리 기술은 향후 커져가고 있는 데이터의 양과 그 복잡성을 고려해 볼 때, 매우 유용하게 활용될 것으로 기대하고 있다”고 말했다.

이번 연구 결과는 DGIST 정보통신융합전공 남윤민 박사과정생이 제1저자로 참여했으며, 정보과학분야에서 권위 있는 국제학술지 ‘인포메이션 사이언스(Information Sciences)’ 4월호에 게재됐다.

실시간 랭킹 뉴스