데이터베이스 트랙

  • 홈ˆ
  • 프로그램
  • 데이터베이스 트랙

[Session 1] Big Data 1   
▒ 일시 및 장소 : 1.19(목) 14:00~15:40 / 그레이스홀2(6층)              좌장 : 김영훈 교수(한양대)

강유 교수(서울대학교)
현재 서울대 컴퓨터공학부 조교수, 2013 SIGKDD Doctoral Dissertation Award, 2013 MSRA New Faculty Award와 두 개의 최우수 논문상 수상

다차원 데이터 마이닝
강연요약 통화 내역 그래프에서 어떻게 중요한 패턴을 추출할 수 있을까? 다차원 지식 베이스에서 서로 연관된 주어, 동사, 목적어 그룹을 어떻게 찾을 수 있을까? 네트워크 트래픽 데이터에서 어떻게 악성 패킷을 찾을 수 있을까? 위 질문들에서 언급한 데이터들은 모두 다차원 데이터(텐서)로 모델링되며, 텐서 마이닝은 위 질문들에 대한 답을 제공하는 툴로 많은 관심을 끌고 있다. 텐서 마이닝은 텐서에서 유용한 패턴과 이상 정보를 추출하는 것을 목표로 한다. 본 발표에서는 텐서 분석의 사례, 이론, 알고리즘에 대해 설명한다.

한욱신 교수(POSTECH)
2013년 ~ 현재 포항공과대학교 창의IT융합공학과/컴퓨터공학과 교수, 경북대학교 부교수, IBM Almaden 연구소 Post-Doctral Fellow 역임

빅 그래프 데이터 처리 기술
강연요약 그래프는 생물학 구조, 소셜 네트워크, 화학물, 온톨로지, 웹 그래프와 같은 실세계의 많은 객체들을 모델링하기 위해 사용된다. 이로 인해 컴퓨터 사이언스, 바이오인포매틱스, 화학, 물리학, 헬스케어 등의 많은 응용들이 그래프 구조 데이터의 효율적/효과적 관리를 필요로 하고 있다. 본 강연에서는 먼저 서브 그래프 색인 및 서브 그래프 동형 검색 알고리즘을 지원하는 iGraph 프레임워크를 소개한다. 서브 그래프 동형 검색은 바이오인포매틱스에서의 모티프 검색, 화학에서의 화합물 검색, 소셜 네트워크 검색, RDF 질의 처리 및 컴퓨터 사이언스에서의 악성 코드 탐지와 같은 많은 중요한 응용에서 사용되고 있다. 다음으로 최신 알고리즘보다 수만 배까지 빠른 서브그래프 동형 검색 알고리즘인 TurboISO를 소개한다. 그리고 개발 중인 그래프 분석 엔진인 TurboGraph를 소개한다. TurboGraph는 1) 멀티 코어 병렬 기능 및 FlashSSD IO의 병렬 기능을 완전하게 활용하였으며, 2) CPU 처리 및 IO 처리 연산들이 가능한 많이 겹치도록 하여 완전한 병렬화를 성취한 첫 그래프 엔진이다. TurboGraph는 수백에서 수천 대에 이르는 머신을 필요로 하는 기존 분산 처리 방법들과 비교하여, 단일 PC상에서 백만 단위 규모의 그래프를 그들과 유사한 수준의 성능으로 처리 할 수 있다. 따라서 100대 미만의 머신만을 사용하여 조 단위 규모 그래프 분석이 가능토록 하는 새로운 시대를 여는 핵심 기술로 사용될 수 있을 것이다. 마지막으로 디스크-기반 병렬 그래프 삼각형 카운트 기법인 OPT와 OPT의 확장인 DUALSIM에 대해서도 간략히 소개한다.

백의현 책임연구원(한국전자통신연구원)
현재 한국전자통신연구원(ETRI) 빅데이터인텔리전스연구부 책임연구원, 2013년 San Jose University 초빙연구원

마이크로 시뮬레이션기반 인구동태 변화 예측
강연요약 2000년대 후반에 들어서, 경제·사회현상을 분석, 예측하기 위한 마이크로 시뮬레이션(Micro Simulation) 기술이 미래 핵심기술로 등장하고 있다. 마이크로 시뮬레이션을 적용하면 각 분야별 쟁점 과제에 대한 다차원 정책실험을 수행할 수 있으며, 이를 통하여 중장기적인 전략설정과 더불어 단기적인 정책수립에 대한 의사결정이 가능해진다. 본 발표에서는 복잡한 사회현상의 본질을 파악하기 위한 마이크로 시뮬레이션 기술을 소개하고, 저출산, 고령화 등 사회변화에 선제적으로 대응하는 정책적 대안을 실험할 수 있는 인구동태 마이크로 시뮬레이션 기술의 현황과 개발 사례를 소개한다.

[Session 3] Big Data 2   
▒ 일시 및 장소 : 1.19(목) 16:00~18:00 / 그레이스홀2(6층)             좌장 : 한욱신 교수(POSTECH)

김영훈 교수(한양대학교)
현재 한양대학교 ERICA 컴퓨터공학과 조교수, 2013년 서울대학교 전기컴퓨터공학부 박사

클라우드 소싱 방법론을 이용한 데이터마이닝
강연요약 클라우드 소싱은 컴퓨터가 수행하기에는 어렵고 가능하다 하더라도 복잡한 연산을 요구하는 일들, 예를 들어 스캔된 이미지에서 글자를 찾는 다던가 리뷰를 읽고 호텔의 평가를 하는 등, 인간이 더 효율적으로 수행할 수 있는 일들을 다수의 익명의 군중에게 배분하여 수행하는 방법론을 말한다. 클라우드 소싱은 물론 근래에 고안된 새로운 시스템이라 할 수는 없으나 컴퓨팅의 일부분을 인간이 수행하고 그 결과를 수집해 컴퓨터가 전체 솔루션을 찾는다는 관점과 온라인을 이용해 소수 전문가가 아닌 다수의 비전문가 군중들에게 일을 맡겨 해결한다는 점, 따라서 다수의 군중들이 병렬/분산 수행하는 구조라는 점에서 차별성이 있으며, 최근 많은 어플리케이션에서 널리 응용되고 있다. 본 발표에서는 클라우드 소싱을 통한 데이터마이닝의 특징을 살펴보고 연사가 수행해온 몇 가지 관련연구를 소개하고자 한다.

오혜연 교수(KAIST)
2008년 9월~현재 KAIST 전산학부 조교수, 부교수, 2008년 8월 MIT Computer Science 박사

딥러닝과 토픽모델링을 결합한 텍스트 분석 모델
강연요약 텍스트 분석은 뉴스나 블로그, 상품 후기, 소셜미디어 등의 수많은 텍스트 데이타에 대한 토픽 분석, 오피니언(감정) 분석 등에서 매우 중요하다. 이미지 분석에서 뛰어난 결과를 보여주고 있는 딥러닝은 텍스트 분석에서도 다양한 모델로 적용되어 좋은 결과를 보여주고 있다. 기존의 토픽과 감정 분석에서 널리 쓰이고 있는 토픽모델인 Latent Dirichlet Allocation (LDA), 그리고 새롭게 딥러닝을 통해 텍스트 모델링을 하는 word2vec 모델을 결합한 dual representation topic model을 소개한다.

이상원 교수(성균관대학교)
2002년~현재 성균관대학교 소프트웨어학과 교수, 2013년 삼성 산호세 연구소 방문 연구원, 2006년 Univ. of Arizona 방문연구원

데이터베이스와 플래시메모리 저장장치의 융합
강연요약 All-flash 저장장치 시대가 성큼 다가오고 있다. 현재의 데이터베이스 엔진은 기존 저장장치인 하드디스크를 단순 읽기, 쓰기 인터페이스만을 사용했다. 하지만, 플래시메모리 저장장치(SSD)는, 하드디스크와 달리, 단순 블록 디바이스를 넘어 다양한 최적화 기회를 제공한다. 본 강연에서는 플래시메모리 특성과 최근 제안된 인터페이스를 간단히 리뷰하고, MySQL 오픈소스 DB 사례 중심으로 SSD와 DB엔진의 수직적 최적화 기법을 소개하고, 새로운 오픈소스 DBMS 엔진 기술개발 및 비즈니스 기회도 간단히 논한다.

지수영 실장(한국전자통신연구원)
1991년 1월~현재 한국전자통신연구원 SW콘텐츠연구소 지능형인지기술연구부 실장, 2011년 9월~현재 한국과학기술연합대학원 컴퓨터 소프트웨어 및 공학 전임 교수

중소 제조산업의 4M 데이터 통합 분석을 활용한 프리딕티브 매뉴팩춰링 시스템 개발
강연요약 제조 전 과정에 관련된 4M 데이터의 수집과 저장/관리, 예측적 분석을 통해 선제적 제조 활동 개선이(예방정비, 불량 요인 개선, 생산성 향상 요인 제고 등) 가능한 의사결정을 지원하는 중소 제조 산업을 위한 프리딕티브 매뉴팩춰링 시스템 개발 o 핵심 기술 - 4M 데이터 통합저장관리 기술 - 4M 데이터 모니터링 기술 - 4M 데이터 분석을 통한 공정 최적화 기술 - GUI 모델링 및 시각화 도구 o 적용 분야 - 중소 제조 기업

※ 상기일정은 사정에 따라 변경될 수 있습니다.

서울시 서초구 방배로 76 (방배동, 머리재빌딩 401호) 우)06704 | (Tel)1588-2728 | (Fax)02-521-1352 | 사업자등록번호 : 114-82-03170 | 대표 : 나연묵

Copyright (c) KIISE. All rights reserved.