본문으로 건너뛰기

AI 인텔리전스

AI 인텔리전스는 GenD의 AI-Native 데이터 이해 기능을 집합한 모듈입니다. 테이블 간 관계를 시각화하는 Schema Graph, RAG 검색을 위한 Documents, 비즈니스 용어를 정의하는 Glossary, 자연어를 SQL로 변환하는 Text-to-SQL, 그리고 멀티 AI 프로바이더 선택 등 다섯 가지 핵심 기능으로 구성됩니다.

Schema Graph

Schema Graph

Schema Graph는 카탈로그에 등록된 테이블 간의 관계를 노드-엣지 그래프로 시각화합니다.

그래프 구성 요소

요소설명
노드 (Node)개별 테이블을 나타내는 원형 또는 카드 형태의 요소
엣지 (Edge)테이블 간 외래 키(FK) 또는 조인 관계를 나타내는 연결선
클러스터동일 스키마에 속하는 테이블 그룹

노드를 클릭하면 해당 테이블의 컬럼 목록과 관계 정보를 확인할 수 있습니다. 그래프는 드래그 및 줌으로 탐색할 수 있으며, 특정 테이블을 중심으로 관련 테이블만 필터링하여 볼 수 있습니다.

데이터 저장소

Schema Graph 데이터는 ArangoDB 그래프 데이터베이스에 저장됩니다. 스키마 동기화(Schema Sync) 작업이 주기적으로 Trino 메타데이터를 ArangoDB에 반영합니다.

Documents

Documents

Documents는 인제스천된 문서를 관리하고 RAG 검색에 활용하는 화면입니다.

기능설명
문서 목록인제스천 완료된 문서를 카테고리별로 탐색
검색키워드 또는 의미 기반(semantic) 검색으로 관련 문서 조회
청크 미리보기문서의 청킹 결과를 개별 조각 단위로 확인
메타데이터보안 등급, 태그, 업로드 일시, 청크 수 등

RAG 검색 시 사용자의 질문과 의미적으로 유사한 문서 청크를 벡터 유사도 기반으로 검색하여 LLM의 컨텍스트로 제공합니다.

Glossary

Glossary

Glossary는 조직의 비즈니스 용어를 정의하고 관리하는 용어집입니다.

항목설명
용어 (Term)비즈니스 용어명 (예: "매출액", "활성 사용자", "이탈률")
정의 (Definition)용어의 비즈니스적 정의
관련 테이블해당 용어와 연관된 테이블/컬럼 매핑
동의어동일한 의미를 가진 다른 표현

Glossary에 등록된 용어는 Text-to-SQL 파이프라인에서 자연어를 SQL로 변환할 때 컨텍스트로 활용됩니다. 예를 들어 "매출액이 높은 고객"이라는 질문에서 "매출액"이 orders.totalprice의 합계임을 Glossary를 통해 파악합니다.

Text-to-SQL 파이프라인

GenD의 Text-to-SQL 파이프라인은 네 단계의 데이터 저장소를 활용합니다.

사용자 질문 (자연어)


┌──────────────┐ 의미 검색 ┌──────────────┐
│ Weaviate │ ──────────────→ │ 관련 문서 │
│ (VDB) │ 벡터 유사도 │ 청크 추출 │
└──────────────┘ └──────┬───────┘

┌──────────────┐ 관계 탐색 ┌─────▼────────┐
│ ArangoDB │ ──────────────→ │ 스키마 관계 │
│ (Graph) │ 그래프 순회 │ 컨텍스트 │
└──────────────┘ └──────┬───────┘

┌──────────────┐ SQL 생성 ┌─────▼────────┐
│ LLM │ ◀───────────── │ 프롬프트 │
│ (AI 모델) │ ──────────────→ │ 생성된 SQL │
└──────────────┘ └──────┬───────┘

┌──────────────┐ 쿼리 실행 ┌─────▼────────┐
│ Trino │ ◀───────────── │ SQL 실행 │
│ (RDB) │ ──────────────→ │ 결과 반환 │
└──────────────┘ └──────────────┘
  1. Weaviate (VDB) — 사용자 질문과 유사한 문서 청크를 벡터 검색으로 추출
  2. ArangoDB (Graph) — 관련 테이블 간 관계를 그래프 순회로 파악
  3. LLM (AI 모델) — 문서 컨텍스트 + 스키마 관계를 바탕으로 SQL 생성
  4. Trino (RDB) — 생성된 SQL을 Federation 엔진에서 실행하여 결과 반환

주요 기능

  • 스키마 그래프 시각화 — 테이블 간 관계를 직관적인 그래프로 탐색
  • RAG 문서 관리 — 인제스천된 문서를 의미 기반으로 검색
  • 비즈니스 용어집 — 조직 고유 용어를 정의하여 AI 정확도 향상
  • Text-to-SQL — 자연어 질문을 SQL로 자동 변환
  • 멀티 AI 프로바이더 — OpenAI, Anthropic, 로컬 모델 중 선택 가능

관련 링크