에이전틱 AI는 왜 온톨로지를 필요로 하는가
솔트룩스 이경일 대표가 말하는 AI의 세 물결, 뉴로심볼릭 AI, 그리고 소버린 AI 전략
솔트룩스가 주최한 '에이전틱 AI, 온톨로지로 완성되다' 세미나에서 이경일 대표의 키노트를 정리했다. 1994년에 첫 AI 기업을 설립하고, 2000년에 솔트룩스를 창업해 25년간 AI 한 분야만 해온 사람의 시각에서 본 온톨로지의 귀환이다.
AI의 세 물결과 온톨로지의 위치
AI의 역사는 세 번의 큰 물결로 나눌 수 있다. 첫 번째 물결은 1943~45년 무렵 퍼셉트론의 개념적 정립과 폰노이만 방식 컴퓨터의 등장이다. CPU, 메모리, 페리퍼럴을 분류하고 버스로 연동하는 이 70년 된 아키텍처는 현재까지 모든 컴퓨팅의 기반이다. 1980년대에 들어서 로지컬 AI가 부상하면서 머신러닝 알고리즘과 함께 온톨로지가 태동했다. 각 물결 사이에는 'AI 윈터'가 있었다. 예산이 끊기고 연구자의 관심이 줄어드는 시기다.
두 번째 AI 윈터(세컨드 윈터) 시절에 시멘틱 웹이라는 큰 무브먼트가 있었다. 월드와이드웹을 만든 팀 버너스리가 W3C 컨소시엄을 통해, 전 세계 웹 환경을 온톨로지와 추론이 가능한 글로벌 네트워크로 구성하겠다는 비전을 제시했다. RDF, OWL 같은 온톨로지 표준이 이때 완성됐다. 2000년대에는 '인공지능'이라는 용어를 쓰는 것 자체가 불경스럽다는 분위기였다. 솔트룩스가 창업된 것이 바로 이 시기인 2000년이다.
세 번째 물결은 트랜스포머 기반의 제너레이티브 AI다. 거대하게 만들수록 더 정확한 답변, 이미지, 노래까지 생성할 수 있다. 그리고 지금, 제너레이티브 AI가 끝나기 전에 에이전틱 AI가 다음 단계로 부상하고 있다. 에이전틱 AI의 본질적 변화는 LLM이 리즈닝(추론)과 플래닝(계획)을 할 수 있게 됐다는 것이다. 데이터를 넣으면 답변을 생성하는 것이 아니라, 깊게 사고하고 목표를 달성할 계획을 세우게 된 것이다.
에이전트란 무엇인가: 에이전시 비유
에이전트를 이해하는 가장 쉬운 방법은 에이전시라는 조직을 생각하는 것이다. 여행 에이전시, 연예 기획사, 스포츠 에이전시, 광고 에이전시, 금융 기관. 이들은 고객의 권리, 자본, 시간을 위탁받아 기획하고, 실행하고, 책임지고, 전문성을 보유하면서 위험 관리와 경제성을 달성한다. 무엇보다 이 모든 것의 업무 프로세스를 가지고 있어야 한다.
에이전트의 정의는 스스로 의사결정을 내리고 행동함으로써 목표에 도달할 수 있는 모든 개체다. 사람도 에이전트이고, 이제 수학으로 만들어진 AI도 조직에 들어와서 에이전트로 협업하는 세상이 열렸다. 여러 에이전트가 협력하려면 조직이 필요하고, 조직을 구성하려면 누가 무엇을 잘하는지 알아야 한다. HR 조직 같은 것이 필요한 것이다. 그래서 만들어진 것이 MCP(Model Context Protocol)와 A2A(Agent-to-Agent) 같은 프로토콜이다. MCP는 다른 모델과 도구를 호출하고 연동하는 수직적 프로토콜이고, A2A는 에이전트끼리 상호 운영할 수 있는 수평적 프로토콜이다.
딥리서치와 구버: 에이전틱 프로세스의 실체
에이전틱 AI가 실제로 어떻게 작동하는지는 딥리서치(Deep Research) 기능에서 볼 수 있다. 사용자가 질문을 하면, 하이브리드 RAG로 정보 검색을 하고, 리즈닝 페이즈를 거치면서 문서를 하나하나 읽는다. "이게 사용자가 요구한 것에 맞는가?" 확인하고, 목표에 도달하지 못하면 MCP 서버를 호출하거나 추가 정보를 조사해서 결합하는 것을 반복한다. 플래닝 단계에서는 어떤 도구와 과정을 거쳐야 하는지 계획을 세운다. LLM 하나가 도는 것이 아니라 수십 번 이상 작동한다.
솔트룩스의 미국 법인이 만든 구버(Goover) 서비스가 이 과정을 보여준다. 'go over'(깊게 살펴봐라)라는 뜻이다. 이경일 대표가 시연한 사례에서는 "팔란티어의 온톨로지 기술을 참조해서 한국의 소버린 AI 기술을 확보하려면?"이라는 질문을 던졌다. 구버는 질문을 다방면으로 분석하고, 벡터 검색으로 의미 검색을 수행한 뒤, 40개의 문서를 수집해서 전부 읽었다. 읽고 나서 "이 질문에 답하려면 이런 추가 질문에도 답해야 한다"고 스스로 질문을 만들어냈다. 16개 문서가 적절하다고 판단한 뒤, 그것이 충분한지 다시 추론해서 부족하면 추가 자료를 검색했다. 최종적으로 답변 구조를 플래닝하고, 목차와 참조 문서를 정리해서 리포트를 생성했다.
이 서비스의 핵심은 질문하면 끝나는 것이 아니라, 해당 분야를 24시간 모니터링하는 에이전트를 생성한다는 점이다. 에이전트가 매일 자동으로 리포트와 팟캐스트를 만들어내고, 그 결과물이 구글 검색에도, ChatGPT의 레퍼런스에도, 퍼플렉시티에서도 참조된다. 3개월 만에 전 세계 140만 사용자를 달성했는데, 월 운영 비용이 2천만 원밖에 안 된다. LLM만으로는 불가능한 비용 구조다. 온톨로지와 결합해서 운영 비용을 1/10로 낮춘 것이 핵심이고, 고가 GPU와 RTX 4090 같은 저가 GPU를 혼용하는 니오클라우드 아키텍처가 이를 가능하게 했다.
뉴로심볼릭 AI: 좌뇌와 우뇌의 결합
DARPA(미국 국방부 산하 R&D 기관)는 AI의 발전을 세 단계로 정의했다. 첫 번째 웨이브는 기호적 접근이다. 지식 베이스(온톨로지)를 만들고 논리적, 연역적 추론을 한다. 두 번째 웨이브는 비기호적 접근으로, 기계 학습과 딥러닝이다. 첫 번째 웨이브는 학습을 못 하고, 두 번째 웨이브는 추론을 못 한다. 이 둘을 결합한 것을 DARPA는 '뉴로심볼릭 AI(Neuro-Symbolic AI)'라고 정의하고, 이것이 설명 가능한 인공지능(XAI)의 핵심이라고 제시했다.
LLM의 할루시네이션이 존재하는 근본적 이유는 두 가지다. 첫째, 벡터 표현의 한계. 1,000~2,000 차원의 벡터로 세상의 모든 지식을 표현하면 근사치(approximation)가 될 수밖에 없다. 둘째, 확률적 생성. 글이나 그림을 생성할 때 디퓨전 모델을 포함해 확률 통계적으로 주사위를 던지는 방식이다. 이 두 가지가 트랜스포머의 근본적 시각이기 때문에 모델 자체만으로는 할루시네이션을 영원히 없앨 수 없다.
온톨로지는 여기서 놀라운 결과를 제공한다. 솔트룩스가 국내 최대 기업과 함께 검증한 사례에서, RAG를 문서가 아닌 온톨로지로 수행하는 '날리지 그라운딩'을 적용했더니 할루시네이션이 제로가 됐다.
모차르트와 아인슈타인이 심볼을 필요로 한 이유
이경일 대표가 든 비유가 인상적이었다. 모차르트는 악보에 작곡을 한 적이 한 번도 없었다. 머릿속에 모든 음악이 들어 있었다. 그런데 왜 악보를 그렸을까? 오케스트라 40명의 단원들에게 자기 머릿속의 음악을 전달할 방법이 필요했기 때문이다. 자기 뇌는 뉴럴 시스템인데, 다른 사람의 뉴럴 시스템과 연결하려면 심볼이 필요한 것이다.
아인슈타인도 마찬가지였다. 아침에 출근할 때 한 시간 동안 머릿속으로 미분 방정식을 풀었다고 한다. 그런데 특수 상대성 이론과 일반 상대성 이론을 유도하는 과정에서 수학자를 불러 칠판 열 개 분량을 써야 했다. 유도하는 절차 자체가 지식이고, 그 절차를 기록하는 과정에서 비로소 도달할 수 있는 결론이 있기 때문이다. 에이전틱 AI가 발전할수록 에이전트 간에 지식을 공유하고 정보를 교환할 표준 언어가 더 필요해진다. 음악에서의 악보, 수학에서의 수식처럼, AI에서의 온톨로지가 바로 그 역할을 한다.
소버린 AI를 위한 여섯 가지 제언
발표의 마지막은 실무적 제언이었다. 팔란티어가 한국 국방 부문에 1년에 3,000억 원의 사용료를 요구했다는 이야기를 꺼내며, 소버린 AI의 필요성을 역설했다. 10년 쓰면 3조다. 안전, 제조, 국방까지 미국에 의존할 수는 없다.
첫째, 온톨로지 모델링을 과거의 추론이나 지식 표현이 아닌 시멘틱 인터오퍼러빌리티, 즉 데이터 패브릭과 매시업 관점으로 접근해야 한다. 데이터를 전부 온톨로지로 변환하는 것이 아니라, 필요한 데이터만 온톨로지로 변환해서 서비스가 온톨로지를 바라보게 하는 것이다. 둘째, 에이전틱 AI를 지원하면서 온프레미스로 설치 가능한 파운데이션 모델이 결합되어야 한다. 셋째, 각 데이터 소스에 대한 MCP 체계가 필요하다. 사일로에 있는 데이터베이스 위에 MCP를 구성하고, 시멘틱 레이어가 이를 바라보게 하면 보안을 유지하면서 통합이 가능하다.
넷째, 기술 플랫폼이 아닌 문제 정의부터 시작해야 한다. LLM만 만들면, 플랫폼만 만들면 해결될 거라는 환상은 빅데이터 시대에 이미 실패로 증명됐다. 해결할 문제를 정의하고, 그 문제를 해결할 데이터를 찾고, 그 데이터를 학습할 방법과 온톨로지 체계를 설계하는 순서가 맞다. 다섯째, 구축 비용뿐 아니라 총운영비용(TCO) 최적화가 필요하다. 구버 서비스가 1/10 비용으로 운영 가능한 것은 온톨로지와 LLM의 결합 덕분이다. 여섯째, 4개월 단위로 작고 빠른 MVP 프로젝트를 해야 한다. 팔란티어를 도입하더라도 내부에서 쉐도 프로젝트를 병행해서 내재화할 수 있는지 검증하는 것이 대한민국이 살아남는 길이다.