Human-Computer Interaction(HCI) 의 미래
LLM의 시대가 도래했다. 이에 따라 interface 에도 큰 바람이 불고 있다. 이전까지는 “인간이 이용하기 편리한” 인터페이스가 짱이었다. 하지만 지금도 그럴까? 그렇지 않다라는 근거가 여기저기서 보인다.
상호작용의 주체를 셋으로 나눠보자. (A) 인간, (B) LLM, (C) 일반 서비스.
- A-B 간의 상호작용: 인간은 이제 주로 “대화”의 형태로 컴퓨터와 상호작용할 것이다. 그것이 채팅이든 음성이든.
- B-C 간의 상호작용: LLM과 일반 서비스는 “텍스트” 형태로 상호작용한다. 물론 기술이 발전하며 LLM이 이미지를 분석하는 능력이 크게 늘고 있지만, 그래도 “텍스트”를 활용하는 것이 훨씬 효율적이다.
- A-C 간의 상호작용: 인간이 일반 서비스와 직접 상호작용하는 것은 없어지지는 않을 것이다. Backward-compatibility (가령 LLM 채팅보다 직접 웹사이트에 접속하는 것이 더 편리하다고 느끼는 사람들)의 측면도 있거니와, 인간은 근본적으로 “대화”의 형태로만 다른 객체와 소통하지는 않기 때문이다.
우리가 주목해야 될 것은 B-C 간의 상호작용이다. 이미 A-B, A-C 간의 상호작용은 어느정도 상향평준화가 되어있기 때문이다. B-C 가 sweet spot 인 것을 일찍 알아챈 서비스 제공자들은 이미 여러 기능들을 제공하고 있다. 가령 Notion 은 클라우드 베이스로 운영되고, LLM 이 여기에 접근하려면 API 를 통해야 한다. 물론 이것도 텍스트 기반이긴 하지만, 로컬 파일을 LLM 이 직접 제어하는것과는 천지차이다. 따라서 Notion 에서 로컬 파일 기반 프로젝트 매니징/노트 테이킹 애플리케이션으로 움직이는 흐름이 많이 보인다. 이것의 대표 예시가 Obsidian 이다. Obsidian은 강력한 plugin 들과 함께 로컬 파일 기반의 markdown editor 를 제공하고 있기 때문에, Notion 에서 Obsidian 으로 옮겼다는 이야기가 많이 들린다. 이러한 흐름에 발맞춰, Obsidian 은 전용 CLI 를 제공하며 LLM과의 결합을 더욱 강하게 하기 위한 기능을 출시하고 있다.
그럼 우리는 어떻게 해야 할까?
하지만 이러한 흐름에 발맞추고 있지 못하는 기관을 꼽아본다면, 나는 공공 및 금융이라고 답할 것 같다. 물론 이 분야는 항상 기술의 발전에 한 발자국 늦곤 했다. 그래서 어느정도 면죄부를 줄 수는 있지만, 그래도 이러한 흐름을 빠르게 인식하고 개선했으면 하는 기대가 있다. AI 강국이 되고자 하는 대한민국의 목표를 생각해본다면, LLM 자체의 성능을 향상시키는 것 뿐만 아니라 이런 LLM과의 통합이 빠르게 되는 것 또한 중요할 것이다. 전자는 연구의 차원이고, 후자는 개발의 차원이기 때문에 이러한 두 축이 병행되는 것이 무리는 아닐것이다.
물론 공공 및 금융이 LLM과 통합되는 것에 challenge는 당연히 있다. 보안이 중요하기에, 어떻게 LLM이 공공 및 금융 서비스에 “안전하게” 연결할 수 있을지 고민해 봐야 한다. 낙관적으로 보자면, 아마도 LLM 통합의 중요성에 대해 이미 인지하고 있지만 이러한 challenge 때문에 통합이 늦어지는 측면이 있을것이다. 그리고 공공 및 금융에서도 MCP를 개발한다 만다 하는 뉴스가 좀 보이는 것 같아서 아주 오래 걸리지는 않겠구나 하는 생각도 있다. 얼른 통합이 되어서 정부4.0을 넘어서 정부 5.0이 되고, 비싼돈주고 사용하는 내 클로드에서 이러한 기능들을 사용하고 싶다.