AI Agent의 투두 리스트 경험

November 27, 2025

비개발자에게 다가갈 전략은?

AI Agent가 넘실대는 세상이다. 우스갯소리로 ‘딸깍’ 하고 휘파람 불고 있으면 뚝딱 완성된다는게 이젠 진짜가 되었다.

개발자로서 Gemini CLI와 Cursor의 Agent를 사용해본 느낌과 비개발자에게 AI Agent가 취해야 할 UX 전략을 생각해봤다.

Gemini CLI

진행 방식

사용자 입력을 받고 플랜을 세운다.
플랜을 todo.md 와 같은 파일로 임시 생성해 보여준다.
투두 리스트의 각 항목의 하위 내용에 대해 write/read/excute 권한을 묻는다. 이 때, 같은 내용에 대해 전부 같은 권한 허용을 할 지 묻기도 한다.

액션에 대한 y/n 처리 방식

제미나이는 (1)이 액션만 허용할건지 (2)똑같은 액션에 대해 전부 허용할건지 (3)허용하지 않고 다른 제안을 제시할건지 묻는다.

(1), (2)에 대해선 굉장히 자연스럽고 편하게 진행된다. CLI임에도 불구하고 마치 VSCode같은 IDE를 쓰는 것 같은 시각적 편안함을 준다.

(3)은 그냥 ESC 내지는 quit 내지는 exit 느낌을 준다. 절단된 사용자 경험을 주는데, 왜 그런지 이유를 두가지 생각해봤다.

첫번째 이유: 멘트

9dcf78679bffd710

위 이미지는 Gemini CLI 확장 프로그램 사용하기 튜토리얼에 삽입된 이미지이다.

마지막 옵션을 보면 ‘No, suggest changes (esc)’라고 되어 있다. 액션은 그냥 ESC인데 멘트는 마치 pause를 하는 것 같은 느낌을 준다. (나만 그럴 시 제미나이에게 사과함)

그래서 막상 그만두는 옵션을 선택해놓고 다른 제안을 전송하면 갑자기 초면인양 앞선 내용들을 참조하지 못한다. (내가 잘 못 쓰는거라면 제미나이에게 사과함)

두번째 이유: 인터페이스

CLI의 한계인 것 같다.

어쩔 수 없이 다양한 인터페이스를 제공해주지 못하기 때문에 앞서 제미나이가 만들었던 TODO List라던가 액션에 대한 사용자의 리액션이 어떤거였는지 추적하기가 어렵다. 그래서 뭔가 중간에 간섭하는 느낌이 아니라 전체 액션이 중단된 것처럼 느껴진다. (근데 그게 맞긴 함)

Cursor Agent

진행 방식

사용자 입력을 받고 플랜을 세운다.
플랜을 plan.md 와 같은 파일로 임시 생성해 보여준다.
투두 리스트의 각 항목의 하위 내용에 대해 자동으로 실행한다.

액션에 대한 y/n 처리 방식

중간에 y/n 처리할 필요가 없다. 그냥 지가 알아서 TODO에 대한 내용을 쭉 만들고 결과만 보내준다. 절차적인 Gemini CLI와 다르게 굉장히 결과중심적이다.

Screenshot 2025-11-27 at 4 08 35 PM

Agent 모드를 사용하지 않을 때, 즉 그냥 Cursor에서 AI Chat을 쓸 때랑 아주 유사하다. 결과에 대해 적용할건지 말건지에 대한 y/n 처리만 해주면 된다.

plan.md와 result.md

사용자 입력에 대해 Agent가 세운 플랜(투두)과 그것이 어떻게 적용됐는지 최종 결과 리포트를 마크다운으로 생성해 보여준다.

VSCode IDE 기반이라 실제로 잘 정리된 마크다운을 볼 수 있고, TODO에 액션을 추가할수도 있다.

그럼에도 Agent의 플랜에 뭔가 불편(?)한게 있어서 수정하고 싶어도 쉽게 수정이 안 된다. 얘는 GUI인데 왜일까?

문서가 가진 일방향성

가장 큰 이유는 마크다운 문서라는 형식 자체의 단방향성이라 생각한다.

채팅은 자명하게 특정 내용에 대해 ‘답글’이 가능하다. 챗 지피티와의 채팅에서도 이야기가 딴 길로 새버리면 기존 채팅에서 브랜치를 새로 딸 수 있다. 이런 유동성이 채팅의 강점인데, 마크다운으로 ‘나 이렇게 할거요.’ 라고 보내주면 거기에 피드백하기가 어렵다.

채팅 기반이다가 갑자기 문서가 나와서 이렇게 할거야 짜잔~ 하니까 대충 이건 필요 없을것 같은데..? 싶어도 그냥 어어 그래~~ 하고 돌려버리게 된다. (나만 느끼는거면 커서에게 사과함)

AI Agent의 UX

공통적으로 사용자 입력을 받고, 그에 대해 계획을 세우고 사용자에게 허락을 받는다.

사용자 허락이 떨어지면(딸깍) 일을 촤라락 알아서 한 다음 사용자에게 어떤게 적용됐는지 알려준다.

그 중간에 일을 촤라락 하는 과정에서 사용자의 인터셉트를 처리하는 UX가 아직은 매끄럽지 못하다는 생각이 든다.

그 이유로 Gemini CLI의 경우 멘트와 CLI의 특성을 들었고, Cursor Agent의 경우 마크다운 문서의 특성을 들었다.

프로세스가 어떻게 돌아가고 특징이 어떻고… 하는 잡 지식 내지는 DX(Developer Experience, 일반적으로 쓰이는 그 DX 아니고 내가 만듦)를 가진 개발자들은 어느정도 인터럽트를 걸기도 하고 자기 입맛에 알맞게 커스터마이징을 하기도 할텐데 비개발자들에겐 이 AI Agent가 어떻게 다가가야 할까?

아는 맛

최근에 읽었던 UIUX 책에서 ‘널리 쓰여서 공식처럼 굳어진 UIUX’를 지향하라는 내용이 진리라고 생각한다.

앞서 말했던 것처럼 ‘채팅’이 가진 양방향성, 그리고 유동성을 통일있게 가져가는 것이 비개발자들이 생소한 기술에 더 쉽게 적응할 수 있는 길이지 않을까?

stop 말고 pause

공장이 잘 돌아가다가 나때문에 전기가 싹 다 나갔다고 생각해보면 오싹하다. 근데 레일 하나만 잠깐 멈춰서 앞에 작업했던 것들은 그대로 남아 있고, 뒤에 작업할 것들도 내가 다시 신호를 주면 하던 대로 일을 계속한다는 약속이 있으면 좀 덜 부담스럽다.

사실은 나도 stop 아니고 pause를 누른걸수도 있지만 어쨌든 나의 사용 경험은 결과적으로 STOP이었다.

멘트든, 기능이든 Pause를 해서 전체를 그만두기 전에 하나의 디딤돌을 더 두면 안정감을 가질 수 있지 않을까?

아님 말고

요즘 나는 AI Agent 앱을 만들면서 앱 자체의 사용성을 확보하고 AI Agent UX에 대한 최소 공식(?)을 따를 수 있도록 애쓰고 있다.

솔직히 이게 챗지피티 무료버전 쓰는 대중에게 어떻게 다가가야 ‘티가 날지’… 일단 티가 나는게 맞는지, 그게 그들의 구매욕구를 실제로 불러일으킬지 고민이 많이 된다.

모쪼록 많은 개발자들이 기술 자체에만 매몰되지 않고 기술이 사회에 어떻게 적용될 수 있을지 DX(이건 그 Digital Transformation 맞음) 및 UI, UX를 고민할 수 있길 바라며 나의 실험기와 고민기를 마친다.

많은 관심과 조언 환영입니다

Twitter Facebook LinkedIn

Seri

AI Agent의 투두 리스트 경험

비개발자에게 다가갈 전략은?

Gemini CLI

진행 방식

액션에 대한 y/n 처리 방식

첫번째 이유: 멘트

두번째 이유: 인터페이스

Cursor Agent

진행 방식

액션에 대한 y/n 처리 방식

plan.md와 result.md

문서가 가진 일방향성

AI Agent의 UX

아는 맛

stop 말고 pause

아님 말고

공유하기

댓글남기기

참고

메*커피 알바하면서 느낀 고령화 시대의 UIUX

macOS에서 pdf 용량 줄이기(feat. ghostscript, 터미널)

RIBs 아키텍처 이해하기