AI 연구자 안드레이 카르파시가 작성한 것으로 추정되는 새로운 AI 코딩 지침 문서가 개발자 커뮤니티에서 빠르게 퍼지고 있다. 진위는 확인되지 않았지만, 기존에 널리 알려진 4가지 원칙을 10가지 규칙으로 확장하면서 AI 코딩 에이전트의 프롬프트 작성법을 넘어 자율적으로 작업을 수행하는 '에이전트 워크플로우' 자체를 바꿀 수 있다는 평가가 나오고 있다.

27일(현지시간) 테크타임스에 따르면, 최근 X를 통해 공유된 문서는 'CLAUDE.md' 파일로 '같은 실수를 두 번 보고 얻은 짧은 규칙(A Short List of Rules, Earned by Watching the Same Mistakes Twice)'이라는 부제를 달고 있다.

5주 전 앤트로픽의 사전학습(Pre-training) 팀에 합류한 카르파시는 문서의 진위에 대해서는 공개적으로 언급하지 않았다.

이번 문서는 많은 개발자들이 이미 사용하고 있는 '안드레이-카르파시 스킬(andrej-karpathy-skills)' 저장소와는 다른 내용이다. 

지난 1월 카르파시는 X를 통해 "코딩 작업의 80%를 AI 에이전트가 수행하고, 사람은 20%만 직접 코딩한다"고 자신의 개발 방식을 소개했다. 이를 개발자 포레스트 창이 정리해 깃허브에 공개한 '4가지 규칙' 저장소는 현재 두 개의 리포지토리를 합쳐 20만개 이상의 별점을 기록하며 깃허브 역사상 가장 빠르게 성장한 프로젝트 가운데 하나가 됐다.

기존 규칙은 ▲코딩 전에 충분히 생각하기(Think Before Coding) ▲필요한 최소한의 코드만 작성하기(Simplicity First) ▲요청받은 부분만 수정하기(Surgical Changes) ▲작업 완료 기준을 먼저 정의하기(Goal-Driven Execution) 등으로 구성됐다.

이들 규칙은 AI가 불필요한 기능을 추가하거나 요구하지 않은 부분까지 수정하는 대표적인 실패 사례를 줄이는 데 초점을 맞췄다.

이번에 유포된 문서는 여기에 6가지 규칙을 추가했다. 가장 큰 차이는 AI가 코드를 작성한 이후에도 스스로 검증하고 판단하도록 만드는 것이다.

첫 번째 규칙인 검증(Verification)은 버그를 수정하기 전에 반드시 오류를 재현하는 테스트를 먼저 작성하도록 요구한다. 이후 코드를 수정하고 테스트를 다시 실행해 통과해야만 버그가 해결된 것으로 간주한다. AI가 "수정된 것 같다"고 판단하는 것이 아니라 실제 테스트 결과를 기준으로 삼도록 한 것이다.

두 번째는 목표 중심 실행(Goal-Driven Execution)을 더 강화한 내용이다. "입력 검증을 추가하라"는 모호한 요구 대신 "빈 이메일 주소나 잘못된 형식의 이메일을 입력하면 오류 메시지를 반환하고 관련 테스트를 통과한다"처럼 기계적으로 검증 가능한 완료 조건을 먼저 정의하도록 했다. 여러 단계의 작업이라면 구현보다 계획을 먼저 세우도록 규정한다.

세 번째 디버깅(Debugging) 규칙은 오류 메시지와 스택 트레이스를 끝까지 읽고, 문제를 재현한 뒤 한 번에 하나의 요소만 수정하도록 요구한다. 원인을 확인하지 않은 채 여러 부분을 동시에 수정하는 AI의 대표적인 실패 사례를 막기 위한 것이다.

네 번째 의존성(Dependencies) 규칙은 새로운 라이브러리 추가를 최소화하도록 한다. 프로젝트에 이미 포함된 라이브러리나 표준 라이브러리로 해결할 수 있는지 먼저 확인하고, 새로운 패키지를 추가할 경우 그 이유를 명확히 기록하도록 했다.

다섯 번째 커뮤니케이션(Communication) 규칙은 AI가 근거 없는 자신감을 보이지 않도록 한다. "이 라이브러리가 스트리밍을 지원하는지 확실하지 않다"는 표현은 허용하지만 "잘될 것 같다"와 같은 막연한 추측은 금지한다.

가장 주목받는 것은 마지막 규칙인 공통 실패 패턴(Common Failure Modes)이다. 문서는 AI 에이전트가 작업을 수행하는 도중 스스로 문제 패턴을 감지하면 즉시 작업을 중단하도록 하는 네 가지 대표적인 실패 유형도 제시했다. 이는 단순히 코드를 완성하는 것보다 잘못된 방향으로 작업이 확산하는 것을 방지하는 데 초점을 맞춘 규칙이다. 

첫 번째는 '키친 싱크(Kitchen Sink)' 현상이다. 이는 수도꼭지를 고치라는 요청을 받았는데 부엌 전체를 리모델링하는 것처럼, 요구 범위를 불필요하게 확대하는 경우를 의미한다.

두 번째는 '잘못된 추상화(Wrong Abstraction)'다. 동일하거나 유사한 코드가 여러 곳에서 반복되고 있음에도 이를 공통 함수나 모듈로 추상화하지 않아 중복 코드가 계속 늘어나는 패턴을 말한다.

세 번째는 '낙관적 경로(Optimistic Path)'다. 정상적인 입력이나 이상적인 실행 환경만 가정한 채 코드를 작성하고, 잘못된 입력이나 네트워크 장애, 서버 오류 등 실제 서비스에서 발생할 수 있는 다양한 예외 상황을 고려하지 않는 경우를 뜻한다.

마지막은 '폭주하는 리팩터링(Runaway Refactor)'이다. 하나의 파일만 수정하면 해결될 작업이 연쇄적인 구조 변경으로 이어져 여러 파일을 동시에 수정하게 되는 현상을 말한다. 

문서는 이러한 패턴을 인식하면 끝까지 작업을 밀어붙이는 대신 즉시 멈추고 방향을 다시 점검해야 한다고 설명한다.

개발자들은 이번 문서가 최근 AI 개발의 핵심 개념으로 떠오른 '루프 엔지니어링(Loop Engineering)'과 맞닿아 있다고 평가한다.

'클로드 코드'를 개발한 보리스 체르니 앤트로픽 책임자는 최근 인터뷰에서 "나는 더 이상 클로드에게 프롬프트를 작성하지 않는다"라며 "클로드에게 프롬프트를 보내고 무엇을 해야 하는지 판단하는 루프를 만든다. 내 일은 이제 루프를 작성하는 것"이라고 밝혔다.

오픈AI의 피터 슈타인버거와 구글의 애디 오스마니도 비슷한 개념을 소개하며, AI 개발이 단일 프롬프트 중심에서 스스로 목표를 검증하고 수정하며 반복 수행하는 자율 에이전트 시스템으로 이동하고 있다고 분석했다.

이번 10가지 규칙도 한 번의 응답이 아니라 사람이 개입하지 않는 반복 실행(Loop) 환경에서 AI가 스스로 멈추고 판단하는 능력을 강화하는 데 초점을 맞추고 있다는 평가다.

이와 함께 문서의 적용 방식도 관심받고 있다. 클로드 코드 프로젝트에서는 프로젝트 루트의 CLAUDE.md 파일을 실행 시 자동으로 읽어 대화 컨텍스트에 포함시킨다. 다만 이는 시스템 프롬프트가 아니라 참고 문맥으로만 사용되기 때문에 AI의 행동에 영향을 줄 뿐 강제하지는 않는다.

실제로 보안업체들은 악성 CLAUDE.md 파일을 깃허브 저장소에 심어 SSH 키나 API 인증정보를 탈취하도록 유도하는 공격 사례를 보고했으며, 앤트로픽은 클로드 코드 2.1.90 버전에서 관련 취약점을 수정했다. 전문가들은 카르파시 가이드라인도 공식 깃허브 저장소에서만 내려받아 사용할 것을 권고하고 있다.

한편, 클로드 코드 2.1.139 버전에 추가된 '/goal' 명령은 이러한 철학을 실제 기능으로 구현한 사례로 평가된다. 이 기능은 코드를 생성한 모델과 별도의 검증 모델이 작업 완료 여부를 매 단계 확인하는 구조를 채택해 AI가 목표 달성 여부를 스스로 검증하면서 작업을 이어갈 수 있도록 설계됐다.

업계에서는 이번 10개 규칙이 실제로 카르파시가 작성한 내부 문서인지 여부와는 별개로, AI 코딩의 패러다임이 '좋은 프롬프트를 만드는 시대'에서 '스스로 검증하고 멈출 줄 아는 에이전트를 설계하는 시대'로 이동하고 있음을 보여주는 상징적인 사례로 받아들이고 있다.

개발자들도 새 규칙을 적용한 이후 AI가 코드를 작성하기 전에 문서를 먼저 읽고 가정을 확인하며 테스트를 수행한 뒤 결과를 검증하는 등 신중한 작업 방식을 보인다고 평가하고 있다. 하지만 이러한 변화가 추가된 6개 규칙 때문인지는 아직 객관적으로 검증되지 않았다.

박찬 기자 cpark@aitimes.com