AI를 활용하면 개인 생산성이 올라간다는 얘기는 이제 상식이 됐다. 웬만한 기업은 ChatGPT 프롬프팅 같은 기본 활용 교육을 거의 하지 않는다(물론 다들 잘 쓴다는 말은 아니다. 중급으로 알고 강의해보면 여전히 초급인 사람이 많다). 새로운 고민은 그다음에 온다. 개인이 느끼는 생산성 향상이 조직 생산성으로 좀처럼 확장되지 않는다는 것이다.
이 어긋남은 일화가 아니라 측정된 현상이다. Brynjolfsson, Rock, Syverson(2021) 의 productivity J-curve 모델은 AI 같은 범용 기술의 효과가 보이려면 조직 자본에 대한 보완적 무형 투자(프로세스 재설계, 거버넌스, 인적자본 재훈련)가 선행해야 하고, 그동안은 측정 생산성이 오히려 정체하거나 떨어진다고 본다. 최근 덴마크 행정 데이터를 이용한 연구도 ChatGPT 도입 이후 11개 AI 노출 직종에서 2024년까지 임금·노동시간에 대한 총 효과가 사실상 0에 가까웠다고 보고한다. 통제된 실험의 큰 개인 효과와 조직 차원의 미미한 효과 사이의 괴리가 핵심이다.
그렇다면 개인의 효과는 어떤 경로를 거쳐 조직으로 전이되는가, 또는 어디서 막히는가. 네 단계로 나눠 보면 함정이 위치별로 정리된다.
1단계: Task — 현재 머물러 있는 지점
대부분의 조직은 여기까지 와 있다. 보고서 한 건, 메일 한 통, 코드 함수 하나 같은 단위 산출물이 빨라지고 많아졌다. 다만 산출물이 많아진다는 것 자체가 다음 단계의 문제를 만든다. 조직에서 한 사람이 시작해 끝내는 업무는 별로 없기 때문이다. 따라서 Task 단계의 효과는 자동으로 위로 올라가지 않는다.
2단계: Workflow — 병목이 가시화되는 지점
Task가 빨라지면 일련의 작업 흐름 어딘가에 압력이 쌓인다. 초안은 열 배 늘었는데 리뷰는 그대로라면, 과거에는 그럭저럭 넘어가던 리뷰 단계가 이제 거대한 병목으로 부각된다. Goldratt의 제약이론(Theory of Constraints) 이 오래전에 정리한 명제다. 시스템 전체 처리량은 가장 약한 고리에 의해 결정된다. 현재 AI는 한 고리만 강화하기 때문에 다른 고리의 약점을 더 도드라지게 만든다.
여기에 한 가지 부작용이 따라붙는다. 초안의 양적 폭증은 흔히 'AI slop'으로 불리는 품질 분산을 동반한다. 누군가는 그것을 골라서 검토해야 하고, 당연히 업무 의욕은 떨어진다.
이 단계의 처방은 의외로 단순하다. AI 도입 전(도입 직후라도)에 워크플로우의 어디가 병목이 될지 먼저 측정하고, 도구 표준화와 프롬프트 표준을 함께 깔아야 한다. 도구만 던져주고 결과를 기대하는 방식은 병목을 옮길 뿐 없애지 않는다.
3단계: Process — 사일로가 본색을 드러내는 지점
부서 안의 워크플로우가 정리돼도 부서 경계를 넘는 흐름은 여전히 막힌다. R&R 모호성, 권위주의, 부서 이기주의 같은 묵은 사일로가 그것이다. 이 단계의 함정을 두 가지로 다시 나눌 수 있다.
첫째, 입력 품질의 문제다. 비싼 제빵기를 들여와도 저질 밀가루가 들어가면 저질 빵이 나온다. 기준 데이터, 불명확한 문제 정의, 의사결정 기준 미비 등 부실한 채로 AI를 얹으면 부실이 더 빠르게 재생산된다.
둘째, 거버넌스의 문제다. 데이터 권한, 산출물 표준, 부서 간 인터페이스 같은 것들이다. 이 영역은 어떤 조건에서 단위 부서 내부보다 더 큰 병목이 되곤 한다. 사일로 구조가 강하고 프로세스가 부서 경계를 가로지를 때 특히 그렇다(반면 단일 부서의 deep work가 핵심인 R&D 조직에서는 단위 내부 병목이 더 클 수도 있다).
이 단계의 처방은 재조정이 아니라 재설계다. 도구 도입 결정과 프로세스 재설계 결정을 분리해서 다루는 한, AI는 사일로를 더 빠른 사일로로 만들 뿐이다.
4단계: Capability — 일회성을 항구적 역량으로 바꾸는 지점
여기가 가장 어렵고 가장 안 다뤄지는 단계다. 잘된 PoC(개념 증명) 한 건이 조직의 지속 역량으로 전환되려면 두 가지가 필요하다.
첫째, 학습 시스템이다. 좋은 결과를 낸 개인의 과정이 공유되지 않으면 효과는 그 사람과 함께 사라진다. 중요 산출물에는 프롬프트를 첨부하게 하거나, 한 달에 한 번 효과 본 프롬프트 공유회를 열고 라이브러리로 정리하는 정도의 운영 관행이 출발점이 될 수 있다. 이를 제대로 굴리려면 내부 AI 시스템 구축이 필요하다.
둘째, 효율성 함정에서 빠져나오는 것이다. AI를 빠르게 일을 마치는 도구로만 쓰면, 남는 시간을 무엇에 쓸지에 대한 답이 없다. 답이 없는 상태로 시간만 남으면 조직은 자연스럽게 인력 재배치, 산출 확대, 신사업 진출, 품질 향상, 전략적 여유 확보 같은 여러 옵션 중 하나를 택할 수밖에 없다. 그 선택이 조직 차원에서 의도되지 않으면 단기 비용 압력이 디폴트가 된다. 그동안 격무에 묻혀 있던 본연의 업무로 전환할 틈이 생긴 것이다. 그 틈을 무엇으로 채울지가 효율성에서 효과성으로 넘어가는 분기점이다. 이 단계는 인사·평가·보상 시스템과 직접 연결되기 때문에 기존 HR 제도와의 충돌을 동반한다. 즉 가장 정치적인 단계이기도 하다.
성과관리라는 시험대
여러 기업이 AI 증강을 적극 시도하는 대표 분야가 성과관리다. 제도적 성격이 강해서 원칙과 기준을 잡기 수월하고, '전사-사업부-팀-개인'이 같은 프로세스를 공유한다는 점에서 4단계 전이 모델을 시험할 수 있는 영역이다.
다만 현재까지의 적용은 1~2단계에 머물러 있다. 평가 코멘트 초안 자동화, KPI 정렬 검토, 1:1 미팅 요약 같은 Task와 Workflow 효율화에 집중돼 있다. 정작 3단계(Process)와 4단계(Capability)로 넘어가는 시도는 드물다. 기존 성과관리의 누적된 문제들 — 점수 인플레이션, 형식주의, 평가-보상 연계의 모호성, 평가자 R&R 불명확성 — 을 그대로 둔 채 AI만 얹으면, 문제가 더 부각될 수 있다. 더 많은 평가 코멘트, 더 일관된 형식주의, 더 매끄러운 점수 인플레이션이다.
이 영역에서 진짜 질문은 다른 차원에 있다. 우리 조직에서 성과란 무엇인가. 성과를 인식하고 평가하는 기준은 무엇인가. 성과관리는 조직·사람·업무 관리와 어떻게 연관돼야 하는가. 근본적인 질문에 답이 없는 채로 도입되는 AI는 편의성만 키우고 의존성을 만든다.
결과
AI는 해결 도구가 아니다. 현상을 비대칭으로 재배치하고, 단계별로 다른 문제를 가시화한다. Task 단계의 효과는 Workflow → Process → Capability로 자동 전이되지 않는다. 각 단계마다 다른 종류의 보완 투자가 필요하다(도구 표준화, 프로세스 재설계, 학습 시스템과 인재 재편). 보완 투자가 빠지면 J-curve의 함정에 빠진다. 개인 효과는 보이는데 조직 효과는 안 보이는 그 구간이다.
어디는 챗봇 활용법을 교육하고, 어디는 워크플로우 개선 워크숍을 한다. 어느 빵집은 제빵기 사용법을 공부하는데, 다른 곳은 재료 배합법과 주방 동선까지 다시 짠다. 차이는 곧 극명하게 벌어질 것이다.