테스트 자동화에서 자주 있는 실패 5선｜도입에서 일어난 실무의 실패와 개선책

테스트 자동화를 도입할 때 한 번쯤 실패를 경험하는 QA 엔지니어는 많습니다.
수동 테스트에서의 이행·CI/CD 통합·유지보수 비용 폭발——
실무에서 실제로 일어난 실패 사례와 거기서 얻은 배움을 솔직하게 해설합니다.

📌 이런 분께 추천합니다

테스트 자동화를 도입하려는데 어떤 실패가 있는지 알고 싶은 분
자동화를 도입했지만 기대한 효과가 나오지 않아 고민하는 분
팀에 자동화를 전개하려는 QA 리드·매니저
다른 팀의 실무적인 실패 사례와 배움을 참고하고 싶은 분

✅ 이 글을 읽으면 알 수 있는 것

테스트 자동화 도입에서 자주 있는 5가지 실패 패턴과 그 원인
실패에서 얻은 구체적인 배움과 개선책
「해서 좋았다」자동화와 「하지 말았어야 했다」자동화의 차이
도입을 성공시키기 위한 판단 기준과 체크리스트

👤
글쓴이 소개：QA 엔지니어로서 Selenium·Playwright·Python·pytest를 활용한 테스트 자동화를 실무에서 담당하고 있습니다. 수동 테스트만 하던 현장에서 제로부터의 자동화 도입, 유지보수 비용 폭발에서의 재건, CI/CD 통합 실패와 재설계 등, 쓴 경험을 포함해 현실적인 시각에서 해설합니다. GitHub에서 코드도 공개 중입니다.

📌 이 글의 결론

실무의 실패에서 얻은 배움은 3가지로 요약됩니다.

① 실패의 대부분은 「설계 부족」과 「대상 선정 실수」에서 발생한다
② 자동화는 「도입하면 끝」이 아니라 「지속적으로 개선하는 프로세스」다
③ 작게 시작해서 성공 체험을 쌓고 단계적으로 넓혀 가는 것이 가장 성공하기 쉽다

「테스트 자동화를 도입했는데 오히려 공수가 늘었다」「유지보수만으로 손이 돌아가지 않게 됐다」——이런 목소리는 자동화에 도전한 엔지니어라면 누구나 한 번쯤 경험하는 것입니다. 테스트 자동화는 올바르게 설계·운용하면 큰 리턴을 가져다주지만, 그 길이 결코 평탄하지는 않습니다. 이 글에서는 실무에서 실제로 일어난 실패 사례와 거기서 얻은 배움을 솔직하게 공유합니다. 같은 전철을 밟지 않기 위해 꼭 참고해 주세요.

테스트 자동화 실패 사례①：「전부 자동화하자」로 유지보수가 붕괴됐다
1. 📋 무슨 일이 있었는가
테스트 자동화 실패 사례②：Flaky 테스트가 CI/CD를 계속 망가뜨렸다
1. 📋 무슨 일이 있었는가
테스트 자동화 실패 사례③：E2E 테스트에 편중되어 비용이 폭발했다
1. 📋 무슨 일이 있었는가
테스트 자동화 실패 사례④：팀에 자동화가 뿌리내리지 않았다
1. 📋 무슨 일이 있었는가
테스트 자동화 실패 사례⑤：「자동화했으니 수동 테스트는 불필요」라고 착각했다
1. 📋 무슨 일이 있었는가
「해서 좋았다」 vs 「하지 말았어야 했다」자동화의 차이
실패를 막는！자동화 도입 전 체크리스트
테스트 자동화에 관한 자주 묻는 질문（FAQ）
정리

테스트 자동화 실패 사례①：「전부 자동화하자」로 유지보수가 붕괴됐다

📋 무슨 일이 있었는가

자동화 도입 초기, 「어차피 할 거라면 전부 자동화하자」는 방침 아래 수동 테스트 케이스 200건을 모두 Playwright 스크립트로 변환했습니다. 처음 3개월은 잘 돌아갔지만, 기능 추가마다 UI가 바뀌어 스크립트가 계속 망가졌습니다. 수정 대응만으로 주 공수의 절반 이상을 소비하게 되어, 결국 테스트 자동화 프로젝트 자체가 동결되었습니다.

❌ 실패의 원인	✅ 배움·개선책
반복 빈도에 상관없이 전체 테스트를 자동화했다	반복 빈도가 높고·사양이 안정된 테스트만 자동화한다
사양 변경이 많은 개발 초기 단계부터 자동화했다	사양이 확정된 후 자동화에 착수한다. 초기에는 수동으로 탐색적 확인
Page Object Model을 사용하지 않고 셀렉터를 직접 작성했다	POM을 도입해 셀렉터를 한 곳에 집약하고 변경 영향 범위를 최소화한다
유지보수 비용을 ROI 계산에 포함하지 않았다	자동화 전에 유지 비용도 포함해 ROI를 시산한다

💡 배움：「전부 자동화한다」는 실패로의 최단 루트입니다. 먼저 ROI가 높은 테스트 20〜30건만 자동화해서 성공 체험을 만들고, 그곳에서 단계적으로 넓혀 가는 것이 정답이었습니다.

테스트 자동화 실패 사례②：Flaky 테스트가 CI/CD를 계속 망가뜨렸다

📋 무슨 일이 있었는가

GitHub Actions에 테스트 자동화를 통합했지만, 같은 테스트가 「성공하거나 실패하거나」를 반복하는 Flaky 테스트（불안정한 테스트）가 다발했습니다. 개발자들은 「또 테스트가 실패했네. 어차피 Flaky겠지」라고 생각하게 되어 테스트 결과를 신뢰하지 않게 되었습니다. 테스트가 실패해도 강행 머지하게 되어 프로덕션 장애가 증가했습니다.

❌ 실패의 원인	✅ 배움·개선책
비동기 처리 완료를 기다리지 않고 요소를 조작했다	wait_for_selector 등으로 명시적인 대기를 구현해 타이밍 의존을 없앤다
테스트 환경이 프로덕션과 다른 설정이었다	Docker로 환경을 통일해 「내 PC에서는 되는데 CI에서 실패」를 근절한다
테스트 데이터가 다른 테스트와 간섭하고 있었다	테스트마다 데이터를 설정·정리해 테스트 간 의존을 없앤다
Flaky 테스트를 방치하며 「어쩔 수 없다」며 포기했다	Flaky 테스트는 즉시 격리·수정. 개선할 수 없다면 삭제해 테스트의 신뢰성을 지킨다

💡 배움：테스트 자동화에서 가장 중요한 것은 「테스트 결과에 대한 신뢰」입니다. Flaky 테스트가 하나라도 있으면 팀 전체의 테스트에 대한 신뢰가 무너집니다. 불안정한 테스트는 「없는 것이 낫다」고 판단하는 용기도 중요합니다.

테스트 자동화 실패 사례③：E2E 테스트에 편중되어 비용이 폭발했다

📋 무슨 일이 있었는가

「자동화＝E2E 테스트」라는 선입견으로, 거의 모든 테스트를 브라우저를 사용한 E2E 테스트로 구현했습니다. 테스트 스위트 전체의 실행에 2시간 이상 걸리게 되어 피드백이 느려졌습니다. 또한 UI 변경마다 테스트가 망가져 유지보수 비용이 급증했습니다.

🔺 테스트 피라미드：이상 vs 실제로 해 버린 것

✅ 이상적인 테스트 피라미드

단위 테스트：70%（빠름·저렴·대량）
통합·API 테스트：20%（중속·중비용）
E2E 테스트：10%（느림·고비용·엄선）

→

❌ 실제로 해 버린 것（역 피라미드）

단위 테스트：5%（거의 없음）
통합·API 테스트：15%（적음）
E2E 테스트：80%（거의 전부！）

❌ 실패의 원인	✅ 배움·개선책
「자동화＝E2E 테스트」라는 선입견이 있었다	테스트 피라미드를 의식하고 단위·API 테스트를 우선해서 자동화한다
단위 테스트와 API 테스트의 가치를 경시했다	단위 테스트는 빠르고 저렴하다. 먼저 단위·API부터 자동화를 시작한다
테스트 실행 시간을 처음부터 계측하지 않았다	테스트 스위트의 실행 시간을 KPI로 설정하고 10분 이내를 목표로 한다

💡 배움：E2E 테스트는 가치가 높은 반면 비용도 가장 높은 층입니다. 「API로 검증할 수 있는 것을 E2E로 하고 있지 않은가?」를 항상 되물어보는 것이 테스트 효율화의 핵심입니다.

테스트 자동화 실패 사례④：팀에 자동화가 뿌리내리지 않았다

📋 무슨 일이 있었는가

자동화 엔지니어 1명이 혼자서 프레임워크를 구축하고 CI/CD까지 정비했습니다. 하지만 팀의 다른 멤버는 아무도 활용할 수 없었고, 결국 그 1명이 퇴직한 후에 프로젝트 전체가 붕괴했습니다. 아무도 유지보수할 수 없는 「돌아가고는 있지만 아무도 건드리지 못하는 테스트」가 대량으로 남았습니다.

❌ 실패의 원인	✅ 배움·개선책
자동화가 특정 1명에게 속인화되어 있었다	문서를 정비하고 팀 전원이 테스트를 추가·수정할 수 있는 상태를 만든다
다른 멤버에게 스킬 트랜스퍼를 하지 않았다	페어 프로그래밍·코드 리뷰·스터디를 통해 스킬을 수평 전개한다
프레임워크가 너무 복잡해 다른 사람이 이해할 수 없었다	「팀에서 가장 경험이 적은 멤버가 사용할 수 있다」를 복잡성의 상한으로 설계한다
테스트 추가 룰이나 위치가 명문화되어 있지 않았다	README와 컨트리뷰션 가이드를 정비해 누구나 막히지 않고 시작할 수 있는 환경을 만든다

💡 배움：테스트 자동화는 「팀의 문화」로 뿌리내리지 않으면 의미가 없습니다. 기술적으로 완벽한 프레임워크보다, 팀 전원이 계속해서 사용할 수 있는 심플한 구조 쪽이 훨씬 가치가 있습니다.

테스트 자동화 실패 사례⑤：「자동화했으니 수동 테스트는 불필요」라고 착각했다

📋 무슨 일이 있었는가

리그레션 테스트를 완전히 자동화한 타이밍에 「수동 테스트는 이제 불필요」라는 분위기가 되어, 탐색적 테스트의 시간이 거의 제로가 되었습니다. 그 결과, 자동 테스트가 상정하지 않았던 조작 패턴에 의한 버그가 프로덕션에서 다발했습니다. 유저 문의가 증가해 신뢰를 크게 손상시켰습니다.

❌ 실패의 원인	✅ 배움·개선책
자동 테스트가 「모든 버그를 발견한다」고 착각했다	자동 테스트는 「상정한 동작의 확인」. 상정 외의 동작은 탐색적 테스트로 발견한다
탐색적 테스트의 가치를 경시했다	자동화로 정형 테스트를 효율화하고 생긴 시간을 탐색적 테스트에 투자한다
유저의 실제 조작 패턴을 테스트에 반영하지 않았다	유저 행동 분석을 바탕으로 테스트 시나리오를 설계하고 실제 사용에 가까운 조작을 자동화한다

💡 배움：자동 테스트와 수동 테스트는 대립하는 것이 아니라 서로 보완하는 것입니다. 자동화로 얻은 시간을 탐색적 테스트에 사용함으로써 비로소 품질 보증이 완성됩니다.

「해서 좋았다」 vs 「하지 말았어야 했다」자동화의 차이

5가지 실패 사례를 바탕으로 자동화의 성패를 가른 요인을 정리합니다.

판단 축	✅ 해서 좋았던 자동화	❌ 하지 말았어야 했던 자동화
실행 빈도	매 스프린트·매 배포에서 실행	월 1회 이하·가끔밖에 실행 안 함
사양 안정성	사양이 확정되어 변경이 적다	사양이 자주 바뀌는 개발 초기
테스트 층	단위·API 중심（피라미드 준수）	E2E 편중（역 피라미드）
설계 품질	POM 도입·재사용성이 높다	설계 없음·복사 붙여넣기 범벅
팀 전개	팀 전원이 사용·기여할 수 있다	특정 1명에게 속인화
CI/CD 통합	푸시마다 자동 실행	수동 실행·가끔 돌림

실패를 막는！자동화 도입 전 체크리스트

자동화에 착수하기 전에 이 체크리스트를 확인하세요. 3개 이상 NO가 있다면 먼저 준비를 갖추고 나서 착수하는 것을 권장합니다.

📋 테스트 자동화 도입 전 체크리스트

✔	체크 항목	NO일 경우의 리스크
☑	대상 테스트는 월 1회 이상 실행하는가?	ROI가 마이너스가 될 가능성이 높다
☑	사양이 안정되어 변경이 적은가?	유지보수 비용이 폭발할 리스크
☑	Page Object 등의 설계 패턴을 사용하는가?	스파게티 코드가 되어 유지보수 불가능하게 됨
☑	팀 전원이 유지보수할 수 있는가?	속인화로 담당자 퇴직 시 붕괴 리스크
☑	CI/CD에 통합해서 자동 실행하는가?	실행 빈도가 내려가 ROI가 하락
☑	Flaky 테스트를 즉시 대응하는 운용 룰이 있는가?	테스트 결과에 대한 신뢰가 붕괴할 리스크

테스트 자동화에 관한 자주 묻는 질문（FAQ）

실무에서 자주 받는 질문을 정리했습니다. 판단에 망설여질 때 참고하세요.

Q. 테스트 자동화는 전부 자동화해야 하나요?

아닙니다. 반복 빈도가 높고·사양이 안정되어 있고·합격·불합격 판단 기준이 명확한 테스트만 자동화하는 것이 기본입니다. 모든 것을 자동화하려 하면 유지보수 비용이 폭발해 ROI가 마이너스가 됩니다. 먼저 ROI가 높은 테스트 20〜30건만 자동화해서 성공 체험을 만드는 것부터 시작하세요.

Q. Flaky 테스트（불안정한 테스트）는 어떻게 하면 되나요?

즉시 대응하는 것이 원칙입니다. 먼저 원인（비동기 대기·환경 차이·데이터 간섭）을 특정해서 수정합니다. 개선할 수 없는 경우에는 테스트를 격리해 스킵하거나, 과감하게 삭제하는 판단도 필요합니다. Flaky 테스트를 방치하면 팀 전체가 테스트 결과를 신뢰하지 않게 되어 자동화의 가치가 사라집니다.

Q. 테스트 자동화와 수동 테스트는 어느 쪽이 중요한가요?

둘 다 필요하며, 서로 보완하는 것입니다. 자동 테스트는 리그레션 테스트·API 테스트·대량 데이터의 유효성 검사에 강점이 있습니다. 수동 테스트는 탐색적 테스트·UX 평가·신기능 확인에 강점이 있습니다. 자동화로 단순한 반복 작업을 효율화하고, 생긴 시간을 사람만이 할 수 있는 테스트에 투자하는 것이 이상적인 형태입니다.

Q. 테스트 자동화는 무엇부터 시작하면 되나요?

지금 업무에서 가장 반복해서 실행하는 테스트를 딱 하나만 자동화해 보는 것부터 시작하세요. 스몰 스타트가 가장 실패하기 어려운 방법입니다. 기술 스택은 Python＋Playwright＋pytest의 조합이 학습 비용이 낮고 실무에서도 널리 사용되고 있어 추천합니다.

Q. 테스트 자동화 도입에는 얼마나 걸리나요?

첫 성과가 나오기까지는 1〜3개월이 기준입니다. 단 「전체가 갖춰질 때까지 도입하지 않는다」는 생각은 금물입니다. 먼저 작게 시작해서 CI/CD에 테스트 하나를 통합하고 성공 체험을 만드는 것이 중요합니다. 그 후 단계적으로 커버리지를 넓혀 가는 접근법이 가장 확실합니다.

🔑 중요한 사고방식

실패는 부끄러운 것이 아니다——실패에서 배우지 않는 것이 문제다
자동화는 「도입하면 끝」이 아니라, 지속적으로 계측·개선하는 프로세스다
작게 시작해서 성공 체험을 만들고 단계적으로 넓혀 간다——이것이 오래 지속되는 자동화의 왕도다
기술보다 「무엇을 자동화해야 하는가」의 판단력 쪽이 장기적인 성과를 좌우한다

📖 관련 기사도 함께 확인하세요

⑦ 테스트 자동화의 ROI（비용 대비 효과）사고방식
→ 실패를 막기 위한 ROI 계산과 손익분기점의 개념
⑧ Page Object Model이란? 코드 유지보수성을 높이는 설계 패턴
→ 유지보수 비용 폭발을 막는 설계 패턴
⑤ 테스트 자동화에서 실패하지 않는 5가지 설계 원칙
→ 설계 단계에서 실패를 막기 위한 원칙
⑨ QA 엔지니어가 테스트 자동화를 배워야 하는 이유
→ 실패를 넘어 자동화를 계속하는 이유

정리

📋 이 글의 정리

「전부 자동화」는 실패의 근원——ROI가 높은 테스트를 엄선해 자동화한다
Flaky 테스트는 방치 엄금——테스트 결과에 대한 신뢰가 팀의 자산이다
E2E 편중은 역 피라미드——단위·API 테스트를 우선해서 테스트를 설계한다
속인화는 붕괴의 전조——팀 전원이 기여할 수 있는 구조를 만든다
자동화해도 수동·탐색적 테스트의 시간을 반드시 확보한다
성공의 비결은 「작게 시작·계측·개선」사이클의 지속이다

실패는 피할 수 없는 것이지만, 실패의 패턴을 알면 피할 수 있는 실패도 있습니다. 이 글의 사례를 참고해서 같은 전철을 밟지 않는 자동화를 목표로 해 주세요. 여러분의 팀의 자동화가 오래·확실하게 성과를 내기를 바랍니다.