GPTBot이 낡은 문서를 읽고 있다면? Cloudflare가 꺼낸 의외의 해법
2026.04.21 · Dev
안녕하세요. 요즘 AI 관련 뉴스를 보다 보면 모델 성능 경쟁 이야기가 정말 많죠. 그런데 이번에는 조금 다른 쪽이 눈에 들어왔습니다. AI가 얼마나 똑똑한가보다, 애초에 무슨 자료를 가져가고 배우는가를 건드리는 이야기였거든요.
Cloudflare는 검증된 AI 학습 크롤러가 오래된 페이지에 접근하면, 기존의 canonical 태그를 바탕으로 최신 문서로 301 리디렉션시키는 기능을 공개했습니다. 쉽게 말해 “예전 안내문을 그냥 읽지 말고, 최신 안내 데스크로 바로 가라”고 길을 다시 잡아주는 방식입니다.
AI는 경고문을 읽는 게 아니라, 문서를 통째로 가져갑니다
문서를 운영해보신 분들은 아실 겁니다. 오래된 페이지를 지우긴 어렵고, 그렇다고 그대로 두면 헷갈리죠. 그래서 보통은 “이 문서는 더 이상 최신이 아닙니다” 같은 문구를 붙이거나, canonical 태그로 대표 문서를 알려줍니다.
여기서 문제가 생깁니다. 사람은 경고문을 읽고 넘어가지만, AI 학습 크롤러는 그런 맥락을 기대만큼 섬세하게 처리하지 못할 수 있습니다.
마치 오래된 사내 공지문에 “최신 내용은 3층 안내실 참고”라고 적혀 있어도, 누군가 그 종이 자체를 복사해 가버리면 결국 낡은 정보가 퍼지는 것과 비슷합니다.
기술적으로 말하면, canonical 태그는 “이 URL이 대표 버전”이라는 신호지만 기존에는 강제력이 약한 편이었습니다.
그래서 canonical을 ‘권고’가 아니라 ‘길 안내’로 바꿨습니다
이번 기능의 핵심은 꽤 단순합니다. 검증된 AI 학습 크롤러가 들어오면, Cloudflare가 HTML 안의 canonical 태그를 확인하고, 자기 자신을 가리키지 않는 최신 URL이 있으면 301 Moved Permanently로 그쪽으로 보내버립니다.
여기서 재밌는 부분은 범위가 꽤 명확하다는 점입니다. 사람 방문자, 일반 검색엔진, AI 비서/AI 검색 계열 트래픽은 그대로 두고, AI 학습용 크롤러에만 별도로 동작합니다. 괜히 전체 사이트 동선을 흔드는 게 아니라, 필요한 대상에게만 길을 다시 잡아주는 느낌입니다.
또 운영 관점에서도 생각보다 실용적입니다. 별도 리디렉션 규칙을 페이지마다 계속 만드는 대신, 이미 문서에 들어 있는 canonical 정보를 활용하니까요. 기존에 붙여둔 표지판을 진짜 표지판처럼 쓰게 만든 셈입니다.
개발자 입장에서는 ‘문서 관리’가 더 중요해졌다는 뜻입니다
Cloudflare는 자사 문서 사이트에서 2026년 3월에 오래된 Workers 문서가 OpenAI에 약 4만 6천 회, Anthropic에 3,600회, Meta에 1,700회 정도 크롤링됐다고 설명했습니다. 그리고 이런 낡은 문서 크롤링이 실제로 오래된 CLI 문법을 AI가 답변하는 사례와 연결될 수 있다고 봤습니다.
이 대목이 저는 꽤 인상적이었습니다. 이제 문서 운영은 단순 SEO나 사용자 편의의 문제가 아니라, AI가 앞으로 어떤 답을 하게 될지에도 영향을 주는 일이 되어가고 있거든요. 개발 블로그, 사내 위키, 제품 문서, API 문서가 다 여기에 걸립니다.
물론 만능 해결책은 아닙니다. 이미 학습된 낡은 데이터까지 거꾸로 고쳐주는 건 아니고, 검증되지 않은 크롤러까지 모두 통제하는 것도 아닙니다. 그래도 “최신 문서를 더 분명하게 먹이자”는 방향으로는 꽤 현실적인 한 수처럼 보입니다.
AI 시대라고 해서 새로운 메타 태그만 잔뜩 생길 줄 알았는데, 오히려 이번엔 웹의 오래된 문법인 canonical과 301 redirect가 다시 중요해졌습니다.
앞으로는 “문서를 잘 썼다”에서 끝나는 게 아니라, “AI가 헷갈리지 않게 최신 버전으로 잘 유도하고 있나”까지 같이 봐야 하지 않을까 싶습니다. 특히 문서가 자주 바뀌는 팀이라면, 이건 한 번쯤 체크해볼 만한 포인트입니다.
참고한 출처
- Redirects for AI Training enforces canonical content — Cloudflare Blog, 2026-04-17
- Introducing Redirects for AI Training — Cloudflare Developers Changelog, 2026-04-17
- Redirects for AI Training — Cloudflare Developers Docs, Last updated 2026-04-17
'Info > AI' 카테고리의 다른 글
| DeepSeek V4 공개, 이제 AI 경쟁은 모델보다 ‘돌아가는 곳’이 더 중요해졌다 (0) | 2026.04.27 |
|---|---|
| AI가 서버를 떠나 스마트폰 안으로 들어오고 있습니다 (0) | 2026.04.24 |
| Cloudflare가 PR 리뷰에 AI를 넣었더니 보인 의외의 포인트 (0) | 2026.04.23 |
| AI가 버튼까지 만든다고? 구글 A2UI v0.9가 보여준 다음 화면 (0) | 2026.04.20 |
| ChatGPT가 털린 건 아니라는데, 왜 맥 앱 업데이트를 서둘렀을까 (0) | 2026.04.13 |
