
구글의 최신 오프 더 레코드(Off The Record) 팟캐스트에서는 존 뮬러(John Mueller)와 마틴 스플릿(Martin Splitt)이 참여해 “Markdown vs HTML“이라는 주제로 두 형식의 활용 사례에 대해 이야기를 나눴습니다.
결론적으로 두 사람 모두 SEO와 검색 최적화 관점에서는 HTML이 표준이며, 검색 엔진이 이해하고 활용하는 핵심 형식이라고 설명했습니다. 반면 마크다운(Markdown) 파일은 SEO 측면에서 특별한 이점을 제공하지 않는다고 밝혔습니다.
즉, 최근 일부에서 AI 검색 최적화나 SEO를 위해 마크다운 파일을 별도로 제공해야 한다는 주장이 나오고 있지만, 구글의 공식 입장은 HTML 기반 콘텐츠만으로도 충분하며 마크다운 파일이 검색 순위 향상에 직접적인 도움을 주지는 않는다는 것입니다.
아래는 해당 팟캐스트로 직접 확인하실 수 있습니다.
존 뮬러는 팟캐스트 말미에 핵심 내용을 정리하며 “SEO와 콘텐츠 발견(discovery) 측면에서 필요한 것은 일반적인 HTML 웹사이트”라고 설명했습니다. 즉, 검색 엔진 최적화를 위해서는 HTML 기반 웹페이지가 가장 기본적이고 중요한 요소라는 의미입니다.
그는 앞서서도 “사진을 판매하는 웹사이트를 검색 엔진에서 찾게 만드는 일반적인 SEO 관점의 대부분은 HTML 페이지와 일반적인 웹페이지에 기반한다”고 말했습니다.
웹 크롤러와 검색 엔진은 수십 년 동안 표준 HTML을 처리해 왔습니다. 또한 HTML에서 텍스트를 추출하는 작업은 이미 자동화 시스템과 다양한 웹 라이브러리에서 매우 쉽게 처리할 수 있는 수준입니다. 따라서 일반적인 HTML 페이지를 제공하는 것이야말로 콘텐츠가 검색 엔진과 AI 시스템에 의해 크롤링되고, 색인되며, 검색 결과에 노출되기 위한 가장 중요한 전제 조건이라고 설명했습니다.
또한 두 사람은 대규모 언어 모델(LLM)을 위해 별도의 마크다운 버전 웹사이트를 추가로 구축하는 것에 대해서도 부정적인 견해를 보였습니다.
웹사이트의 HTML 버전과 별도로 LLM 전용 마크다운 버전을 운영하면 관리해야 할 콘텐츠가 두 배로 늘어나고 기술적인 복잡성도 크게 증가하게 됩니다. 특히 사용자에게 보이지 않는 숨겨진 LLM 전용 페이지에 오류가 발생하더라도 실제 방문자는 이를 확인할 수 없기 때문에 문제 신고가 이루어지지 않을 가능성이 높습니다. 그 결과 AI 시스템이나 검색 엔진이 오류가 있는 페이지를 그대로 수집하고 색인하는 상황이 발생할 수 있다고 지적했습니다.
물론 이것이 마크다운이 전혀 필요 없다는 의미는 아닙니다. 마크다운은 문서 작성, 개발 문서 관리, 콘텐츠 제작 등 다양한 분야에서 여전히 유용하게 활용될 수 있습니다. 다만 SEO와 검색 노출을 위해 별도의 마크다운 페이지를 운영할 필요는 없다는 것이 이번 팟캐스트의 핵심 메시지였습니다.
관심이 있다면 해당 에피소드를 직접 들어보거나, 제공된 PDF 대본을 통해 전체 내용을 확인할 수 있습니다.