Một câu trên cộng đồng SEO: “Thêm Schema Markup vào thì AI sẽ cite trang mình nhiều hơn đúng không?”

Câu trả lời nghe có vẻ hiển nhiên – vì nhìn vào dữ liệu, các trang được AI cite đều có tỷ lệ dùng JSON-LD cao hơn hẳn so với trang không được cite. Nhưng đó là tương quan, không phải nhân quả.

Ahrefs vừa công bố một nghiên cứu rất đáng đọc, thiết kế riêng để trả lời câu hỏi này một cách nghiêm túc. Mình tóm tắt lại và chia sẻ góc nhìn của mình ở đây.

nghien cuu cua ahrefs

Bối cảnh: Tại sao cần nghiên cứu thêm?

Trong phân tích ban đầu trên 6 triệu URL, đội nghiên cứu Ahrefs phát hiện: các trang được AI cite có xác suất dùng JSON-LD cao gần gấp 3 lần so với trang không được cite.

Con số này trông rất ấn tượng – và nó lan nhanh trên LinkedIn, conference slide khắp nơi.

Nhưng đội Ahrefs không dừng lại ở đó. Họ chỉ ra đúng vấn đề: những trang có Schema thường cũng là những trang được đầu tư kỹ hơn – content mạnh hơn, backlink nhiều hơn, technical SEO tốt hơn. Schema có thể chỉ đang “đi nhờ xe” của các tín hiệu khác.

Câu hỏi thực sự cần trả lời: Nếu tôi thêm Schema vào trang của mình, tôi có được AI cite nhiều hơn không?

Phương pháp nghiên cứu

Để cô lập riêng tác động của Schema, đội nghiên cứu Ahrefs thực hiện như sau:

  • Theo dõi 1.885 trang web đã thêm JSON-LD schema trong khoảng thời gian từ tháng 8/2025 đến tháng 3/2026
  • Ghép với 4.000 trang kiểm soát (không thêm schema, có mức citation tương tự trước đó)
  • Đo lường sự thay đổi citation trên Google AI Overviews, Google AI Mode, và ChatGPT
  • Dùng phương pháp Difference-in-Differences (DiD) – loại bỏ xu hướng chung của nền tảng, chỉ nhìn vào tác động thực sự của schema

Dữ liệu được trích xuất từ Brand Radar, phân tích bằng Agent A (công cụ AI marketing của Ahrefs).

Kết quả: Schema gần như không tạo ra sự khác biệt

Nền tảng AITác độngKết luận
Google AI Overviews−4,6%Giảm nhỏ, có ý nghĩa thống kê nhưng không rõ nguyên nhân
Google AI Mode+2,4%Không có ý nghĩa thống kê (nhiễu)
ChatGPT+2,2%Không có ý nghĩa thống kê (nhiễu)

Không có nền tảng nào cho thấy schema tạo ra tăng trưởng citation đáng kể.

Với Google AI ModeChatGPT: mức tăng +2,4% và +2,2% quá nhỏ, hoàn toàn có thể là biến động ngẫu nhiên trong tập dữ liệu hàng nghìn URL.

Với Google AI Overviews: mức giảm −4,6% có ý nghĩa thống kê (xác suất xảy ra ngẫu nhiên chỉ khoảng 1/2.500). Tuy nhiên, đội Ahrefs nhấn mạnh hai điểm quan trọng:

  • Về giá trị tuyệt đối, mức giảm chỉ khoảng 12 citation/ngày/trang – trong khi hầu hết trang đang có hàng trăm citation/ngày
  • Cả hai nhóm (có thêm schema và không thêm) đều đang giảm citation AI Overview trong giai đoạn này – nhiều khả năng do Google thu hẹp phạm vi hiển thị AI Overview cho một số loại nội dung, không liên quan đến schema

Ahrefs chạy đến 4 phương pháp phân tích khác nhau (t-test, DiD, event study, DiD với cửa sổ thời gian đối xứng) – và cả 4 đều cho ra cùng một kết luận.

Vậy tại sao 53% trang được AI Cite vẫn có Schema?

Đây là câu hỏi mình thấy thú vị nhất trong nghiên cứu này.

Đội Ahrefs giải thích: những site đầu tư vào Schema thường cũng là những site đầu tư vào tất cả mọi thứ – content chất lượng cao, backlink mạnh, technical SEO cẩn thận, trang được cập nhật thường xuyên. AI có xu hướng cite những trang như vậy không phải schema, mà vì tất cả những thứ còn lại.

Nếu bỏ schema ra, những tín hiệu kia vẫn đủ để trang được cite.

Một lưu ý quan trọng: Nghiên cứu này chỉ áp dụng cho trang đã được AI Cite

Toàn bộ 1.885 trang trong nghiên cứu đều đã có 100+ AI Overview citations trước khi thêm schema. Tức là đây đều là các trang đã nằm trong “tầm ngắm” của AI.

Với những trang chưa được AI cite lần nào, schema có thể vẫn đóng vai trò trong việc giúp trang được crawl, parse, và index tốt hơn – nghiên cứu này không thể kết luận về trường hợp đó.

Ngoài ra, một nghiên cứu riêng từ searchVIU cũng cho thấy: khi các hệ thống AI (ChatGPT, Claude, Perplexity, Gemini, Google AI Mode) truy cập trang web trực tiếp theo thời gian thực, họ không đọc JSON-LD, Microdata hay RDFa ẩn – chỉ đọc HTML visible. Điều này gợi ý rằng schema có thể tác động gián tiếp (qua indexing, knowledge graph) hơn là tác động trực tiếp vào lúc AI trả lời.

Góc nhìn của mình

Mình không cho rằng nghiên cứu này là lý do để bỏ qua Schema Markup. Vẫn có nhiều lý do chính đáng để làm schema: rich results trên Google Search, voice assistants, knowledge graph, entity recognition – những thứ ảnh hưởng đến SEO tổng thể.

Điều mình rút ra là: đừng coi schema là “chìa khóa vàng” cho GEO (Generative Engine Optimization). Nếu trang của bạn chưa có content tốt, authority mạnh, technical SEO nền tảng vững – schema sẽ không cứu được bạn trong cuộc đua AI citation.

Thứ tự ưu tiên vẫn như cũ: Content → Authority → Technical. Schema nằm trong phần Technical, và nó tốt khi có – nhưng không phải đòn bẩy cho AI visibility nếu đó là mục tiêu duy nhất bạn thêm nó vào.

Nguồn: Ahrefs – “We Tracked 1,885 Pages Adding Schema. AI Citations Barely Moved.” (2026) Tác giả nghiên cứu: Xibeijia (Ahrefs Research Team)

1 Người đánh giá 5/5 sao