內部分享 · INTERNAL REFERENCE v3

AI 收錄就贏2026 內容站的真實戰場 · 給 popdaily 內容團隊

整理人：Maki Chiba（91APP 廣告業務部 AI PoC TPM）
給：mimi → popdaily 內容/編輯團隊
日期：2026-05-04（v3 校準版）
來源：個人實際營運的 3 條 pipeline + 30 天 first-hand AI bot 爬蟲數據 + 87 天 GSC 數據
研究底：Perplexity Max DeepSearch · SuperGrok DeepSearch · Princeton/Georgia Tech KDD 2024 GEO 研究 · Ahrefs 60 萬頁 study

2026 內容站的勝場不是 Google 排名，是 AI 收錄。

當 AIO（AI Overviews）+ ChatGPT Search + Perplexity 持續啃食傳統搜尋點擊，
與其死守 SEO 防守教條，不如直接把站做成 LLM 引用的優質來源。

為什麼這樣判斷？

Google 不罰 AI 寫的內容（Ahrefs 60 萬頁實證，相關性 0.011）——但傳統 SEO 流量被 AIO 啃食是事實
2026 Q1 Microsoft 官方 GEO/AEO 指南定調「click-based → citation-based」
chibakuma 自家實測：30 天 AI bot 爬量遠大於人類搜尋曝光（Vectorless RAG 那篇 8:1）
「AI 收錄好」這個目標比追傳統 SEO 簡單、且 future-proof

Step 0 · 先確認你的 game

內容站可以選三種「餵誰」策略，先決定再選 pipeline。我（Maki）三條站故意各選一種：

站	餵誰	對 popdaily 適用性
mkbrain.maki.tw	只餵自己（個人筆記，`robots Disallow:/`）	❌ 不適用
blog.chibakuma.com	主要餵 LLM（robots 主動列 5 大 AI bot Allow）	✅ popdaily 該學這條
marketing.91app.com（公司）	人 + LLM 混合（hybrid workflow）	🟡 可借鏡 review 流程

給 popdaily 的判斷 你們是內容媒體，理論上「人 + LLM 都餵」，但實務上 LLM-first 是 future-proof 的選擇——AI 收錄好了，傳統搜尋自然也不會差；反過來追傳統 SEO 但忽略 AI 收錄，2026 之後會越來越累。

First-hand 證據 · LLM 真的在抓中文站

chibakuma 是中文個人寫作站、流量不大、但主動配置成 LLM-first（robots.txt 為每個 AI bot 寫 Allow）。30 天爬蟲數據如下——這是給 popdaily 看的真實數字，不是業界研究：

📊 SOURCE · blog.chibakuma.com nginx access log · 2026-04-04 ~ 2026-05-04

2,497

AI bot 命中總數
佔總流量 1.95%

767

ClaudeBot 訓練爬
(Anthropic)

321

GPTBot 訓練爬
(OpenAI)

116

OAI-SearchBot
(ChatGPT 即時 search)

PerplexityBot
(Perplexity)

Google-Extended
⚠ Gemini 完全沒抓

最被 AI bot 反覆抓的內容

192  /robots.txt
 88  /sitemap.xml
 71  /wp-sitemap.xml
 58  /vectorless-rag-shi-ce-yong-shu-zhuang-tui-li...   🌟 一篇技術深度文
 16  /

關鍵對比 「Vectorless RAG 實測」那篇 30 天被 ClaudeBot 抓 58 次，但 87 天人類搜尋曝光只有 7 次——LLM 比人類勤勞 8 倍。

意味著：「實測 + 第一人稱經驗」內容對 LLM 訓練極有吸引力，這是 popdaily 編輯部親身體驗類內容的天然 moat。

啟示給 popdaily

中文站、流量不大、依然會被全球 5 大 AI bot 主動爬——不是「太小所以 AI 不理你」
「實測 + 親身經驗」類文章對 LLM 比熱門排行更有價值——這正是 popdaily 編輯部最強的內容類型
Gemini grounding（Google-Extended）對中文站重視度低——主要 LLM 戰場是 Anthropic + OpenAI + Perplexity
傳統 SEO 流量低不代表 AI 戰場輸——兩個指標分開看

AI 收錄 Quick Wins（直接抄）

1robots.txt 為 5 大 AI bot 顯式列 Allow

為什麼：很多媒體預設 User-agent: * Disallow: /something 會誤擋 AI bot；明確 Allow 是「我邀請你來抓」的訊號。chibakuma 配置就是這樣。

# Default rules
User-agent: *
Allow: /
Disallow: /admin/
Disallow: /api/

# OpenAI - 訓練爬蟲
User-agent: GPTBot
Allow: /

# OpenAI - 即時 search
User-agent: ChatGPT-User
Allow: /

# Anthropic
User-agent: ClaudeBot
Allow: /

# Perplexity
User-agent: PerplexityBot
Allow: /

# Google Gemini grounding
User-agent: Google-Extended
Allow: /

# OpenAI 即時 search bot（2025 上線）
User-agent: OAI-SearchBot
Allow: /

popdaily 落地：用上面 template 直接改 popdaily.com/robots.txt。30 分鐘搞定，立刻生效。

2每篇文章必有「第一人稱經驗段落」

為什麼：Google 2025-01 QRG 對「Experience」維度（EEAT 第一個 E）警戒度暴增，「paraphrased」用詞從 3 → 25 次；LLM 訓練偏好也一樣——Vectorless RAG 那篇被抓 58 次正因為是實測，不是改寫。

popdaily 落地：

編輯部食記 / 試用 / 實測類文章本來就有第一人稱——強化它，別讓 AI 改寫稀釋掉
AI 起草 → 編輯加入「我自己怎麼用 / 踩什麼坑 / 真實感受」段落 → 發稿
Hard rule：每篇必須有 ≥ 1 段「popdaily 自己才知道的內容」——讀者調查、後台留言精選、編輯實測對比

3強制注入：1 個統計數據 + 1 個一手引用

為什麼：Princeton/Georgia Tech KDD 2024 對照組研究——加入統計數據 + 引用來源 +30~40% AI 引用可見度，answer-first 結構 +67% 引用率。

popdaily 落地：

每篇強制 ≥ 1 個統計數據（讀者投票、後台流量、第三方研究）
每篇強制 ≥ 1 個一手引用 URL（官方文件、學術研究、品牌網站）
文章開頭 3 句必須直接給答案（answer-first），不要先寫 1500 字鋪陳

4CMS 自動注入 schema（FAQ + Article + Product/Recipe）

為什麼：FAQ schema 讓頁面被 AIO 引用機率 提升 3.2 倍；商品評測加 Product schema、食譜加 Recipe schema，讓 LLM 更容易抓出結構化資訊。

popdaily 落地：

所有商品評測 → Product schema（含評分、價格、評論）
所有食譜 → Recipe schema
所有「常見問題」段落 → FAQ schema
一般文章 → Article schema（author、publish date、修訂日期）

5監測 AI bot 爬量（這是新 KPI）

為什麼：傳統 SEO 看 GSC 排名 / 點擊；AI 收錄看 nginx access log 的 AI bot 爬量。每月一份 dashboard 就好，不用做成天天看的儀表板。

# 每月跑一次（grep nginx log）
zcat /var/log/nginx/access.log.*.gz | \
  grep -ciE "GPTBot|ChatGPT-User|ClaudeBot|PerplexityBot|OAI-SearchBot|Google-Extended"

# 看 top 被抓的內容
grep -iE "GPTBot|ClaudeBot" access.log | \
  awk '{print $7}' | sort | uniq -c | sort -rn | head -20

popdaily 落地：把這 KPI 跟既有 GA / GSC 並列在月報。如果某類內容 AI bot 爬量持續上升 → 加碼產製；如果某類爬量為零 → 看是不是 robots / schema / 內容問題。

三條 pipeline 對照（簡化版）

這三條是我（Maki）實際營運的 pipeline，給 popdaily 看「不同目標的不同設計」：

A · mkbrain.maki.tw（個人筆記）

Internal · 不適用 popdaily

robots Disallow:/ 全擋，純自己看的個人 PKI 站

▸ Trigger

收書籤

→

⚡ LLM

本地改寫

→

🔒 Private

只給自己看

列出來是讓 popdaily 看到對比——有些站本來就不該打 SEO/AI 收錄戰場，先確認你的 game。

B · blog.chibakuma.com（個人寫作站）

⭐ LLM-first 範本 · popdaily 該學這條

主動 invite 5 大 AI bot · 4 階段查證 · 30 天爬量 1,277 次

▸ Trigger

手動觸發

→

🔍 Search

外部一手引用

Perplexity

→

⚡ Analyze

分析素材

Claude Haiku

→

⚡ Voice

個人風格寫作

Voice profile

→

🧹 Clean

Humanizer 後置

→

📝 Draft

發布

關鍵設計：① robots.txt 主動列 AI bot Allow / ② 每篇強制有第一人稱觀點 / ③ Perplexity 查一手引用 / ④ Humanizer 後置消 AI 痕跡。
結果：30 天 ClaudeBot 767 / GPTBot 321 / OAI-SearchBot 116 / PerplexityBot 70——LLM 訓練 + 即時 search 雙線都進得去。

C · marketing.91app.com（公司行銷 blog）

人 + LLM 混合

即時通觸發 · AI 起草 · 真人 review · 圈內 hybrid workflow 領先範本

▸ Trigger

內部即時通

→

⊕ Style

注入個人風格

→

⚡ LLM

Gemini 改寫

→

📝 Draft

建草稿

→

👤 Human

真人 Review

給 popdaily 的借鏡：人工 review gate 不是負擔，是 8 倍排名差距（42,000 頁面研究：人工撰寫排名第一機率是純 AI 的 8 倍）。把 review UI 做極簡（preview + 一鍵 publish + 批次處理），就不會拖累節奏。

popdaily 推薦 pipeline

結合 Pipeline B（LLM-first 配置）+ Pipeline C（人工 review gate）：

▸ Trigger

編輯選題

人工 / 熱點偵測

→

⚡ Draft

AI 起草

→

⊕ Inject

強制原創注入

經驗+數據+引用

→

👤 Review

編輯極簡 review

→

🏷 Schema

自動加 schema

→

▶ Publish

發布

編輯團隊配置

1-2 人 prompt engineering 專責：維護 popdaily 風格 prompt template + 個別作者風格檔
每位編輯每天 review 配額：例 10-15 篇 AI 起草 + 自己親寫 1-2 篇深度文
每月品質審計 + AI bot 爬量月報：看 Experience 維度落實率、原創數據比例、AI bot 爬量趨勢

新 KPI 對照

傳統 KPI	新增 KPI（AI 收錄）
GA Pageview	AI bot 月爬量（GPTBot/ClaudeBot/...）
GSC clicks / position	AIO 引用 sample（手動季度抽查）
SEO ranking	ChatGPT/Perplexity 引用 sample
跳出率 / 停留時間	每篇第一人稱 + 統計數據 + schema 落實率

popdaily 強項放大

女性社群數據護城河 popdaily 後台知道哪些主題互動率最高、留言情緒、年齡分群——這些是 LLM 改寫文章抓不到的差異化資產。寫進文章 = 強原創訊號。

編輯部第一人稱經驗 化妝品實測、餐廳實訪、產品試用——這些是 Google Experience 維度 + LLM 訓練偏好雙重最強的訊號。

品牌信任資產（也是脆弱點） popdaily 域名 authority 是優勢，但也是脆弱點——別在 popdaily.com 開「AI 內容子目錄」當實驗田。如要試 AI 高量產，另開獨立網域。

明確不要做的事

議題	判定	為什麼
`llms.txt`	🔴 暫時別做	Aleyda Solis、John Mueller 質疑類似 keywords meta tag，無對照組數據；30 分鐘做了不虧但別放大期待
明標「本文 AI 生成」	🔴 不需要	無對照組證明影響排名 / AI 引用；圈內 consensus「不標不罰，標了傷讀者轉換率」
純 AI 全自動發文（無 review）	🔴 不要	2026-03 Spam Update 後 deindex 案例集中於此（NationalToday 850k 篇全 AI 站直接 deindex）
以 AI 偵測工具反制 AI 寫作痕跡	🔴 別追	Google 不靠 AI 偵測判罰；軍備競賽圈內共識「其實不重要」
每天設「發文上限」	🔴 不需要	頻率不是主要紅線，量大但有原創價值不會被罰；popdaily 量級每天 10-30 篇正常

結語

popdaily 的天然優勢（女性社群數據 + 編輯部親身體驗 + 品牌信任）正好對應 LLM 訓練 + 即時 search + AIO 引用三方都偏好的內容類型。

AI 不是用來取代這些優勢，是用來放大它們——讓編輯把時間花在「親身體驗 + 數據洞察」，AI 處理初稿、格式、結構化。

把 AI 收錄做到 best-in-class，傳統 SEO 自然不會差；反過來追傳統 SEO 但忽略 AI 收錄，2026 之後會越來越累。

選擇你的戰場，做到底。

引用來源

Google Search 2026 AI policy（官方）
Defending Search users from Parasite SEO（Google 官方）
Google March 2026 Spam Update
Ahrefs 60 萬頁 AI content study
Princeton/Georgia Tech GEO study, KDD 2024
Microsoft Advertising 2026 GEO/AEO 官方指南
Aleyda Solis（@aleyda）AI Search 3-Layer Framework
Lily Ray（@lilyraynyc）non-commodity content 立場
2026 真實 deindex 案例：@glenngabe NationalToday.com case study（850k+ 篇全 AI 站被 deindex）
First-hand：blog.chibakuma.com 30 天 nginx access log AI bot 爬蟲統計
First-hand：blog.chibakuma.com 87 天 Google Search Console 數據