noindex

noindex 是一種告知搜尋引擎「請勿收錄此頁面」的指令，通常以 meta 標籤或 HTTP 回應標頭的形式出現在網頁程式碼中。當 Google、Bing 等搜尋引擎的爬蟲存取帶有 noindex 標記的頁面時，它們會讀取此指令並選擇不將該頁面加入搜尋結果索引，即使爬蟲已抓取頁面內容。

此指令看似簡單，但實際應用卻十分微妙。許多網站管理員誤以為「收錄越多越好」，但現實中存在大量不該出現在搜尋結果中的頁面：登入頁、購物車頁面、篩選結果頁、測試頁、隱私權政策頁等。這些頁面對使用者有實際功能，但如果被搜尋引擎收錄，可能導致低品質頁面稀釋網站整體權重，甚至引發重複內容問題。noindex 的存在，就是要確保頁面可存取的同時，避免這些內容進入搜尋引擎的索引庫。

為何需要 noindex？

搜尋引擎每天需處理海量網頁，它們會根據頁面品質、使用者體驗、內容獨特性等因素決定是否收錄以及如何排名。並非所有頁面都值得被收錄，不當收錄反而會帶來負面影響。

例如，一個電子商務網站可能有成千上萬個依價格、顏色、品牌篩選的組合頁面，這些頁面內容高度相似，標題和描述也大同小異。若全部被收錄，搜尋引擎可能會認為網站存在大量重複內容，降低整體信任度。此時，對這些篩選頁使用 noindex 可以避免索引膨脹，將搜尋引擎的注意力集中在真正有價值的產品詳情頁和分類頁上。

再者，許多網站的感謝頁、確認頁、站內搜尋結果頁等功能性頁面，使用者存取後不太可能透過搜尋引擎再次進入，收錄它們毫無意義，還可能因為這些頁面缺乏實質內容而被判定為低品質頁面。

noindex 的實現方式

最常見的實現方式是在頁面 HTML 的 <head> 部分加入 meta 標籤：

<meta name="robots" content="noindex">

此指令對所有搜尋引擎都有效。如果只想針對特定搜尋引擎，可以使用：

<meta name="googlebot" content="noindex">

除了 meta 標籤，HTTP 回應標頭也能實現相同效果，適用於非 HTML 檔案（如 PDF、圖片）：

X-Robots-Tag: noindex

也可以在 robots.txt 檔案中設定 Disallow 規則，但這與 noindex 有本質區別：robots.txt 阻止爬蟲存取，而 noindex 允許存取但不收錄。如果同時使用 robots.txt 禁止存取和 noindex 標籤，爬蟲可能根本看不到 noindex 指令，反而導致頁面被收錄。

noindex 與 nofollow 的區別

許多人容易混淆 noindex 和 nofollow，它們經常一起出現但作用完全不同。

noindex 控制的是頁面本身是否被收錄，不影響爬蟲是否抓取頁面中的連結。即使頁面被 noindex 標記，爬蟲仍會追蹤頁面內的連結，存取其他頁面。

nofollow 控制的是頁面中的連結是否被追蹤，可應用於整個頁面（meta 標籤）或單一連結（連結屬性）。它告訴搜尋引擎「請勿追蹤這些連結，也不要傳遞權重」。

實際應用中，<meta name="robots" content="noindex, nofollow"> 表示既不收錄此頁面，也不追蹤頁面中的任何連結，常應用於完全無價值的頁面或臨時測試頁。

常見使用場景

電子商務網站的篩選頁面

使用者透過多重條件篩選商品時，系統會生成大量 URL 組合，這些頁面內容相似度極高，收錄後容易被搜尋引擎視為重複內容。對這些頁面使用 noindex，可以保持網站索引的精簡與品質。

會員中心與帳戶頁面

登入後的個人資訊頁、訂單歷史頁、購物車頁等，這些頁面對使用者有價值，但不應出現在公開搜尋結果中。使用 noindex 可以保護使用者隱私，也避免無意義收錄。

站內搜尋結果頁

網站站內搜尋功能會生成動態 URL，每次搜尋都可能產生不同的結果頁。這些頁面品質參差不齊，收錄後可能稀釋網站整體權重。

測試環境與開發頁面

上線前的測試頁面、草稿頁、臨時活動頁等，應在正式發佈前使用 noindex，避免被提前收錄。待內容完善後再移除標記。

低品質內容頁

某些自動生成的標籤頁、歸檔頁、分頁過深的列表頁等，內容價值較低，收錄後可能拉低網站整體評分。

使用 noindex 需要注意的問題

雖然 noindex 是控制收錄的有效工具，但使用不當可能帶來反效果。

誤標重要頁面是最常見的問題。如果不小心在核心產品頁、主要分類頁或優質內容頁上使用了 noindex，這些頁面將從搜尋結果中消失，直接導致流量下降。因此，修改 noindex 標記前務必確認頁面的重要性，定期檢查網站日誌和 Google Search Console 的覆蓋率報告。

noindex 並非即時生效。搜尋引擎需要重新抓取頁面才能識別到新的標記，移除 noindex 後頁面也不會立即重新出現在搜尋結果中。如果頁面已被收錄，添加 noindex 後可能需要數週時間才能完全從索引中移除。

robots.txt 與 noindex 的衝突也需要警惕。如果用 robots.txt 禁止了某個頁面，爬蟲無法存取該頁面，自然也看不到頁面中的 noindex 標記，結果可能是頁面仍然被收錄但只顯示 URL 而無描述。正確做法是允許爬蟲存取，只在頁面中添加 noindex。

誰適合使用 noindex？

幾乎所有網站都會涉及 noindex 的應用場景，但電子商務網站、內容聚合平台、會員制網站尤其需要重視。

電子商務網站因為商品數量多、篩選條件複雜，容易產生大量重複或低品質頁面；內容平台的標籤系統、分類歸檔可能生成數以千計的列表頁，不加控制會稀釋權重；會員網站的帳戶頁、付費內容預覽頁則涉及隱私和商業策略，必須避免被公開收錄。

對於SEO 從業人員、網站開發人員、內容營運人員來說，理解 noindex 的運作邏輯和應用場景，是提升網站搜尋表現的基礎技能。合理使用此指令，可以幫助搜尋引擎更有效率地理解網站結構，將抓取預算集中在真正有價值的內容上，從而提升整體排名和流量品質。