
Jika tapak anda ingin mendapatkan keterlihatan, a peta laman XML yang tersusun dengan baik Ia adalah kunci yang mempercepatkan merangkak dan membantu enjin carian memahami seni bina tapak anda. Ia tidak mendatangkan keajaiban, tetapi ia menjadikannya lebih mudah untuk Google dan enjin carian lain menemui kandungan penting dan menjejakinya apabila perubahan berlaku.
Mari kita lihat di struktur peta laman XMLKami akan merangkumi teg, had, variasi (imej, video, berita), contoh dunia sebenar dan cara membuat serta menyerahkannya. Kami juga akan menyemak amalan terbaik, kaedah penyerahan dan cara mendiagnosis ralat dalam Konsol Carian, dengan petua yang digunakan dengan baik sama ada anda menggunakan WordPress, Shopify, PrestaShop atau CMS lain.
Apakah peta laman XML dan mengapa ia penting?
Peta laman XML ialah a fail berstruktur yang menyenaraikan URL yang anda mahu enjin carian merangkak, bersama-sama dengan metadata seperti tarikh terakhir diubah suai. Ia direka untuk robot, bukan pengguna (untuk orang terdapat peta laman HTML), dan amat berguna pada tapak besar, dengan Pautan dalaman yang lemah atau kandungan yang kerap berubah.
Nota: Memasukkan peta laman tidak menjamin pengindeksan, tetapi ia membantu perangkak berfungsi dengan lebih cekap. lebih cekap dan lengkapSelain itu, Google membenarkan anda menganalisis statusnya dalam Konsol Carian, mengesan ralat dan melihat bila terakhir ia diproses.
Format peta laman yang disokong dan masa untuk menggunakannya
Google menerima format yang ditakrifkan oleh Protokol peta lamanTiada keutamaan rasmi; pilih yang paling sesuai dengan projek anda dan CMS anda.
| Format | Huraian | kelebihan | Kelemahan |
|---|---|---|---|
| Peta Laman XML | Semakin banyak serba boleh dan boleh dikembangkanIa menyokong data tambahan (imej, video, berita, penukaran bahasa). | Ia membolehkan anda menyumbang kekayaan maklumat yang lebih besar Mengenai URL anda; kebanyakan CMS menjananya secara automatik atau melalui pemalam. | Ia mungkin terhasil lebih susah untuk menyelenggara di tempat yang sangat besar jika ia tidak automatik. |
| RSS/MRSS dan Atom 1.0 | Suapan dengan struktur yang serupa dengan XML, yang dibuat oleh banyak CMS standard. | Mudah disediakan; berguna untuk kandungan terkini dan kemas kini daripada video dengan MRSS. | Mereka biasanya hanya meliputi URL terkini; kawalan yang kurang baik ke atas keseluruhan inventori. |
| Peta laman teks | Fail .txt dengan a URL setiap baris, tanpa metadata. | Sangat mudah untuk dibuat dan teruskanSesuai untuk inventori yang besar jika anda tidak memerlukan metadata. | Terhad kepada URL dengan kandungan boleh diindeks (HTML dan seumpamanya), tanpa maklumat tambahan. |
Struktur dan teg peta laman XML
Pangkalan data ialah senarai entri dalam tempoh a Ini adalah label utama, mengikut protokol rasmi:
- : bekas akar dengan ruang nama protokol.
- : blok untuk setiap URL yang disertakan.
- (Diperlukan): URL mutlak, dengan protokol. Adalah lebih baik untuk mengelakkan melebihi ~2.048 aksara.
- (pilihan): tarikh pengubahsuaian terakhir dalam format W3C, contohnya 2024-06-04 atau dengan masa jika berkenaan.
- (pilihan): anggaran kekerapan perubahan (harian, mingguan, bulanan…).
- (pilihan): berat relatif 0.0 hingga 1.0.
Penting untuk Google: abaikan danWalau bagaimanapun, anda boleh menggunakan jika ia mencerminkan perubahan ketara (kandungan utama, data berstruktur, pautan), bukan sekadar tweak hak cipta.
Seperti mana-mana XML, ingat untuk menggunakan kod melarikan diri daripada entiti jika aksara khas muncul, dan kodkan fail masuk UTF-8 untuk mengelakkan masalah.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.ejemplo.com/pagina-importante</loc>
<lastmod>2024-06-04</lastmod>
</url>
</urlset>
Pada tapak dengan versi mudah alih/desktop yang berasingan, ia termasuk hanya satu versi kanonik dalam peta laman. Jika atas sebab teknikal anda menyertakan kedua-duanya, beri anotasi padanya supaya jelas versi mana setiap URL milik dan pastikan versi kanonik itu konsisten.
Varian khusus: imej, video, berita dan versi bahasa
Anda boleh menyediakan konteks tambahan menggunakan sambungan protokol. Ini amat berguna jika tapak web anda bergantung pada multimedia atau penutup hadir.
- Imejan: menunjukkan imej yang berkaitan untuk setiap URL (berguna untuk katalog, galeri atau e-dagang).
- Video: menentukan tajuk, perihalan, lakaran kenit dan lokasi fail atau pemain.
- berita: menghidu artikel terbaru untuk Google News dengan medan tertentu (tajuk, genre, tarikh).
- Versi setempatAnda boleh mengisytiharkan alternatif mengikut bahasa dan wilayah menggunakan anotasi yang sesuai dalam peta tapak.
Sambungan ini membolehkan enjin carian memahami dengan lebih baik kandungan bukan teks dan utamakan pengesanannya apabila menegak (imej, video, berita) adalah kunci dalam strategi anda.
Had, lokasi fail dan sifat URL
Peta laman mempunyai had yang ketat: maksimum 50.000 URL y 50 MB tidak dimampatkan setiap fail (anda boleh memampatkan menggunakan GZIP). Jika anda melebihi had itu, pisahkan mereka dan buat indeks peta laman. Ia tidak kira perintah Google tidak memproses URL secara berurutan.
Berkenaan lokasi, anda boleh mengehoskannya di mana-mana sahaja di tapak, tetapi jika anda tidak menyerahkannya melalui Konsol Carian, ia hanya terpakai pada keturunan direktori di mana sahaja mereka berada. Itulah sebabnya disyorkan untuk menyiarkannya di akar domain untuk menampung segala-galanya.
Termasuk sahaja URL mutlak dan layak (https://…). Elakkan laluan relatif (seperti /page.html) kerana Google akan cuba merangkaknya betul-betul seperti yang ada. Ingat bahawa fail mesti ada UTF-8 dan bahawa liputan peta laman harus mencerminkan URL kanonik dan boleh diindeks.
Cara membuat peta laman anda: CMS, manual atau alatan
Hari ini, adalah perkara biasa bagi CMS itu sendiri atau pemalam untuk menjana dan mengemas kini peta laman secara automatik. Walaupun begitu, adalah berguna untuk mengetahui pilihan untuk memilih yang terbaik. stabil dan mudah diselenggara dalam kes anda.
- WordPressPemalam seperti Yoast SEO, Rank Math atau All in One SEO mencipta peta laman diindeks dalam /sitemap_index.xml, membolehkan anda memasukkan/mengecualikan jenis kandungan dan mengemas kini secara automatik.
- Shopify / Wix / WebflowMereka biasanya menjana peta laman dalam /sitemap.xml secara automatik. Semak perkara yang disertakan dan jika anda memerlukan sebarang pengecualian.
- PrestashopGunakan modul Peta Laman Google untuk memilih jenis halaman yang hendak disertakan (produk, kategori, CMS).
- Tanpa CMS atau projek tersuai: jana peta laman daripada pangkalan data anda atau gunakan alatan seperti Screaming Frog, XML Sitemap Generator atau alternatif dalam talian lain.
Untuk tapak kecil anda boleh membuat satu secara manual menggunakan editor teks mengikut sintaks protokol. Pada tapak besar, ia mengautomasikan penciptaannya untuk mengelakkan percanggahan dengan inventori sebenar.
Suapan RSS/Atom dan peta laman teks
Jika CMS anda sudah menjana a RSS atau suapan AtomAnda boleh menyerahkannya sebagai peta laman: ini cara cepat untuk menyampaikan perubahan terkini, walaupun ia biasanya tidak meliputi keseluruhan tapak. MRSS berguna untuk kandungan video.
Peta laman teks ialah format minimalis: satu URL setiap baris dan sambungan .txt. Ia sah untuk HTML dan kandungan lain yang boleh diindeks, dan memudahkan pengurusan dalam inventori yang besar apabila anda tidak memerlukan metadata.
https://www.ejemplo.com/pagina-1
https://www.ejemplo.com/pagina-2
Dalam fail teks, jangan masukkan apa-apa selain a URL yang sahNama boleh menjadi apa sahaja yang anda mahukan (contohnya sitemap.txt) selagi ia mempunyai sambungan .txt.
Indeks peta tapak untuk tapak besar
Apabila anda melebihi had fail atau memilih untuk mengawal bahagian berasingan (blog, produk, kategori, multimedia), cipta a indeks peta laman yang menyenaraikan beberapa peta laman separa.
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://www.ejemplo.com/sitemaps/sitemap-productos.xml</loc>
<lastmod>2024-06-04</lastmod>
</sitemap>
<sitemap>
<loc>https://www.ejemplo.com/sitemaps/sitemap-blog.xml</loc>
<lastmod>2024-06-03</lastmod>
</sitemap>
</sitemapindex>
Segmentasi ini menambah baik penyelenggaraanIa mempercepatkan diagnosis dan membolehkan anda melihat prestasi mengikut kawasan dalam Konsol Carian.
Di mana untuk mencari peta laman mana-mana tapak web
Cara terpantas ialah mencuba laluan biasa seperti /sitemap.xml o /sitemap_index.xmlJika ia tidak muncul, semak fail. robots.txt dalam akar (https://domain.com/robots.txt), di mana laluan sering diisytiharkan dengan arahan Peta Laman.
Anda juga boleh menggunakan pengendali carian seperti tapak:domainanda.com inurl:peta laman o tapak:domainanda.com jenis fail:xmlMereka tidak selalu memulangkan fail, tetapi mereka boleh memberikan petunjuk. Dalam WordPress dan CMS lain, pemalam SEO biasanya menunjukkan dengan jelas URL peta tapak.
Cara menyerahkan peta laman anda kepada Google (dan enjin carian lain)
Penghantaran adalah a cadanganIa bukan satu kewajipan. Walaupun begitu, berbuat demikian memberikan anda laporan dan kawalan.
- Konsol Carian GoogleDalam Pengindeksan > Peta laman, tambahkan laluan (contohnya, peta laman.xml atau peta_indeks.xml). Anda akan dapat melihat sama ada ia telah diproses dengan betul, bilangan URL yang dikesan dan sebarang ralat.
- API Konsol CarianBerguna jika anda ingin mengautomasikan penghantaran daripada saluran paip penggunaan anda.
- robots.txtTambahkan garisan dengan lokasi peta laman dan Google akan menemuinya semasa merangkak robot anda.
Sitemap: https://www.ejemplo.com/sitemap.xml - PingSesetengah enjin menerima a ping melalui URL untuk memberitahu perubahan, contohnya:
https://www.google.com/ping?sitemap=https://www.ejemplo.com/sitemap.xml https://www.bing.com/webmaster/ping.aspx?siteMap=https://www.ejemplo.com/sitemap.xml - WebSub Dengan RSS/Atom: Jika anda menggunakan suapan, anda boleh mengedarkan kemas kini kepada enjin carian yang serasi.
Peta laman untuk berbilang tapak dan domain
Jika anda mengurus berbilang tapak, anda boleh memusatkan dan memudahkan penghantaran, sambil sentiasa menghormati sekatan harta benda dan skop.
- Dengan Konsol Carian: Sahkan pemilikan semua domain yang terlibat dan serahkan peta laman (atau indeks) yang menyenaraikan semuanya, walaupun dihoskan di satu lokasi di bawah kawalan anda.
- Menggunakan robots.txtBuat peta tapak yang berasingan untuk setiap tapak (hanya menggunakan URLnya), muat naiknya ke lokasi yang sama jika anda mahu (cth., https://sitemaps.example.com/), dan rujuk setiap satu dalam robots.txt domain anda berkenaan.
# robots.txt de https://example.com/ Sitemap: https://sitemaps.ejemplo.com/sitemap-example-com.xml
Ingat bahawa jika anda tidak menyerahkan melalui Konsol Carian, peta tapak hanya terpakai pada keturunan direktori tempat anda tinggal dan, secara amnya, ke URL di bawah yang sama tuan rumah, melainkan dasar enjin carian dan pengesahan pemilikan membenarkan sebaliknya.
Amalan terbaik SEO untuk peta laman yang sempurna
Fokus pada kualiti: peta laman dengan kurang bunyi dan hanya URL yang sah Ia berprestasi lebih baik daripada senarai gergasi dengan ralat.
- Termasuk sahaja URL kanonik dan boleh diindeks (Status 200, tiada noindex, tiada sekatan dalam robots.txt).
- Mengalih keluar ubah hala, ralat 404, ujian, parameter yang tidak diperlukan dan zon persendirian.
- Usa Hanya apabila terdapat perubahan yang berkaitan. Elakkan "bermain" dengan kurma tiruan.
- Pastikan URL mutlak dan dibentuk dengan baik; jangan campurkan protokol atau subdomain tanpa kawalan.
- Jangan melebihi 50.000 URL atau 50 MB setiap fail. Jika anda menghampiri had ini, bahagikan tapak anda dan buat indeks.
- Elakkan ID sesi dalam URL dan aksara yang tidak dibenarkan; jika tidak dapat dielakkan, gunakannya dengan betul. melarikan diri daripada entiti.
- Kemas kini peta laman anda untuk mengikuti perkembangan sebenar tapak anda dan kerap menyemaknya status dalam Konsol Carian.
Kesilapan biasa dan cara mengesannya
Konsol Carian menawarkan laporan yang sangat berguna untuk untuk mendiagnosis masalah. Ini adalah yang paling biasa dan cara menanganinya:
- URL tidak boleh diaksesPeta laman sedang diproses, tetapi beberapa halaman tidak dimuatkan. Cuba pemeriksaan URL, sahkan status 200 dan betulkan sebarang sekatan atau ralat pelayan.
- Terlalu banyak ubah hala atau pautan relatif: Pastikan URL mutlak dan sentiasa menunjuk ke versi terakhir (kanonik) untuk mengelakkan rentetan yang tidak perlu.
- URL tidak sahTerdapat aksara yang tidak disokong atau format yang salah (salah taip seperti htps//, domain salah eja). Normalkan dan sahkan.
- Kandungan penduaJika berbilang URL mempunyai tujuan yang sama, isytiharkan kanonik dan meninggalkan alternatif.
Selepas membetulkan, kembali ke serahkan peta tapak dalam Konsol Carian. Laporan liputan indeks akan memberitahu anda jumlah URL sah, Dikecualikan o Dengan amaran, yang memberi anda gambaran yang cukup tepat tentang kemajuan.
Contoh praktikal untuk disalin dan disesuaikan
Peta tapak XML asas dengan tarikh perubahan sebenar dan tiada metadata yang tidak diperlukan secara amnya lebih dari cukup untuk kebanyakan tapak:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://midominio.com/</loc>
<lastmod>2025-01-10</lastmod>
</url>
<url>
<loc>https://midominio.com/acerca-de</loc>
<lastmod>2025-01-09</lastmod>
</url>
</urlset>
Untuk fail robots.txt biasa yang mengisytiharkan peta laman tanpa sekatan khas, sesuatu yang mudah seperti berikut sudah memadai: Sebaris pada akhir fail:
User-agent: *
Allow: /
Sitemap: https://tudominio.com/sitemap.xml
Jika kandungan anda bergantung pada video atau imej, pertimbangkan untuk menambah sambungan sepadan dengan peta laman untuk meningkatkan pemahaman oleh enjin carian dan mempercepatkan penemuan mereka.

Bilakah sesuai untuk mempunyai lebih daripada satu peta laman?
Anda tidak selalu memerlukan berbilang, tetapi terdapat senario yang jelas menguntungkan: tapak dengan puluhan ribu URL, projek dengan kandungan yang sangat pelbagai (blog, produk, dokumentasi, multimedia) atau pasukan yang mahukan kawalan terperinci dan diagnosis mengikut bahagian dalam Konsol Carian.
Bahagikan secara logik: mengikut jenis (produk, kategori, siaran), mengikut bahasa, atau mengikut pepohon direktori. Ini sangat memudahkan operasi. tugas penyelenggaraan dan pengesanan insiden.
Soalan pantas untuk disimpan
Adakah ia meningkatkan SEO dengan sendirinya? Ia bukan faktor kedudukan, tetapi Ya, ia meningkatkan liputan dan kadar penemuan. Adakah perlu jika saya mempunyai pautan dalaman yang baik? Jika tapak web anda kecil dan saling berkaitan dengan baik, anda mungkin tidak menyedarinya; dalam tapak sederhana/besar Ia membuat perbezaan. Adakah peta laman HTML berguna? Ia untuk pengguna; XML ialah apa yang... robotBolehkah saya memampatkannya? Ya, dalam format .gz; ia menghormati had 50 MB tidak dimampatkan dan 50.000 URL bagi setiap fail.
Adakah saya perlu menggunakan dan Google tidak menggunakannya, jadi jangan bazirkan tenaga anda padanya. Bagaimana pula Gunakannya apabila ia mencerminkan perubahan nyata dan boleh disahkan pada halaman; ia adalah metadata yang berguna.
Peta laman yang dibuat dengan baik adalah seperti peta jalan yang jelas untuk enjin carian: ia memastikan inventori anda teratur, mempercepatkan penemuan perubahan dan mengurangkan kesilapan bodoh yang akhirnya menghalang pengindeksan. Jika anda berpegang pada perkara penting—URL berkanun dan boleh diakses, sempadan yang dihormati, lastmod jujur- penyerahan dan pemantauan dalam Konsol Carian—anda akan mempunyai asas teknikal yang kukuh untuk berkembang dengan lancar.

