Google banner copy

Google Keresés működése

Részletes útmutató a Google Keresés működéséhez

A Google Kereső egy teljesen automatizált keresőmotor, amely webrobotként ismert szoftvereket használ, amelyek rendszeresen felfedezik az internetet, hogy megtalálják az indexünkbe felvehető oldalakat. Valójában a találataink között felsorolt ​​oldalak túlnyomó többségét nem manuálisan küldjük be felvételre, hanem automatikusan megtalálják és hozzáadják őket, amikor webrobotjaink felfedezik az internetet. Ez a dokumentum bemutatja a Keresés működésének lépéseit az Ön webhelyével összefüggésben. Ezen alapismeretek birtokában kijavíthatja a feltérképezési problémákat, indexelheti oldalait, és megtanulhatja, hogyan optimalizálhatja webhelye megjelenését a Google Keresésben.

Mielőtt belemennénk a Keresés működésének részleteibe, fontos megjegyezni, hogy a Google nem fogad el fizetést egy webhely gyakrabban történő feltérképezéséért vagy magasabb rangsorolásáért. Ha valaki mást mond, akkor téved.

A Google nem garantálja, hogy feltérképezi, indexeli vagy megjeleníti az Ön oldalát, még akkor sem, ha az oldal követi a Google Search Essentials előírásait .

A Google Keresés három szakaszban működik, és nem minden oldal jut át ​​minden szakaszon:

  1. Feltérképezés: A Google az interneten talált oldalakról szövegeket, képeket és videókat tölt le automatizált programokkal, amelyeket feltérképező robotoknak neveznek.
  2. Indexelés: A Google elemzi az oldalon található szövegeket, képeket és videofájlokat, és az információkat a Google indexében tárolja, amely egy nagy adatbázis.
  3. Keresési eredmények kiszolgálása: Amikor egy felhasználó keres a Google-on, a Google olyan információkat ad vissza, amelyek relevánsak a felhasználó lekérdezése szempontjából.

Az első lépés annak megállapítása, hogy milyen oldalak léteznek a weben. Nincs minden weboldal központi nyilvántartása, ezért a Google-nak folyamatosan új és frissített oldalakat kell keresnie, és fel kell vennie az ismert oldalak listájára. Ezt a folyamatot “URL-felderítésnek” nevezik. Egyes oldalak ismertek, mert a Google már meglátogatta őket. Más oldalakat a rendszer akkor fedez fel, amikor a Google egy ismert oldalról egy új oldalra mutató hivatkozást követ: például egy központi oldal, például egy kategóriaoldal, egy új blogbejegyzésre mutató hivatkozás. Megint más oldalakat fedez fel, amikor elküldi az oldalak listáját ( webhelytérképet ) a Google számára, hogy feltérképezze.

Amint a Google felfedezi egy oldal URL-jét, felkeresheti (vagy „feltérképezheti”) az oldalt, hogy megtudja, mi van rajta. Hatalmas számítógépkészletet használunk oldalak milliárdjainak feltérképezésére az interneten. A letöltést végző program neve Googlebot (más néven robot, bot vagy pók). A Googlebot algoritmikus folyamatot használ annak meghatározására, hogy mely webhelyeket, milyen gyakran és hány oldalt kell lekérni az egyes webhelyekről. A Google feltérképező robotjai is úgy vannak programozva, hogy ne próbálják meg túl gyorsan feltérképezni a webhelyet, hogy elkerüljék a túlterhelést. Ez a mechanizmus a webhely válaszain (például a HTTP 500-as hibák “lassulást” jelent ) és a Search Console beállításain alapul .

A Googlebot azonban nem térképezi fel az összes általa felfedezett oldalt. Előfordulhat, hogy egyes oldalak feltérképezését a webhely tulajdonosa nem engedélyezi, más oldalak nem érhetők el a webhelyre való bejelentkezés nélkül, más oldalak pedig a korábban feltérképezett oldalak másolatai . Például sok webhely elérhető a domain név www ( www.example.com) és nem www ( example.com) változatán keresztül, még akkor is, ha a tartalom mindkét verzióban azonos.

A feltérképezés során a Google megjeleníti az oldalt, és lefuttat minden talált JavaScriptet a Chrome legfrissebb verziójával, hasonlóan ahhoz, ahogy a böngésző megjeleníti a felkeresett oldalakat. A megjelenítés azért fontos, mert a webhelyek gyakran JavaScriptre támaszkodnak, hogy tartalmat vigyenek az oldalra, és megjelenítés nélkül előfordulhat, hogy a Google nem látja ezt a tartalmat.

A feltérképezés attól függ, hogy a Google feltérképező robotjai hozzáférhetnek-e a webhelyhez. Néhány gyakori probléma a Googlebot webhelyek elérésével kapcsolatban:

Az oldal feltérképezése után a Google megpróbálja megérteni, miről szól az oldal. Ezt a szakaszt indexelésnek nevezik, és magában foglalja a szöveges tartalom, valamint a kulcsfontosságú tartalmi címkék és attribútumok, például <title>elemek és altattribútumok, képek , videók és egyebek feldolgozását és elemzését.

Az indexelési folyamat során a Google megállapítja, hogy egy oldal egy másik internetes oldal másolata vagy gyűjtőoldal . A gyűjtő az az oldal, amely megjelenhet a keresési eredmények között. A kanonikus kiválasztásához először csoportosítjuk az interneten talált, hasonló tartalmú oldalakat, majd kiválasztjuk azt, amelyik leginkább reprezentálja a csoportot. A csoport többi oldala alternatív verziók, amelyek különböző kontextusokban jelenhetnek meg, például ha a felhasználó mobileszközről keres, vagy egy nagyon konkrét oldalt keres a klaszterből.

A Google jelzéseket is gyűjt a kanonikus oldalról és annak tartalmáról, amelyeket a következő szakaszban használhatunk fel, ahol az oldalt a keresési eredmények között jelenítjük meg. Egyes jelek közé tartozik az oldal nyelve, a tartalom helyi országa, az oldal használhatósága stb.

A kanonikus oldalról és fürtjéről összegyűjtött információk a Google indexében, egy több ezer számítógépen tárolt nagy adatbázisban tárolhatók. Az indexelés nem garantált; nem minden Google által feldolgozott oldal lesz indexelve.

Az indexelés az oldal tartalmától és metaadataitól is függ. Néhány gyakori indexelési probléma a következőket foglalhatja magában:

Amikor egy felhasználó beír egy lekérdezést, gépeink megkeresik az indexben a megfelelő oldalakat, és az általunk legjobbnak ítélt és a felhasználó számára legrelevánsabb eredményeket adják vissza. A relevanciát több száz tényező határozza meg, amelyek lehetnek például a felhasználó tartózkodási helye, nyelve és eszköze (asztali számítógép vagy telefon). Például a „kerékpárjavító műhelyek” kifejezésre történő keresés más eredményeket mutatna egy párizsi felhasználó számára, mint egy hongkongi felhasználó számára.

A Search Console jelezheti, hogy egy oldal indexelve van, de nem látja a keresési eredmények között. Ennek oka lehet:

Bár ez az útmutató elmagyarázza, hogyan működik a Keresés, folyamatosan dolgozunk algoritmusaink fejlesztésén. Ezeket a változásokat nyomon követheti a Google Keresőközpont blogjának követésével .