Algoritmi i renditjes algjebrike. Algoritmi i renditjes Yandex

Autori tregon rreth 30 histori argëtuese (dhe mësimore) nga fusha e matematikës. Një nga tregimet flet për parimet e PageRank, një algoritëm i renditjes së lidhjeve i përdorur për herë të parë nga Google. Tema është relevante dhe mjaft e lehtë për t'u kuptuar. Pra, tek Steven Strogatz...

Në ato kohë të largëta, kur Google nuk ekzistonte ende, kërkimi në internet ishte një detyrë e pashpresë. Faqet e ofruara nga motorët e vjetër të kërkimit shpesh nuk përputheshin me pyetjen, dhe ato që përmbanin informacionin e nevojshëm ose u varrosën thellë në listën e rezultateve ose mungonin plotësisht. Algoritmet e bazuara në analizën e lidhjeve e zgjidhën problemin duke hyrë në thelbin e një paradoksi të ngjashëm me Zen koans: kërkimet në internet supozohej të shfaqnin faqet më të mira. Çfarë e bën një faqe më të mirë? Kur faqe të tjera po aq të mira lidhen me të.

Shkarkoni shënimin në ose

Kjo tingëllon si një rreth vicioz. Kjo është e vërtetë. Kjo është arsyeja pse gjithçka është kaq e ndërlikuar. Duke marrë këtë ide dhe duke e kthyer në avantazhin e saj, algoritmi i minierave të lidhjeve ofron një zgjidhje jiu-jitsu për kërkimet në ueb. Kjo qasje është ndërtuar mbi idetë e marra nga algjebra lineare, studimi i vektorëve dhe matricave. Pavarësisht nëse dëshironi të identifikoni modele në sasi të mëdha të dhënash ose të kryeni llogaritje gjigante që përfshijnë miliona variabla, algjebra lineare i ka të gjitha. mjetet e nevojshme. Me ndihmën e tij, u ndërtua themeli për algoritmin PageRank, i cili përbën bazën e Google. Ai gjithashtu ka ndihmuar shkencëtarët të klasifikojnë fytyrat njerëzore, të analizojnë votimin në Gjykatën e Lartë dhe të fitojnë çmimin Netflix (i dhënë ekipit që mund të përmirësojë sistemin e Netflix për të bërë rekomandime për filmat më të mirë me më shumë se 10 përqind).

Për të eksploruar algjebrën lineare në veprim, le të shohim se si funksionon algoritmi PageRank. Dhe për të zbuluar thelbin e saj pa zhurmë të panevojshme, le të imagjinojmë një rrjet lodër të përbërë nga vetëm tre faqe të lidhura me njëra-tjetrën. si më poshtë:

Oriz. 1. Rrjet i vogël i tre vendeve

Shigjetat tregojnë se faqja X përmban një lidhje me faqen Y, por Y nuk reciproke. Përkundrazi, Y i referohet Z. Ndërkohë, X dhe Z i referohen njëri-tjetrit.

Cilat faqe janë më të rëndësishmet në këtë ueb të vogël? Ju mund të mendoni se është e pamundur të përcaktohet për shkak të mungesës së informacionit për përmbajtjen e tyre. Por kjo mënyrë e të menduarit është e vjetëruar. Shqetësimet për përmbajtjen rezultuan në një mënyrë të papërshtatshme për të renditur faqet. Kompjuterët kanë pak njohuri për përmbajtjen dhe njerëzit nuk mund të përballojnë mijëra faqe të reja që shfaqen në internet çdo ditë.

Qasja, e shpikur nga Larry Page dhe Sergey Brin, studentë të diplomuar në universitet dhe themelues të Google, ishte të lejonte që faqet të renditeshin në një renditje specifike duke votuar për lidhjet. Në shembullin e mësipërm, faqet X dhe Y lidhen me Z, duke e bërë Z të vetmen faqe me dy lidhje hyrëse. Rrjedhimisht, do të jetë faqja më e njohur në këtë mjedis. Sidoqoftë, nëse lidhjet vijnë nga faqe me cilësi të diskutueshme, ato do të punojnë kundër vetvetes. Popullariteti në vetvete nuk do të thotë asgjë. Gjëja kryesore është të keni lidhje nga faqe të mira.

Dhe këtu ne përsëri e gjejmë veten në një rreth vicioz. Një faqe konsiderohet e mirë nëse ka faqe të mira që lidhen me të, por kush vendos se cilat janë të mira në radhë të parë? Këtë e vendos rrjeti. Kështu shkon.

Algoritmi i Google i cakton çdo faqe një numër thyesor midis 0 dhe 1. Kjo vlerë numerike quhet PageRank dhe mat "rëndësinë" e një faqeje në lidhje me të tjerët duke llogaritur sasinë relative të kohës që një përdorues hipotetik do të shpenzonte për ta vizituar atë. Megjithëse një përdorues mund të zgjedhë nga më shumë se një lidhje dalëse, ai zgjedh një rastësisht me probabilitet të barabartë. Me këtë qasje, faqet konsiderohen më autoritare nëse vizitohen më shpesh.

Dhe duke qenë se indekset e PageRank përcaktohen si përmasa, shuma e tyre në të gjithë rrjetin duhet të jetë 1. Ky ligj ruajtjeje sugjeron një mënyrë tjetër, ndoshta më të prekshme, për të vizualizuar PageRank. Imagjinoni si substancë e lëngshme, që rrjedh nëpër rrjet, sasia e të cilit zvogëlohet në faqet e këqija dhe rritet në ato të mira. Duke përdorur një algoritëm, ne përpiqemi të përcaktojmë se si ky lëng shpërndahet në internet me kalimin e kohës.

Përgjigja do të merret si rezultat i procesit të mëposhtëm që përsëritet shumë herë. Algoritmi fillon me një supozim, pastaj përditëson të gjitha vlerat e PageRank, duke shpërndarë lëngun në mënyrë të barabartë nëpër lidhjet dalëse dhe më pas shkon rreth e rrotull disa herë derisa të arrijë një gjendje të caktuar ku faqet marrin pjesën e tyre të drejtë.

Fillimisht, algoritmi vendos aksione të barabarta, gjë që lejon çdo faqe të marrë të njëjtën sasi të PageRank. Në shembullin tonë ka tre faqe, dhe secila prej tyre fillon të lëvizë sipas algoritmit me rezultatin 1/3.

Oriz. 2. Vlerat fillestare të PageRank

Rezultati përditësohet më pas për të treguar vlerën aktuale të secilës faqe. Rregulli është që secila faqe merr PageRank-in e saj nga rrethi i fundit dhe e shpërndan atë në mënyrë të barabartë në të gjitha faqet me të cilat lidhet. Prandaj, vlera e përditësuar e faqes X pas raundit të parë është ende 1/3, pasi kjo është sa PageRank merr nga Z, e vetmja faqe që lidhet me të. Kjo zvogëlon rezultatin e faqes Y në 1/6 pasi ajo merr vetëm gjysmën e PageRank-it të X pas raundit të mëparshëm. Pjesa e dytë shkon në faqen Z, duke e bërë atë fituese në këtë fazë, pasi ajo shton edhe 1/6 e faqes X, si dhe 1/3 e Y, për gjithsej 1/2. Kështu, pas rrethit të parë kemi vlerat e mëposhtme të PageRank:

Oriz. 3. Vlerat e PageRank pas një përditësimi

Në qarqet pasuese, rregulli i përditësimit mbetet i njëjtë. Nëse shënojmë me x, y, z numrin aktual të faqeve X, Y dhe Z, atëherë si rezultat i përditësimit marrim numërimin e mëposhtëm:

z’ = ½ x + y,

ku goditjet tregojnë se ka ndodhur një përditësim. Është i përshtatshëm për të kryer llogaritje të tilla të përsëritura në një tabelë (ose manualisht nëse rrjeti është i vogël, si në rastin tonë).

Pas dhjetë përsëritjesh, do të zbulojmë se numrat praktikisht nuk ndryshojnë nga përditësimi në përditësim. Në këtë pikë, pjesa e X do të jetë 40.6% e totalit të PageRank, pjesa e Y do të jetë 19.8%, dhe Z do të jetë 39.6%. Këto vlera janë në mënyrë të dyshimtë afër numrave 40, 20 dhe 40%, gjë që sugjeron që algoritmi duhet të konvergojë me to. Kjo është e vërtetë. Algoritmi i Google i përcakton këto vlera kufizuese për rrjetin si PageRank.

Oriz. 4. Kufijtë e Page Rank

Përfundimi për këtë rrjet të vogël është se faqet X dhe Z janë po aq të rëndësishme, edhe pse Z ka dy herë më shumë lidhje hyrëse. Kjo është e kuptueshme: Faqja X është e barabartë me Z për nga rëndësia, pasi ajo merr miratimin e plotë prej saj, por i jep asaj vetëm gjysmën e miratimit në këmbim. Gjysma tjetër shkon te Y. Kjo gjithashtu shpjegon pse Y merr vetëm gjysmën e aksioneve të X dhe Z.

Shtë interesante që këto vlera mund të merren pa përdorur përsëritje të shumëfishta. Thjesht duhet të mendoni për kushtet që përcaktojnë një gjendje të palëvizshme. Nëse asgjë nuk ndryshon pas përditësimit tjetër, atëherë x' = x, y' = y dhe z' = z. Prandaj, duke zëvendësuar variablat e paracaktuar në ekuacionet e përditësimit me ekuivalentët e tyre pa numra të thjeshtë, marrim një sistem ekuacionesh

kur zgjidhet x = 2y = z. Meqenëse shuma e vlerave të x, y dhe z duhet të jetë e barabartë me 1, rrjedh se x = 2/5, y = 1/5 dhe z = 2/5, që korrespondon me vlerat e gjetura më parë.

Vështirësitë fillojnë aty ku ka një numër të madh variablash në ekuacione, siç ndodh në një rrjet real. Prandaj, një nga problemet qendrore të algjebrës lineare është zhvillimi i algoritmeve më të shpejta për zgjidhjen e sistemeve të mëdha të ekuacioneve. Edhe përmirësime të vogla në këto algoritme ndihen pothuajse në të gjitha fushat e jetës - nga oraret e fluturimeve deri te kompresimi i imazhit.

Sidoqoftë, fitorja më domethënëse e algjebrës lineare, për sa i përket rolit të saj në jetën e përditshme, sigurisht që është bërë zgjidhja e paradoksit të Budizmit Zen për renditjen e faqeve. "Një faqe është po aq e mirë sa faqet e mira që lidhen me të." I përkthyer në simbole matematikore, ky kriter bëhet algoritmi PageRank.

Motori i kërkimit Google u bë ai që është sot duke zgjidhur ekuacionin që ju dhe unë sapo zgjidhëm, por me miliarda variabla - dhe, në përputhje me rrethanat, me miliarda fitime.

Sipas Google, termi PageRang vjen nga bashkëthemeluesi i Google, Larry Page, jo fjalë angleze faqe (faqe).

Për thjeshtësi, unë do të paraqes vetëm versionin bazë të algoritmit PageRank. Për të trajtuar rrjetet me disa veti të tjera strukturore, ai duhet të modifikohet. Supozoni se ka faqe në rrjet që lidhen me të tjerët, por ato, nga ana tjetër, nuk lidhen me to. Gjatë procesit të përditësimit, këto faqe do të humbasin PageRank-in e tyre. Ata ua japin të tjerëve dhe nuk plotësohet më. Kështu, ato do të përfundojnë me vlera PageRank të barabarta me zero, dhe nga ky këndvështrim do të bëhen të padallueshme.

Nga ana tjetër, ka rrjete ku disa faqe ose grupe faqesh janë të hapura për të grumbulluar PageRank, por nuk lidhen me faqe të tjera. Faqe të tilla veprojnë si akumulues i PageRank.

Për të shmangur rezultate të tilla, Brin dhe Page modifikuan algoritmin e tyre si më poshtë. Pas çdo hapi në procesin e përditësimit të të dhënave, të gjitha vlerat aktuale të PageRank zvogëlohen me një faktor konstant, në mënyrë që shuma e tyre të jetë më e vogël se 1. PageRank-i i mbetur më pas shpërndahet në mënyrë të barabartë midis të gjitha nyjeve në rrjet, sikur "bie nga qielli.” Kështu, algoritmi përfundon me një veprim barazimi që shpërndan vlerat e PageRank midis nyjeve më të varfra.

Matematika e PageRank dhe kërkimi interaktiv diskutohen më gjerësisht në E. Aghapour, T. P. Chartier, A. N. Langville dhe K. E. Pedings, Google PageRank: Matematika e Google (

Ne liruam libër i ri"Marketingu i përmbajtjes në rrjetet sociale: Si të futeni në kokën e abonentëve tuaj dhe t'i bëni ata të dashurohen me markën tuaj."

Algoritmet e renditjes - metodat për vlerësimin e cilësisë së faqeve të internetit

TOP 10 duhet të përfshijë vetëm ato faqe që i përgjigjen kërkesës së përdoruesit sa më plotësisht të jetë e mundur. Rezultatet me cilësi të lartë sigurohen nga formula të veçanta matematikore që përcaktojnë "dobinë" e një siti të caktuar. Motorët e kërkimit nuk zbulojnë informacione rreth algoritmeve të tyre, ata u ofrojnë webmasterëve vetëm rekomandime të përgjithshme për përmirësimin dhe optimizimin e faqeve. Megjithatë, optimizuesit kanë mësuar të identifikojnë modele të caktuara në bazë të të cilave zhvillohet një strategji.

lëvizjes.

Më shumë video në kanalin tonë - mësoni marketingun në internet me SEMANTICA

Çfarë kriteresh merr parasysh algoritmi i renditjes?

Motorët e kërkimit vlerësojnë faqet e internetit bazuar në shumë parametra. Ndër kriteret më të rëndësishme janë:

  • unike dhe optimizim i teksteve (prania e frazave kyçe, të përziera, përmbajtja e ujit);
  • mosha e domenit;
  • sasia dhe cilësia e lidhjeve hyrëse;
  • lloji i CMS i përdorur;
  • shpejtësia e ngarkimit të faqes së faqes;
  • prania e gabimeve në kod.

Duke kuptuar se si funksionon algoritmi i motorit të kërkimit, një webmaster mund të ndikojë në renditjen e faqes së tij të internetit. Për ta bërë këtë, është e nevojshme të "rregulloni" faqet e projektit në internet me kërkesat e PS. Në veçanti, do t'ju duhet të futni frazat kryesore në meta etiketat e titullit dhe të përshkrimit, si dhe direkt në tekstin e faqes. Nëse jeni duke promovuar në bazë të një kërkese të varur nga gjeografia, atëherë përveç çelësave, duhet të shtoni edhe emrin qytetin e dëshiruar ose rajon.

Kjo është interesante! Motori i kërkimit përmirësohet periodikisht, gjë që çon në një ndryshim rrënjësor në algoritmet ekzistuese. Masa të tilla kanë për qëllim luftimin e spamit të kërkimit. Shpesh, një ndryshim në algoritmin Yandex çon në një përkeqësim të pozicioneve të vendeve të promovuara nga metodat "e zezë" dhe "gri".

Sanksionet e kërkimit

Nëse një webmaster po përpiqet qartë të manipulojë algoritmet Yandex, atëherë motori i kërkimit mund të aplikojë sanksione të ndryshme ndaj tij. Mund të shfaqen problemet e mëposhtme:

  • Renditja më e ulët në rezultatet e kërkimit
  • Indeksimi i dobët i faqeve të reja (ose dokumentet e vjetra që bien jashtë indeksit)
  • BAN i plotë ose i pjesshëm

Algoritmet Yandex vendosin sanksione për optimizimin e tepërt të teksteve, për shembull, për postimin e listave të frazave kryesore në faqe. Filtri mund të aplikohet për të bërë përzierjen e tekstit "të padukshëm" në sfond. Gjithashtu subjekt i sanksioneve janë faqet e hyrjes dhe platformat e internetit që kopjojnë përmbajtjen e njerëzve të tjerë.

Algoritmi i ri Yandex - Minusinsk

Ky algoritëm përfshin pesimizimin e një projekti në internet për përdorimin e lidhjeve SEO. Po flasim për sajte që blejnë mijëra lidhje duke përdorur shkëmbime të automatizuara si Sape. Nga këndvështrimi i Yandex, një lidhje konsiderohet "SEO" nëse drejton nga një sit donatorësh me cilësi të ulët dhe ka një spirancë komerciale.

Arsyeja e përdorimit të filtrit " " mund të jetë një rritje e mprehtë në masën e lidhjes. Prandaj, për të mbrojtur projektin tuaj të internetit nga mundësia e një sanksioni të tillë, duhet të blini lidhjet gradualisht dhe të holloni lidhjet e ankorimit me hiperlidhjet jo ankoruese.

total

Për një kohë shumë të gjatë, algoritmet e renditjes Yandex mbetën një "sekret" për përdoruesit. Specialistët e motorëve të kërkimit Yandex preferuan të mos informojnë përdoruesit e Internetit për ndryshimet në algoritmet e renditjes.

Algoritmet e renditjes Yandex

1 2007

Dhe vetëm në vitin 2007, punonjësit e Yandex filluan të informojnë përdoruesit e tyre për futjen e risive në algoritmin e kërkimit. Kjo e bën promovimin e faqes në internet pak më të lehtë për shumë webmaster.

Vlen të përmendet se algoritmet e renditjes Yandex po ndryshojnë vazhdimisht. Falë këtyre ndryshimeve, shtohet funksionaliteti më i ri dhe më i avancuar, gjë që e bën shumë më të lehtë punën me këtë motor kërkimi. Gjithashtu, falë ndryshimeve në algoritmet e renditjes, gabimet eliminohen, filtrat dhe kufizuesit përditësohen, dhe shpërndarja më e saktë e informacionit është rregulluar që përputhet më së miri me kërkesën origjinale.

2 maj 2008

Në maj 2008, specialistët e Yandex lëshuan një algoritëm të ri të quajtur "Magadan".

Algoritmi Magadan

Në këtë algoritëm, numri i faktorëve të renditjes është dyfishuar dhe klasifikuesi i bazuar në vendndodhjen e përdoruesit (gjeotargeting) është përmirësuar ndjeshëm. Gjithashtu në algoritmin Magadan ka të tilla zgjidhje inovative si shtimi i klasifikuesve për përmbajtjen dhe lidhjet. Shpejtësia e motorit të kërkimit në kërkimin e informacionit bazuar në pyetjet kryesore të futura është rritur ndjeshëm (në sajë të këtij algoritmi, motori i kërkimit është në gjendje të japë informacion edhe me tekste që kanë drejtshkrim para-revolucionar).

Lëshuar në korrik të të njëjtit vit version i ri algoritmi Magadan, i cili përfshinte faktorë shtesë të renditjes, për shembull, përcaktimin e veçantisë së tekstit dhe informacionit, përcaktimin nëse përmbajtja është pornografike, etj.

3 shtator 2008

Tashmë në shtator 2008, kompania Yandex lëshoi ​​​​një algoritëm të ri të quajtur "Nakhodka".

Falë ardhjes së këtij algoritmi, puna me fjalorë në motorin e kërkimit Yandex është përmirësuar ndjeshëm, dhe cilësia e renditjes për pyetjet që përmbajnë fjalë ndalese (lidhëza dhe parafjalë) është rritur ndjeshëm. Gjithashtu në këtë algoritëm, u zhvillua një qasje krejtësisht e re për mësimin e makinerive (makina filloi të dallonte midis pyetjeve të ndryshme dhe filloi të ndryshojë faktorët e renditjes për pyetje të ndryshme në formulën e llogaritjes për rezultatet e kërkimit).

4 prill 2009

Një algoritëm i ri i quajtur "Arzamas" ose "Anadyr" u postua në motorin e kërkimit Yandex në prill 2009.

Algoritmi Arzamas

Falë prezantimit të këtij algoritmi, motori i kërkimit Yandex mësoi të kuptonte gjuhën ruse më saktë dhe dukshëm më mirë, gjë që bëri të mundur zgjidhjen më të saktë të fjalëve të paqarta në pyetje. Ky algoritëm gjithashtu lejoi motorin e kërkimit të merrte parasysh rajonin në të cilin ndodhet përdoruesi. Falë së cilës përdoruesit filluan të marrin më të sakta dhe më shumë informacione të dobishme në pyetjen e kërkuar, e cila kishte rëndësinë maksimale për rajonin në të cilin ishte vendosur përdoruesi.

Duhet theksuar se në rajone të ndryshme informacioni i dhënë është gjithashtu i ndryshëm, pavarësisht nga e njëjta pyetje e futur nga përdoruesi. Gjithashtu në këtë algoritëm kërkimi formula është përmirësuar ndjeshëm, gjë që e bën më të përshtatshëm punën me pyetje me shumë fjalë. U prezantuan filtra më të rreptë për faqet me banderola popunder (banderoli Pop-Under shfaqet në të gjitha faqet e faqes dhe nuk ka lidhje me temën e sajtit), clickander (reklamat me klikim që shfaqet në faqe kur vizitori klikon për herë të parë) dhe bodyclic (Bodyclic - shërbim reklamimi ngacmues).

5 nëntor 2009

Në nëntor 2009, u lëshua një algoritëm i ri, i quajtur "Snezhinsk".

Algoritmi Snezhinsk

Ky algoritëm prezanton funksione shtesë dhe parametra të renditjes që ju lejojnë të aplikoni disa mijëra parametra kërkimi për një dokument të vetëm. Gjithashtu në këtë algoritëm u prezantuan parametra të rinj rajonalë (filtra për faqet që synojnë të ndikojnë në rezultatet e kërkimit, faqe më e thjeshtë, anti-shit), dhe kërkimi i përmbajtjes origjinale në internet u përmirësua ndjeshëm. Ky algoritëm përfshinte edhe sistemin MatrixNet vetë-mësues.

6 dhjetor 2009

Në dhjetor 2009, u shfaq një algoritëm i ri i quajtur "Konakovo".

Ky algoritëm ishte vetëm një version i përmirësuar i algoritmit Snezhinsk dhe vetëm renditja lokale u përmirësua. Në Shtator 2010, u publikua një algoritëm i ri "Obninsk". Në këtë algoritëm, renditja për pyetjet e pavarura territoriale u përmirësua dhe u fut një kufizim në ndikimin e lidhjeve artificiale në renditje. Gjithashtu, falë këtij algoritmi është përmirësuar ndjeshëm procedura për përcaktimin e tekstit të autorit, si dhe është zgjeruar ndjeshëm fjalori i transliterimit.

7 2010

Në dhjetor 2010, u lëshua një algoritëm i ri i quajtur "Krasnodar".

Për të krijuar këtë algoritëm, një i zhvilluar posaçërisht teknologji e re, i cili quhet Spektri. Falë këtij algoritmi, motori i kërkimit Yandex filloi të klasifikojë pyetjet dhe të zgjedhë objekte prej tyre, duke i caktuar pyetjeve një kategori specifike (produkte, shërbime, etj.).

8 2014

Një tjetër vrasës i shtënë nga Yandex - algoritmet e renditjes Yandex nuk do të marrin më parasysh lidhjet gjatë renditjes. Sipas njoftimeve të fundit, renditja pa lidhje do të nisë në fillim të vitit 2014. Yandex do të heqë të gjithë faktorët e lidhjes nga faktorët e renditjes. Kjo risi do të prekë vetëm kërkesat komerciale dhe fillimisht do të testohet në Moskë dhe rajonin e Moskës. Autorë të risive, krijues të AGS Yandex.

PageRank është një vlerë numerike që karakterizon "rëndësinë" e faqes në internet të një faqe interneti. Sa më shumë lidhje të çojnë në një faqe faqeje dhe sa më cilësore të jenë, aq më "e rëndësishme" bëhet faqja. Përveç kësaj, "pesha" e faqes A përcaktohet nga pesha e lidhjes së transmetuar nga faqja B. Kështu, PageRank është një metodë për llogaritjen e peshës së një faqeje duke llogaritur rëndësinë e lidhjeve në të.

Kjo metodë llogaritjeje u patentua nga zhvilluesit dhe bashkëthemeluesit e motorit të kërkimit Google Sergey Brin dhe Larry Page. Lexoni më në detaje tekstin e studimit (në anglisht). Në rusisht.

Cila është pesha e faqes në internet?

Nën peshën e faqes është shkalla e rëndësisë së saj. Nëse bëjmë një analogji me marrëdhëniet njerëzore, atëherë fraza "fjala e tij ka peshë" do të pasqyrojë thelbin e konceptit "pesha e një faqe interneti".

Pesha e faqes shprehet në numra specifikë dhe mund të llogaritet.

Në mënyrë konvencionale, ekzistojnë dy lloje të peshës së faqes:

  1. Pesha statike (një numër i caktuar), i cili llogaritet në bazë të faktorëve të pavarur nga pyetja - të gjithë këta janë faktorë që nuk lidhen me pyetjen e kërkimit. Për shembull, mosha e faqes, faqet e saj, data e indeksimit të faqeve, numri i lidhjeve të brendshme dhe të jashtme që çojnë në faqe.
  2. Pesha dinamike, e cila llogaritet në bazë të faktorëve të varur nga pyetja - këta janë të gjithë faktorë që lidhen me pyetjen e kërkimit (tekstin). Teksti i kërkesës krahasohet me tekstin e faqes së faqes, prandaj, faktorët e varur nga kërkesa janë ata që varen kryesisht nga elementët e tekstit të faqes - titulli i tij, përshkrimi i përshkrimit, teksti në të, ankorat (tekstet) e lidhjeve që tregoni për të dhe burojnë prej saj.
Algoritmi PageRank përcakton peshën statike të një faqeje, jo dinamike. Me fjalë të tjera, pesha statike e një faqeje është PageRank e saj. Mund të ketë një faqe në faqe pa përmbajtje, por nëse të paktën një lidhje të çon në të, atëherë ajo do të ketë peshë statike.

Pesha statike konsiderohet nga motorët e kërkimit në sfond dhe caktohet në faqen e faqes. Pas një kohe të caktuar ai rillogaritet. Pesha dinamike nuk llogaritet në sfond, por në fluturim kur përdoruesi paraqet një pyetje kërkimi në motorin e kërkimit për të gjetur rezultate.

Si duket formula e PageRank?

Askush nuk e di saktësisht se si Google llogarit në të vërtetë PageRank. Por ju mund të përqendroheni në këtë formulë të propozuar nga Sergey Brin dhe Larry Page në studimin e tyre.

PR(A)=(1-d)+d(PR(T_1)/C(T_1) +⋯+PR(T_n)/C(T_n)) , Ku

PR(A) - pesha e faqes së pranuesit A ​​(në të cilën është vendosur lidhja)

PR(T_n) - pesha e faqes së donatorit që lidhet me faqen A (nga e cila është vendosur lidhja)

C(T_n) - numri i lidhjeve nga faqja e donatorëve

D është koeficienti i dobësimit, zakonisht i barabartë me 0.85. Në modelin probabilistik, nënkupton që përdoruesi nuk do të ndjekë fare lidhjen, por do të mbyllë faqen e faqes. Kësaj ngjarjeje iu caktua një probabilitet prej 15%. Pjesa e mbetur prej 85% u jepet lidhjeve.

1-d është një element që nevojitet për të siguruar që formula të mos bëhet e pavlefshme nëse pesha e faqeve të donatorëve lidhës është e barabartë me 0. Kjo do të thotë që edhe faqja më e parëndësishme në faqe mund të transmetojë një peshë minimale përmes lidhjes .

Formula mund të shkruhet si më poshtë

Pesha e faqes së pranuesit të faqes është e barabartë me shumën e peshave të transmetuara nëpërmjet lidhjeve nga faqet e donatorëve në faqen e pranuesit.

Shembull

Nëse një faqe interneti po promovohet në fushën e shitjes së blindave, atëherë duhet të gjejmë faqe në faqet e donatorëve me një PageRank të lartë. Kur komunikoj, unë nuk analizoj vlerën e PageRank të secilës faqe të faqes me të cilën dua të bëj kontakt, sepse... një faqe e tillë mund të jetë në një faqe të spamuar. Përqendrohem në temën e faqes së donatorëve dhe që një faqe e tillë të jetë në motorin TOP 10 të kërkimit për pyetjet tematike të informacionit që kanë të bëjnë me produktin/shërbimin që promovohet dhe në treguesit me të cilët kontrolloj çdo faqe të mundshme të donatorëve përpara se të shkruaj një propozim. pronarit të tij ose personit përgjegjës për postimin e materialeve në të, në lidhje me publikimin e një lidhjeje ose përmendjeje.

Nëse një faqe është në faqen e parë të rezultateve të kërkimit, atëherë algoritmi i kërkimit e konsideroi atë të një cilësie të lartë në mënyrë që të ishte në TOP 10 për pyetjen e kërkimit që na intereson. Ju duhet të përpiqeni të merrni një lidhje aktive ose përmendje nga një faqe e tillë, sepse tashmë ka trafik nga kërkimi dhe një lidhje e vendosur në një faqe të tillë do të ketë një probabilitet të lartë për t'u ndjekur nga përdoruesit për shkak të të qenit në TOP.

Kam shkruar në terma të përgjithshëm se çfarë është një motor kërkimi dhe si i rendit faqet në një artikull të datës 8 gusht.
Aty shikuam se çfarë është një motor kërkimi, si mëson për faqet e reja dhe si përcakton rendin në të cilin faqet shfaqen në rezultatet e kërkimit për një pyetje. Përsëri, këto ishin koncepte të përgjithshme dhe më abstrakte. Sot do të flasim për një algoritëm specifik të renditjes në motorin e kërkimit Yandex.

Në vitin 2009, motori i kërkimit Yandex kaloi në një algoritëm të ri kërkimi - Snezhinsk, i cili përdor teknologjinë Matrix. Net (Matrixnet). Por këto janë të gjitha fjalë dhe nuk na thonë asgjë. Çfarë është Matrixnet? Dhe çfarë lidhje ka qyteti i Snezhinsk me të? Ne do të përpiqemi ta kuptojmë gradualisht.

Pra, në nëntor 2009, Yandex filloi një kërkim të ri. Për të kuptuar kuptimin e kërkimit të ri, ia vlen t'i drejtoheni pak historisë dhe të zbuloni se si ishte e vjetra? Në fund të fundit, unë vetë fillova të studioj SEO në fund të vitit 2009, d.m.th. kur Snezhinsk me Matrixnet ishte zbatuar tashmë. Si u ndërtua kërkimi i dokumenteve përkatëse në motorin e kërkimit Yandex në Snezhinsk?

Mos harroni se një motor kërkimi është thjesht një robot, një makinë e bazuar në logjikën matematikore. Ato. Ju mund të vendosni formula matematikore në program, x=1, y=3, x

Për shembull, x=optimizimi në internet, y=lidhje të jashtme, etj. Secilës variabël të tillë iu caktua një numër i caktuar dhe kishte qindra variabla të tillë. Të gjithë treguesit u "përmbledhën", d.m.th. çdo faqeje iu caktua një numër i caktuar, në përputhje me të cilin u zhvillua renditja, faqet u renditën në një sekuencë të caktuar në rezultatet e kërkimit. Natyrisht, ky është shembulli më primitiv, vetëm për të përcjellë thelbin.

Në çfarë çoi në fund të fundit kjo? Megjithëse sekreti i formulës nuk u zbulua kurrë, të gjithë e dinin që tregues të caktuar të uebsajteve u morën si bazë, dhe natyrisht, kjo çoi në faktin se çdo optimizues me aftësi analitike mund të identifikonte në mënyrë empirike një numër të caktuar parametrash të rëndësishëm që ndikojnë në renditjen, dhe filloni t'i përdorni ato për promovim, d.m.th. ndikojnë artificialisht në rezultatet e kërkimit. Përshtateni faqen tuaj sipas treguesve specifikë.

Dhe meqenëse optimizuesit kanë mësuar të ndikojnë në rezultatet e kërkimit, do të thotë që faqet filluan të shfaqen në vendet e para, të cilat, megjithëse korrespondojnë me pyetjen e kërkimit, por, duke qenë në krye, nuk japin mundësinë për të arritur në krye. për faqe të tjera që mund të jenë gjithashtu interesante dhe të dobishme për njerëzit. Dhe gjëja më e trishtueshme në këtë situatë ishte se kishte shumë faqe tregtare në krye që kishin mundësinë të shpenzonin para për promovim.

Çfarë solli algoritmi i ri i kërkimit Snezhinsk me teknologjinë e tij Matrixnet? Unë u përpoqa të studioja sa më plotësisht informacionin në lidhje me këtë algoritëm të renditjes dhe do të përpiqem t'ju përcjell thelbin e tij.

Baza nuk u mor në ndonjë tregues specifik të faqes, por në vetë faqet, të cilat, sipas mendimit të punonjësve të Yandex, janë burime të dobishme nga pikëpamja njerëzore. Sa objektiv ishte vlerësimi i këtyre vendeve? Ne nuk mund të gjykojmë objektivitetin e qasjes ndaj kësaj. Por le ta marrim vetëm me besim.

Le të heqim një mori vlerësimesh negative nga optimizuesit se Yandex është një organizatë tregtare, se nuk është e interesuar për përdoruesin, por është e interesuar vetëm të fitojë para nga reklamat kontekstuale. Mendimi im personal është se një balerin i keq gjithmonë i pengon diçka :).

Yandex gjithmonë deklaron se detyra e tij kryesore është t'i japë një përgjigje përdoruesit. Le ta marrim këtë si një aksiomë. Dhe ne do të besojmë se faqet janë përzgjedhur për algoritmin e ri bazuar në kritere objektive.

Pra, u përzgjodhën një numër i caktuar pyetjesh specifike dhe një numër i caktuar faqesh që plotësojnë më plotësisht këto pyetje. Dhe njerëz të trajnuar posaçërisht, vlerësues, përputheshin çdo kërkesë me një dokument specifik. Ato. sipas mendimit të tyre objektiv-subjektiv, kërkesa 1 i përgjigjet sitit A, kërkesa 2 vendit B etj.

Çdo çift i tillë "kërkesë=dokument" u analizua nga një makinë (program), e cila gjeti modele midis këtyre dokumenteve (natyrisht, bazuar në të njëjtën logjikë matematikore), dhe bazuar në modelet e identifikuara, nxori një formulë. Ishte sipas kësaj formule që gjithçka filloi të renditet në motorin e kërkimit Yandex. Por, ka një numër paralajmërimesh.

Paralajmërimi i parë është se ka shumë formula të tilla. Mund të supozoj se pothuajse çdo temë dhe fokus kishte formulën e vet. Sepse Është e pamundur të vlerësohen faqet tregtare dhe jokomerciale, faqet argëtuese dhe faqet me punime shkencore bazuar në të njëjtat kritere.

Paralajmërimi i dytë i rëndësishëm është se për të nxjerrë formulën, në çdo rast duhej të futeshin disa variabla në makinë, d.m.th. treguesit e faqes në internet. Baza mbi të cilën makina do të krahasojë faqet me njëra-tjetrën.

Dhe përsëri, si mund t'i krahasoni faqet me njëri-tjetrin? Sigurisht, këtu nuk mund të mos merren parasysh faktorët e brendshëm dhe të jashtëm. Por ata nuk janë më vendimtarë. Në dritën e deklaratave të fundit të Yandex për , cilët tregues të tjerë mund të jenë vendimtarë kur renditen faqet?

Gjithnjë e më shumë flitet për një faktor të tillë renditjeje si faktori i sjelljes.

Dhe është ai, sipas shumë njerëzve, dhe sipas rezervave të përfaqësuesve të Yandex, që është vendimtar në renditje. Dhe, në një farë mase, kjo mund të jetë vërtet e vërtetë.

Pra, çfarë e bën unik algoritmin e ri? Së pari, është faktori njerëzor që përcakton se sa interesant është një faqe se një tjetër. Nga njëra anë, faktori njerëzor është një opinion subjektiv. Por këtu pyetja nuk është më tepër për interesin, por për faktin se dokumenti i jep një përgjigje gjithëpërfshirëse pyetjes së bërë. Dhe pikërisht mbi këtë parim u përzgjodhën dokumentet dhe iu caktuan kërkesave të caktuara.

Dhe rezulton se, nga ana tjetër, ata po përpiqen të mësojnë një makinë të mendojë si një person. E dyta vjen nga e para, punonjësit e Yandex mësojnë makinën të gjejë modele në të menduarit njerëzor. Makina i gjen këto modele (nëse të mira apo të këqija është një pyetje tjetër), dhe bazuar në këto modele ajo ndërton formulën e saj dhe, rrjedhimisht, rezultatet e kërkimit.

Dhe në fakt, teknologjia Matrixnet nuk është asgjë më shumë se mësimi i makinës.

Falë kësaj, rezultatet e kërkimit kanë më shumë gjasa të përfshijnë burime të dobishme në të cilat përdoruesi gjen në të vërtetë përgjigjen e pyetjes së tij. Dhe këtu gjëja e rëndësishme është që për të arritur në krye të Yandex, nuk duhet të jeni një burim i vjetër besimi, nuk keni nevojë të blini një numër të madh lidhjesh.

Ajo që është e rëndësishme është përmbajtja interesante, e dobishme dhe interesi i qartë i përdoruesve të rrjetit për faqen.

Po, por çfarë lidhje ka Snezhinsk me të? Fakti është se është në algoritmin e ri që formula e renditjes për pyetjet rajonale është përmirësuar. Ato. Kudo ku ndodhet përdoruesi dhe pavarësisht pyetjeve që ai shkruan, përparësi do t'u jepet faqeve rajonale, faqeve të atyre organizatave që ndodhen në të njëjtin rajon me përdoruesin.

Në artikujt e mëposhtëm, do të shikoj më në detaje të gjithë faktorët e mundshëm që ndikojnë në renditjen e faqeve, natyrisht, bazuar në deklarata nga burime zyrtare. Dhe, natyrisht, është e pamundur të jepet një përgjigje shteruese për faktorët, sepse gjithçka që mund të ndikojë në renditjen e faqeve është sekret dhe nuk zbulohet nga përfaqësuesit e Yandex. Gjithashtu, do të përpiqem t'i kushtoj më shumë vëmendje faktorit të sjelljes, me cilat kritere përcaktohet sjellja e përdoruesit dhe pse ky është faktori "kryesor". Ndiqni përditësimet e blogut.

Gjithnjë e më shumë njerëz janë të interesuar për profesionin e pavarur, dhe autori i blogut seolabel.ru premton të flasë se si mund të jetë puna në shtëpi. Ndoshta do të gjeni diçka interesante për veten tuaj.