starfish

κατάταξη αποτελεσμάτων στις μηχανές αναζήτησης



Μια πολύ συνηθισμένη απορία αφορά τον τρόπο με τον οποίο κατατάσσονται τα αποτελέσματα στις μηχανές αναζήτησης. Εάν και θεωρητικά υπάρχουν πολλές μηχανές με διαφορετικούς τρόπους αναζήτησης αυτό που ισχύει είναι ότι αυτήν την στιγμή το συντριπτικό ποσοστό των αναζητήσεων γίνεται στις τρεις μεγάλες μηχανές  οι οποίες είναι οι Google, Yahooκαι MSN. Οι περισσότερες από τις υπόλοιπες που θα συναντήσετε χρησιμοποιούν κάποια από τις παραπάνω και δεν είναι ανεξάρτητες. Εμείς θα ασχοληθούμε κυρίως με το Googleκαθώς είναι στατιστικά η δημοφιλέστερη.

 

Η κατανομή των αποτελεσμάτων στο Google

 

Όταν κάνετε μια αναζήτηση έχετε παρατηρήσει ότι τα αποτελέσματα της μπορεί να φτάσουν σε αρκετά εκατομμύρια σελίδες. Η ταξινόμηση τους είναι μια  περίπλοκη διαδικασία που στόχο έχει να εμφανίσει ψηλότερα τα αποτελέσματα που είναι όσο το δυνατόν πιο σχετικά με αυτό που ψάξατε και όσο το δυνατόν από πιο «έμπιστες» σελίδες.

 

Στόχος κάθε σελίδας είναι να δέχεται επισκέψεις. Για να επιτύχετε την μέγιστη επισκεψιμότητα πρέπει να καταφέρετε να εμφανίζεστε όσο πιο ψηλά γίνεται στα αποτελέσματα (στατιστικά η περισσότεροι χρήστες ποτέ δεν κοιτούν πέρα των πρώτων 3-4 σελίδων αποτελεσμάτων). Φυσικά αυτό μπορεί να επιτευχθεί για συγκεκριμένες αναζητήσεις που αφορούν το θέμα σας και όχι γενικά.  Βασικό όμως προαπαιτούμενο για να επιτύχετε να εμφανίζεστε ψηλά στα αποτελέσματα είναι να καταλάβετε τον τρόπο με τον οποίο γίνεται αυτή η κατάταξη.

 

Σε γενικές γραμμές η κατάταξη των αποτελεσμάτων γίνεται με βάση τα παρακάτω:

 

  1. Το πόσες φορές και σε ποια σημεία βρίσκονται οι λέξεις κλειδιά στο κείμενο της σελίδας.
  2. Εάν βρίσκονται στα metatagsτης σελίδας.
  3. Εάν η σελίδα περιέχει κείμενο / περιεχόμενο και όχι μόνο Links ή σκόρπια keywords.
  4. Από το πόσες άλλες σελίδες έχουν Linkπρος την συγκεκριμένη σελίδα.
  5. Από την ποιότητα των σελίδων που έχουν linkπρος την συγκεκριμένη σελίδα.

 

Τα παραπάνω μας δείχνουν ότι για να εμφανιστούν τα αποτελέσματα η μηχανή αναζήτησης πραγματοποιεί δύο ξεχωριστές εργασίες. Η πρώτη γίνεται από τα λεγόμενα spidersή robotsτα οποία ανιχνεύουν το διαδίκτυο προσπαθώντας να κατηγοριοποιήσουν τις σελίδες ανάλογα με το περιεχόμενο τους. Η δεύτερη εργασία αφορά την κατηγοριοποίηση των σελίδων σε σχέση με την ποιότητα τους στον βαθμό που αυτή μπορεί να «υπολογιστεί» από έναν αλγόριθμό.

 

Σχετικότητα αποτελεσμάτων (keyword relativity)

 

Για να το κάνουμε πιο κατανοητό ας δούμε ένα παράδειγμα.


Έστω ότι ψάχνετε τις λέξεις "Search Engine Optimization". Τα spiders των μηχανών έχουν ήδη εντοπίσει στο δίκτυο προτού κάνετε εσείς την  αναζήτηση και γνωρίζουν σε ποιες σελίδες βρίσκονται οι παραπάνω λέξεις. Επίσης έχουν καταχωρήσει τις σελίδες ανάλογα με το πόσο συχνά βρίσκονται τα παραπάνω Keywords στο περιεχόμενο και σε ποιες θέσεις. Όπως αναφέρει και το Googleσε ένα σχετικό άρθρο ο τρόπος που προσπαθεί να καταλάβει κατά πόσο μια σελίδα έχει όντως σχέση με το search engine optimization που είναι το παράδειγμα μας αποτελείτε από τα εξής.

  • Βρίσκεται ολόκληρη η φράση SearchEngineOptimizationμέσα στο περιεχόμενο ή απλά οι τρεις λέξεις αυτές σε διαφορετικά σημεία;
  • Βρίσκεται η παραπάνω φράση στον τίτλο της σελίδας ή όχι;
  • Πόσες φορές βρίσκεται η παραπάνω φράση στο περιεχόμενο;
  • Είναι η παραπάνω φράση γραμμένη πιο έντονα από το υπόλοιπο κείμενο;

 

Page Rank

Όσον αφορά την αξιολόγηση των σελίδων που αποτελεί το άλλο μεγάλο κομμάτι της εργασίας κάθε μηχανή διαθέτει τον δικό της αλγόριθμο με τον οποίο την επιτυγχάνει. Η αξιολόγηση της σελίδας γίνεται όχι με βάση συγκεκριμένα keywordsαλλά σε σχέση με την αξία αυτής της σελίδας στο παγκόσμιο ιστό σε σχέση με όλες τις υπόλοιπες σελίδες που υπάρχουν. Αυτό είναι μια καινοτομία που εισήγαγε το Googleκαι βασίζεται στο paperπου δημοσίευσαν οι δημιουργοί του όταν ήταν στο πανεπιστήμιο και το ονόμασαν PAGERANK. Αργότερα και οι υπόλοιπες μηχανές εισήγαγαν παρόμοιους αλγόριθμους. Με λίγα λόγια το PageRankείναι μια βαθμολογία που απονέμεται στην σελίδα και εκφράζει την αξία της όπως αυτή υπολογίζεται από την μηχανή αναζήτησης. Με το πάρα πολύ σημαντικό θέμα του PageRankθα ασχοληθούμε στο επόμενο άρθρο.

 

Τέλος όσον αφόρα το Googleη εργασία δεν σταματάει εδώ. Έστω ότι για την αναζήτηση της φράσης searchEngineOptimizationβρέθηκαν κάποια αποτελέσματα. Αυτά έχουν κατηγοριοποιηθεί κατά περιεχόμενο δηλαδή μπορούμε να υποθέσουμε για παράδειγμα ότι έχουν χωριστεί σε σχετικά, λίγο σχετικά και πιθανόν σχετικά (προφανώς είναι λίγο πιο περίπλοκο από αυτό). Έπειτα αυτές οι σελίδες ταξινομούνται και με βάση την βαθμολογία τους.

 

Η Googleσε μια προσπάθεια να κάνει την ταξινόμηση ακόμα πιο ακριβής υπολογίζει την αξία των συγκεκριμένων σελίδων (PR) αλλά λαμβάνει υπόψη και κατά πόσον άλλες σελίδες με το ίδιο περιεχόμενο (keywords) έχουν Linkπρος αυτήν. Για παράδειγμα ας υποθέσουμε δύο σελίδες οι οποίες για τον όρο searchengineoptimizationφαίνονται να παρουσιάζουν την ίδια σχετικότητα. Η μία όμως έχει ένα pagerankτης τάξης του 8 και ή άλλη του 6. Ας πούμε ότι η πρώτη αποτελεί μια ιστοσελίδα μεγάλης κίνησης και αξίας όπως παράδειγμα το pathfinder.grενώ η δεύτερη είναι μεν μια πάρα πολύ καλή σελίδα (PR 6) αλλά υστερεί σε σχέση με την προηγούμενη. Ας υποθέσουμε ότι η δεύτερη λοιπόν είναι μια σελίδα η οποία είναι αφιερωμένη στο θέμα του seoόπως το seoingreekενώ η πρώτη έχει ένα ή περισσότερα άρθρα για το θέμα. Προφανώς η δεύτερη επιλογή πρέπει να εμφανιστεί πιο πάνω από την πρώτη. Για να ξεπεράσει το πρόβλημα αυτό το Googleκοιτάει τα linkπου δείχνουν προς αυτές τις σελίδες από τον παγκόσμιο ιστό και συγκεκριμένα κοιτάει πιο είναι το περιεχόμενο τους. Για το Pathfinderλοιπόν προφανώς θα βρει περισσότερα link (για αυτό και το μεγαλύτερο PR) αλλά με διάφορα θέματα. Η πλειοψηφία όμως των Linkπου θα δείχνουν προς το seoingreekείναι πιθανόν να έχουν ως θέμα το Seo. Εάν ισχύει αυτό είναι πιθανόν η σελίδα με το χαμηλότερο PRνα εμφανιστεί ψηλότερα στα αποτελέσματα.

 
Γενικά η ακριβής λειτουργία όλων των παραπάνω δεν είναι γνωστή. Γνωρίζουμε ότι μπορούμε να καταλάβουμε πειραματικά και ότι μας ανακοινώνουν οι εταιρίες πίσω από τις μηχανές αναζήτησης. Η ακριβής λειτουργία τους είναι επτασφράγιστο μυστικό καθώς αποτελεί τον βασικό τομέα του ανταγωνισμού μεταξύ τους.