تكشف المستندات المسربة كيف تحافظ بوابة بحث Google على الإنترنت


بحث جوجل غالبًا ما يُشار إليها باسم “عتبة الباب إلى الإنترنت”، فهي المحطة الأولى في رحلة معظم الأشخاص إلى المعلومات عبر الإنترنت. ومع ذلك، لا يقول جوجل الكثير عن كيفية تنظيم الإنترنت، مما يجعل البحث بمثابة صندوق أسود عملاق يملي علينا ما نعرفه وما لا نعرفه. هذا الأسبوع، تم الإبلاغ عن تسرب مكون من 2500 صفحة، لأول مرة بواسطة خبير تحسين محركات البحث (SEO). راند فيشكين، أعطى العالم نظرة ثاقبة للغموض الذي يكتنف بحث Google منذ 26 عامًا.

وقال فيشكين في بيان أرسل عبر البريد الإلكتروني إلى Gizmodo: “أعتقد أن أهم ما يمكن استنتاجه هو أن ما يقوله ممثلو Google العامون وما يفعله محرك بحث Google هما شيئان مختلفان”.

توفر هذه المستندات عرضًا أكثر تفصيلاً لكيفية تحكم بحث Google في المعلومات التي نستهلكها. إن جلب صفحة الويب الصحيحة إلى جهاز الكمبيوتر الخاص بك ليس بالمهمة السلبية حيث يتم اتخاذ آلاف القرارات التحريرية نيابةً عنك من قبل مجموعة سرية من موظفي Google. بالنسبة إلى تحسين محركات البحث (SEO)، وهي الصناعة التي تعيش وتموت من خلال خوارزميات جوجل، فإن الوثائق المسربة تمثل زلزالًا. يبدو الأمر كما لو أن حكام اتحاد كرة القدم الأميركي أعادوا كتابة قواعد كرة القدم في منتصف الموسم، وأنت تكتشف ذلك أثناء لعب Super Bowl.

أخبر العديد من خبراء تحسين محركات البحث Gizmodo أن التسريب يسرد 14000 ميزة تصنيف والتي، على أقل تقدير، تضع مخططًا لكيفية تنظيم Google لكل شيء على الويب. تتضمن بعض هذه العوامل تحديد Google لسلطة موقع الويب في موضوع معين، أو حجم موقع الويب، أو عدد النقرات التي تتلقاها صفحة الويب. وقد نفت جوجل سابقًا أنها تستخدم بعضًا من ميزات التصنيف هذه في البحث، لكن الشركة أكدت أن هذه المستندات حقيقية، وإن كانت في روايتها غير كاملة.

وقال متحدث باسم جوجل في رسالة بالبريد الإلكتروني إلى Gizmodo: “نود أن نحذر من تقديم افتراضات غير دقيقة حول البحث استنادًا إلى معلومات خارج السياق أو قديمة أو غير كاملة”. “لقد شاركنا معلومات شاملة حول كيفية عمل البحث وأنواع العوامل التي تزنها أنظمتنا، بينما نعمل أيضًا على حماية سلامة نتائجنا من التلاعب.”

وفيما يتعلق بـ “تحذير Google”، لن تؤكد الشركة ما هو صحيح أو غير صحيح بشأن هذه المستندات. وتقول جوجل إنه من غير الصحيح افتراض أن هذه معلومات شاملة حول البحث، وأخبرت Gizmodo أن الكشف عن الكثير من المعلومات قد يؤدي إلى تمكين الجهات الفاعلة السيئة. في النهاية، لا نعرف ما الذي يدخل في تحديد هذه العوامل، أو مدى الأهمية التي يعطيها بحث Google لكل عامل، إن وجد.

قال مايك كينغ، خبير تحسين محركات البحث الذي كان من أوائل الذين قاموا بتحليل التسريب، في مقابلة مع جيزمودو: “نحن ننظر فقط إلى المتغيرات المختلفة التي يدرسونها”. “هذه هي الدقة التي تنظر بها (جوجل) إلى مواقع الويب.”

تم ملاحظة هذا التسرب لأول مرة من قبل عرفان عظيمي، وهو أحد ممارسي تحسين محركات البحث (SEO) الذي وجد وثائق واجهة برمجة التطبيقات (API) علنًا على GitHub. ومن غير الواضح ما إذا كانت هذه الوثائق “مسربة” حقًا أو تم نشرها بطريقة أو بأخرى بواسطة Google في ركن هادئ من الويب، ربما عن طريق الصدفة. وكان عظيمي يهدف إلى نشر هذه الوثائق من خلال إحضارها إلى فيشكين الأسبوع الماضي، الذي طلب من كينغ المساعدة في فهمها.

ويشير كينغ إلى أن إحدى ميزات التصنيف “الصفحة الرئيسيةPagerankNs” تشير إلى أن سمعة الصفحة الرئيسية لموقع الويب يمكن أن تكون سيئة. دعم كل ما ينشر. كتب فيشكين أن التسريب يشير إلى نظام يسمى NavBoost – الذي أشار إليه لأول مرة نائب رئيس قسم البحث في Google، باندو ناياك، في شهادته بوزارة العدل – والذي يُزعم أنه يقيس النقرات لتعزيز التصنيف على بحث Google. يأخذ الكثيرون في صناعة تحسين محركات البحث (SEO) هذه المستندات كتأكيد لما اشتبهت فيه الصناعة منذ فترة طويلة: قد يحصل موقع الويب الذي تعتبره Google مشهورًا على تصنيف بحث أعلى لاستعلام ما على الرغم من أن الموقع الأقل شهرة قد يحتوي على معلومات أفضل.

في الأشهر الأخيرة، قام العديد من الناشرين الصغار بذلك شهدت اختفاء حركة المرور على بحث Google. عندما سأل نيلاي باتيل من The Verge الرئيس التنفيذي لشركة Google ساندر بيتشاي عن هذا الأمر الأسبوع الماضي، قال بيتشاي إنه ولم يكن واضحا “ما إذا كان هذا اتجاها موحدا.يبدو أن إحدى ميزات التصنيف التي ينادي بها King هي تصنيف تلك المواقع الصغيرة بشكل موحد.

وقال كينج: “لديهم ميزة تسمى “smallPersonalSite”، ونحن لا نعرف بالطبع كيف يتم استخدامها، ولكن هذا مؤشر على أن (جوجل) تتطلع إلى فهم ما إذا كانت هذه مواقع أصغر”. “بما أن الكثير من هذه المواقع الصغيرة يتم سحقها في الوقت الحالي، فهذا يظهر أن (جوجل) لا تفعل شيئًا لتعويض إشارات العلامات التجارية الكبيرة هذه.”

ومن الجدير بالذكر أن بيتشاي ذكر لاحقًا في تلك المقابلة مع The Verge أنه في أوقات أخرى، قامت Google بتوجيه المزيد من الزيارات نحو المواقع الصغيرة. يمكن أن تشير ميزات التصنيف هذه إلى الأدوات التي يمكن أن تسحبها Google. مع قيام المزيد والمزيد من المؤسسات الإعلامية الوطنية بترخيص محتواها للظهور على ChatGPT، يبدو أيضًا أن بحث Google يتجه نحو الناشرين الكبار. على نطاق واسع، يمكن أن يكون لهذا تأثير سحق، حيث يضغط ما يسمعه معظم الناس في المؤسسات الإعلامية الرئيسية فقط.

كانت الآثار المترتبة على مستندات Google المسربة محسوسة على نطاق واسع. كريستين روبي، الرئيس التنفيذي لمجموعة Ruby Media Group التي عملت في مجال العلاقات العامة الرقمية وتحسين محركات البحث لأكثر من 15 عامًا، أخبرت Gizmodo أنها حصلت على نص مشؤوم ليلة الإثنين: “سيسقط جوجل غدًا”.

وسرعان ما اكتشفت روبي التسريب ولاحظت اثنتين من ميزات التصنيف التي ظلت عالقة في ذهنها: “isElectionAuthority” و”isCovidLocalAuthority”. يبدو أن هذه الميزات هي طريقة Google لتصنيف مصداقية صفحة الويب لتوفير المعلومات الصحيحة حول الانتخابات وكوفيد-19، على التوالي. في عام 2019، كتبت روبي على نطاق واسع عن كيفية قياس جوجل لصفحات الويب الجديرة بالثقة (والذي يشير إليه Google بـ أكل(ترمز إلى الخبرة والخبرة والسلطة والثقة) هي سياسية بطبيعتها. وتشير إلى أن قياس جوجل لهذه العوامل يميل إلى الانحراف على طول الخطوط السياسية.

“من الصعب بالنسبة لي أن Google لا تقدم أي سياق بشأن العناصر المهمة في البيانات مثل “isElectionAuthority” أو “isCovidLocalAuthority”. كيف تحدد جوجل السلطة في هذه المجالات المهمة؟ وقال روبي في بيان عبر البريد الإلكتروني. “لا ينبغي لي أن أخمن ما هي الإجابة. يجب أن يكون جوجل مستعدًا ويخبرني بالجواب”.

وعلى الرغم من أن جوجل شركة تجارية، ولها الحق في الحصول على معلومات خاصة، فإن روبي يرى أن جوجل ملزمة بالإجابة على الأسئلة المتعلقة بميزات التصنيف هذه التي تشكل العالم من حولنا. لاحظ كينج وفيشكين أيضًا “isCovidLocalAuthority” و”isElectionAuthority” في كتاباتهما عن التسريب، حيث أشار كلاهما إلى أهمية محركات البحث في رفع جودة المعلومات.

وقال كينج: “أعتقد أنه من المهم حقًا أن يقدموا هذا النوع من التمييز للمعلومات، لأنه سواء شئنا أم أبينا، فإن Google هي خدمة عامة فعليًا”. “ربما يعارضونني عندما أقول ذلك، ولكننا نعتبره المصدر الأساسي لكيفية حصولك على المعلومات على الويب.”

تعد كيفية تصنيف Google للمعلومات في هذه الأمثلة نموذجًا مصغرًا لنظام البحث البيئي بأكمله. في أي يوم، هناك ملايين الأسئلة حول ما هي المعلومات التي يجب تضخيمها وما هي المعلومات التي يجب إسكاتها. في حين أن جوجل، والعديد من شركات التكنولوجيا، حاولت منذ فترة طويلة تصوير نفسها على أنها خوارزميات أقل رأيًا، فإن ميزات التصنيف هذه تظهر أن الأمر ليس كذلك تمامًا. هناك العديد من الأمثلة على ميزات التصنيف التي تم الكشف عنها في التسريب المكون من 2500 صفحة.

البحث عن إجابات وسط خوارزمية جوجل

نظرًا لأن Google لن تشرح هذه المستندات بالتفصيل، حيث تخبر Gizmodo أن الكشف عن الكثير من المعلومات قد يؤدي إلى تمكين الجهات الفاعلة السيئة، فإن خبراء تحسين محركات البحث (SEO) يُتركون لفهم هذا الأمر نيابة عن كل من يستخدم بحث Google. العديد من ميزات التصنيف البالغ عددها 14000 والتي تم تحديدها في الأسبوع الماضي هي أشياء ادعت Google صراحةً أنها لم تستخدمها على مر السنين.

في مقطع فيديو من عام 2016، أعلن أحد ممثلي بحث Google: “نحن ليس لديك درجة سلطة موقع الويب.” في مقابلة أجريت عام 2015، قال موظف آخر في Google: “استخدام النقرات مباشرة في الترتيب سيكون خطأ.ومن الصعب الآن فهم هذه التعليقات في ظل الوثائق المسربة ورد جوجل.

وقال فيشكين: “يعد هذا الرد مثالاً رائعًا على سبب عدم إعجاب الأشخاص بشركة Google أو عدم ثقتهم بها”. “إنه بيان لا يعالج التسريب، ولا يقدم أي قيمة، وربما تم كتابته بواسطة الذكاء الاصطناعي الذي تم تدريبه على رسائل الشركات الأكثر بلا روح في العقد الماضي.”

وفي عصر إجابات الذكاء الاصطناعي، تشير روبي إلى أن الطريقة التي يصنف بها جوجل صفحات الويب أصبحت أكثر أهمية من أي وقت مضى. بدلاً من سلسلة من الروابط لوجهات نظر مختلفة، قد تحصل على إجابة واحدة مباشرة بفضل نظرة عامة على الذكاء الاصطناعي الجديد من Google. ومع ذلك، فقد رأينا منشورات Reddit عمرها 10 سنوات تحصل على قدر غريب من السلطة، حيث تطلب من بعض المستخدمين وضع الغراء في البيتزا الخاصة بهم. إن كيفية اختيار جوجل للسلطة تكتسب أهمية متزايدة، حيث أن النتيجة العليا قد تكون هي الوحيدة التي لها صوت الآن.

“نحن نقوم بتبديل التروس. قال روبي: “إننا ننتقل من نظام بحث إلى آخر”. “يؤثر الذكاء الاصطناعي على نتائج البحث بطرق عميقة.”

في النهاية، من الصعب أن نقول ما الذي تفعله Google حقًا بميزات التصنيف هذه. ما هو واضح هو أن جوجل أنشأت هذه المصنفات، ومن المحتمل أن يكون لديها المزيد، لتصنيف مواقع الويب على الإنترنت. من الواضح أن هذه التصنيفات تتطلب قرارات قضائية، مما يضيف المزيد من الأدلة على أن بحث Google ليس تجربة موضوعية، بل سلسلة من الاختيارات التحريرية التي يتخذها الأشخاص داخل Google.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى