محركات البحث العربية
--------------------------------------------------------------------------------
ما هو محرك البحث؟
آليات البحث
أدلة البحث
محركات البحث العربية
ما هو محرك البحث؟
محرك البحث (search engine) هو برنامج يُتيح للمُستخدِمين البحثَ عن كلمات محددة ضمن مصادر الإنترنت المختلفة (مواقع الويب ومواقع FTP و تلنت (Telnet))، ويتألف محرك البحث من ثلاثة أجزاء رئيسة هي:
• برنامج العنكبوت .(spider program)
• برنامج المُفهرِس .(indexer program)
• برنامج محرك البحث.
ومضة: من الجدير بالذكر أن بعض محركات البحث تُستخدَم للبحث ضمن موقعٍ واحد فقط.
شرح وظيفة البرامج المكونة لمحرك البحث:
1. برنامج العنكبوت
تَستخدِم محركاتُ البحث برنامجَ العنكبوت (spider) لإيجاد صفحات جديدة على الويب لإضافتها، ويسمى هذا البرنامج أيضاً الزاحف (crawler) لأنه يُبحر في الإنترنت بهدوء لزيارة صفحات الويب والاطلاع على محتوياتها، ويأخذ هذا البرنامج مؤشرات المواقع من عنوان الصفحة (title)، والكلمات المفتاحية (keywords) التي تحويها، إضافة إلى محتويات محدِّدات الميتا (**** tags) فيها. ولا تقتصر زيارة برنامج العنكبوت على الصفحة الأولى للموقع بل يتابع البرنامج تَعقُّبَ الروابط (links) الموجودة فيها لزيارة صفحات أخرى. أما الغاية من هذه الزيارات فهي وضع النصوص المنتقاة في نظام الفهارس لمحرك البحث، ليتمكن المحرك من العودة إليها فيما بعد، ولم تغب فكرة تغير المحتوى في الموقع عن بال مصممي محرك البحث، إذ ينظم محرك البحث زيارات دورية للمواقع الموجودة في الفهرس للتأكد من التعديلات التي تصيب المواقع المفهرسة.
رجوع
2. برنامج المُفهرس
يُمثل برنامج المُفَهرِس (index program)، الكتالوج (catalogue) أحياناً، قاعدة بيانات (database) ضخمة تُوَصِّف صفحات الويب، وتَعتمد في هذا التوصيف على المعلومات التي حَصَلت عليها من برنامج العنكبوت (spider) كما تعتمد على بعض المعايير مثل الكلمات الأكثر تكراراً من غيرها، وتختلف محركات البحث عن بعضها في هذه المعايير، إضافة إلى اختلافها في خوارزميات المطابقة (ranking algorithms).
رجوع
3. برنامج محرك البحث
يبدأ دور برنامج محرك البحث (search engine program) عند كتابة كلمة مفتاحية (keyword) في مربع البحث
(search box)
؛ إذ يأخذ هذا البرنامج الكلمة المفتاحية ويبحث عن صفحات الويب التي تحقق الاستعلام الذي كونه برنامج المُفهرس في قاعدة بيانات الفهرس (index database)، ثم تُعرَض نتيجة البحث المتمثلة بصفحات الويب التي طلبها المُستخدِم في نافذة المُستعرض .(browser window)
أمثلة على محركات البحث:
يوجد عدد كبير من محركات البحث التي تنتشر على الويب نذكر منها على سبيل المثال لا الحصر
Lycos
AltaVista
Excite
Netscape
وتختلف محركات البحث عن بعضها في أسلوب العمل، فمثلاً: تحتفظ قاعدة بيانات ألتافيستا (AltaVista) بكل تفاصيل صفحة الويب المخزنة، أما غيرها من آليات البحث الأخرى فقد يحتفظ بالعناوين الرئيسة للصفحة فقط، مما يؤدي إلى اختلاف نتائج شكل ودقة نتائج البحث الظاهرة للمُستخدم.
رجوع
آليات البحث
ذكرنا سابقاً أن محركات البحث تستخدم في بحثها عن مواقع الويب ما يدعى الكلمات المفتاحية (keywords) التي يمكن أن تكون كلمة أو عبارة (phrase). وتَستخدِم آلياتُ البحث عادةً بعضَ المعاملات (operators)، مع هذه الكلمات المفتاحية، لتوفير خيارات إضافية لعملية البحث. ونعرض في الجدول التالي كيفية عمل بعض هذه المعاملات، إلى جانب بعض الأمثلة عليها:
طريقة عمله وأمثلة على ذلك
مُعامل البحث
يُستخدَم هذا المُعامل للبحث عن عبارة محددة.
“computer technology”
(تُعرَض عندها مواقع الويب التي تحوي هذه العبارة مع مراعاة ترتيب كلماتها)
" "
تُستخدَم مع مجموعة من الكلمات للبحث عن مواقع تحوي هذه الكلمات (منفردة أو مجتمعة).
Computer + technology
(تُعرَض عندها المواقع والصفحات التي تحتوي كلمة computer وكلمة technology ولكن ليس بالضرورة أن توجد الكلمتان مع بعضهما في الموقع نفسه).
AND أو +
يُستخدَم مع مجموعة من الكلمات للبحث عن كل من هذه الكلمات المفتاحية على حدة.
Computer OR technology
(تُعرَض المواقع التي تحوي كلمة computer بمفردها، والمواقع التي تحتوي كلمة technology بمفردها)
يجب مراعاة ترك مسافة قبل OR وعدم ترك مسافة بعدها.
OR
يُستخدَم رمز النجمة للبحث عن كلمة عُلِمَ أحد مقاطعها، ويسمى البحث باستخدام المحارف البديلة (wildcard search).
مثال: Tech*
تعرض المواقع التي تبدأ كلماتها بالمقطع Tech مثل:(technology, technician, technical, ..)
النجمة *
ويمكن استخدام مجموعة من هذه المعاملات مع بعضها لتشكيل جُمل بحث متقدمة. ويمكن في محركات البحث تحديد مجالات البحث للوصول إلى نتائج أكثر دقة.
أدلة البحث :(Search directories)
يُعَدُّ دليل الويب (Web directory)، أو المُرشد أو الكتالوج (catalogue or guide)، وسيلةً أخرى للبحث عن المعلومات في شبكة الويب العالمية. وخلافاً لمحركات البحث، يحوي دليل الويب، وهو موقع على الويب، روابطَ مُنظمة ومُرتبة (تنظم عادة حسب مواضيع عامة وأخرى فرعية) تُؤدي إلى مصادر المعلومات. وتُنشِئ هذه الأدلة من قِبل بعض الجهات أو المؤسسات، ثُمَّ يجري تحديد مصادر المعلومات التي ستشير الروابط إليها، وتُجمع، وتُراجع، وتُنظم، وتُصنف لتوضع في النهاية في أدلة الويب.
رجوع
محركات البحث العربية
ظهر مؤخراً بعض محركات البحث التي تدعم البحث باللغة العربية، ويكمن السبب في قلة هذه المحركات وتأخر ظهورها إلى التقنيات المعقدة التي يحتاجها البحث باللغة العربية. إذ تختلف طبيعة اللغة العربية عن الإنجليزية، فاللغة العربية لغة صَرفية (morphological)، بينما الإنجليزية لغة لصقية (affixational). ومن هنا كان لا بد للشركات التي تطرح محركات بحث عربية قوية أن تمتلك التقنيات اللازمة لمعالجة اللغة العربية آلياً.
وقد ظهر أثر ذلك في محركات البحث الموجودة التي انقسمت إلى مجموعتين:
• المجموعة الأولى:
قلَّدت هذه المجموعة محركات البحث الإنجليزية ولذلك فقد جاءت نتائجها ضعيفة لاعتمادها في البحث على المطابقة الحرفية
(string matching)
لكلمات البحث، مما يتسبب في حجب الكثير من المعلومات التي تتوافق مع الكلمات المراد البحث عنها (التي قد تختلف بأحرف زائدة بسيطة).
• المجموعة الثانية:
اعتمدت هذه المجموعة من محركات البحث على تقنيات متقدمة لمعالجة اللغة العربية، ومن أبرز الأمثلة عليها: أراب فيستا (Arabvista) و الإدريسي؛ الذي أصدرته شركة صخر لبرامج الحاسب الآلي.
تتميز المجموعة الثانية بإمكانات إضافية مثل: البحث باللواصق، والبحث بالمشتقات. وقد استفاد محرك الإدريسي من التقنيات المتقدمة التي ابتكرتها شركة صخر في معالجة اللغة العربية، فتميز عن غيره بعدة أمور مثل:
1. البحث بالمترادفات: تُستخدم للبحث عن نصوص عربية متشابهة المعنى كما هو مبين في المثال.
مثال: البحث عن كلمة "مساعدة" سيعطي من بين نتائج البحث كل الصفحات التي تحوي كلمات عربية مثل: (مساعدة، معونة، مؤازرة، .. الخ).
2. البحث بالمعاني والترجمة: تُستخدم للبحث عن نصوص إنجليزية عن طريق كلمة عربية يجهل المستخدم معناها.
مثال: البحث عن كلمة "مساعدة" سيعطي من بين النتائج كل الصفحات التي تحوي كلمات إنجليزية مثل: (help, assistance, aid).
3. إمكانية التعامل مع التشكيل بشكل جيد.
ومن الجدير بالذكر أن معظم محركات البحث العربية تقوم بعد معالجة الكلمة أو العبارة المراد البحث عنها بترجمتها إلى اللغة الإنجليزية، ليجري البحث عنها بعدة لغات في مواقع الويب المُفهرسة لديه.
• خاصة عنوان الصفحة (title)، وأول خمس وعشرين كلمة من النص الوارد، إضافة إلى محتويات مُحدِّدات الميتا (**** tags)
تُشتق الكلمات في اللغة العربية من جذورها، ولذلك فمن الممكن أن توجد الكلمة الواحدة في عشرات الأشكال، وذلك بالتصاقها بأحرف زائدة (حروف جر، حروف عطف، ضمائر متصلة،...) في البداية والوسط والنهاية.
مثال: (وبمدرستهم، ومدرستهم، لمدرستهم، مدرستنا، مدارسكم، ...)، وتعود جميع هذه الكلمات بعد تجريدها من الزوائد إلى كلمة (مدرسة) والتي تعود إلى الجذر (درس)
الثلاثاء مارس 12, 2019 11:00 am من طرف مراد
» مواد بناء وتشطيب من مصانع الصين لبيتك 008615011961687
الإثنين أغسطس 22, 2016 2:27 pm من طرف دليل الصين
» مواد بناء وتشطيب من مصانع الصين لبيتك 008615011961687
الإثنين أغسطس 22, 2016 2:26 pm من طرف دليل الصين
» أنواع الصحف الحائطية
السبت ديسمبر 12, 2015 9:47 pm من طرف على فتحى
» كيفية عمل صحيفة الحائط
السبت ديسمبر 12, 2015 9:44 pm من طرف على فتحى
» أنواع الصحف المدرسية
السبت ديسمبر 12, 2015 9:41 pm من طرف على فتحى
» كيفية إعداد صحيفة حائط متميزة
السبت ديسمبر 12, 2015 9:29 pm من طرف على فتحى
» نموذج اختبار كادر المعلم ( اعلام تربوى )
السبت ديسمبر 12, 2015 9:21 pm من طرف على فتحى
» الإعلام التربوي
السبت ديسمبر 12, 2015 9:18 pm من طرف على فتحى