بیست و پنج نکته کلیدی جستجوی کلمات فارسی در موتورهای جستجو وشبکه اینترنت
بیست و پنج نکته کلیدی جستجوی کلمات فارسی در موتورهای جستجو وشبکه اینترنت
شاید مقاله یا گفتاری را تنظیم نمود که در مورد چگونگی جستجو کلمات و متون فارسی در شبکه مجاری اینترنت سخن گفته باشد، کمتر تدوین شده است از سویی موتورهای جستجو با توجه به زیرساختارهای نرم افزاری و برنامه های غیرسازگار با فارسی با جملات زبان فارسی مشکل جدی دارند و این درحالی است که اگر موتورجستجو مانند گوگل یا یاهو این مشکل را حل نموده باشد جلوگیری از افشا رموز باعث می شود که موتورهای جستجو در راهنمای خود تنها به چگونگی جستجو کلمات زبان انگلیسی بسنده کنند و کارشناسان و نخبگان فن آوری اطلاعات کشور به اجبار آن را ترجمه کنند. در حالی که فارسی دارای مشکلات منحصر به خود است خط فارسی دارای مشكلات مختلفی است اما ناامیدنباشید، ما در این گفتار با تکیه برمهندسی معکوس رازهای یک جستجو موفق فارسی در موتورهای جستجو را بیان می کنیم یعنی ابتدا با آزمایش و خطا و از تحلیل نتیجه به این رموز پی بردیم در این گفتار در 25 مورد تذکر و توصیه هایی درمورد جستجو صحیح درموتورهای جستجو را باهم مرور می کنیم
بیست و پنج نکته کلیدی جستجوی کلمات فارسی در موتورهای جستجو وشبکه اینترنت
روشهای معمول جستجو با موتورهای جستجوگر
جستجوی اطلاعات در اینترنت به دو روش میتواند صورت گیرد یكی استفاده از
جملات زبان محاورهای است و دیگری بكارگیری كلمات كلیدی.
استفاده از جملات زبان محاورهای
در روش استفاده از جملات زبان محاورهای كه اغلب به كاربران تازهكار پیشنهاد میشود. یكی از عیبهای بزرگ این روش تعداد نتایج جستجوی زیادی است كه بازگردانده میشود. به همین دلیل این روش توسط كاربران حرفهای و حتی توسط همه، كمتر استفاده میشود.
بكارگیری كلمات كلیدی
یكی از كاراترین و مقتدرترین روشهای جستجوی اطلاعات در دنیای وب استفاده از واژههایی است كه اصطلاحاً كلمات كلیدی نامیده میشوند. اغلب كاربران حرفهای و جستجوگران ورزیده دنیای اینترنت میتوانند با طرح بهترین كلمات كلیدی و بكار بستن قوانین تركیب آنها با هم برای نیازهای اطلاعاتی خود پاسخی در خور بیابند. در این روش توصیههای زیر برای انتخاب كلمات كلیدی و نیز جستجوی دقیق و مفید پیشنهاد میشود كه بشرح ذیل است:
توصیه هایی برای جستجو بهتر در موتورهای جستجو
١- حتیالمقدور سعی شود كلمات كلیدی از میان اصطلاحات منحصر به فرد و اسامی خاص انتخاب شود.
٢- حتیالمقدور از آوردن كلمات عمومی كه عناوین بسیاری را در زیر مجموعه خود شامل میشوند، جداً خودداری كنید.
٣ – همیشه اسم شخص یا نام شی یا هر چیز دیگری را كه مد نظر دارید بهطور كامل وارد كنید.
٤ – دقت كنید كه اگر موتور جستجو میان حروف بزرگ و كوچك تفاوتی میگذارد، این مسأله را در طرح كلمات كلیدی خود مدنظر داشته باشید.
٥ – در نظر داشته باشید اگر نتیجه جستجو صفر بود به احتمال زیاد میتواند از یك اشتباه تایپی باشد.
٦ – اگر املای صحیح و كامل كلمهای را نمیدانید از كاركتر جانشین كه اغلب * و یا ؟ است استفاده كنید.
٧ – اگر یك كلمه كلیدی را برای طرح دقیق و تمام و كمال یك مورد جستجو كفایت نمیكند، از تكنیكهای جستجوی عبارتی، استفاده از اپراتورهای جبر بولین (AND, OR, NOT) استفاده كنید. جستجوی عبارتی یكی از مهمترین و قدرتمندترین امكانات جستجو در اغلب موتورهای جستجو میباشد و میتوان یك عبارت یا جمله مشخص را به همان ترتیبی كه كلمات وارد شدهاند مورد جستجو قرار داد. برای این روش جستجو عبارت مورد نظر را داخل گیومه"" بگذارید.
٨ - استفاده از عملگر AND : and به مفهوم "و" برای محدود كردن دامنه جستجو از طریق تركیب كلید واژههای مختلف به كار میرود و برای تركیب كلیدهای جستجو زمانی كه برای شما مهم است كه دو یا چند كلمه كلیدی حتماً وجود داشته باشد و علامت آن در پایگاههای مختلف به صورت استفاده از عبارت and، استفاده از + ، انتخاب عبارت all the word از منو، انتخاب عبارت (match on all words and) بهوسیله كلیك كردن بر روی دكمههای رادیویی است.
٩– استفاده از عملگر OR: اپراتور OR به مفهوم "یا" و برخلاف عملگر AND باعث گسترش دامنه جستجو و بازیابی اطلاعات بیشتر شده برای تركیب كلید واژههای جستجو زمانی كه انتظار دارید تنها یك، دو یا چند كلمه كلیدی حضور داشته باشند و علامت آن استفاده از عبارت or، نحوهی اجرای ساده و معمولی آن، انتخاب عبارت any of the words از منو، انتخاب عبارت (match on any words or) با كلیك بر روی دكمههای رادیویی میباشد. یكی از كاربردهای مهم این عملگر پوشش مفاهیم یا اصطلاحات مترادف، مرتبط یا با املاهای متفاوت است.
١٠ – استفاده از عملگر NOT: اپراتور Not به مفهوم "نه" و یا به جز كه در این صورت تمامی جوابهای بازگشتی كه حاوی عبارت یا كلمه كلیدی هستند حذف خواهند گردید و برای اجرای آن تنها كافیست كه not را قبل از عبارت یا كلمه كلیدی مورد نظرتان با یك فاصله بیاورید.
١١ – استفاده از كوتاهسازی كلید واژهها: این تكنیك به ما امكان میدهد كه با وارد كردن بخشی از یك كلید واژه بتوانیم مشتقات مختلف آن را نیز در فرآیند جستجو بازیابی كنیم. اكثر موتورهای جستجو این تكنیك را با استفاده از علامت ستاره (*) ارایه میدهند. یكی از مشكلات استفاده از این تكنیك این است كه باعث بازیابی اطلاعات غیرمرتبط و ناخواسته زیادی میشود.
١٢ – استفاده از عملگر نزدیكیابی: در بسیاری از موارد استفاده از عملگر and باعث بازیابی اطلاعاتی میشود كه برای ما مفید نیست. به این دلیل كه این عملگر كلید واژهها را در هر كجای متن كه باشند بازیابی میكند. در این موارد استفاده از تكنیك نزدیكیابی میتواند از ریزش كاذب اطلاعات و یا بازیابی اطلاعات غیرمرتبط جلوگیری نماید. همه موتورهای جستجو قابلیت استفاده از این تكنیك را ندارند ولی به عنوان مثال در موتور جستجوی آلتاویستا میتوان با استفاده از عملگر NEAR از این تكنیك استفاده نمود.
١2+1 – جستجوی تركیبی با استفاده از پرانتز: این تكنیك یكی از مهمترین تكنیكهای جستجو میباشد كه به وسیله آن میتوان تا حدود زیادی از بازیابی موارد غیرمرتبط در محیط وب جلوگیری كرد. در این روش میتوان از همه عملگرهای جستجو كه در بالا گفته شده یكجا استفاده كرد و آنها را با همدیگر تركیب نمود.
١٤ – جستجوی كلیدواژه در عنوان صفحات وب: این تكنیك با این پیش فرض كه عنوان یك صفحه وب تا حدود زیادی نمایانگر محتوای اطلاعات موجود در آن است به جستجوی واژههای كلیدی در عنوان سایتها میپردازد. علامت آن در موتورهای جستجو متفاوت است ولی اغلب موتورهای جستجو از طریق فهرست انتخابی و یا گزینههای دیگر این امكان را فراهم میآورند.
١٥ – جستجوی حوزه سایتها: با توجه به این كه به صورت قراردادی هر كشوری حوزه خاصی در محیط وب دارد، قابلیت جستجوی حوزه سایتها به ما این امكان را میدهد كه فرایند جستجو را به حوزه خاصی نظیر سایتهای وب ایران (ir) و یا سایتهای وب سازمانهای غیر انتفاعی (org) محدود كنیم. دستورات استفاده از این تكنیك در موتورهای جستجو مختلف میباشد.
١٦ – محدود كردن جستجو به زبانهای مختلف باعث میشود نتایج جستجو به زبانهای دیگر آورده نشود و انتخاب مطلب مورد نظر آسانتر است.
١٧ – محدود كردن جستجو به تاریخ انتشار منابع در وب: تاریخ انتشار یا به اصطلاح روزآمدی مطلب به خصوص در منابع علمی اصل مهمی است و اینگونه محدودیت باعث میشود بنا به نیاز كاربر جدیدترین و یا قدیمیترین منبع بازیابی بشود.
١٨ – جستجوی رسانههای مختلف؛ موسیقی، عكس، ویدئو: زمانی كه فقط نوع خاصی از رسانه مورد نیاز است به عنوان مثال زمانی كه به عكس یك شخصیت نیاز داریم، جستجو در میان عكسها باعث میشود نتیجه جستجو شامل اطلاعات دیگری در مورد آن شخصیت نباشد.
١٩ – جستجوی صفحات با فرمتهای مختلف: PDF, Word, MP3, MPEG, ….: زمانی كه فرمت خاصی مورد نظر است میتوان از این تكنیك استفاده كرد . به عنوان مثال اگر مایل باشیم منبع بازیابی شده در فرمت PDF باشد، این تكنیك میتواند مفید باشد.
٢٠ – آگاهی از پیشفرضهای جستجو در موتور جستجو: با توجه به این كه هر موتور جستجو برای تركیب واژهها یك پیشفرض دارد و اگر از هیچ گونه عملگری استفاده نشود، كلید واژهها را به صورت پیشفرض با یكی از عملگرهای جبر بولی تركیب میكند؛ آگاهی از این پیشفرض موتورهای جستجوی مختلف مهارت ما را در جستجو بالا میبرد.
٢١ – وب نامریی: وب نامرئی به دو دلیل كمی و كیفی اهمیت دارد كمی از این نظر كه موتورهای جستجو فقط قادر هستند حدود ١٦ درصد از اطلاعات موجود در اینترنت را بازیابی كنند و اندازه وب نامریی تقریبا ٥٠٠ برابر وب مریی است و كیفی از این نظر كه منابع اطلاعاتی موجود در وب عمیق معمولا ارزشمند و مفید هستند و در بسیاری از موارد پاسخگوی نیاز كاربران میباشند. آشنایی با ابزارهایی كه برای شناسایی منابع وب نامریی به وجود آمدهاند و كاربران را به سایتهای مناسب راهنمایی میكنند، باعث دسترسی به این بخش عظیم از اطلاعات مفید و ارزشمند میشود. مثل سایت Invisibleweb كه فهرستی از منابع نامریی را و سایت Completeplaset كه فهرستی از تقریبا ٤٠٠٠٠ پایگاه اطلاعاتی وب نامریی را ارایه میدهد.
22 – اما بدنیست که اشتباهات رایج و متدوال در جستجوگرها و موتورهای جستجو را بدانیم تا از آن گریز کنیم
اشتباهات متداول موتورهای جستجو در یافتن کلمات
موتورهای جستجو به عنوان یكی از اساسیترین دروازههای ورود به منابع اینترنتی دارای ضعفهایی هستند كه میتوان به این موارد اشاره كرد:
- در یك مجموعه از یافتههای بازیابی شده مدخلهای تكراری فراوانی ملاحظه میشود.
- نتایج غیر قابل پیشبینی هستند.
- نتایج چه بسا گمراه كننده باشند؛ ممكن است جستجویی در یك موتور كاوش نتیجهای نداشته، ولی در موتور دیگر دارای یافتههای فراوان باشد.
- موتورهای كاوش محتویات پایگاههای اطلاعاتی خودشان را نشان نمیدهند و از معیارهایی كه برای گنجاندن یك مدرك در فایلهایشان دارند حتی شرحی ارایه نمیكنند.
- مهار واژگانی وجود ندارد و قواعد نقطهگذاری و بزرگنویسی نیز استاندارد نیست.
- بدون بررسی عملی هر عنصر، اغلب نمیتوان میزان ربط و رابطهها را تحلیل كرد

مدیر وبلاگ :