بیست و پنج نکته کلیدی جستجوی کلمات فارسی در موتورهای جستجو وشبکه اینترنت

شاید مقاله یا گفتاری را تنظیم نمود که در مورد چگونگی جستجو کلمات و متون فارسی در شبکه مجاری اینترنت سخن گفته باشد، کمتر تدوین شده است  از سویی موتورهای جستجو با توجه به زیرساختارهای نرم افزاری و  برنامه های غیرسازگار با فارسی با جملات زبان فارسی مشکل جدی دارند و این درحالی است که  اگر موتورجستجو مانند گوگل یا یاهو این مشکل را حل نموده باشد جلوگیری از افشا رموز  باعث می شود که موتورهای جستجو در راهنمای خود تنها به چگونگی جستجو کلمات زبان انگلیسی بسنده کنند و کارشناسان و نخبگان فن آوری اطلاعات کشور به اجبار آن را ترجمه کنند. در حالی که فارسی دارای مشکلات منحصر به خود است خط فارسی دارای مشكلات مختلفی است اما ناامیدنباشید، ما در این گفتار با تکیه برمهندسی معکوس رازهای یک جستجو موفق فارسی در موتورهای جستجو را بیان می کنیم یعنی ابتدا با آزمایش و خطا و از تحلیل نتیجه به این رموز پی بردیم در این گفتار در 25 مورد تذکر و توصیه هایی درمورد جستجو صحیح درموتورهای جستجو را باهم مرور می کنیم  

بیست و پنج نکته کلیدی جستجوی کلمات فارسی در موتورهای جستجو وشبکه اینترنت

روشهای معمول جستجو با موتورهای جستجوگر

جستجوی اطلاعات در اینترنت به دو روش می‌تواند صورت گیرد یكی استفاده از بیست و پنج نکته کلیدی جستجوی کلمات فارسی در موتورهای جستجو وشبکه اینترنت  - وبلاگ فن آوری اطلاعات یزدجملات زبان محاوره‌ای است و دیگری بكارگیری كلمات كلیدی.

استفاده از جملات زبان محاوره‌ای

 در روش استفاده از جملات زبان محاوره‌ای كه اغلب به كاربران تازه‌كار پیشنهاد می‌شود. یكی از عیب‌های بزرگ این روش تعداد نتایج جستجوی زیادی است كه بازگردانده می‌شود. به همین دلیل این روش توسط كاربران حرفه‌ای و حتی توسط همه، كم‌تر استفاده می‌شود.

بكارگیری كلمات كلیدی

یكی از كاراترین و مقتدرترین روش‌های جستجوی اطلاعات در دنیای وب استفاده از واژه‌هایی است كه اصطلاحاً كلمات كلیدی نامیده می‌شوند. اغلب كاربران حرفه‌ای و جستجوگران ورزیده دنیای اینترنت می‌توانند با طرح بهترین كلمات كلیدی و بكار بستن قوانین تركیب آن‌ها با هم برای نیازهای اطلاعاتی خود پاسخی در خور بیابند. در این روش توصیه‌های زیر برای انتخاب كلمات كلیدی و نیز جستجوی دقیق و مفید پیشنهاد می‌شود كه بشرح ذیل است:

توصیه هایی برای جستجو بهتر در موتورهای جستجو

‌١- حتی‌المقدور سعی شود كلمات كلیدی از میان اصطلاحات منحصر به فرد و اسامی خاص انتخاب شود.

‌٢- حتی‌المقدور از آوردن كلمات عمومی كه عناوین بسیاری را در زیر مجموعه خود شامل می‌شوند، جداً خودداری كنید.

‌٣همیشه اسم شخص یا نام شی یا هر چیز دیگری را كه مد نظر دارید به‌طور كامل وارد كنید.

‌٤دقت كنید كه اگر موتور جستجو میان حروف بزرگ و كوچك تفاوتی می‌گذارد، این مسأله را در طرح كلمات كلیدی خود مدنظر داشته باشید.

‌٥در نظر داشته باشید اگر نتیجه جستجو صفر بود به احتمال زیاد می‌تواند از یك اشتباه تایپی باشد.

‌٦اگر املای صحیح و كامل كلمه‌ای را نمی‌دانید از كاركتر جانشین كه اغلب * و یا ؟ است استفاده كنید.

‌٧اگر یك كلمه كلیدی را برای طرح دقیق و تمام و كمال یك مورد جستجو كفایت نمی‌كند، از تكنیك‌های جستجوی عبارتی، استفاده از اپراتورهای جبر بولین (AND, OR, NOT) استفاده كنید. جستجوی عبارتی یكی از مهم‌ترین و قدرتمندترین امكانات جستجو در اغلب موتورهای جستجو می‌باشد و می‌توان یك عبارت یا جمله مشخص را به همان ترتیبی كه كلمات وارد شده‌اند مورد جستجو قرار داد. برای این روش جستجو عبارت مورد نظر را داخل گیومه"" بگذارید.

‌٨ - استفاده از عملگر AND : and به مفهوم "و" برای محدود كردن دامنه جستجو از طریق تركیب كلید واژه‌های مختلف به كار می‌رود و برای تركیب كلیدهای جستجو زمانی ‌كه برای شما مهم است كه دو یا چند كلمه كلیدی حتماً وجود داشته باشد و علامت آن در پایگاه‌های مختلف به صورت استفاده از عبارت and، استفاده از + ، انتخاب عبارت all the word از منو، انتخاب عبارت (match on all words and) به‌وسیله كلیك كردن بر روی دكمه‌های رادیویی است.

‌٩استفاده از عملگر OR: اپراتور OR به مفهوم "یا" و برخلاف عملگر AND باعث گسترش دامنه جستجو و بازیابی اطلاعات بیش‌تر شده برای تركیب كلید واژه‌های جستجو زمانی كه انتظار دارید تنها یك، دو یا چند كلمه كلیدی حضور داشته باشند و علامت آن استفاده از عبارت or، نحوه‌ی اجرای ساده و معمولی آن، انتخاب عبارت any of the words از منو، انتخاب عبارت (match on any words or) با كلیك بر روی دكمه‌های رادیویی می‌باشد. یكی از كاربردهای مهم این عملگر پوشش مفاهیم یا اصطلاحات مترادف، مرتبط یا با املاهای متفاوت است.

‌١٠استفاده از عملگر NOT: اپراتور Not به مفهوم "نه" و یا به جز كه در این صورت تمامی جواب‌های بازگشتی كه حاوی عبارت یا كلمه كلیدی هستند حذف خواهند گردید و برای اجرای آن تنها كافیست كه not را قبل از عبارت یا كلمه كلیدی مورد نظرتان با یك فاصله بیاورید.

‌١١استفاده از كوتاه‌سازی كلید واژه‌ها: این تكنیك به ما امكان می‌دهد كه با وارد كردن بخشی از یك كلید واژه بتوانیم مشتقات مختلف آن را نیز در فرآیند جستجو بازیابی كنیم. اكثر موتورهای جستجو این تكنیك را با استفاده از علامت ستاره (*) ارایه می‌دهند. یكی از مشكلات استفاده از این تكنیك این است كه باعث بازیابی اطلاعات غیرمرتبط و ناخواسته زیادی می‌شود.

‌١٢استفاده از عملگر نزدیك‌یابی: در بسیاری از موارد استفاده از عملگر and باعث بازیابی اطلاعاتی می‌شود كه برای ما مفید نیست. به این دلیل كه این عملگر كلید واژه‌ها را در هر كجای متن كه باشند بازیابی می‌كند. در این موارد استفاده از تكنیك نزدیك‌یابی می‌تواند از ریزش كاذب اطلاعات و یا بازیابی اطلاعات غیرمرتبط جلوگیری نماید. همه موتورهای جستجو قابلیت استفاده از این تكنیك را ندارند ولی به عنوان مثال در موتور جستجوی آلتاویستا می‌توان با استفاده از عملگر NEAR از این تكنیك استفاده نمود.

‌١2+1جستجوی تركیبی با استفاده از پرانتز: این تكنیك یكی از مهم‌ترین تكنیك‌های جستجو می‌باشد كه به وسیله آن می‌توان تا حدود زیادی از بازیابی موارد غیرمرتبط در محیط وب جلوگیری كرد. در این روش می‌توان از همه عملگرهای جستجو كه در بالا گفته شده یك‌جا استفاده كرد و آن‌ها را با هم‌دیگر تركیب نمود.

‌١٤جستجوی كلیدواژه در عنوان صفحات وب: این تكنیك با این پیش فرض كه عنوان یك صفحه وب تا حدود زیادی نمایان‌گر محتوای اطلاعات موجود در آن است به جستجوی واژه‌های كلیدی در عنوان سایت‌ها می‌پردازد. علامت آن در موتورهای جستجو متفاوت است ولی اغلب موتورهای جستجو از طریق فهرست انتخابی و یا گزینه‌های دیگر این امكان را فراهم می‌آورند.

‌١٥جستجوی حوزه سایت‌ها: با توجه به این‌ كه به صورت قراردادی هر كشوری حوزه خاصی در محیط وب دارد، قابلیت جستجوی حوزه سایت‌ها به ما این امكان را می‌دهد كه فرایند جستجو را به حوزه خاصی نظیر سایت‌های وب ایران (ir) و یا سایت‌های وب سازمان‌های غیر انتفاعی (org) محدود كنیم. دستورات استفاده از این تكنیك در موتورهای جستجو مختلف می‌باشد.

‌١٦محدود كردن جستجو به زبان‌های مختلف باعث می‌شود نتایج جستجو به زبان‌های دیگر آورده نشود و انتخاب مطلب مورد نظر آسان‌تر است.

‌١٧محدود كردن جستجو به تاریخ انتشار منابع در وب: تاریخ انتشار یا به اصطلاح روزآمدی مطلب به خصوص در منابع علمی اصل مهمی است و این‌گونه محدودیت باعث می‌شود بنا به نیاز كاربر جدیدترین و یا قدیمی‌ترین منبع بازیابی بشود.

‌١٨جستجوی رسانه‌های مختلف؛ موسیقی، عكس، ویدئو: زمانی‌ كه فقط نوع خاصی از رسانه مورد نیاز است به عنوان مثال زمانی كه به عكس یك شخصیت نیاز داریم، جستجو در میان عكس‌ها باعث می‌شود نتیجه جستجو شامل اطلاعات دیگری در مورد آن شخصیت نباشد.

‌١٩جستجوی صفحات با فرمت‌های مختلف: PDF, Word, MP3, MPEG, ….: زمانی كه فرمت خاصی مورد نظر است می‌توان از این تكنیك استفاده كرد . به عنوان مثال اگر مایل باشیم منبع بازیابی شده در فرمت PDF باشد، این تكنیك می‌تواند مفید باشد.

‌٢٠آگاهی از پیش‌فرض‌های جستجو در موتور جستجو: با توجه به این كه هر موتور جستجو برای تركیب واژه‌ها یك پیش‌فرض دارد و اگر از هیچ گونه عملگری استفاده نشود، كلید واژه‌ها را به صورت پیش‌فرض با یكی از عملگرهای جبر بولی تركیب می‌كند؛ آگاهی از این پیش‌فرض‌ موتورهای جستجوی مختلف مهارت ما را در جستجو بالا می‌برد.

‌٢١وب نامریی: وب نامرئی به دو دلیل كمی و كیفی اهمیت دارد كمی از این نظر كه موتورهای جستجو فقط قادر هستند حدود ‌١٦ درصد از اطلاعات موجود در اینترنت را بازیابی كنند و اندازه وب نامریی تقریبا ‌٥٠٠ برابر وب مریی است و كیفی از این نظر كه منابع اطلاعاتی موجود در وب عمیق معمولا ارزشمند و مفید هستند و در بسیاری از موارد پاسخ‌گوی نیاز كاربران می‌باشند. آشنایی با ابزارهایی كه برای شناسایی منابع وب نامریی به وجود آمده‌اند و كاربران را به سایت‌های مناسب راهنمایی می‌كنند، باعث دسترسی به این بخش عظیم از اطلاعات مفید و ارزشمند می‌شود. مثل سایت Invisibleweb كه فهرستی از منابع نامریی را و سایت Completeplaset كه فهرستی از تقریبا ‌٤٠٠٠٠ پایگاه اطلاعاتی وب نامریی را ارایه می‌دهد.

22 – اما بدنیست که اشتباهات رایج و متدوال در جستجوگرها و موتورهای جستجو را بدانیم تا از آن گریز کنیم

اشتباهات متداول موتورهای جستجو در یافتن کلمات

موتورهای جستجو به عنوان یكی از اساسی‌ترین دروازه‌های ورود به منابع اینترنتی دارای ضعف‌هایی هستند كه می‌توان به این موارد اشاره كرد:

- در یك مجموعه از یافته‌های بازیابی شده مدخل‌های تكراری فراوانی ملاحظه می‌شود.

- نتایج غیر قابل پیش‌بینی هستند.

- نتایج چه بسا گمراه كننده باشند؛ ممكن است جستجویی در یك موتور كاوش نتیجه‌ای نداشته، ولی در موتور دیگر دارای یافته‌های فراوان باشد.

- موتورهای كاوش محتویات پایگاه‌های اطلاعاتی خودشان را نشان نمی‌دهند و از معیارهایی كه برای گنجاندن یك مدرك در فایل‌هایشان دارند حتی شرحی ارایه نمی‌كنند.

- مهار واژگانی وجود ندارد و قواعد نقطه‌گذاری و بزرگ‌نویسی نیز استاندارد نیست.

- بدون بررسی عملی هر عنصر، اغلب نمی‌توان میزان ربط و رابطه‌ها را تحلیل كرد