ی ݘ  ی ی   ی ی ی Ԑ ی       ی   یی ی                                                            ی ی ی ݘ  یی.                                          Ԙ   ی ی ݘ栠

   

 

نکاتی که بايد برای استفاده از اينترنت در انجام تحقيقات مورد توجه قرار داد

ی ݘ ی ی ی یی

   
   

www.Fekreno.org

 

 

 

 

 

اينترنت يک رسانه شخصی است نه يک کتابخانه که کتب و نشريات موجود در آن توسط متخصصين ارزيابی و انتخاب شده باشد. در واقع، می توان همه گونه اطلاعات را روی اينترنت يافت: از دقيق ترين و مستندترين گرفته تا مطالب واهی و غيرقابل استناد. بنابراين، برای استفاده از منابع موجود روی اينترنت در امور تحقيقاتی، همه چيز بايد ابتدا مورد ارزيابی قرار گيرد و از صحت و اعتبار آن اطمينان حاصل گردد.

 

هنگامی که در مورد يک موضوع روی اينترنت تحقيق می کنيد، حتما" به تعداد زيادی سايت مراجعه کنيد و به هيچ وجه به مطالب يافت شده در يک سايت يا يک نوع سايت اکتفا ننماييد.

 

سه منبع اصلی برای يافتن مطالب مورد علاقه روی اينترنت عبارتند از ليست موضوعات، موتورهای جستجو و ديپ وب. البته بايد توجه داشت که هريک از سه منبع فوق برای يک نوع جستجو مناسب است و شما بايد ابتدا تفاوت هريک از آنها و موارد کاربرد آنها را بخوبی بدانيد.

 

ليست موضوعات

براي جستجوهاي عمومي و درصورت تمايل به مشاهده سايتهايی توصيه شده توسط اهل فن، می توان از ليستهای موضوعات استفاده کرد.

 

تعريف: ليست موضوعات سرويسی است که مجموعه ای از لينکها به منابع موجود روی وب در زمينه مورد علاقه کاربر را در اختيار وی می گذارد. اين ليستها توسط طراحان سايتها يا ارزشيابها بر اساس موضوع سازماندهی و طبقه بندی شده اند. برای پذيرش يک لينک به ليست موضوعات، معيارها و شرايط خاصی وجود دارد اما اين معيارها و شرايط برای ليست های موضوعات مختلف، متفاوت است. بيشتر ليستها دارای قابليت جستجو هستند.

 

هنگام استفاده از ليستهای موضوعی به خاطر داشته باشيد که:

 

   دو نوع ليست موضوعات وجود دارد: ليستهای دانشگاهی و تخصصی که غالبا" توسط متخصصين موضوعات مربوطه و به منظور پاسخگويی به نيازهای محققين ايجاد و اداره می شوند، و ليستهايی که بصورت تجاری عمل می کنند، مخاطبينشان عموم مردم  و هدفشان جذب هرچه بيشتر مراجعين می باشد.  بنابراين دقت کنيد که از ليست موضوعی مناسب با نيازتان استفاده کنيد.

 

    ضوابط پذيرش سايتها در ليستهای موضوعی مختلف بسيار متفاوت است. بنابراين بهتر است قبل از استفاده از يک ليست موضوعات، ابتدا سياستهای آن و معيارهای پذيرش سايتها در آن ليست را مورد توجه قرار دهيد. مشکلی که در اين زمينه وجود دارد اين است که همه ليستهای موضوعات، تمام سياستها و نام و تخصص تأييد کنندگان سايتهای خود را اعلام نمی کنند. اين مسئله بخصوص در مورد ليستهای موضوعات تجاری صادق است.

 

    بسياری از مردم از ليستهای موضوعات استفاده کافی نمی کنند و مستقيما" به سراغ موتورهای جستجو می روند. توجه داشته باشيد که ليستهای موضوعات دانشگاهی دربرگيرنده مجموعه های بدقت انتخاب شده ای از سايتهای با کيفيت بالا هستند. اگر به دنبال سايتهای پرکيفيت می گرديد، ليستهای موضوعات را فراموش نکنيد. INFOMINE از دانشگاه کاليفرنيا مثال خوبی برای ليستهای موضوعات دانشگاهی و Yahoo! مثال خوبی برای ليستهای موضوعات تجاری است.  توجه داشته باشيد که هيچگاه از ياهو يا ليستهای موضوعات تجاری مشابه در تحقيقات جدی و مهم استفاده نکنيد. فهرست کاملتری از هر دو نوع ليستهای موضوعات را می توانيد اينجا بيابيد.

 

موتور جستجو

برای جستجوهای هدفمند، پيچيده و در بعضی موارد جستجوهای کلی از موتورهای جستجو استفاده می شود.

 

تعريف: يک موتور جستجو پايگاه اطلاعاتی قابل جستجويی از فايلهايی است که توسط يک برنامه کامپيوتری (که سرگردان، خزنده، روبات، کرم يا عنکبوت خوانده می شود) ايجاد شده است. کليدسازی  بر اساس اطلاعات جمع آوری شده در مورد فايلها صورت می گيرد مانند عنوان، متن کامل، اندازه، URL و غيره. هيچگونه معيار ويا ضابطه خاصی برای پذيرش سايتها در موتورهای جستجو وجود ندارد هرچند که  طريق ترتيب نمايش نتايج می تواند نشاندهنده نوعی ارزيابی سايتها باشد.

موتور جستجو که شايد بهتر باشد بگوييم سرويس موتور جستجو يا سرويس جستجو شامل سه بخش است:

 

    عنکبوت: برنامه ای که بر روی شبکه وب از يک لينک به لينک ديگر رفته و صفحات را شناسايی کرده و می خواند.

 

     ايندکس: پايگاه اطلاعاتی شامل يک کپی از تمام صفحات وبی است که توسط عنکبوت خوانده شده است.

 

     مکانيزم موتور جستجو: مکانيزمی است که به کاربران امکان جستجو در ايندکس را می دهد و معمولا" نتايج را بر اساس ميزان تطابق با موضوع مورد علاقه کاربر مرتب کرده، نمايش می دهد.

HotBot مثال خوبی برای موتورهای جستجو می باشد. در آخر، ليست کاملتری از موتورهای جستجو آمده است.

 

ديپ وب

براي جستجوهاي هدفمند، و زمانی که شما بدنبال اطلاعات غيرمتنی هستيد از ديپ وب استفاده کنيد.

اخيرا" در رسانه ها اصطلاح ديپ و ب يا وب نامرئی زياد مشاهده می شود. امروزه وب به يک مجموعه  پيچيده تبديل شده است که دربرگيرنده حيطه وسيعی از انواع مختلف و متنوع اطلاعات است. اين اطلاعات بسيار بيشتر از آنچه که در صفحات ثابت وب قابل رؤيتند هستند. بعضی از مردم به دلايلی که در زير با آن آشنا می شويد، به اشتباه به اين بخش از وب وب نامرئی می گويند.

وقتی به ديپ وب اشاره می شود، منظور موارد زير است:

 

  محتويات پايگاههای اطلاعاتی قابل دسترسی بر روی وب پايگاههای اطلاعاتی دربردارنده اطلاعاتی هستند که در جداولی که با برنامه هايی مانند اکسس، اوراکل، اس کيو ال سرور و دی بی تو ساخته شده اند ذخيره گرديده اند. اطلاعات ذخيره شده در اين پايگاههای اطلاعاتی تنها از طريق جستجوی اين پايگاهها قابل استحصال هستند و بنابراين، اين اطلاعات با صفحات وب معمولی که بصورت اسنادی با امکان دسترسی مستقيم هستند، متفاوتند. اين پايگاههای اطلاعاتی معمولا" يک موضوع مشخص ويا جنبه خاصی از يک موضوع مشخص را دربر می گيرند. عنکبوتهای موتورهای جستجو از ايندکس کردن اينگونه اطلاعات عاجزند.حجم قابل توجهی از اطلاعات با  ارزش روی وب توسط اين پايگاههای اطلاعاتی ارائه می شوند. درواقع، تخمين زده می شود که حجم اطلاعات موجود در اين پايگاهها، پانصد برابر اطلاعات موجود در صفحات وب معمولی باشد.

 

    فايل های غير متنی  مانند فايل های چند رسانه ای، فايلهای گرافيکی، نرم افزار و اسنادی با فرمتهای غير استاندارد مانند اسناد با فرمت pdf. بسياری از سرويس دهندگان جستجو برای يافتن اينگونه فايلها گزينه های جستجوی مجزايی ارائه می کنند. آلتاويستا، اگزايت، هات بات و ليکاس تنها چند نمونه از سرويس دهندگان جستجويی هستند که برای جستجوی فايلهای چندرسانه ای و تصاوير و ... مکانيزمهای جستجوی مجزايی درنظر گرفته اند در حالی که گوگل، در قسمت جستجوی عمومی، فايلهای از نوع PDF را نيز مورد جستجو قرار می دهد.

 

صحبت در مورد پايگاههای اطلاعاتی روی وب قدمتی چند ساله دارد و پيش از رواج اصطلاحاتی مانند وب نامرئی يا ديپ وب، گاهی اوقات از آن با عناوينی چون پايگاههای اطلاعاتی تخصصی، پايگاههای اطلاعاتی با موضوع مشخص، کتابخانه های مجازی و ساير عناوين مشابه نام برده می شد. با توسعه تکنولوژی وب و با افزايش حجم اطلاعات انباشته شده در اين پايگاههای اطلاعاتی روی وب، اهميت اين پايگاهها، بعنوان ابزارهای کسب اطلاعات بصورت روزافزون افزايش می يابد.

 

چرا از اصطلاح وب نامرئی استفاده می شود؟ علت در اين امر نهفته است که محتويات پايگاههای اطلاعاتی معمولا" در نتايج جستجوی موتورهای جستجو نشان داده نمی شوند زيرا عنکبوتهای موترهای جستجو نمی توانند وارد جداول اطلاعاتی اين پايگاهها شوند. بنابراين، محتويات اين پايگاهها برای آنها نامرئی است.اما به دلايل زير، اصطلاح وب نامرئی انتخاب مناسبی نيست:

 

1.      در اين اصطلاح،  تنها از ديد موتورهای جستجو به پايگاههای اطلاعات نگريسته شده و اينگونه فرض شده که تنها راه کسب اطلاعات روی وب، استفاده از موتورهای جستجو می باشد. در حالی که در عمل چنين نيست.

 

2.      هيچ اطلاعات ثبت شده ای نامرئی نيست. ممکن است که دستيابی به برخی اطلاعات مشکل تر از اطلاعات ديگر باشد، اما اين به معنای نامرئی بودن آن اطلاعات نيست.

 

3.      سالهاست که از پايگاههای اطلاعاتی استفاده می شود. بسياری از ما با مجموعه CD-ROM های موجود در کتابخانه ها يا پايگاههای اطلاعاتی تحت وب آشنا هستيم و از کاتالوگ های کتابخانه ها روی وب استفاده می کنيم. هيچگاه کسی اين بخش از اطلاعات کتابخانه ها را کتابخانه نامرئی نناميده است. اينها فقط پايگاههای اطلاعاتی هستند که برای استفاده از اطلاعاتشان کاربر می بايست در آنها بگردد.  درست مانند يک کتابخانه، وب هم دربرگيرنده انواع مختلف اطلاعات است که بصورت های متفاوت ذخيره شده و قابل دستيابی است.

 

يک کمپانی با نام  BrightPlanetاصطلاح "deep Web" را برای پايگاههای اطلاعاتی قابل جستجو روی وب ابداع نموده است که بسيار بهتر است زيرا اطلاعات موجود در پايگاههای اطلاعاتی روی وب با استفاده از ابزار و تکنولوژی مناسب جستجو قابل دستيابی و "مرئی" خواهند بود. هچنين بر اين اساس، صفحات وب معمولی با عنوان "surface Web" يا "وب سطحی" خوانده می شوند.


هنگام کار با ديپ وب، به اين نکات توجه داشته باشيد:

    يک دايرکتوری خوب، دارای لينکهايی به سايتهای دارای پايگاه اطلاعات می باشد.

 

    وب سايتهايی وجود دارند که به طور تخصصی به  گرد آوری آدرس پايگاههای اطلاعاتی قابل دسترسی روی وب می پردازند. يکی از اين سايتها اينويزيبل وب می باشد که لينکهايی به بيش از ده هزار پايگاه اطلاعاتی روی وب دارد. اسامی ساير سايتهای مشابه نيز در آخر آمده است. تنوع موضوعی لينکهای موجود در سايت اينويزيبل وب بسيار زياد است که اين خود به نوعی مشکل ساز است زيرا تفکيک سايتهارا مشکل می سازد. علاوه براين، چون سايتهای موجود روی وب هم از نظر کمی و هم از نظر کيفی مرتبا" درحال رشد،  تغيير و دگرگونی هستند، سايتهايی که در زيرگروه های مشخص طبقه بندی شده اند، دائما" تغيير می کنند.

 

   اطلاعاتی که به طور پيوسته در حال تغييرند مانند اخبار، فرصتهای شغلی، پروازهای خطوط هوايی و امثال آن، از طريق ديپ وب قابل جستجو هستند.

 

    دايرکتوريها (ليستها) بخشی از ديپ وب را تشکيل می دهند. مثلا" می توانيد راهنمای تلفن، راهنمای يافتن افراد روی وب، راهنمای نام ونشانی متخصصين نظير پزشکان و وکلا، راهنمای حقوق مؤلفين، ديکشنريها و فرهنگنامه ها، اطلاعات مربوط به شرکتها و بسياری موضوعات ديگر را در ديپ وب بيابيد.

 

    هرچند ياهو! يکی از محبوبترين سايتهای وب و يکی از بزرگترين ليستهای موضوعی تجاری روی وب است، اما به دلايل زير، يک منبع قابل اعتماد يا ابزاری مناسب برای امور پژوهشی نيست و به هيچ وجه نبايد برای اين منظور به کار رود: 

 

    ياهو!  هرگونه سايتی را که در آن ثبت کنند، به مراجعين ارائه می نمايد.

 

    کارکنان سايت ياهو! پيش از اضافه نمودن نام يک سايت به ليست خود، مطالب موجود در آن را به دقت مورد بررسی قرار نمی دهند بنابراين، آدرس سايتهای علمی و دانشگاهی بدون هيچگونه تفکيکی در بين سايتها ديگر به مراجعين ارائه می شود.

 

    ياهو تنها صفحه اول هر سايت را ايندکس می کند. بنابراين، چنانچه اطلاعات مورد علاقه ما روی صفحات ديگر سايت باشند، آنها را در نتيجه جستجو نشان نمی دهد.

 

   اديتورهای ياهو! وقت کافی برای مرور همه سايتهای ثبت شده در آن را ندارند بنابراين، بسياری از سايتها يا به ليستهای ياهو اصافه نمی شوند ويا اينکه معمولا" اين عمل با چندين ماه تأخير صورت می گيرد.

 

هنگام استفاده از يک موتور جستجو روی وب، دانستن اصول منطقی جستجوی بولين می تواند بسيار مفيد باشد. اين منطق جستجو به سه شيوه مختلف در موتورهای جستجوی روی وب مشاهده می شود. برای کسب اطلاعات بيشتر، به  جستجوی بولين روی وب مراجعه کنيد.

****

: "  نکاتی که بايد برای استفاده از اينترنت در انجام تحقيقات مورد توجه قرار داد "- :   http://www.amirazodi.net/persian/students/Internet_for_research.htm        

 

 

 

 

 

 

                       

 

 

 

 

 

 

               
  ی   ݘ  Ӂ   ی  .      

 

 

 

         ݘ

 

 

 

ی-ی -یی-ی-ی -یی-ی-ی -یی-ی-ی -یی-ی-ی -یی-ی-ی -یی-ی-ی -یی

 

Ґ ی  

 

 

 

 

 

 

ی ݘ-ی ی ی یی

wwww.fekreno.org

 ی-ی -یی