CiteSeer X

از ویکیپدیا، دانشنامه آزاد
پرش به ناوبری پرش به جستجو


CiteSeer x
نوع سایت
پایگاه کتابشناختی
مالککالج علوم و فناوری اطلاعات دانشگاه ایالتی پنسیلوانیا
URLciteseerx .ist .psu .edu این را در ویکی داده ویرایش کنید
ثبتاختیاری
راه اندازی شد2008 ; 13 سال پیش / 1997 ; 24 سال پیش ( 2008 ) ( 1997 )
وضعیت فعلیفعال
مجوز محتوا
مجوز Creative Commons BY-NC-SA [1]

CiteSeer x (با نام اصلی CiteSeer ) یک موتور جستجوی عمومی و کتابخانه دیجیتالی برای مقالات علمی و دانشگاهی، عمدتاً در زمینه‌های علوم کامپیوتر و اطلاعات است . CiteSeer به عنوان سلف ابزارهای جستجوی دانشگاهی مانند Google Scholar و Microsoft Academic Search در نظر گرفته می شود . [ نیاز به نقل قول ] موتورها و آرشیوهای مشابه CiteSeer معمولا فقط اسناد را از وب سایت های در دسترس عموم جمع آوری می کنند و وب سایت های ناشر را نمی خزند. به همین دلیل، نویسندگانی که اسناد آنها آزادانه در دسترس است، بیشتر در فهرست نمایش داده می شوند.

هدف CiteSeer بهبود انتشار و دسترسی به ادبیات دانشگاهی و علمی است. به عنوان یک سرویس غیرانتفاعی که می تواند آزادانه توسط هر کسی استفاده شود، به عنوان بخشی از جنبش دسترسی آزاد در نظر گرفته شده است که تلاش می کند انتشارات دانشگاهی و علمی را تغییر دهد تا امکان دسترسی بیشتر به ادبیات علمی را فراهم کند. CiteSeer به صورت رایگان فراداده های Open Archives Initiative تمام اسناد نمایه شده را ارائه می دهد و اسناد نمایه شده را در صورت امکان به منابع دیگر ابرداده مانند DBLP و پورتال ACM پیوند می دهد . برای ترویج داده های باز ، CiteSeer x داده های خود را برای مقاصد غیرتجاری تحت مجوز Creative Commons به اشتراک می گذارد.[1]

CiteSeer نام خود را به ResearchIndex تغییر داد و سپس دوباره آن را تغییر داد. [ نیازمند منبع ]

تاریخچه [ ویرایش ]

CiteSeer و CiteSeer.IST [ ویرایش ]

CiteSeer توسط محققین لی گیلز ، کرت بولاکر و استیو لارنس در سال 1997 زمانی که آنها در موسسه تحقیقاتی NEC (اکنون آزمایشگاه‌های NECپرینستون، نیوجرسی ، ایالات متحده بودند، ایجاد شد. هدف CiteSeer خزیدن و جمع‌آوری فعال اسناد دانشگاهی و علمی در وب و استفاده از نمایه‌سازی استنادی مستقل برای اجازه دادن به استناد یا سند و رتبه‌بندی آنها بر اساس تأثیر استناد بود . زمانی به آن ResearchIndex می گفتند.

CiteSeer در سال 1998 عمومی شد و بسیاری از ویژگی های جدید در موتورهای جستجوی دانشگاهی در آن زمان در دسترس نبود. اینها عبارت بودند از:

  • نمایه سازی استنادی مستقل به طور خودکار یک نمایه استنادی ایجاد می کند که می تواند برای جستجو و ارزیابی ادبیات استفاده شود.
  • آمار استنادها و اسناد مرتبط برای همه مقالات ذکر شده در پایگاه داده محاسبه شد، نه فقط مقالات نمایه شده.
  • پیوند مرجع که امکان مرور پایگاه داده با استفاده از پیوندهای استنادی را فراهم می کند.
  • زمینه استناد، زمینه استنادها را به یک مقاله مشخص نشان می‌دهد، و به محقق اجازه می‌دهد تا به سرعت و به راحتی ببیند که سایر محققان در مورد مقاله مورد علاقه چه می‌گویند.
  • اسناد مرتبط با استفاده از معیارهای استنادی و مبتنی بر کلمه نشان داده شد و یک کتابشناسی فعال و به روز شده مداوم برای هر سند نشان داده شده است.

ویکیپدیا یک ایالات متحده اعطا شد ثبت اختراع # 6289342، با عنوان " نمایه سازی استنادی خودمختار و ادبیات در حال مشاهده با استفاده از زمینه استناد "، در 11 سپتامبر، 2001. ثبت اختراع در 20 مه 1998 ثبت شده است و اولویت دارد تا ژانویه 5، 1998. در ادامه مبحث حق اختراع (اختراع ایالات متحده با شماره 6738780) در 16 می 2001 ثبت شد و در 18 می 2004 اعطا شد.

پس از NEC، در سال 2004 به عنوان CiteSeer.IST در وب جهانی در کالج علوم و فناوری اطلاعات، دانشگاه ایالتی پنسیلوانیا میزبانی شد و بیش از 700000 سند داشت. برای دسترسی، عملکرد و تحقیق پیشرفته، نسخه‌های مشابه CiteSeer در دانشگاه‌هایی مانند موسسه فناوری ماساچوست ، دانشگاه زوریخ و دانشگاه ملی سنگاپور پشتیبانی می‌شوند . با این حال، نگهداری این نسخه‌های CiteSeer دشوار بود و دیگر در دسترس نیستند. از آنجایی که CiteSeer فقط مقالات آزادانه موجود در وب را نمایه می کند و به ابرداده های ناشر دسترسی ندارد، تعداد استنادات کمتری را نسبت به سایت هایی مانند Google Scholar برمی گرداند.، که دارای فراداده ناشر هستند.

CiteSeer از سال 2005 به دلیل محدودیت در طراحی معماری آن به طور جامع به روز نشده بود. نمونه‌گیری نماینده‌ای از اسناد تحقیقاتی در علوم رایانه و اطلاعات داشت، اما از نظر پوشش محدود بود، زیرا محدود به مقالاتی بود که در دسترس عموم هستند، معمولاً در صفحه اصلی نویسنده، یا مقالاتی که توسط نویسنده ارسال می‌شد. برای غلبه بر برخی از این محدودیت ها، یک معماری ماژولار و منبع باز برای CiteSeer طراحی شد – CiteSeer x .

CiteSeer x [ ویرایش ]

CiteSeer x جایگزین CiteSeer شد و تمام درخواست‌ها به CiteSeer هدایت شدند. CiteSeer x [2] یک موتور جستجوی عمومی و کتابخانه دیجیتال و مخزن مقالات علمی و دانشگاهی است که عمدتاً بر روی علوم کامپیوتر و اطلاعات تمرکز دارد . [2] با این حال، اخیراً CiteSeer x به سایر حوزه‌های علمی مانند اقتصاد، فیزیک و دیگران گسترش یافته است. این کتاب که در سال 2008 منتشر شد، بر اساس موتور جستجوی قبلی و کتابخانه دیجیتالی CiteSeer بود و با یک منبع باز جدید ساخته شده است.زیرساخت، SeerSuite، و الگوریتم های جدید و پیاده سازی آنها. این توسط محققین دکتر ایزاک کانسل و دکتر سی لی گیلز در کالج علوم و فناوری اطلاعات ، دانشگاه ایالتی پنسیلوانیا توسعه یافته است.. به حمایت از اهداف مشخص شده توسط CiteSeer برای خزیدن و جمع‌آوری فعال اسناد دانشگاهی و علمی در وب عمومی و استفاده از جستجوی استناد با استناد و رتبه‌بندی اسناد بر اساس تأثیر استنادها ادامه می‌دهد. در حال حاضر، لی گیلز، پراسنجیت میترا، سوزان گوچ، مین ین کان، پرادیپ ترگودا، خوان پابلو فرناندز رامیرز، پوکتادا تریراتپیتوک، ژیان وو، داگلاس جردن، استیو کارمن، جک کارول، جیم جانسن، و شویی ژنگ فعال هستند یا بوده اند. در توسعه آن دخیل است. اخیرا قابلیت جستجوی جدول ارائه شده است. [3] این توسط بنیاد ملی علوم ، ناسا ، و تحقیقات مایکروسافت تامین شده است .

CiteSeer x همچنان به عنوان یکی از برترین مخازن جهان رتبه بندی می شود و در جولای 2010 رتبه 1 را کسب کرد. [4] در حال حاضر بیش از 6 میلیون سند با نزدیک به 6 میلیون نویسنده منحصر به فرد و 120 میلیون استناد دارد.

CiteSeer x همچنین نرم‌افزار، داده‌ها، پایگاه‌های داده و ابرداده‌های خود را با سایر محققان به اشتراک می‌گذارد که در حال حاضر توسط Amazon S3 و rsync انجام می‌شود . [5] معماری و نرم‌افزار متن‌باز مدولار جدید آن (قبلاً در SourceForge موجود بود اما اکنون در GitHub موجود بود ) بر روی Apache Solr و سایر ابزارهای Apache و منبع باز ساخته شده است که به آن اجازه می‌دهد بستر آزمایشی برای الگوریتم‌های جدید در برداشت، رتبه‌بندی، فهرست‌سازی اسناد باشد. و استخراج اطلاعات

CiteSeer x برخی از فایل های PDF را که اسکن کرده است در حافظه پنهان نگه می دارد. به این ترتیب، هر صفحه شامل یک پیوند DMCA است که می تواند برای گزارش نقض حق نسخه برداری استفاده شود. [6]

ویژگی های فعلی [ ویرایش ]

استخراج خودکار اطلاعات [ ویرایش ]

CiteSeer x از ابزارهای استخراج خودکار اطلاعات ، که معمولاً بر اساس روش‌های یادگیری ماشینی مانند ParsCit ساخته می‌شوند، برای استخراج ابرداده‌های مستند علمی مانند عنوان، نویسنده، چکیده، نقل‌قول و غیره استفاده می‌کند. به این ترتیب، گاهی اوقات خطاهایی در نویسندگان و عنوان‌ها وجود دارد. سایر موتورهای جستجوی دانشگاهی نیز خطاهای مشابهی دارند.

خزیدن متمرکز [ ویرایش ]

CiteSeer x اسناد علمی در دسترس عموم را عمدتاً از صفحات وب نویسنده و سایر منابع باز می‌خزد و به ابرداده‌های ناشر دسترسی ندارد. از این رو تعداد استنادها در CiteSeer x معمولاً کمتر از تعداد استنادهای موجود در Google Scholar و Microsoft Academic Search هستند که به فراداده ناشر دسترسی دارند.

استفاده [ ویرایش ]

CiteSeer x نزدیک به 1 میلیون کاربر در سراسر جهان بر اساس آدرس های IP منحصر به فرد دارد و روزانه میلیون ها بازدید دارد. دانلود سالانه اسناد PDF نزدیک به 200 میلیون در سال 2015 بود.

داده ها [ ویرایش ]

داده‌های CiteSeer x به طور منظم تحت مجوز Creative Commons BY-NC-SA با محققان در سراسر جهان به اشتراک گذاشته می‌شوند و در بسیاری از آزمایش‌ها و مسابقات مورد استفاده قرار گرفته‌اند.

به لطف نقطه پایانی OAI-PMH ، [7] CiteSeerX یک بایگانی باز است و محتوای آن مانند یک مخزن سازمانی در موتورهای جستجوی دانشگاهی نمایه می شود ، به عنوان مثال مصرف کنندگان BASE و Unpaywall .

سایر موتورهای جستجوی مبتنی بر SeerSuite [ ویرایش ]

مدل CiteSeer برای پوشش اسناد دانشگاهی در تجارت با SmealSearch و در تجارت الکترونیک با eBizSearch گسترش یافته بود . با این حال، این موارد توسط حامیان مالی آنها حفظ نشد. یک بار نسخه قدیمی هر دوی اینها را می‌توان در BizSeer.IST یافت اما دیگر در خدمت نیست.

دیگر سیستم‌های جستجو و مخزن Seer مانند برای شیمی، Chem X Seer و برای باستان‌شناسی، ArchSeer ساخته شده‌اند. دیگری برای جستجوی فایل robots.txt ساخته شده بود، BotSeer . همه اینها بر روی ابزار منبع باز SeerSuite ساخته شده اند که از نمایه ساز منبع باز Lucene استفاده می کند .

همچنین ببینید [ ویرایش ]

منابع [ ویرایش ]

  1. ^ a b "خط مشی داده CiteSeerX" . بایگانی شده از نسخه اصلی در 05/01/2012 . بازیابی 2015-11-10 .
  2. ^ a b "درباره CiteSeerX" . بازیابی شده در 2010-05-07 .
  3. «تیم CiteSeerX» . دانشگاه ایالتی پنسیلوانیا بایگانی شده از نسخه اصلی در 2018-07-26 . بازیابی شده در 2018-05-01 .
  4. «رتبه‌بندی وب مخازن جهانی: ۸۰۰ مخزن برتر» . آزمایشگاه سایبرمتریک جولای 2010. بایگانی شده از نسخه اصلی در 2010-07-24 . بازیابی شده در 2010-07-24 .
  5. «درباره داده‌های CiteSeerX» . دانشگاه ایالتی پنسیلوانیا بایگانی شده از نسخه اصلی در 05/01/2012 . بازیابی شده در 2012-01-25 .
  6. ^ برای مثال، "CiteSeerx – DMCA Notice". CiteSeerX 10.1.1.604.4916 . سند با شناسه "10.1.1.604.4916" به دلیل اخطار حذف DMCA حذف شده است. اگر فکر می‌کنید حذف اشتباه انجام شده است، لطفاً از طریق صفحه بازخورد به همراه شناسه ذکر شده در این صفحه با ما تماس بگیرید.  استناد به مجله نیاز دارد |journal=( کمک )
  7. هرست، نویسنده تونی (08-12-2011). "استفاده از OAI-PMH به عنوان یک رابط پرس و جو در سطح رکورد برای Citeseer" . بازیابی شده در 2020-04-25 .

ادامه مطلب [ ویرایش ]

پیوندهای خارجی [ ویرایش ]