سايتسير X

من ويكيبيديا، الموسوعة الحرة
اذهب إلى الملاحة اذهب للبحث


سايتسير x
نوع الموقع
قاعدة بيانات ببليوغرافية
صاحبكلية علوم وتكنولوجيا المعلومات بجامعة ولاية بنسلفانيا
URLciteseerx .ist .psu .edu قم بتحرير هذا في ويكي بيانات
تسجيلاختياري
انطلقت2008 ؛ قبل 13 عاما / 1997 . قبل 24 عاما ( 2008 ) ( 1997 )
الحالة الحاليةنشيط
ترخيص المحتوى
ترخيص Creative Commons BY-NC-SA [1]

CiteSeer س (وتسمى في الأصل CiteSeer ) هو العام محرك البحث و المكتبة الرقمية للأوراق العلمية والأكاديمية، وخاصة في مجالات الكمبيوتر و المعلومات العلمية . يعتبر CiteSeer سلفًا لأدوات البحث الأكاديمي مثل Google Scholar و Microsoft Academic Search . [ بحاجة لمصدر ] محركات وأرشيفات تشبه CiteSeer عادةً ما تحصد المستندات فقط من مواقع الويب المتاحة للجمهور ولا تزحف إلى مواقع الناشرين. لهذا السبب ، من المرجح أن يتم تمثيل المؤلفين الذين تتوفر وثائقهم مجانًا في الفهرس.

هدف CiteSeer هو تحسين النشر والوصول إلى المؤلفات الأكاديمية والعلمية. كخدمة غير ربحية يمكن لأي شخص استخدامها بحرية ، فقد تم اعتبارها جزءًا من حركة الوصول المفتوح التي تحاول تغيير النشر الأكاديمي والعلمي للسماح بوصول أكبر إلى المؤلفات العلمية. قدمت CiteSeer بحرية مبادرة الأرشيف المفتوح الفوقية لجميع الوثائق المفهرسة وصلات فهرستها الوثائق عندما يكون ذلك ممكنا إلى مصادر أخرى للالفوقية مثل DBLP و البوابة ACM . لتعزيز البيانات المفتوحة ، تشارك CiteSeer x بياناتها لأغراض غير تجارية بموجب ترخيص المشاع الإبداعي.[1]

قام CiteSeer بتغيير اسمه إلى ResearchIndex في وقت ما ثم قام بتغييره مرة أخرى. [ بحاجة لمصدر ]

التاريخ

CiteSeer و CiteSeer.IST

تم إنشاء CiteSeer بواسطة الباحثين Lee Giles و Kurt Bollacker و Steve Lawrence في عام 1997 أثناء وجودهم في معهد أبحاث NEC (الآن مختبرات NEC ) ، برينستون ، نيو جيرسي ، الولايات المتحدة الأمريكية. كان هدف CiteSeer هو الزحف بنشاط إلى الوثائق الأكاديمية والعلمية وحصادها على الويب واستخدام فهرسة الاقتباس المستقلة للسماح بالاستعلام عن طريق الاقتباس أو المستند ، وترتيبها حسب تأثير الاقتباس . في وقت ما ، كان يسمى ResearchIndex.

أصبح CiteSeer عام 1998 ولديه العديد من الميزات الجديدة غير المتوفرة في محركات البحث الأكاديمية في ذلك الوقت. وشملت هذه:

  • تقوم فهرسة الاقتباس الذاتي تلقائيًا بإنشاء فهرس اقتباس يمكن استخدامه للبحث في الأدبيات وتقييمها.
  • تم حساب إحصائيات الاقتباس والوثائق ذات الصلة لجميع المقالات المذكورة في قاعدة البيانات ، وليس فقط المقالات المفهرسة.
  • ربط مرجعي يسمح بتصفح قاعدة البيانات باستخدام روابط الاقتباس.
  • أظهر سياق الاقتباس سياق الاقتباسات من ورقة معينة ، مما يسمح للباحث أن يرى بسرعة وسهولة ما يقوله الباحثون الآخرون حول مقال مهم.
  • تم عرض الوثائق ذات الصلة باستخدام الاقتباس والقياسات القائمة على الكلمات ويتم عرض ببليوغرافيا نشطة ومحدثة باستمرار لكل وثيقة.

تم منح CiteSeer براءة اختراع أمريكية # 6289342 ، بعنوان " فهرسة الاستشهاد الذاتي وتصفح الأدبيات باستخدام سياق الاقتباس " ، في 11 سبتمبر 2001. تم إيداع براءة الاختراع في 20 مايو 1998 ، ولها الأولوية في 5 يناير 1998. استمرار تم إيداع براءة الاختراع (براءة الاختراع الأمريكية رقم 6738780) في 16 مايو 2001 ، ومنحت في 18 مايو 2004.

بعد NEC ، تم استضافتها في عام 2004 باسم CiteSeer.IST على شبكة الويب العالمية في كلية علوم وتكنولوجيا المعلومات ، جامعة ولاية بنسلفانيا ، وكان لديها أكثر من 700000 وثيقة. لتعزيز الوصول والأداء والبحوث، تم دعم الإصدارات المماثلة من CiteSeer في الجامعات مثل معهد ماساتشوستس للتكنولوجيا ، جامعة زيوريخ و جامعة سنغافورة الوطنية . ومع ذلك ، ثبت أن هذه الإصدارات من CiteSeer صعبة الصيانة ولم تعد متوفرة. نظرًا لأن CiteSeer لا يقوم إلا بفهرسة الأوراق المتاحة مجانًا على الويب وليس لديه إمكانية الوصول إلى البيانات الوصفية للناشر ، فإنه يعرض عددًا أقل من الاقتباسات من المواقع ، مثل الباحث العلمي من Google، التي تحتوي على بيانات وصفية للناشر.

لم يتم تحديث CiteSeer بشكل شامل منذ عام 2005 بسبب القيود في تصميمه الهندسي. كان يحتوي على عينة تمثيلية من وثائق البحث في علوم الكمبيوتر والمعلومات ، ولكنه كان محدودًا في التغطية لأنه كان مقصورًا على الأوراق المتاحة للجمهور ، عادةً على الصفحة الرئيسية للمؤلف ، أو تلك التي قدمها المؤلف. للتغلب على بعض هذه القيود ، تم تصميم بنية معيارية ومفتوحة المصدر لـ CiteSeer - CiteSeer x .

CiteSeer x

حل CiteSeer x محل CiteSeer وتم إعادة توجيه جميع الاستفسارات إلى CiteSeer. CiteSeer س [2] هو العام محرك البحث و المكتبة الرقمية و مستودع للأوراق العلمية والأكاديمية في المقام الأول مع التركيز على الكمبيوتر و المعلومات العلمية . [2] ومع ذلك ، توسعت CiteSeer x مؤخرًا في مجالات علمية أخرى مثل الاقتصاد والفيزياء وغيرها. تم إصداره في عام 2008 ، وكان يعتمد بشكل فضفاض على محرك بحث CiteSeer السابق والمكتبة الرقمية وتم بناؤه بمصدر مفتوح جديدالبنية التحتية ، SeerSuite ، والخوارزميات الجديدة وتطبيقاتها. تم تطويره من قبل الباحثين الدكتور إسحاق كونسيل والدكتور سي لي جايلز في كلية علوم وتكنولوجيا المعلومات ، جامعة ولاية بنسلفانيا. وتواصل دعم الأهداف التي حددتها CiteSeer لتتبع ارتباطات وحصاد الوثائق الأكاديمية والعلمية على شبكة الإنترنت العامة واستخدام استعلام الاقتباس من خلال الاستشهادات وترتيب الوثائق حسب تأثير الاستشهادات. حاليًا ، لي جايلز ، وبراسينجيت ميترا ، وسوزان غوش ، ومين-ين كان ، وبراديب تيريجودا ، وخوان بابلو فرنانديز راميريز ، وبكتادا تريراتبيتوك ، وجيان وو ، ودوغلاس جوردان ، وستيف كارمان ، وجاك كارول ، وجيم يانسن ، وشويى زينج ، كانوا أو كانوا نشطين تشارك في تطويرها. في الآونة الأخيرة ، تم تقديم ميزة البحث في الجدول. [3] وقد تم تمويله من قبل National Science Foundation و NASA و Microsoft Research .

لا يزال CiteSeer x يُصنف كواحد من أفضل مستودعات التخزين في العالم وقد تم تصنيفه رقم 1 في يوليو 2010. [4] لديه حاليًا أكثر من 6 ملايين مستند مع ما يقرب من 6 ملايين مؤلف فريد و 120 مليون استشهاد.

تشارك CiteSeer x أيضًا برمجياتها وبياناتها وقواعد بياناتها وبياناتها الوصفية مع باحثين آخرين ، حاليًا بواسطة Amazon S3 و rsync . [5] تم تصميم هيكلها المعياري الجديد مفتوح المصدر والبرمجيات (المتوفرة سابقًا على SourceForge ولكن الآن على GitHub ) على Apache Solr وغيرها من أدوات Apache والمصدر المفتوح والتي تتيح لها أن تكون اختبارًا للخوارزميات الجديدة في تجميع المستندات وترتيبها وفهرستها ، واستخراج المعلومات.

يقوم CiteSeer x بتخزين بعض ملفات PDF التي قام بمسحها ضوئيًا. على هذا النحو ، تتضمن كل صفحة رابط قانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية والذي يمكن استخدامه للإبلاغ عن انتهاكات حقوق النشر. [6]

الميزات الحالية

الاستخراج الآلي للمعلومات

يستخدم CiteSeer x أدوات استخراج المعلومات الآلية ، والتي عادةً ما تكون مبنية على أساليب التعلم الآلي مثل ParsCit ، لاستخراج البيانات الوصفية للوثائق العلمية مثل العنوان والمؤلفين والملخص والاستشهادات وما إلى ذلك ، على هذا النحو ، هناك أحيانًا أخطاء في المؤلفين والعناوين. محركات البحث الأكاديمية الأخرى لديها أخطاء مماثلة.

الزحف المركز

يقوم CiteSeer x بالزحف إلى المستندات العلمية المتاحة للجمهور في المقام الأول من صفحات الويب الخاصة بالمؤلف والموارد المفتوحة الأخرى ، وليس لديه حق الوصول إلى البيانات الوصفية للناشر. على هذا النحو ، فإن عدد الاقتباسات في CiteSeer x عادة ما يكون أقل من تلك الموجودة في الباحث العلمي من Google و Microsoft Academic Search الذين لديهم حق الوصول إلى البيانات الوصفية للناشر.

الاستخدام

لدى CiteSeer x ما يقرب من مليون مستخدم حول العالم بناءً على عناوين IP الفريدة ولديه ملايين الزيارات يوميًا. بلغ عدد التنزيلات السنوية لملفات PDF الخاصة بالوثائق ما يقرب من 200 مليون في عام 2015.

البيانات

تتم مشاركة بيانات CiteSeer x بانتظام بموجب ترخيص Creative Commons BY-NC-SA مع الباحثين في جميع أنحاء العالم ، وقد تم استخدامها في العديد من التجارب والمسابقات.

بفضل نقطة النهاية OAI-PMH ، [7] CiteSeerX هو أرشيف مفتوح ويتم فهرسة محتواه كمستودع مؤسسي في محركات البحث الأكاديمية ، على سبيل المثال مستهلكو BASE و Unpaywall .

محركات البحث الأخرى المستندة إلى SeerSuite

تم تمديد نموذج CiteSeer ليشمل الوثائق الأكاديمية في الأعمال التجارية مع SmealSearch وفي الأعمال التجارية الإلكترونية مع eBizSearch . ومع ذلك ، لم يتم الحفاظ عليها من قبل رعاةهم. يمكن العثور على نسخة قديمة من كلاهما في BizSeer.IST ولكنها لم تعد في الخدمة.

تم إنشاء أنظمة بحث ومستودعات أخرى تشبه Seer للكيمياء ، Chem X Seer وعلم الآثار ، ArchSeer. تم إنشاء ملف آخر للبحث عن ملفات robots.txt ، وهو BotSeer . كل هذه الأشياء مبنية على أداة مفتوحة المصدر SeerSuite ، والتي تستخدم مفهرس مفتوح المصدر Lucene .

انظر أيضا

المراجع

  1. ^ أ ب "سياسة بيانات CiteSeerX" . مؤرشفة من الأصلي في 2012-01-05 . تم الاسترجاع 2015/11/10 .
  2. ^ أ ب "حول CiteSeerX" . تم الاسترجاع 2010-05-07 .
  3. ^ "فريق CiteSeerX" . جامعة ولاية بنسلفانيا. مؤرشفة من الأصلي في 26 يوليو 2018 . تم الاسترجاع 2018/05/01 .
  4. ^ "ترتيب مستودعات الويب العالمية: أفضل 800 مستودعات" . مختبر القياسات السيبرانية. يوليو 2010. مؤرشفة من الأصلي في 2010-07-24 . تم الاسترجاع 2010-07-24 .
  5. ^ "حول بيانات CiteSeerX" . جامعة ولاية بنسلفانيا. مؤرشفة من الأصلي في 2012-01-05 . تم الاسترجاع 2012-01-25 .
  6. ^ على سبيل المثال ، "CiteSeerx - إشعار قانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية". CiteSeerX 10.1.1.604.4916 . تمت إزالة المستند الذي يحمل المعرّف "10.1.1.604.4916" بسبب إشعار إزالة وفقًا لقانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية. إذا كنت تعتقد أن الإزالة تمت عن طريق الخطأ ، فيرجى الاتصال بنا من خلال صفحة التعليقات ، جنبًا إلى جنب مع المعرف المذكور في هذه الصفحة.  يتطلب الاستشهاد بمجلة |journal=( مساعدة )
  7. ^ هيرست ، المؤلف توني (8 ديسمبر 2011). "استخدام OAI-PMH كواجهة استعلام على مستوى سجل واحد لـ Citeseer" . تم الاسترجاع 2020-04-25 .

قراءات إضافية

روابط خارجية