داده ها

از ویکیپدیا، دانشنامه آزاد
پرش به ناوبری پرش به جستجو
برخی از انواع مختلف داده ها

داده ها ( US : / ˈ d æ t ə / ; UK : / ˈ d t ə / ) حقایق فردی ، آمار یا موارد اطلاعاتی هستند که اغلب عددی هستند. [1] در مفهوم فنی تر، داده ها مجموعه ای از مقادیر متغیرهای کمی یا کیفی در مورد یک یا چند شخص یا شی هستند، [1] در حالی که یک داده (مفرد از داده ها ) یک مقدار واحد از یک متغیر است. [2]

اگرچه اصطلاحات "داده" و "اطلاعات" اغلب به جای یکدیگر استفاده می شوند، این اصطلاح معانی متمایزی دارد. در برخی از نشریات رایج، گاهی اوقات گفته می شود که داده ها زمانی که در زمینه یا پس از تجزیه و تحلیل مشاهده می شوند، به اطلاعات تبدیل می شوند. [3] با این حال، در درمان های دانشگاهی داده های موضوع صرفاً واحدهای اطلاعاتی هستند. داده‌ها در تحقیقات علمی ، مدیریت کسب‌وکار (مانند داده‌های فروش، درآمد، سود، قیمت سهامامور مالی ، حاکمیت (مثلاً نرخ جرم و جنایت ، نرخ بیکاری ، نرخ باسوادی ) و تقریباً در هر شکل دیگری از فعالیت‌های سازمانی انسانی استفاده می‌شوند. به عنوان مثال، سرشماری تعداد افراد بی خانمان توسط سازمان های غیر انتفاعی).

داده ها اندازه گیری ، جمع آوری، گزارش و تجزیه و تحلیل می شوند و برای ایجاد تجسم داده ها مانند نمودارها، جداول یا تصاویر استفاده می شوند. داده به عنوان یک مفهوم کلی به این واقعیت اشاره دارد که برخی از اطلاعات یا دانش موجود به شکلی مناسب برای استفاده یا پردازش بهتر نمایش داده یا کدگذاری شده است. داده های خام ("داده های پردازش نشده") مجموعه ای از اعداد یا نویسه ها هستند قبل از اینکه توسط محققین "پاکسازی" و تصحیح شوند. داده‌های خام باید اصلاح شوند تا موارد پرت حذف شوندیا خطاهای آشکار ابزار یا ورودی داده ها (به عنوان مثال، خواندن دماسنج از یک مکان بیرونی قطب شمال که دمای استوایی را ثبت می کند). پردازش داده ها معمولاً به صورت مرحله ای انجام می شود و "داده های پردازش شده" از یک مرحله ممکن است "داده های خام" مرحله بعدی در نظر گرفته شوند. داده های میدانی، داده های خامی هستند که در یک محیط کنترل نشده " درجا " جمع آوری می شوند. داده های تجربی داده هایی هستند که در چارچوب یک تحقیق علمی با مشاهده و ثبت تولید می شوند.

داده ها به عنوان نفت جدید اقتصاد دیجیتال توصیف شده است . [4] [5]

ریشه شناسی و اصطلاحات

اولین استفاده انگلیسی از کلمه "داده" مربوط به دهه 1640 است. کلمه "داده" برای اولین بار در سال 1946 به معنای "اطلاعات رایانه ای قابل انتقال و ذخیره" استفاده شد. عبارت "پردازش داده ها" برای اولین بار در سال 1954 استفاده شد. [6]

کلمه لاتین داده جمع « datum» ، «(چیز) داده شده»، فعل ماضی خنثی از جرات «دادن» است. [6] در زبان انگلیسی، کلمه داده ممکن است به عنوان اسم جمع به این معنا استفاده شود، با برخی از نویسندگان - معمولاً کسانی که در علوم طبیعی، علوم زیستی و علوم اجتماعی کار می کنند - از datum در مفرد و داده برای جمع استفاده می کنند، به ویژه در قرن بیستم و در بسیاری از موارد نیز قرن بیست و یکم (به عنوان مثال، سبک APA در نسخه هفتم هنوز به «داده» نیاز دارد که جمع باشد. [7] ). با این حال، در زبان روزمره و بسیاری از استفاده از توسعه نرم افزار وعلوم کامپیوتر ، "داده" بیشتر در مفرد به عنوان یک اسم جمعی استفاده می شود (مانند "شن" یا "باران"). واژه کلان داده به صورت مفرد در می آید.

معنی

Adrien Auzout "A TABLE of the Apertures of Object-Glasses" از مقاله ای در سال 1665 در تراکنش های فلسفی

داده ها، اطلاعات ، دانش و خرد مفاهیمی نزدیک به هم هستند، اما هر یک نقش خود را در مورد دیگری دارد و هر اصطلاح معنای خود را دارد. بر اساس یک دیدگاه رایج، داده ها جمع آوری و تجزیه و تحلیل می شوند. داده‌ها تنها زمانی به اطلاعاتی مناسب برای تصمیم‌گیری تبدیل می‌شوند که به نوعی تجزیه و تحلیل شوند. [8] می توان گفت که میزان اطلاعاتی بودن مجموعه ای از داده ها برای شخصی به میزان غیرمنتظره بودن آن شخص بستگی دارد. مقدار اطلاعات موجود در یک جریان داده ممکن است با آنتروپی شانون مشخص شود .

دانش عبارت است از درک مبتنی بر تجربه گسترده در برخورد با اطلاعات در مورد یک موضوع. به عنوان مثال، ارتفاع قله اورست به طور کلی داده در نظر گرفته می شود. ارتفاع را می توان به طور دقیق با ارتفاع سنج اندازه گیری کردو وارد دیتابیس شد. این داده ها ممکن است در کتابی به همراه سایر داده های مربوط به کوه اورست گنجانده شود تا کوه را به گونه ای توصیف کند که برای کسانی که مایلند بهترین روش صعود به آن را انتخاب کنند مفید باشد. درک مبتنی بر تجربه بالا رفتن از کوه ها که می تواند افراد را در راه رسیدن به قله اورست راهنمایی کند، ممکن است به عنوان "دانش" تلقی شود. صعود عملی به قله اورست بر اساس این دانش ممکن است به عنوان "خرد" تلقی شود. به عبارت دیگر، حکمت به کاربرد عملی دانش شخص در شرایطی اطلاق می‌شود که ممکن است خیر حاصل شود. بنابراین خرد مجموعه «داده‌ها»، «اطلاعات» و «دانش» مفاهیم انتزاعی فزاینده را تکمیل و تکمیل می‌کند.

داده ها اغلب انتزاعی ترین مفهوم، اطلاعات کمترین انتزاعی ترین و دانش انتزاعی ترین فرض می شوند. [9] در این دیدگاه، داده ها با تفسیر به اطلاعات تبدیل می شوند. به عنوان مثال، ارتفاع کوه اورست به طور کلی "داده" در نظر گرفته می شود، کتابی در مورد ویژگی های زمین شناسی کوه اورست ممکن است "اطلاعات" در نظر گرفته شود، و کتاب راهنمای کوهنوردی حاوی اطلاعات عملی در مورد بهترین راه برای رسیدن به قله اورست ممکن است "دانش" در نظر گرفته شود. . "اطلاعات" دارای معانی گوناگونی است که از کاربرد روزمره تا کاربرد فنی را در بر می گیرد. با این حال، این دیدگاه همچنین برای معکوس کردن نحوه ظهور داده ها از اطلاعات و اطلاعات از دانش نیز استدلال شده است. [10]به طور کلی، مفهوم اطلاعات ارتباط نزدیکی با مفاهیم محدودیت، ارتباطات، کنترل، داده، شکل، دستورالعمل، دانش، معنا، محرک ذهنی، الگو، ادراک و بازنمایی دارد. بینون دیویس از مفهوم نشانه برای تمایز بین داده ها و اطلاعات استفاده می کند. داده ها مجموعه ای از نمادها هستند، در حالی که اطلاعات زمانی رخ می دهد که نمادها برای اشاره به چیزی استفاده می شوند. [11] [12]

قبل از توسعه دستگاه‌ها و ماشین‌های محاسباتی، مردم مجبور بودند به صورت دستی داده‌ها را جمع‌آوری کرده و الگوهایی را بر آن تحمیل کنند. از زمان توسعه دستگاه ها و ماشین های محاسباتی، این دستگاه ها می توانند داده ها را نیز جمع آوری کنند. در دهه 2010، رایانه‌ها به طور گسترده در بسیاری از زمینه‌ها برای جمع‌آوری داده‌ها و مرتب‌سازی یا پردازش آن‌ها، در رشته‌هایی از بازاریابی ، تجزیه و تحلیل استفاده از خدمات اجتماعی توسط شهروندان تا تحقیقات علمی مورد استفاده قرار گرفتند. این الگوها در داده ها به عنوان اطلاعاتی در نظر گرفته می شوند که می توانند برای افزایش دانش مورد استفاده قرار گیرند. این الگوها ممکن است به عنوان « حقیقت » تعبیر شود" (اگرچه "حقیقت" می تواند یک مفهوم ذهنی باشد) و ممکن است به عنوان معیارهای زیبایی شناختی و اخلاقی در برخی از رشته ها یا فرهنگ ها مجاز باشد. رویدادهایی که بقایای فیزیکی یا مجازی قابل درک را پشت سر می گذارند را می توان از طریق داده ها ردیابی کرد. علائم دیگر یک بار داده در نظر گرفته نمی شوند. پیوند بین علامت و مشاهده شکسته شده است. [13]

دستگاه های محاسباتی مکانیکی بر اساس نحوه نمایش داده ها طبقه بندی می شوند. یک کامپیوتر آنالوگ یک داده را به عنوان یک ولتاژ، فاصله، موقعیت یا سایر کمیت های فیزیکی نشان می دهد. یک کامپیوتر دیجیتال یک قطعه داده را به عنوان دنباله ای از نمادها نشان می دهد که از یک الفبای ثابت گرفته شده است . رایج‌ترین رایانه‌های دیجیتال از الفبای دودویی استفاده می‌کنند، یعنی الفبای دو کاراکتری که معمولاً «۰» و «۱» را نشان می‌دهند. سپس نمایش‌های آشناتر، مانند اعداد یا حروف، از الفبای دودویی ساخته می‌شوند. برخی از اشکال خاص داده ها متمایز می شوند. یک برنامه کامپیوتریمجموعه ای از داده ها است که می تواند به عنوان دستورالعمل تفسیر شود. اکثر زبان‌های کامپیوتری بین برنامه‌ها و سایر داده‌هایی که برنامه‌ها روی آن‌ها کار می‌کنند تمایز قائل می‌شوند، اما در برخی از زبان‌ها، به‌ویژه Lisp و زبان‌های مشابه، برنامه‌ها اساساً از سایر داده‌ها قابل تشخیص نیستند. تمایز متادیتا ، یعنی توصیفی از سایر داده ها نیز مفید است. یک اصطلاح مشابه و در عین حال اولیه برای ابرداده «داده های جانبی» است. نمونه اولیه ابرداده، فهرست کتابخانه است که توصیفی از محتویات کتاب است.

اسناد داده

هر زمان که داده ها باید ثبت شوند، داده ها به شکل اسناد داده وجود دارند. انواع اسناد داده عبارتند از:

برخی از این اسناد داده‌ای (مخزن‌های داده، مطالعات داده‌ها، مجموعه‌های داده و نرم‌افزار) در نمایه‌های استنادی داده نمایه می‌شوند ، در حالی که مقالات داده در پایگاه‌های داده‌های کتابشناختی سنتی نمایه می‌شوند، به عنوان مثال، Science Citation Index . ادامه مطلب را ببینید. [14]

جمع آوری داده ها

جمع‌آوری داده‌ها را می‌توان از طریق یک منبع اولیه (پژوهشگر اولین فردی است که داده‌ها را به دست می‌آورد) یا یک منبع ثانویه (محقق داده‌هایی را که قبلاً توسط منابع دیگر جمع‌آوری شده است، مانند داده‌های منتشر شده در یک مجله علمی به دست می‌آورد) انجام شود. روش های تجزیه و تحلیل داده ها متفاوت است و شامل مثلث بندی داده ها و نفوذ داده ها می شود. [15]روش دوم برای جمع‌آوری، طبقه‌بندی و تجزیه و تحلیل داده‌ها با استفاده از پنج زاویه احتمالی تحلیل (حداقل سه زاویه) برای به حداکثر رساندن عینیت تحقیق و امکان درک کامل پدیده‌های مورد بررسی تا حد امکان ارائه می‌کند: روش‌های کمی و کیفی، ادبیات. بررسی (از جمله مقالات علمی)، مصاحبه با کارشناسان، و شبیه سازی کامپیوتری. سپس داده‌ها با استفاده از یک سری مراحل از پیش تعیین‌شده «نفوذ» می‌شوند تا مرتبط‌ترین اطلاعات را استخراج کنند.

در سایر زمینه ها

اگرچه داده ها نیز به طور فزاینده ای در زمینه های دیگر مورد استفاده قرار می گیرند، پیشنهاد شده است که ماهیت بسیار تفسیری آنها ممکن است با اخلاق داده ها به عنوان "داده شده" در تضاد باشد. پیتر چکلند اصطلاح capta (از لاتین capera ، "گرفتن") را برای تمایز بین تعداد زیادی از داده های ممکن و زیر مجموعه ای از آنها که توجه به آنها معطوف است، معرفی کرد. [16] یوهانا دراکر استدلال کرده است که از آنجایی که علوم انسانی تولید دانش را به عنوان «موقعیت، جزئی و سازنده» تأیید می‌کند، استفاده از داده‌ها ممکن است مفروضاتی را ارائه دهد که غیرمولد هستند، مثلاً اینکه پدیده‌ها گسسته هستند یا مستقل از مشاهده‌گر هستند. [17] اصطلاح کاپتا، که بر عمل مشاهده به عنوان سازنده تأکید می کند، به عنوان جایگزینی برای داده ها برای بازنمایی های بصری در علوم انسانی ارائه می شود.

همچنین مشاهده کنید

منابع

  1. ^ a b OECD واژه نامه اصطلاحات آماری . OECD. 2008. ص. 119. شابک 978-92-64-025561.
  2. ^ "زبان آماری - داده ها چیست؟" . اداره آمار استرالیا 13/07/2013. بایگانی شده از نسخه اصلی در 2019-04-19 . بازیابی شده در 09-03-2020 .
  3. "داده در مقابل اطلاعات - تفاوت و مقایسه | تفاوت" . www.diffen.com . بازیابی شده در 2018-12-11 .
  4. یونگو، جوریس توندرز (۲۳ ژوئیه ۲۰۱۴). "داده نفت جدید اقتصاد دیجیتال است" . سیمی - از طریق www.wired.com.
  5. «داده ها روغن جدید هستند» . 16 جولای 2018. بایگانی شده از نسخه اصلی در 2021-10-27.
  6. ^ a b "داده ها | منشاء و معنای داده ها توسط دیکشنری آنلاین ریشه شناسی" . www.etymonline.com .
  7. انجمن روانشناسی آمریکا (2020). "6.11". کتابچه راهنمای انتشار انجمن روانشناسی آمریکا: راهنمای رسمی سبک APA . انجمن روانشناسی آمریکا. شابک 9781433832161.
  8. «نشر مشترک 2-0، اطلاعات مشترک» (PDF) . رئیس ستاد مشترک، انتشارات دکترین مشترک . وزارت دفاع 23 اکتبر 2013. صص I-1 . بازبینی شده در 17 جولای 2018 .
  9. آکاش میترا (2011). "طبقه بندی داده ها برای مدل سازی موفق" .
  10. تومی، ایلککا (2000). "داده بیش از دانش است". مجله سیستم های اطلاعات مدیریت . 6 (3): 103-117. doi : 10.1080/07421222.1999.11518258 .
  11. P. Beynon-Davies (2002). سیستم های اطلاعاتی: مقدمه ای بر انفورماتیک در سازمان ها . بیسینگ استوک، انگلستان: پالگریو مک میلان . شابک 0-333-96390-3.
  12. P. Beynon-Davies (2009). سیستم های اطلاعات کسب و کار بیسینگ استوک، انگلستان: پالگریو. شابک 978-0-230-20368-6.
  13. شارون دانیل. پایگاه داده: زیبایی شناسی کرامت .
  14. ^ شوپفل و همکاران. 2020. "Data Documents". دایره المعارف سازمان دانش ISKO https://www.isko.org/cyclo/data_documents
  15. مسلی، اولیویه (2015). ایجاد مدل در تحقیقات روانشناختی. États-Unis : Springer Psychology : 126 صفحه. شابک 978-3-319-15752-8 
  16. ^ پی چکلند و اس. هاولول (1998). اطلاعات، سیستم ها و سیستم های اطلاعاتی: ایجاد حس در زمینه . چیچستر، ساسکس غربی: جان وایلی و پسران. صص 86-89. شابک 0-471-95820-4.
  17. یوهانا دراکر (2011). "رویکردهای علوم انسانی به نمایش گرافیکی" . فصلنامه علوم انسانی دیجیتال . 005 (1).

پیوندهای خارجی