رحمت الله فتاحی، معلم علم اطلاعات و دانش شناسی، دانشگاه فردوسی مشهد
به عنوان پیش درآمد نوشته حاضر، باید گفت که در مقایسه با اطلاعات و دانش که نظریه های گوناگونی درباره آن ها مطرح شده، مفهوم داده به لحاظ نظری آنچنان مورد توجه قرار نگرفته است. این درحالی است که با توجه به اهمیت فزاینده دادهها (بویژه در چارچوب علم داده ها، اکوسیستم داده ها، و کلاندادهها یا دادههای بزرگ) در حوزه های گوناگون دانش بشری، بویژه در علوم زیستی، علوم شناختی، علوم اقتصادی، فناوری اطلاعات و مانند آن ها، پژوهش های اندکی در این قلمرو انجام گرفته و مقاله های محدودی منتشر شده است.
درعین حال، تنها در چند دهه اخیر است که انسان به ارزش فلسفی و علمی دادهها به منزله یک عنصر حیاتی و دارای ارزش افزوده و قابلیت های گسترده در زندگی فردی، اجتماعی و یا سازمانی پی برده است. جامعه امروزی جامعه ای داده-بنیاد است و همه فعالیت های اساسی آن برمبنای تولید، توزیع و مصرف داده ها در سطح کلان انجام می گیرد. با وجود چنین اهمیتی، هنوز در زمینه نظریه پردازی در باب دادهها حرکت جدی مشاهده نمی شود. نگارنده تلاش کرده است تا کتابی مقدماتی در این زمینه تدوین و منتشر کند.
هدف کتاب "درآمدی بر نظریه داده ها"[1] نه تنها ارائه مفاهیم پایه و مرتبط با موضوع دادههاست بلکه تلاش شده تا، ضمن مرور دیدگاه های اندیشمندان مختلف در این زمینه، برای نخستین بار در سطح جهانی، نظریه هایی عمومی را نیز ارائه دهد. آنچه در این اثر ارائه شده است دربرگیرنده بحث های بنیادی در زمینه مفهوم و چیستی (فلسفه) دادهها، مرور و مقایسه تعریف های گوناگون داده، مدل هایی برای دسته بندی دادهها، تعریف نظریه از دیدگاه های گوناگون، چارچوب های نظریه پردازی، و در نهایت پیشنهاد چند نظریه علمی و فلسفی در باره داده است. افزون بر رشته علم اطلاعات و دانش شناسی، محتوای کتاب می تواند برای برخی حوزه های دیگر از جمله علوم رایانه، علوم شناختی، آمار و ریاضیات، انفورماتیک پزشکی، مدیریت، اقتصاد و مانند آن ها سودمند باشد. هدف غایی نگارنده آن بوده است که این اثر بتواند علاقه و انگیزه کافی در خوانندگان برای ژرف نگری بیشتر در باره دادهها و انجام پژوهش های نظری و کاربردی در این زمینه را فراهم آورد.
چرا به نظریه هایی در باره داده نیاز داریم؟
همانگونه که پیشتر اشاره شد، مفاهیمی چون اطلاعات و دانش، به واسطه پیشینه علمی و کاربردی آن ها، از ادبیات بسیار غنی در چند دهه اخیر برخوردار است بلکه نظریه های گوناگونی در باره آن ها نیز ارائه شده است. فرانکسن (Franksen, 1985) یکی از نخستین اندیشمندانی است که به همین مسئله اشاره دارد. او بر این باور است که، با وجود این واقعیت که مفهوم داده یک مفهوم زیربنایی در علوم به شمار می رود، اما ما آن را در بافت نظریه های علمی، مبتنی بر قوانین یا اصول خدشه ناپذیر مطرح نکرده ایم، بلکه تنها در ارتباط با برنامه های رایانه ای مورد توجه قرار داده ایم. کاپورو و یورلند (2003) بر این باورند که پرداختن به موضوع دادهها با تاخیر بسیار در علم اطلاعات صورت گرفته است. فرنر (Furner, 2016) نیز خاطرنشان می کند که مبحث داده در بسیاری از متون حوزه علم اطلاعات و دانش شناسی مورد غفلت واقع شده است. پس ما نیازمند اندیشه ورزی ژرف تر در این زمینه، و بویژه نظریه پردازی و توجیه فلسفه وجودی این عنصر بسیار مهم در فرایند زندگی خود هستیم.
ویژگی ها و قابلیت های دادهها
مرور آنچه اندیشمندان از دیدگاه های مختلف در باره دادهها مطرح کرده اند ما را به این نکته رهنمون می سازد که شناخت ارزش ها و ویژگی های کاربردی دادهها، و همچنین قابلیت ها و تفسیرهای گوناگون درباره آن می تواند سرشت پویا و تاثیرگذار آن را بر ما نمایان سازد. آنچه در زیر مورد بحث قرار می گیرد می تواند به منزله زمینه های عینی مناسب برای نظریه پردازی در باره دادهها به شمار آید:
- قابلیت "دریافت" یا برگرفتن دادهها. 2. قابلیت "ذخیره". 3. قابلیت "انتقال و تبادل". 4. قابلیت "خرید و فروش". 5. قابلیت "سنجش و اندازه گیری". 6. قابلیت "پالایش". 7. "پویایی" دادهها. 8. قابلیت "پردازش". ۹. قابلیت "ارتباط دهندگی و معناسازی".
در یک نگاه کلی، می توان نتیجه گرفت دادهها در عصر ما از آنچنان ارزش ها، قابلیت ها و اهمیتی برخوردار شده اند که بسیاری از مدیران، کارشناسان و نیز پژوهشگران در سازمان های دولتی و بخش خصوصی به شدت به آن وابسته شده اند. درواقع، می توان گفت که حیات بسیاری از سازمان ها بدون دسترسی به داده، پردازش آن، و استنباط برپایه آن غیرممکن شده است.
به سوی نظریه هایی در باره دادهها
با توجه به نقش ارزشمند دادهها در زندگی افراد، سازمان ها و جوامع از یکسو و شکل گیری علم دادهها از سوی دیگر، به نظر می رسد شرایط لازم برای تدوین نظریه هایی درباره دادهها فراهم شده است. شکل گیری و توسعه علم دادهها بدون تدوین نظریه(هایی) برای آن بی هدف خواهد بود.
در اینجا به برخی گزاره هایی که برپایه آن ها نظریه هایی در باره دادهها مطرح شده اشاره می شود:
- دادهها متغیرهای زیستی یعنی شواهدی از موجودیت ها و رخدادهای جهان هستی هستند. بر این اساس، می توان این گزاره را مطرح کرد که"جهان هستی و فرایند زیست همواره درحال خلق رخداد است و هر موجودیتی و هر رخدادی به طور بالقوه قابلیت تولید داده دارد؛ پس هر داده ای حاصل یک موجودیت یا رخداد است، و از این دیدگاه، دادهها جهان هستی (زیست جهان) را توصیف یا بازنمون می کنند". بر پایه همین گزاره، این پیش فرض وجود دارد که هیچ محدودیت و پایانی در تولید و فزونی حجم دادهها در عالم هستی و در فرایند زیست نیست. تا زمانی که هستی (مجموعه موجودیت ها) و نیز رخدادها (پویایی در موجودیت ها و خلق رابطه ها) در جهان وجود دارد و ما ناچاریم رابطه میان آن ها را دریابیم، دادهها تولید، مصرف و بازتولید می شوند تا فرایند زیست معنا و حرکت (پویایی) کسب کند.
- برپایه گزاره بالا، "دادهها ویژگی فزایندگی و پتانسیل مانایی دارند". این ویژگی، بویژه در شکل داده های عینیِ ثبت شده و نیز کلان دادهها، همواره جهان هستی و رخدادهای آن را تحت تاثیر قرار می دهد و این یک حقیقت آشکار است. این بدان معناست که هرچه داده تولید می شود، بخش بزرگی از آن، به منظور بهره گیری در آینده، ذخیره شده و پایدار خواهد ماند.
- داده، اطلاعات و دانش رابطه ای تعاملی دارند. بر این اساس، موجودیت اطلاعات و دانش وابسته به تولید و پردازش دادهها و در مقابل، بخش عمده ای از دادههای تولید شده حاصل اطلاعات و دانشی است که انسان به دلیل فعالیت های ذهنی و عینی خود انجام می دهد. به سخن دیگر، دادهها، عنصری حیاتی در ساخت و پرداخت اطلاعات و دانش هستند. عکس آن نیز صادق است: اطلاعات و دانش باید در قالب داده ها ثبت و ذخیره شود تا قابلیت بازیابی، پردازش و استفاده داشته باشند. بر پایه این گزاره، می توان گفت که هرچه پردازش های هدفمندتر و پیچیده تری روی داده ها انجام گیرد، اطلاعات و دانش سودمندتری تولید خواهد شد.
- برپایه گزاره بالا، رابطه عنصر دادهها با اطلاعات و دانش به واسطه عنصر دیگری فارغ از آن ها (مانند انسان یا ماشین) شکل می گیرد. به واسطه این عنصر (انسان یا ماشین) است که دادهها معنادار و قابل استفاده می شوند. درواقع، دادهها به واسطه عنصری دیگر عینیت می یابند و از حالت انتزاعی به واقعیت ها یا بوده ها (facts) تبدیل می گردند. از این رو، دادههابه طور بالقوه تولید و منتقل می شوند اما تا هنگامی که دریافت نشده و بر محملی (مغز انسان، ابزار، یا سامانه ای دیگر) ثبت و ذخیره نشوند پایا و ماندگار نیستند.
- رفتارهای انسان، بویژه در سطح اجتماعی، در زمینه تولید، پردازش و مصرف دادهها یک پدیده[2] پویا، معنادار و قابل مطالعه است. از این دیدگاه این نوع رفتارها را می توان به عنوان یک پدیده مورد مطالعه قرار داد. جامعه امروزی جامعه ای داده-بنیاد است و رویکرد داده گرایی، رویکرد غالب در بسیاری از نهادها و شرکت هاست. دادهها به منزله عناصر اطلاعاتی درنظر گرفته می شوند که بنیاد نظریه پردازی را شکل می دهند. به همین دلیل، مشاهده، گردآوری، و تحلیل دادهها جزو فرایندهای بنیادی برای طرح و پاسخ به فرضیه ها به شمار می رود. این زمینه مطالعاتی هنوز جوان به نظر می رسد و برای بالندگی نیازمند پژوهش های نظری و کاربردی فراوان است.
- سطح پویایی موجودات زنده به میزان تولید و پردازش دادهها توسط آن ها بستگی دارد. هر موجودیتی که پویاتر و پیچیده تر باشد و یا در بافت (ساختار، فرایندها و شرایط) پویاتر و پیچیده تری قرار گیرد و فعالیت کند نه تنها دادههای بیشتری تولید می کند، بلکه به دادههای بیشتری نیز برای پردازش به قصد تداوم فعالیت نیاز دارد.این بدان معناست که بین سطح پردازش دادهها توسط موجودات زنده و سطح بهره وری از دادهها برای تصمیم گیری و زندگی بهتر رابطه وجود دارد. درواقع، میزان پویایی یک موجودیت به توانمندی ذهنی آن در جذب و پردازش دادهها بستگی دارد که می تواند در موقعیت ها و بافت های مختلف متفاوت باشد. در اینجا، "پویایی" به منزله فعالیت های بیشتر و "پیچیدگی" به مفهوم وجود ساختار، روابط و پردازش های سطح بالاتر در یک موجودیت است. به همین ترتیب، دستگاه های پویاتر و پیچیده تر، مانند هواپیما در مقایسه با اتومبیل، و اتومبیل در مقایسه با دوچرخه، دادههای بیشتری از عملکرد خود بازتاب می دهند. برپایه همین استدلال، می توان گفت که با واکاوی و سنجش میزان و نوع دادههای تولید شده و پردازش شده توسط هر موجودیتی، می توان میزان پویایی و پیچیدگی آن را مورد سنجش و تحلیل قرار داد (داده به منزله ابزار سنجش). همچنین، موجودیت های پویاتر و پیچیده تر قادرند برپایه دادههای کسب و پردازش شده، روابط میان مفاهیم و رخدادها را بهتر کشف کنند. پس می توان این فرضیه را مطرح کرد که" هرچه سازمان ها و افراد پویاتر باشند، دادههای بیشتری تولید می کنند، و هرچه دادههای بیشتری تولید شود، امکان تاثیرگذاری آن بر ساختار و فرایندهای سازمان افزایش می یابد. به طور خلاصه و در ارتباط با پویایی دادهها می توان این نظریه ها را مطرح کرد: بین پویایی داده (به لحاظ میزان و پیچیدگی) و تاثیرگذاری آن رابطه مثبت وجود دارد.
سخن پایانی
درک جهان هستی، ساختار و مجموعه عناصر تشکیل دهنده آن (موجودیت ها، رخدادها و همچنین روابطی که میان آن ها وجود دارد) نیازمند درکِ مفهوم، چیستی و فلسفه دادهها از دو بعد نظری و عملی است. دادهها، در ذات خود مفاهیمی انتزاعی و در عین حال، در عالم واقع، واقعیت هایی پویا هستند که ریشه در تمامی پدیده های عالم هستی دارند. دادهها ماهیتی پویا و پیچیده دارند. داده خام به تنهایی نمی تواند برای انسان معنابخش و در نهایت، قدرت آفرین باشد چراکه قادر به شکلدهی تفکر و تصمیم سازی نیست. برداشت و کاربرد مؤثر از دادهها و استفاده از قابلیت های گوناگون دادهها به انسان در تولید اطلاعات با کیفیت و ایجاد ارزش افزوده کمک می کند.
اگر بپذیریم که دادهها شواهدی از جهان هستی (مجموعه موجودیت ها، رخدادها و روابط میان آن ها) است، در آن صورت می توان استدلال کرد که همه رخدادهای این جهان داده تولید می کنند. پس دادهها حاصل رخداد هاست. رخدادها همواره در حال وقوع هستند، زیرا موجودیت های جهان هستی در حال فعالیت، تغییر و تحول (پویایی) هستند و از این دیدگاه هیچ محدودیت و پایانی در تولید و فزونی دادهها در عالم هستی وجود ندارد. تا زمانی که هستی و رخدادها (تغییر و پویایی در موجودیت ها) در جهان وجود دارد دادهها تولید، مصرف و بازتولید می شوند تا به زندگی معنا و حرکت (پویایی) دهند.
در یک جمع بندی کلی، ما شاهد تحولات عمده ای در قلمرو دادهها و علم دادهها خواهیم بود و این نیازمند مطالعات نظری و کاربردی ژرف تر برای مدیریت بهتر رخدادهای جهان هستی است. اکنون جامعه بشری در آستانه یک پارادایم و انقلاب داده ای جهان شمول و ارزشمند است، تحولی که افق های نوینی در همه حوزه های فعالیت انسان باز کرده است. به نظر می رسد حوزه های مطالعاتی و عملکردی و در نتیجه، تخصص های جدیدی برپایه قابلیت های دادهها شکل گرفته و توسعه یابد. حتی می توان انتظار داشت که موضوع جدیدی همچون اخلاق داده ها به یک مسئله مهم جوامع بشری تبدیل شود زیرا، همچون اطلاعات، چالش های بسیاری از جمله سوء استفاده از داده ها، سوء برداشت از داده ها و مانند آن می تواند آسیب زننده باشد. در این میان، نظریه پردازی و تدوین نظریه های فلسفی و علمی مرتبط با داده از جایگاه ویژه ای برخوردار است.
منابع و ماخذ
Capurro, R. and Hjørland, B. (2003). The concept of information, in Annual review of information science and technology 37 (1): 343-411
Franksen, O.I. (1985). The nature of data — From measurements to systems. BIT Numerical Mathematics, 25: 24. doi:10.1007/BF01934986.
Furner, J. (2016). “Data”: the Data. In: Kelly M, , Bielby J, editors. Information cultures in the digital age: A festschrift in honor of Rafael Capurro. Wiesbaden: Springer; (2016) ; p. 287-306. doi: 10.1007/978-3-658-14681-8_17.
[1] رحمت الله فتاحی. درآمدی بر نظریه داده ها: جستارهایی فلسفی و علمی پیرامون داده ها. تهرتن: نشر کتابدار، 1397.
[2] phenomenon