البيانات الكبيرة على الانترنت وتغير الوضع القائم

بمجيء إنترنت الأشياء (IoT) وتطور تكنولوجيات الويب، ثمة نمو هائل في كمية البيانات التي يتم إنتاجها. وبالتالي، فإن التكنولوجيات التقليدية مثل نظام إدارة قواعد البيانات العلائقية (RDBMS) لها حدودها في التعامل مع البيانات الكبيرة، أما التكنولوجيات الجديدة فقد طُوِّرت للتعامل معها واستخلاص رؤى مفيدة منها.
البيانات الكبيرة على الانترنت وتغير الوضع القائم
بقلم: راجيف براساد، كبير مسؤولي المعلومات في اكسباند ريتيل من سافانت
بواسطة أريبيان بزنس
الخميس, 18 يناير , 2018

بمجيء إنترنت الأشياء (IoT) وتطور تكنولوجيات الويب، ثمة نمو هائل في كمية البيانات التي يتم إنتاجها. وبالتالي، فإن التكنولوجيات التقليدية مثل نظام إدارة قواعد البيانات العلائقية (RDBMS) لها حدودها في التعامل مع البيانات الكبيرة، أما التكنولوجيات الجديدة فقد طُوِّرت للتعامل معها واستخلاص رؤى مفيدة منها.

ومع رقمنة أغلب العمليات، وظهور منصات شبكات تواصل اجتماعي مختلفة، ونشر المستشعرات، واعتناق الأجهزة الذكية، والأجهزة القابلة للارتداء والانفجار في استخدام الإنترنت، تُنتج كميات ضخمة من البيانات على نحوٍ مستمر. ودون شك، فقد غير الإنترنت طريقة ممارسة الأعمال في الوقت الحالي، وطريقة عمل الحكومات، والتعليم وأسلوب حياة الناس حول العالم. واليوم، هذه التوجهات في مرحلة تحول، حيث معدل إنتاج البيانات مرتفع للغاية ويتجاوز نوع البيانات المُنتَجة قدرة أساليب تخزين البيانات الحالية. ولا يمكن إنكار أن هذه البيانات تحمل كميات مهولة من المعلومات أكثر من أي وقتٍ مضى بسبب ظهور الإنترنت واعتناقه.

واستخلاص المعنى من هذه البيانات الضخمة المُنتَجة يمكنه مساعدة المؤسسة في اتخاذ قرار مطلع وتوفير ميزة تنافسية لها. وفيما سبق، استخدمت المؤسسات أنظمة قائمة على المعاملات استخدمت في الأصل أنظمة إدارة قواعد البيانات العلائقية (RDBMS) والأساليب البسيطة لتحليل البيانات مثل اللغة الاستفسارية الإنشائية المركبة (SQL) في عملياتهم اليومية ولقد ساعدتهم في اتخاذهم القرارات والتخطيط. وعلى الرغم من هذا، ونتيجةً لزيادة حجم البيانات خاصةً الصيغة غير المنظمة من البيانات، مثل مراجعات العملاء لصفحات فيسبوك أو التغريدات الخاصة بهذه المؤسسات -فقد أمسى من شبه المستحيل معالجة هذه البيانات بأساليب التخزين الحالية والاستفسارات البسيطة.

والتركيز الحالي والبارز في مجال تحليلات البيانات الكبيرة ينصب على استكشاف الأساليب التقليدية مثل الأنظمة القائمة على القواعد، والتنقيب عن الأنماط، وأشجار القرارات وغيرها من أساليب التنقيب عن البيانات لتطوير قواعد أعمال تعمل بكفاءة حتى على مجموعات البيانات الضخمة. ويمكن تحقيق هذا إما بتطوير الخوارزميات التي تستخدم التخزين الموزَّع للبيانات، أو الحوسبة في الذاكرة أو باستخدام الحوسبة العنقودية من أجل الحوسبة الموازية. وفيما مضى، نُفِّذت هذه العمليات باستخدام الحوسبة الشبكية، التي تغلبت عليها الحوسبة السحابية في الأيام الأخيرة.

وعلى الرغم من أنه لا توجد تكنولوجيا بلا عيوب، إلا أنه باعتبار مزايا الحوسبة الشبكية أو الحوسبة السحابية وسلبياتها، فقد يكون من المفيد معالجة كميات ضخمة من البيانات التي تحتاج إلى المعالجة لتحليل البيانات الكبيرة أو تحليل بيانات البث المباشر.

وما من تعريف محدد للبيانات الكبيرة رغم تعريفها بصورٍ متنوعة. وقليلٌ من حدد ما تفعله البيانات الكبيرة بينما ركز القليل جدًا على ماهيتها. كما أن تعريف البيانات الكبيرة بناءً على مفهوم 3Vs نسبي – الحجم Volume، والسرعة Velocity، والتنوع Variety. ويشير الحجم إلى ضخامة البيانات التي تُنتَج وتُجمع. وهي تتزايد بمعدلٍ أسرع من التيرابايتات إلى البيتابايتات. وتشير السرعة إلى معدل إنتاج البيانات. وتستند تحليلات البيانات التقليدية إلى التحديثات الدورية-يوميًا أو أسبوعيًا أو شهريًا. وبالمعدل المتزايد لإنتاج البيانات، ستُعالج البيانات الكبيرة وتُحلَل في الوقت الفعلي أو وقتٍ مقاربٍ له لاتخاذ قرارات مطلعة.
ويشير التنوع إلى أنواع مختلفة من البيانات التي تُنتَج وتُلتَقَط. حيث تمتد إلى ما هو أكثر من البيانات المنظمة وتدخل ضمن فئات البيانات شبه المنظمة وغير المنظمة.

فلم يترك مفهوم تحليلات البيانات الكبيرة أي قطاع دون أن يدخل فيه. ولقد كانت قطاعات قليلة مثل الاتصالات، والتجزئة والخدمات المالية هي التي اعتنقت تحليلات البيانات الكبيرة في وقتٍ مبكر، وتبعها قطاعات أخرى.

وفي حين يعيد المستهلكون تعريف نموذج تقديم سلسلة الإمداد تدريجيًا، فإن السنوات القليلة القادمة ستمثل اختبارًا لتجار التجزئة أثناء سعيهم للتميز عن منافسيهم من خلال منهجيتهم المبتكرة في التوريد وتعويض النقص والتوزيع. ومن الواضح أن بوابات البيانات تنفتح على مصراعيها الآن للشركات من كل الأحجام والمواصفات، جالبةً فرصًا لا حصر لها للتحليل في الوقت المناسب سعيًا وراء اكتساب ميزة تنافسية. ورغم أن التركيز يميل حاليًا نحو سلوك المستهلكين، إلا أن البيانات متوفرة في نقاط متعددة في سلسلة إمداد المنتجات أو الخدمات وتأتي في صورٍ كثيرة—تقليدية (منظمة)، أو مخصصة (غير منظمة)، أو في الوقت الفعلي أو عبر إنترنت الأشياء--أو ناتجة من آلة إلى آلة، وهذا على سبيل المثال لا الحصر.

وتستطع الشركات التي تطبق تحليلات البيانات الكبيرة مبكرًا أن تحصد مكافآت مجزية من الكفاءة في ترشيد التكلفة والابتكارات المُدرة للعائد. ستتيح البيانات الكبيرة للشركات تحقيق التحول الرقمي الذي يسمح لهم بالحفاظ على التنافسية في مواجهة أي شركات ناشئة قد تعوقهم—وهي شركات يكاد يكون تعريفها أنها تعتمد على البيانات—تظهر في أسواقهم.

ومع ذلك، فإن رؤى الأعمال المفيدة لا تتدفق تلقائيًا من وابلٍ من المعلومات المتباينة - حيث يجب تحديد البيانات القابلة للتطبيق، وتنظيمها وتحليلها، ثم يتم تنفيذ النتائج عبر كل الأجزاء ذات الصلة في الأعمال. ويتطلب هذا تخطيطًا وميزانية والأدوات المناسبة والخبرة.

ولمتابعي مجال البيانات الكبيرة، فقد كان أكثر قطاع الناشئة بروزًا في 2017 هو "الذكاء الاصطناعي، وتعلم الآلة، والأتمتة والأنظمة الإدراكية". تعلّم الآلة في 2018 يصبح الآن العائق الأكبر وتعلّم الآلة المشتمل على التطبيقات التحليلية بدأ يصبح هو المعيار. وتكاد تكون المستويات المتزايدة من الأتمتة متطلبًا حتميًا إذا رغبت المؤسسات في تجنب الغرق في البيانات—أو بتعبير آخر ستتنامى أهمية الذكاء الاصطناعي مع بداية زيادة حجم البيانات.

وخلال الأعوام القادمة، سننتقل قريبًا من عقلية التحدث كثيرًا عن البيانات الكبيرة؛ وبدلاً من ذلك سينتقل التركيز إلى نتائج البيانات الكبيرة التي يتم تقديمها في منهجية خدمة ذاتية.

اشترك بالنشرةالإخبارية

اشترك بنشرة أخبار أريبيان بزنس لتصلك مباشرة أهم الأخبار العاجلة والتقارير الاقتصادية الهامة في دبي والإمارات العربية المتحدة ودول الخليج