قاموس البيانات: كيفية وأفضل الممارسات

قاموس البيانات عبارة عن قائمة بالمصطلحات والمقاييس الأساسية مع التعريفات ، مسرد مصطلحات الأعمال. في حين أنها تبدو بسيطة ، تافهة تقريبًا ، إلا أن قدرتها على التوفيق بين العمل وإزالة الالتباس قد تكون عميقة. في الواقع ، قد يكون قاموس البيانات أحد أكثر الأعمال الفنية قيمة التي يمكن لفريق البيانات تقديمها إلى الشركة.

لدى معظم الشركات مفهوم أو مصطلح أو مقياس واحد على الأقل يتم استخدامه أو تفسيره بشكل مختلف بين الفرق. عندما يحدث هذا ، يسود الارتباك. قد يختلف صناع القرار حول ما تظهره البيانات والإجراءات الواجب اتخاذها. قد تعرض التقارير بين الفرق أرقامًا مختلفة لنفس المقياس من مصدر البيانات نفسه نظرًا لعدم توافق منطق الأعمال. قد تتجادل الفرق حول التعريف الصحيح وتدافع عن العشب ، ربما لأن التعريف يجعل أرقامها تبدو أفضل. هذا ليس جيدًا للعمل.

بمجرد أن يكون لديك قاموس للبيانات ، فهو عبارة عن مستند يمكن لجميع الموظفين الرجوع إليه وعلى نفس الصفحة ، كما أنه يسهل عملية استيعاب الموظفين الجدد ، وفريق الاستخبارات التجارية (BI) لديه متطلبات واضحة تمامًا لتنفيذ تلك المقاييس.

لكي نكون واضحين ، هنا ، نحن لا نفكر في وثائق جدول قاعدة البيانات الخام على الرغم من أن هذا أمر مهم للغاية ، ولكن قائمة أعلى من مصطلحات وقياسات العمل. كيف يفكر النشاط التجاري ككل في "المستخدم" أو "الإيرادات" أو "تكلفة الاستحواذ"؟ هل لدى الجميع نفس الفهم أو "منطقة المبيعات" ، أو "متوسط ​​وقت الشحن" ، أو "الجلسة"؟ يجب أن يكون الهدف هو تمكين عضو مبتدئ غير تقني ، مثل وكيل خدمة العملاء ، من قراءة الجزء الخاص بهم من العمل وفهم المصطلحات ذات الصلة ، ولكنه مفصل ودقيق بدرجة كافية لاستيعاب منطق العمل. من تلك المقاييس.

في هذا المنشور ، سأوضح بعض أفضل الممارسات التي تحيط بقواميس البيانات وعملية كيفية إنشاء واحدة. هذه ليست العملية الوحيدة التي ستنجح على الإطلاق ، ولكنها نجحت على الأقل بالنسبة لي. هنا ، أفترض أن فريق BI يقود هذه العملية. في رأيي ، ينبغي أن يمتلكوا قاموس البيانات وتطبيق المقاييس في أدوات استقصاء المعلومات.

1. جمع الشروط

الخطوة الأولى هي تجميع قائمة بالمصطلحات. بمعنى أنه ينبغي لفريق BI إنشاء جدول بيانات مع قائمة بأسماء مفاهيم ومقاييس العمل (التدابير) وكيفية تقسيم البيانات وتقطيعها (الأبعاد). في حين أن هذا يبدو مخيفًا ، إلا أن أحد الأساليب هو الذهاب إلى فريق العمل من قبل فريق العمل وفحص عينة من جميع التقارير ولوحات المعلومات القياسية الخاصة بهم. اذكر كل علامات المحور من المخططات ورؤوس الأعمدة من جداول التقارير وأبعاد كيفية تقسيم البيانات. وبالتالي ، فإن التقرير الذي يوضح الإيرادات حسب المنطقة (لفترة زمنية معينة) ينتج عنه مصطلحين أساسيين: "الإيرادات" و "الإقليم". في هذه المرحلة ، تقوم فقط بتجميع قائمة بأسماء المصطلحات وليس تعريفاتها.

الإخراج هو قائمة بأسماء الفريق ، واسم المصطلح ، ونوع البيانات ، وقيمة المثال أو اثنين ، وربما رابط لتقرير مثال يستخدم هذا المصطلح. الأعمدة الإضافية التي يمكن أن تكون مفيدة لإضافتها هي عمود يشير إلى ما إذا كان هذا بُعدًا أو تدبيرًا (هناك اتفاق عام على الأبعاد أكثر من المقاييس) وعمودًا يحدد مصدر الحقيقة.

الخطوة 1: قائمة المصطلحات دون تعريفات

تنظيم وتجميع القائمة حسب وظيفة العمل ، مثل المقاييس المالية ، ومقاييس التسويق ، ومقاييس خدمة العملاء ، وما إلى ذلك. قد ترغب أيضًا في استنباط أبعاد عامة حقًا ("السنة" ، و "product_id" ، و "البلد" ، إلخ) تمتد عبر العديد من فرق لقسمهم أيضا.

القائمة ربما لا تكون طويلة كما قد تتوقع. ذلك لأن الفرق تميل إلى امتلاك مجموعة صغيرة نسبيًا من المقاييس التي يحاولون تتبعها وتحسينها باستخدام مجموعة صغيرة نسبيًا من الروافع الموجودة تحت تصرفهم - على سبيل المثال ، قد يركز التسويق عبر الإنترنت على بعض الجوانب الرئيسية مثل الحملة ، والقناة ، الإنفاق ، والجزء.

اطلب من فريق العمل إلقاء نظرة على القائمة ، وخاصة القسم الخاص بهم وإضافة أي مصطلحات مفقودة. إذا كان لديهم مجموعة قوية من لوحات المعلومات والتقارير ، فمن المحتمل أن يكون لديك قائمة شاملة. إذا لم يفعلوا ، فهذا يوفر مفاهيم إضافية ذات قيمة لجمعها.

2. تحديد الشروط

يجب على فريق BI الآن إجراء تمريرة أولى عند محاولة تجميع أو إنشاء تعريفات.

أولاً ، اسحب أي تعريفات من أي وثائق موجودة. قد يكون هذا من خلال wiki أو التقارير السنوية أو من الكود الفعلي مثل استعلامات SQL أو وحدات ماكرو Excel. يجب أن تكون التعريفات واضحة ولا لبس فيها. إذا كان من الواضح إظهار صيغة بسيطة (مثل ARPU = total_revenue / number_subscribers) بدلاً من كتابة تعريف ، فقم بإظهار ذلك. يجب أن يكون معظم الموظفين قادرين على فهم التعريف ، حتى إذا احتاجوا إلى الإشارة إلى بعض المصطلحات.

ثانياً ، اجلس مع الفرق ، واحدة تلو الأخرى ، واطلب مساعدتهم لوضع أي تعريفات مفقودة أو تحسين التعريفات. (ستحقق تقدماً أفضل بدءًا من التعريف ، حتى لو كان خطأً ، مقارنة بخلية فارغة.) قد يتطلب ذلك بعضًا تلو الأخرى حتى تحصل على بعض الاتفاق داخل هذا الفريق. قد يتطلب أيضًا إجراء بعض الأبحاث حول كيفية حساب المقياس حاليًا.

الأهم من ذلك ، لا تسأل "ما هو التعريف الحالي؟" ولكن "كيف ينبغي تعريف هذا؟" إذا لم يكن التطبيق الحالي هو التعريف المثالي ، فهذه هي الفرصة المثالية لفريق العمل لتحديد حالته المثالية. على سبيل المثال ، هذه فرصة لتبسيط ما إذا كنت قد ورثت تعريفًا شديد التعقيد. بمجرد التقاط هذا التعريف المثالي ، يكون هناك ضغط إضافي على فريق البيانات أو الفريق الفني أو أجزاء أخرى من العمل لتقديم هذا المقياس كما هو محدد.

3. تحديد الصراعات

هذه خطوة أساسية: استخرج أي مصطلحات حيث يختلف تعريفها بين الفرق.

4. الحصول على المحاذاة

لتلك المصطلحات التي تختلف بين الفرق ، أحضر الفرق ذات الصلة إلى نفس الغرفة (وقفل الباب). اطلب منهم مناقشة كيف ولماذا يختلفون.

بالنسبة لهذا الاجتماع ، يجب أن يكون هناك اتفاق مع نتيجتين فقط:

* فريق واحد يوافق على تبني تعريف الفريق الآخر.

* لديهم أسباب مشروعة لماذا تختلف. في هذه الحالة ، وافق على اسم جديد لواحد أو كلا المصطلحين.

(هناك خيار ثالث حيث يوافق الفريقان على تعديل تعريفهما إلى بعض التعريفات المشتركة وهو أمر ممكن ولكن أقل احتمالًا.)

يجب أن تكون الأسماء ضرورية لتجنب الغموض أو الالتباس. إذا كان "community_adjusted_editba" مصطلحًا مناسبًا وملائمًا يميزه عن "ebitda" العادي ، فاستخدم هذا المصطلح الأطول والأكثر وصفية. والهدف من ذلك هو القضاء على الارتباك لا يكون مقتضب.

5. الحصول على تسجيل الخروج

اجعل رؤساء الفريق يوقعون. هذا أمر بالغ الأهمية. لا تريد أن يحدد فريق BI مصطلحًا ولا يوافق فريق العمل سراً. في هذه الحالة ، سينطلق العمل وينفذ منطقه الخاص في Excel وستعود إلى المربع رقم واحد. كخبراء في المجال وكأشخاص سوف يتخذون قرارات أعمال بناءً على تلك المقاييس ، يجب أن يكون أصحاب الأعمال هؤلاء على متنها بالكامل.

في Warby Parker ، استفدنا من مساعدة الرؤساء التنفيذيين المشاركين لمطالبة رؤساء الفرق بالتوقيع والقيام بذلك في تاريخ معين. رؤساء الفريق مشغولون وقد لا يبدو قاموس البيانات ذا أولوية قصوى ، حتى إذا استطاعوا رؤية القيمة. وهكذا ، ثبت أن هذا الدعم من أعلى إلى أسفل قيمة للغاية.

6. نشر

قم بنشر قاموس البيانات كمستند صفحة واحد حيث يمكن للشركة بأكملها الوصول إليه - وبالتالي ، ليس فقط في أداة BI. ينبغي فهم هذه التعاريف واعتمادها على نطاق واسع ، ليس فقط من قبل التنفيذيين والمحللين وصناع القرار ، ولكن من جانب جميع الموظفين. لذلك ، الرؤية أمر بالغ الأهمية. إذا كانت الشركة تستخدم ويكي بكثرة ، فإنها تنشر هناك. يجب أن يكون حيث يتوقع الناس.

من الناحية النظرية ، تكون هذه المصطلحات مستقلة عن أي نظام أو مصدر بيانات واحد ، وبالتالي فهي غير مرتبطة بأداة استقصاء المعلومات. ومع ذلك ، ينبغي أيضًا تعريف التعاريف الفردية في أدوات استقصاء المعلومات حيثما أمكن ذلك. إذا كانت الأداة تدعم ذلك ، فعندما تحرك الماوس فوق بُعد أو مقياس ، يجب أن يظهر التعريف والمثال.

نظرًا لأن هذه التعريفات قد تظهر في أماكن متعددة ، يجب أن يسعى فريق البيانات إلى إنشاء قاموس البيانات تلقائيًا من مصدر واحد ، مثل جدول قاعدة البيانات أو مستودع الكود ، بدلاً من الاحتفاظ بجدول ثابت يدويًا. على سبيل المثال ، في Warby Parker ، تم إنشاء قاموس البيانات الخاص بنا من مهمة Jenkins. إذا تم تعديل المستودع ، فقد أعاد إنشاء مستنداتنا (موقع ويب داخلي مخصص أو "دفتر بيانات" لجميع وثائق البيانات).

7. الحفاظ عليها

على الرغم من أن المقاييس الأساسية يجب أن تكون مستقرة نسبيًا ، فقد تكون هناك أسباب عمل مشروعة وراء ضرورة تغيير تعريف المقياس. يجب أن يأتي هذا التغيير والتعريف الجديد من فريق العمل. ومع ذلك ، سوف يتطلب الأمر مساعدة فريق البيانات لتنفيذ التغيير وإبلاغه.

يجب على فريق BI تقييم تأثير التغيير قبل نشره. على سبيل المثال ، قم بإعداد مخطط يوضح المقياس مع كل من التعريف القديم والجديد للمقياس لتعيين توقعات لكيفية تغيير الأرقام.

عامل تغيير التعريف هذا كإصدار منتج: أبلغ عن تغيير التعريف مقدمًا ، وأخبر الأشخاص بما يجب توقعه ، وقم بتوثيق التغيير في قاموس البيانات ، مثل سجل التغيير في أسفل المستند.

لا تدع الأنظمة المختلفة تخرج عن المزامنة ؛ وبالتالي ، لماذا التوليد التلقائي للوثائق هو قيمة.

لإنشاء قاموس بيانات باتباع العملية المذكورة أعلاه ليس مجهودًا صغيرًا. قد يستغرق الأمر بضعة أشهر لأنه يتطلب محادثات وتنسيقًا بين العديد من الموظفين. إنه جهد جماعي كبير ، مدفوع ومنسق من قِبل فريق BI ، ولكنه يتطلب شراءًا واسعًا وتعاونًا وجهدًا واندفاعًا من التعزيزات من أعلى إلى أسفل.

أنا لا أقترح أخذ العملية مجزأة. على سبيل المثال ، لا تنشئ قاموس بيانات تسويقية بالكامل ، مع توقع الحصول على تمويل لقاموس البيانات في وقت لاحق. هذا يجعل الأمر أكثر صعوبة للوصول إلى مناقشات المواءمة (الخطوة 4) بين الفرق ، وهذا هو المكان الذي يحدث فيه المردود الحقيقي. أيضا ، الطبيعة المتسلسلة تجعل من السهل فقدان البخار. تحتاج إلى مناقشات متزامنة بين الفرق مع تاريخ تسجيل الخروج لتحقيق الهدف.