كيفية جعل زبال يطارد أكثر متعة مع الذكاء الاصطناعي

لقد وجدت صيادين الزبال لعدة أجيال. غني عن اللعبة التقليدية شيء من هذا القبيل:

  • زعيم يكتب قائمة من الأشياء على خردة الورق.
  • ثم تقضي الفرق فترة ما بعد الظهر في البحث في المنطقة المحيطة - سواء في الهواء الطلق أو في الداخل - عن تلك الأشياء.
  • يقومون بعبور العناصر من القائمة عند العثور عليها ، ثم تابع حتى تكتمل القائمة.

قواعد بسيطة. لكن الكثير من المرح.

تحديث اللعبة باستخدام الذكاء الاصطناعى

لقد كتبت تطبيقًا لمنصة Amazona Alexa التي تعمل على تحديث عمليات البحث عن الزبال. تعمل على الاستفادة من أحدث التقنيات المتاحة - بما في ذلك أدوات الذكاء الاصطناعي مثل التعرف على الصور والصوت.

لا تتغير فرضية اللعبة: يمكنك العثور على عشرة عناصر عشوائية موجودة في منزلك - أو في جوارك - خلال ساعة. إلا أنه اليكسا هو الذي يسهل اللعب.

تطبيقي مجاني لتمكينه إذا كنت أحد الملايين من الأشخاص الذين يمتلكون تطبيق Amazon Alexa. توضح أداة الكتابة أدناه كيفية الاستفادة من كل أداة من أدوات الذكاء الاصطناعي ، بما في ذلك خدمات AWS الجديدة - إعادة الإدراك والاستطلاع. وتسمى هذه المهارة زبال هانت. إليك معاينة لكيفية عملها:

الذكاء الاصطناعي # 1 - اليكسا

بدء اللعبة يبدأ باستدعاء مهارة Alexa. أي شخص لديه جهاز ينص على الطلب التالي.

أليكسا ، اطلب من Scavenger Hunt أن تبدأ لعبة جديدة.

يمكن لأي من الملايين من مالكي Alexa استخدام صوتهم لتقديم هذا الطلب. اللغة خفية. يختلف اختيار الكلمات عندما يتم إجراء هذه النية من خلال مختلف الجنسين والفئات العمرية والديموغرافيا العرقية والاجتماعية. إن قوة الذكاء الاصطناعي هي التي تحل هذه الاختلافات الدقيقة في اختيارات الكلمات واللهجة في طلب بسيط لبدء اللعبة.

كيف تعمل اللعبة؟

يبدأ اللعب بتنفيذ تطبيق Alexa لمجموعة متنوعة من التقنيات المختلفة. إليك بنية الخدمات والواجهات المختلفة المستخدمة:

تتولى منصة Alexa معالجة اللغة وترجمة نوايا الصوت إلى نصوص. تستضيف خدمة Lambda منطق المعالجة ويتم كتابة التعليمات البرمجية في NodeJS. يتم تتبع اللعبة على المنصة من خلال رمز لعبة فريد من أربعة أرقام يعاد للمستخدم. تحدد المهارة العناصر التي يجب اكتشافها وتخزينها في سجل على جدول DynamoDB.

يسجل المنطق في Lambda أيضًا الطابع الزمني عندما بدأت اللعبة. هذا بمثابة ساعة توقيت افتراضية العد التنازلي لمدة ستين دقيقة للعب اللعبة فيها. في أي وقت ، يمكن للمستخدم العودة وطلب اليكسا لتحديث النتيجة. يستجيب اليكسا مع الوقت المتبقي ، ودفتر الأستاذ الحالي للعناصر التي يجري البحث عنها.

الذكاء الاصطناعي # 2 - بولي

أستمتع ببناء تجربة مستخدم صوت رائعة في تطبيقات Alexa الخاصة بي. تميز الجودة الآن الألعاب على هذه المنصة المتنامية. هذا أمر بالغ الأهمية بالنظر إلى أن هناك الآن أكثر من 10 ألف مهارات اليكسا للاختيار من بينها.

إن تطوير واجهات مستخدم صوت ممتاز يشبه إنتاج بث إذاعي. واحد كبير يولد المزيد من الإثارة من استخدام صوت المفرد. ويشمل الأناشيد والأصوات التي تحاكي الحركة. تتطلب كتابة هذه التطبيقات كتابة كل من الكود وسرد قصة شيقة.

القصص الجيدة ليست مناجاة. يتطلب هذا النهج ترميز متقدم ليشمل أكثر من حرف واحد. هذا هو المكان الذي استخدمت فيه خدمة Polly ، لتكمل صوت Alexa القياسي. إليك ما يبدو عليه "النص" للرسالة التمهيدية. يتم تشغيل هذا عند بدء تشغيل لعبة جديدة ، ويظهر كيف تلعب المكونات بعضها البعض.

يتطلب إدخال الموسيقى تسجيل مقاطع Mp3 قصيرة تحتوي على أصوات وأناشيد. أسجل الموسيقى على سطح المكتب الخاص بي ، ثم أحملها في دلو S3. التالي هو كيفية الحصول على العديد من الأصوات داخل المهارة ، حيث أن Alexa لديه صوت واحد. لإنشاء هذه التجربة الصوتية ، إنها مزيج من التقنيات. لدى Polly القدرة على توليد 47 صوتًا مختلفًا في 24 لغة مختلفة. إنه سهل الاستخدام ، والتسجيل القصير يستغرق بضع دقائق. ابدأ بالانتقال إلى وحدة التحكم وإحضار خدمة Polly.

هناك العديد من الأصوات داخل اللغة الإنجليزية للاختيار من بينها. لقد اخترت الإنجليزية والمملكة المتحدة في القائمة المنسدلة ، ثم قمت بالنقر فوق زر الاختيار للحصول على صوت أنثى يسمى إيمي. بعد ذلك ، كتبت البرنامج النصي في مربع النص ، وحوّله بولي إلى خطاب. يحفظ الخيار الموجود في أسفل اليمين التسجيل في ملف Mp3. قمت بتنظيم الملف في دلو S3 حيث يمكن الوصول إلى مهارة Alexa.

دمج الأصوات باستخدام SSML

وصف القسم السابق كيفية إنشاء الأجزاء الفردية للبرنامج النصي. الآن حان الوقت لجمعها معًا. تتطلب منصة Alexa أن يكون لكل مهارة واجهة برمجة تطبيقات تتوافق مع نموذج رسالة قياسي. في هذا النموذج ، تمثل السمات المختلفة خصائص تفاعل المستخدم. السمة audioOutput لكائن الاستجابة هي ما يقرأه Alexa مرة أخرى للمستخدم.

لإنشاء السمة مع الأجزاء الأربعة ، ستحتاج إلى إنشاء ترميز يشبه هذا:

<الكلام>
  

تشير العلامات إلى كل ملف mp3 تم تنظيمه في مكان متاح للجمهور على الإنترنت. هذه هي أيضًا الطريقة التي يجمع بها المستعرض الصور والنصوص باستخدام HTML في جزء واحد من الزجاج. اليكسا يفعل نفس التجمع من الصوت باستخدام SSML.

الذكاء الاصطناعي # 3 - إعادة الإدراك

تتطلب اللعبة أداة تسجيل نقاط ، لذلك تلعب خدمة أخرى هذا الدور. أدمغة مسؤولنا الحديث هي خدمة AWS Rekognition. يقوم هذا بمسح الصور وتحديد كل العناصر المرئية وتتبعها للعبة. فيما يلي تفاصيل عن التكنولوجيا الداعمة.

الحدث يحركها معالجة الصور

تحميل الصور إلى دلو S3 عبر موقع scavengerskill.com. المجموعة هي الإعداد لتشغيل حدث لكل كائن جديد تمت إضافته. ينفذ هذا الحدث وظيفة Lambda ، ويستدعي واجهة برمجة تطبيقات Rekognition لمسح الصورة. تحتوي استجابة مكالمة API على العناصر المكتشفة. تكتب الوظيفة التفاصيل إلى جدول DynamoDB ، مما يجعلها متاحة لمهارة Alexa.

على سبيل المثال ، إليك صورة من لعبة والاستجابة المقابلة من Rekognition API.

{
 "captureDt": "2017–04–16" ،
 "captureTm": "21:45:40" ،
 "gameId": "9180" ،
 "imageId": "9180 / upload_13277b04a3c001948f3e570580f377c4.JPG" ،
 "ملصقات": [
   {"الثقة": 98.8132629395 ، "الاسم": "الأريكة"} ،
   {"الثقة": 98.8132629395 ، "الاسم": "الأثاث"} ،
   {"الثقة": 85.2093963623 ، "الاسم": "المصباح"} ،
   {"الثقة": 85.2093963623 ، "الاسم": "مصباح الجدول"} ،
   {"الثقة": 83.6216506958 ، "الاسم": "طاولة القهوة"} ،
   {"الثقة": 83.6216506958 ، "الاسم": "الجدول"} ،
   {"الثقة": 66.3723068237 ، "الاسم": "طاولة الطعام"} ،
   {"الثقة": 54.6450958252 ، "الاسم": "Hardwood"} ،
   {"الثقة": 54.6450958252 ، "الاسم": "الخشب"} ،
   {"الثقة": 52.6244163513 ، "الاسم": "المشروبات"} ،
   {"الثقة": 52.6244163513 ، "الاسم": "الشراب"} ،
   {"الثقة": 52.0414428711 ، "الاسم": "Lampshade"} ،
   {"الثقة": 50.595413208 ، "الاسم": "غرفة الطعام"} ،
   {"الثقة": 50.595413208 ، "الاسم": "في الداخل"} ،
   {"الثقة": 50.595413208 ، "الاسم": "الغرفة"}
 ]
}

تحتوي الاستجابة على مجموعة من التسميات القابلة للتطبيق على الصورة وفاصل ثقة لكل منها. في هذه اللعبة ، كنت أبحث عن "مصباح" وحددت الخدمة أنه موجود في الصورة مع يقين 85 ٪. الفضل لي الفضل في العثور عليه!

السلع الأمازون معالجة الصور

قيمة خدمة Rekognition هي بساطتها. دربت Amazon بالفعل نماذج التعلم الآلي للتعرف على العديد من الأشياء. كل ما أحتاج إليه لاستخدام الخدمة هو الاتصال بواجهة برمجة التطبيقات (API) بعنوان الكائن الذي أريد مسحه ضوئيًا. وهذا يجعل خدمة قوية للغاية بسيطة وغير مكلفة. إذا قمت بمسح 1000 صورة ضوئيًا ، فسوف يكلفني ذلك 1 دولار. يمكّنني هذا من التركيز على إنشاء تجربة المستخدم ، بما في ذلك طريقة اللعب المثيرة.

استنتاج

أنا أستمتع بلعب هذه النسخة الحديثة من صياد الزبال مع عائلتي. من الممتع التجوّل في الفناء والتقاط صور لأشياء في المنزل والمنطقة المجاورة ، ثم العودة مرة أخرى مع Alexa بشأن العناصر التي تطابقها. يرجى تجربتها واسمحوا لي أن أعرف ما هو رأيك!

"أوه، الأماكن التى سترتادها! هناك سعادة عند الانتهاء!
هناك نقاط ليكون وسجل. هناك ألعاب يمكن الفوز بها.
والأشياء السحرية التي يمكنك القيام بها بهذه الكرة
سوف تجعلك الفائز الفائز في كل شيء. "
- دكتور سوس ، أوه ، الأماكن التي ستذهب إليها!