تحديثات “شات جي بي تي” الجديدة تمكنه من السمع والرؤية والكلام!
قدمت شركة أوبن إيه آي “OpenAI“ تحديثات جديدة لـ “روبوت الدردشة” المعروف باسم شات جي بي تي “ChatGPT” وهذه التحديثات تسمح للمستخدمين بالاستفادة من الصور والمدخلات الصوتية عند طرح أسئلتهم.
وهذا التحسين يجعل “شات جي بي تي” أكثر تشابهًا مع المساعدين الذكيين المعروفين مثل سيري من آبل والمساعد الصوتي من غوغل.
وقالت “أوبن إيه آي” في تدوينة نشرتها: “إن الميزة الصوتية تمكّن من فتح أفاق واسعة أمام تطبيقات إبداعية متعددة تركّز على تعزيز إمكانية الوصول”.
ومنذ ظهوره لأول مرة في نهاية العام الماضي، أصبح “ChatGPT” أداة معترف بها من قبل الشركات لأداء مجموعة متنوعة من المهام.
وتشمل هذه المهام تلخيص المستندات وكتابة “الأكواد” البرمجية، مما أثار منافسة حادة بين كبرى شركات التقنية لإطلاق عروضها الخاصة التي تعتمد على التوليد الذكي.
ويمكن للمستخدمين الاستفادة من ميزة الإدخال الصوتي بسهولة عن طريق النقر على أيقونة “الميكروفون”، ثم التحدث إلى النظام “الروبوت”، حيث يعتمد هذا النظام على تقنيات تعرف الصوت لفهم احتياجات المستخدم، ويقدم إجابات صوتية على استفساراته.
وأفادت “أوبن إيه آي” بأن شركة “سبوتفاي” تستفيد من التكنولوجيا وراء ميزة الإدخال الصوتي لترجمة محتواها إلى لغات متعددة، وهي ميزة تُستخدم من قبل مقدمي البث الصوتي على منصتهم.
ومن خلال ميزة دعم الصور، يمكن للمستخدمين التقاط صور للأشياء في محيطهم واستخدام برنامج “الدردشة الآلي” لاكتشاف الأخطاء وإصلاحها، أو لاستكشاف محتويات ثلاجتهم للتخطيط لوجبة محددة، أو حتى لتحليل رسوم بيانية معقدة تتعلق بالبيانات الخاصة بالعمل.
وستكون هذه المزايا متوفرة أولاً للأعضاء الذين يشتركون في خطة “شات جي بي تي بلس”، وللعملاء الشركات وأصحاب الأعمال خلال الأسبوعين القادمين.
و”شات جي بي تي” يتيح امكانية استخدام الصور عند طرح الأسئلة، سواء عبر التقاطها من الكاميرا أو تحميلها من الجهاز.
وأعلنت شركة أوبن إيه آي مؤخرًا عن دمج نموذج “دال إيه” في “شات جي بي تي”، بهدف تمكينه من إنتاج الصور.
وتأتي هذه المزايا الجديدة التي تُطلقها الشركة لمستخدميها في ظل تقارير حديثة تُشير إلى انخفاض عدد المستخدمين خلال الأشهر الأخيرة.
ومن المهم أن نشير إلى أن “روبوت غوغل بارد” وتطبيق “بنغ شات” قد قاما بتفعيل ميزات البحث الصوتي والبحث بالصور منذ بضعة أسابيع.