"أوبن إيه آي" تطرح إمكانات الصوت والصورة لـ ChatGPT.. إليك كل ما تريد معرفته

الأربعاء، 27 سبتمبر 2023 11:00 م
"أوبن إيه آي" تطرح إمكانات الصوت والصورة لـ ChatGPT.. إليك كل ما تريد معرفته ChatGPT - صورة أرشيفية
كتبت هبة السيد

مشاركة

اضف تعليقاً واقرأ تعليقات القراء
أعلنت OpenAI عن بعض الميزات الجديدة التي ستجعل ChatGPT أكثر ذكاءً، مع اقتراب الذكرى الأولى لتطبيق الذكاء الاصطناعي التوليدى، حيث تطرح الشركة بانتظام ميزات جديدة في برنامج الدردشة الآلى الخاص بها.
 
وفي منشور بالمدونة، كشفت "أوبن إيه أي"، أن إمكانيات الصوت والصورة قادمة إلى ChatGPT. "لقد بدأنا في طرح إمكانات جديدة للصوت والصورة في ChatGPT." وقالت الشركة إنها توفر نوعًا جديدًا وأكثر سهولة من الواجهة من خلال السماح للمستخدم بإجراء محادثة صوتية أو إظهار "شات جي بي تي"ما تتحدث عنه.
 
ويمكن لمستخدمي "شات جي بي تي"، النقر على صور ثلاجتهم ومخزن المؤن لمعرفة ما سيتم تناوله على العشاء (وطرح أسئلة متابعة للحصول على وصفة خطوة بخطوة).
 
"نحن نطرح الصوت والصور في "شات جي بي تي"، لمستخدمي Plus وEnterprise خلال الأسبوعين المقبلين. قال أوبن إيه أي: "الصوت قادم على نظامي iOS وأندرويد (قم بالاشتراك في إعداداتك) وستكون الصور متاحة على جميع الأنظمة الأساسية".
 
يمكن لمستخدمي " شات جي بي تي"، النقر على صور ثلاجتهم ومخزن المؤن لمعرفة ما سيتم تناوله على العشاء (وطرح أسئلة متابعة للحصول على وصفة خطوة بخطوة).
 
"نحن نطرح الصوت والصور في ChatGPT لمستخدمي Plus وEnterprise خلال الأسبوعين المقبلين، قال OpenAI: "الصوت قادم على نظامي iOS وAndroid (قم بالاشتراك في إعداداتك) وستكون الصور متاحة على جميع الأنظمة الأساسية".

احصل على ChatGPT للتحدث معك

يمكن للمستخدمين ببساطة تنشيط ChatGPT من خلال المطالبات الصوتية والمشاركة في محادثة ذهابًا وإيابًا مع المساعد. 
 
ويتم تشغيل القدرة الصوتية الجديدة من خلال نموذج جديد لتحويل النص إلى كلام، قادر على توليد صوت يشبه صوت الإنسان من مجرد نص وبضع ثوانٍ من عينة الكلام. "لقد تعاونا مع ممثلين صوتيين محترفين لإنشاء كل صوت. كما نستخدم Whisper، وهو نظام التعرف على الكلام مفتوح المصدر الخاص بنا، لتحويل كلماتك المنطوقة إلى نص.

اعرض الصور واطلب من ChatGPT الإجابة

يمكنك عرض صورة واحدة أو أكثر لـ ChatGPT، للتركيز على جزء معين من الصورة، يمكن للمستخدمين استخدام أداة الرسم في تطبيق الهاتف المحمول. يتم دعم فهم الصور بواسطة الوسائط المتعددة GPT-3.5 وGPT-4. تطبق هذه النماذج مهاراتها في التفكير اللغوي على مجموعة واسعة من الصور، مثل الصور الفوتوغرافية ولقطات الشاشة والمستندات التي تحتوي على نصوص وصور، وفقًا لـ OpenAI.

 










مشاركة

اضف تعليقاً واقرأ تعليقات القراء
لا توجد تعليقات على الخبر
اضف تعليق

تم أضافة تعليقك سوف يظهر بعد المراجعة





الرجوع الى أعلى الصفحة